第二章 随机变量
第一节 随机变量
一、随机变量概念的产生
在实际问题中,随机试验的结果可以用 数量来表示,由此就产生了随机变量的概念.
1、有些试验结果本身与数值有关(本身 就是一个数).
例如,掷一颗骰子面上出现的点数;
七月份郑州的最高温度;
每天从北京站下火车的人数;
昆虫的产卵数;
2、在有些试验中,试验结果看来与数值无 关,但我们可以引进一个变量来表示它的各 种结果.也就是说,把试验结果数值化.
正如裁判员在运动 场上不叫运动员的 名字而叫号码一样,
二者建立了一种对 应关系.
这种对应关系在数学上理解为定义了一种 实值函数.
e. X(e)
Ω R
这种实值函数与在高等数学中大家接触到 的函数一样吗?
(1)它随试验结果的不同而取不同的值,
因而在试验之前只知道它可能取值的范围,
而不能预先肯定它将取哪个值.
(2)由于试验结果的出现具有一定的概 率,于是这种实值函数取每个值和每个确 定范围内的值也有一定的概率.
称这种定义在样本空间上的实值函数为
简记为 r.v.(random variable)
而表示随机变量所取的值 时,一般采用小写字母x,y,z等.
随机变量通常用大写字母
X,Y,Z
或希腊字母ζ,η
等表示
例如,从某一学校随机选一 学生,测量他的身高.
我们可以把可能的 身高看作随机变量
X,
然后我们可以提出关于X的各种问题.
如 P(X>1.7)=? P(X≤1.5)=?
P(1.5<X<1.7)=?
有了随机变量,随机试验中的各种事件,
就可以通过随机变量的关系式表达出来.
二、引入随机变量的意义
如:单位时间内某电话交换台收到的呼 叫次数用X表示,它是一个随机变量.
事件{收到不少于1次呼叫} { X 1}
⇔ ≥
{没有收到呼叫} {X= 0}
⇔
随机变量概念的产生是概率论发展 史上的重大事件. 引入随机变量后,对 随机现象统计规律的研究,就由对事件 及事件概率的研究扩大为对随机变量及 其取值规律的研究.
事件及 事件概率
随机变量及其 取值规律
四、随机变量的分类
通常分为两类:
如“取到次品的个数”,
“收到的呼叫数”等.
随 机 变 量
离散型随机变量
连续型随机变量
所有取值可以逐个 一一列举
例如,“电视机的寿命”,实 际中常遇到的“测量误差”等.
全部可能取值不仅 无穷多,而且还不能 一一列举,而是充满
一个区间.
这两种类型的随机变量因为都是随机变 量,自然有很多相同或相似之处;但因其取 值方式不同,又有其各自的特点.
随 机 变
量 连续型随机变量 离散型随机变量
学习时请注意它们各自的特点和描述方法.
设X是一个离散型随机变量,它可能 取的值是 x1, x2
, … .
为了描述随机变量 X ,我们不仅需 要知道随机变量X的取值,而且还应知道
X取每个值的概率.
第二章 第二节
离散型随机变量
这样,我们就掌握了X这个 随机变量取值的概率规律.
从中任取3 个球
取到的白球数X是一个随机变量
X可能取的值是0,1,2
取每个值的概率为
10 ) 1
0
(
35 3 3
=
=
= C
X C P
10 ) 6
1
(
35 1 2 2
3
=
=
= C
C X C
P
10 ) 3
2
(
35 2 2 1
3
=
=
= C
C X C
P
例1
且
∑
=
=
3
=
1
1
i
i X
P ( )
其中 (k=1,2, …) 满足:
p
k,
≥ 0
p
kk=1,2, …
(1)
∑ =
k
p 1
k(2)
定义1:设xk(k=1,2, …)是离散型随机变 量X所取的一切可能值,称
k=1,2,…
, )
( X x
kp
kP = =
为离散型随机变量X的概率分布或分布 律,有的书上也称概率函数.
用这两条性质判断 一个函数是否是
概率分布
一、离散型随机变量概率分布的定义
解: 依据概率分布的性质:
∑ = =
k
k X
P ( ) 1
P(X =k)≥0,
! 1 0
0
=
=
≥
∑
∞=
λ
λk ae a
a
k
k
从中解得
欲使上述函数为概率分布 应有
λ
= e
−a
∑
∞=
=
0
!
:
k
k
e
λλ k 注
例2. 设随机变量X的概率分布为:
! , )
( X k a k P
λk
=
= k =0,1,2, …,
试确定常数a .> 0
λ
二、表示方法
(1)列表法:
(2)公式法
10 3 10
6 10
1
2 1
0
X~
2 , 1 , 0 ,
)
(
35 2 3
3
=
=
=
−k
C C k C
X P
k k
再看例1
任取3 个球
X为取到的白球数 X可能取的值 是0,1,2
三、举例
例3. 某篮球运动员投中篮圈概率是0.9,求 他两次独立投篮投中次数X的概率分布.
解: X可取0、1、2为值 P(X =0)=(0.1)(0.1)=0.01 P(X =1)= 2(0.9)(0.1) =0.18
P(X =2)=(0.9)(0.9)=0.81
且 P(X =0) + P(X =1) + P(X =2) = 1
常常表示为:
81 .
0 18
. 0 01
. 0
2 1
~ 0 X
这就是X的概率分布.
例 4
如上图所示.电子线路中装有两个并联的 继电器.假设这两个继电器是否接通具有随机 性,且彼此独立.已知每个电器接通的概率为 0.8,记X为线路中接通的继电器的个数.
求:(1)X的分布律.
(2)线路接通的概率.
解: (
1).记Ai={第i个继电器接通},i=1,2.∵ 两个继电器是否接通是相互独立的,∴
A1和A2相互独立,另外P(A1)=P(A2)=0.8.下面 求X的分布律.
首先:X可能取0,1,2,三个值.
P{X=0}=P{表示两个继电器都没接通}
04 .
0 2
. 0 2
. 0 )
( )
( )
(
1 2=
1 2= × =
= P A A P A P A
32 .
0 8
. 0 2
. 0 2
. 0 8
. 0
) (
) (
) (
) (
) (
) (
)) (
) ((
2 1
2 1
2 1
2 1
2 1
2 1
=
× +
×
=
+
=
+
=
∪
=
A P
A P
A P
A P
A A P
A A
P A
A A
A P
P{X=1}=P{恰有一个继电器接通}
64 .
0 8
. 0 8
. 0 )
( )
( )
(
1 2=
1 2= × =
= P A A P A P A
P{X=2}=P{两个继电器都接通
}
,
,
∴ X的分布律为X
0 1 2p
k 0.04 0.32 0.642) ∵是并联电路 ∴ P(线路接通)
=P(只要一个继电器接通)=P{X≥1}
=P{X=1}+P{X=2}=0.32+0.64=0.96.
(二)常见的离散型随机变量的概率分布 (I) 两点分布
设E是一个只有两种可能结果的
随机试验,用Ω={ ω
1, ω
2}表示其样本空间.
P({ ω
1})=p , P({ ω
2})=1-p l 来源
X( ω)=
1, ω= ω
10, ω= ω
2200件产品中,有196件是正品,4件 是次品,今从中随机地抽取一件,若规定 例 5
X( ω)= 1, 取到合格品
0, 取到不合格品 则 P{X=1}=196/200=0.98, P{X=0}=4/200=0.02
故X服从参数为0.98的两点分布.
即 X ∼ B(1,0.98).
例6 设生男孩的概率为p,生女孩的概率为
q=1-p,令X表示随机抽查出生的4个婴儿
中“男孩”的个数.贝努里概型 和 二项分布 (II)
我们来求X的概率分布.
4 , 3 , 2 , 1 , 0 ,
) 1
( }
{ X = k = C
4p − p
4−k =
P
k k kX的概率分布是:
男 女
X表示随机抽查的4个婴儿中男孩的个数,
生男孩的概率为 p.
X=0 X =1 X =2 X =3 X =4
X可取值0,1,2,3,4.
例7 将一枚均匀骰子抛掷3次,
令X 表示3次中出现“4”点的次数
3 , 2 , 1 , 0 ,
6 ) ( 5 6 )
( 1 }
{ X = k = C
3 3−k =
P
k k kX的概率分布是:
不难求得,
掷骰子:“掷出4点”,“未掷出4点” 一般地,设在一次试验中我们只考虑两个 互逆的结果:A或 , 或者形象地把两个互 逆结果叫做“成功”和“失败”.
A
新生儿:“是男孩”,“是女孩” 抽验产品:“是正品”,“是次品”
再设我们重复地进行n次独立试验 ( “重复”
是指这次试验中各次试验条件相同 )
这样的n次独立重复试验称作n重贝努里 试验,简称贝努里试验或贝努里概型.
每次试验成功的概率都是
p
,失败的概率 都是q =1- p
.用X表示n重贝努里试验中事件A(成功)
出现的次数,则
n k
p p
C k
X
P ( = ) =
nk k( 1 − )
n−k, = 0 , 1 , ,
称r.v.X服从参数为n和p的二项分布,记作
X~B(n,p)
注: 贝努里概型对试验结果没有等可能的 要求,但有下述要求:
(1)每次试验条件相同;
二项分布描述的是n重贝努里试验中出现
“成功”次数X的概率分布.
(2)每次试验只考虑两个互逆结果A或 ,
A
且P(A)=p , ;P ( A ) = 1 − p
(3)各次试验相互独立.
例8 某类灯泡使用时数在2000小时以上视为正 品.已知有一大批这类的灯泡,其次品率是0.2.
随机抽出20只灯泡做寿命试验,求这20只灯泡 中恰有3只是次品的概率.
解: 设X为20只灯泡中次品的个数 ,则.
X ~ B (20, 0.2),
, )
8 . 0 ( ) 2 . 0 ( )
( X k C
20k k 20 kP = =
−. 20 ,...,
1 ,
= 0
k
下面我们研究二项分布B(n,p)和两 点分布B(1,p)之间的一个重要关系.
¹ 说明
设试验E只有两个结果:
A
和 .记p=P(A),则P( )= 1- p ,0<p<1,
A A
我们把试验E在相同条件下,相互独立地进行 n次,且记X为n次独立试验中结果A出现的次 数.把描述第i次实验的随机变量记作Xi
则 Xi ∼ B(1,p), 且X1,X2 ,… ,Xn也是相互 独立的(随机变量相互独立的严格定义第三 章再讲).则有
X= X1+X2+…+Xn
一、泊松分布的定义及图形特点
) (
~ ,
0
; ,
2 , 1 , 0
! ; }
{ )
; (
λ λ
λ λ
λ
λP X
X
k k e
k X
P k
P
k
的泊松分布 是服从参数为
称
>
=
=
=
=
−
设随机变量X所有可能取的值为0 , 1 , 2 , … , 且概率分布为:
(III) 泊松分布
易见
=
=
≥
=
∑
∞=
− 0
! 1
, 2 , 1 , 0 0
} {
k
k
k e
k k
X P
λ
λ
例9
某一无线寻呼台,每分钟收到寻呼的次 数X服从参数λ=3的泊松分布.求:(1)一分钟内恰好收到3次寻的概率.
(2)一分钟内收到2至5次寻呼的概率
. 解:
(1) P{X=3}=p(3;3)=(33/3!)e-3≈0.2240(2) P{2≤X≤5}
=P{X=2}+P{X=3}+P{X=4}+P{X=5}
=[(32/2!)+(33/3!)+(34/4!)+(35/5!)]e-3 ≈0.7169
解:
例10
某一城市每天发生火灾的次数X服从参数 为0.8的泊松分布.求:该城市一天内发生3次以上火灾的概率.
P{X≥3}=1- P{X<3}
=1-[P{X=0}+ P{X=1}+P{X=2}]
=1-[(0.8 0/0!)+(0.81/1!)+(0.82/2!)]e-0.8
≈0.0474
泊松分布的图形特点: X~P( )
λ
对于二项分布B(n,p),当n充 分大,p又很小时,则对任意固定的非负 整数k,有近似公式
历史上,泊松分布是作为二项分布的近 似,于1837年由法国数学家泊松引入的 .
二、二项分布与泊松分布
l命题
np k e
p p
C
k k
n k
k
n
−
−≈ λ
−λλ =
! , )
1
(
. fixed
for as
) 1
.(
3
; fixed
for as
) .(
2
; )
1
! (
) 1 (
) 1 (
) 1
( .
1
: Proof
! , )
1 (
k n
n e n p
j n
p j
n
n n p k
p k
n p
n np
p p
C
np k e
p p
C
k n
k n k
n k
k n
k k
n k
k n
∞
→
→
−
∞
→
→
−
+ −
−
= −
−
=
≈
−
−
−
−
−
−
−
λ
λ
λ
λ λ
由泊松定理,n重贝努里试验中稀有事件 出现的次数近似地服从泊松分布.
我们把在每次试验中出现概率很小的事 件称作稀有事件. 如地震、火山爆发、特大 洪水、意外事故等等
解:
例11
某出租汽车公司共有出租车400辆,设每 天每辆出租车出现故障的概率为0.02,求:一天 内没有出租车出现故障的概率.
将观察一辆车一天内是否出现故障看成 一次试验E.因为每辆车是否出现故障与其它 车无关,于是观察400辆出租车是否出现故障 就是做400次独立试验,设X表示一天内出现故 障的出租车数,则: X ∼ B(400, 0.02).
令λ=np=400×0.02=8 于是:
P{一天内没有出租车出现故障}=P{X=0}
=B(0;400,0.02) ≈(80/0!)e-8 =0.0003355
对于离散型随机变量,如果知道了它的 概率分布,也就知道了该随机变量取值的概率 规律. 在这个意义上,我们说
这一讲,我们介绍了离散型随机变量及 其概率分布.
离散型随机变量由它的概率分布唯一确定.
两点分布、二项分布、泊松分布 及其关系
第二章 第三节
连续型随机变量
连续型随机变量X所有可能取值充满一个区间, 对 这种类型的随机变量, 不能象离散型随机变量那样, 以 指定它取每个值概率的方式, 去给出其概率分布, 而是 通过给出所谓“概率密度函数”的方式.
下面我们就来介绍对连续型随机变量的描述方法.
第二章 第三节
连续型随机变量
(I)直方图
(一) 概率密度函数
∫
=
≤
≤
ba
f x dx b
X a
P ( ) ( )
,使得对任意 , 有
a ≤ b
∈ ( −∞ , +∞ )
对于随机变量 X ,如果存在非负可积函数f(x) , x
则称 X为连续型r.v.,称 f(x)为 X 的概率密度函 数,简称为概率密度或密度.
(II) 连续型r.v.及其概率密度函数的定义
(III) 概率密度函数的性质 1 o
f ( x ) ≥ 0
2 o
∫
−∞∞f ( x ) dx = 1
这两条性质是判定一个 函数 f(x)是否为某r.vX的 概率密度函数的充要条件.
f (x)
o
x
面积为1
故 X的密度 f(x) 在 x 这一点的值,恰好是 X落在区间 上的概率与区间长度
之比的极限. 这里,如果把概率理解为质量, f (x)相当于线密 度.
∆ x
] ,
( x x + ∆ x
若x是 f(x)的连续点,则:
x
x x
X x
P
x
∆
∆
∆
) lim ( < ≤ +
→0
x
) ( lim
0∆
= ∫
+∆→
∆
x x
x x
dt t
f
=f(x) 3. 对 f(x)的进一步理解:
要注意的是,密度函数 f (x)在某点处a的高度,并不 反映X取值的概率. 但是,这个高度越大,则X取a附近的 值的概率就越大. 也可以说,在某点密度曲线的高度反 映了概率集中在该点附近的程度.
f (x)
o
x
若不计高阶无穷小,有:
x x
f x
x X
x
P
{ < ≤ + ∆ } = ( )∆它表示随机变量 X 取值于 的概率近似等 于 .
] ,
( x x + ∆ x x
x f ( ) ∆ x
x
f ( ) ∆
在连续型r.v理论中所起的作用与k
k
p
x X
P ( = ) =
在离散型r.v理论中所起的 作用相类似.4. 连续型r.v取任一指定值的概率为0.
即:
P ( X = a ) = 0 ,
a为任一指定值这是因为
) (
lim )
( X a
0P a X a x
P
x∆
∆
≤ < +
=
=
→∫
+=
→ a xx a ∆
f x dx
∆
lim ( )
0
= 0
由此得,
) (
)
( a X b P a X b
P ≤ ≤ = < ≤ = P ( a ≤ X < b )
1) 对连续型 r.v X,有
) ( a X b P < <
=
2) 由P(X=a)=0 可推知
{ } ) ( ) ( ) 1
( X ∈ R − a = ∫
−∞∞f x dx − P X = a = P
而 {X=a} 并非不可能事件,
可见, 由P(A)=0, 不能推出
A = φ
并非必然事件
}}
{ {
X
∈R
−a
由P(B)=1, 不能推出 B=
Ω
(二)、随机变量的分布函数
设X(ω)是一个随机变量.称函数 F(x):= P{X≤x},-∞<x<∞为随机变量X的分布函数.
l分布函数的性质
(1)∀a<b,总有F(a)≤F(b)(单调非减性)
(2)F(x)是一个右连续的函数
(3)∀x∈R1 ,总有0≤F(x)≤1(有界性),且
l定义
1 )
( lim
, 0 )
(
lim = =
∞
→
−∞
→
F x F x
x x
证明: 仅证(1)
∵{a<X≤b}={X≤b}∩{X>a}
={X≤b}-{X≤a},而{X≤a}⊂{X≤b}.
∴ P{a<X≤b}= P{X≤b}- P{X≤a}
=F(b)- F(a).
又∵P{a<X≤b}≥0, ∴F(a)≤F(b).
上述证明中我们得到一个重要公式:
P{a<X≤b}=F(b)- F(a).
它表明随机变量落在区间(a,b]上的概率 可以通过它的分布函数来计算.
注意
设离散型随机变量X的分布律为
p
k= P{X=x
k} , k=1,2,…, 则X的分布函数为
离散型随机变量的分布函数
{ }
=
=
≤
=
≤ x xk
k
x X
P x
X P
x
F ( ) { }
{ } ∑
∑
≤ ≤=
=
=
∴
x x
k x
x
k
k k
p x
X P
x
F ( )
分布函数F(x)是一个右连续的函数,在 x=xk(k=1,2…)处有跳跃值 pk=P{X=xk},
如下图所示
F(x)=
0 x<0 0.04 0≤X<1 0.36 1≤X<2 1 2≤X
连续型 r.v.的分布函数
即分布函数是密度函数的可变上限的 定积分.
若 X 是连续型r.v., X f (x) , 则 F(x) = P(X x) =
∫
−∞x
f ( t ) dt
~
≤
由上式可得,在 f (x)的连续点,
) ) (
( f x
dx x
dF =
下面我们来求一个连续型 r.v 的分布函数.
例 设r.v X 的密度函数为 f (x)
− − ≤ ≤
=
0, 其它
1 1
, 2 1
) (
2
x
x x
f π
求 F(x).F(x) = P(X x) =
∫
−∞x
f ( t ) dt
≤
解:
对 x < -1,F(x) = 0
∫
∫
−−
∞
−
⋅ + −
= dt
xt dt
x
F
11 2
2 1 0
)
( π
2 arcsin 1
1 −
2+ 1 +
= x x x
π π
, 1 1 ≤ ≤
− x
对
对 x>1, F (x) = 1
>
≤
≤
− +
+
−
−
<
=
1 ,
1
1 1
2 , arcsin 1
1 1
1 ,
0 )
(
2x
x x
x x
x x
F π π
即
(三)常见的连续型随机变量
正态分布、均匀分布、指数分布
正态分布是应用最广泛的一 种连续型分布.
正态分布在十九世纪前叶由 高斯
(Gauss)加以推广,所以通常称为高斯分布.
德莫佛
德莫佛(De Moivre)最早发现了二项 分布的一个近似公式,这一公式被认为是 正态分布的首次露面.
一、正态分布
高 尔 顿 钉 板 试 验
这条曲线就近似我们将要介绍的正态分 布的密度曲线。
(I)、正态分布的定义
若r.v. X 的概率密度为
) ,
(
~ N µ σ
2记作
X
f (x)所确定的曲线叫作正态曲线.
∞
<
<
∞
−
=
− −
x e
x f
x
, )
(
) (
2 2
2
2
1 σµ
π σ
其中 和 都是常数, 任意, >0,
则称X服从参数为 和 的正态分布.
µ σ σ
µ σ µ
(Normal)
(II)、正态分布 的图形特点
N ( µ , σ
2)
正态分布的密度曲线是一条关于 对称的钟形曲线.
µ
特点是“两头小,中间大,左右对称”.
决定了图形的中心位置, 决定了图形中峰的陡峭程度.
µ σ
正态分布 的图形特点
N
(µ
,σ
2 )故f(x)以μ为对称轴,并在x=μ处达到最大值:
∞
<
<
∞
−
=
− −
x e
x f
x
, )
(
) (
2 2
2
2
1 σµ
π σ
令x=μ+c, x=μ-c (c>0), 分别代入f (x), 可得 f (μ+c)=f (μ-c)
且 f (μ+c) ≤f (μ), f (μ-c)≤f (μ)
σ µ π
2 ) 1
( =
f
这说明曲线 f(x)向左右伸展时,越来越贴近x轴。即f (x) 以x轴为渐近线。
∞
<
<
∞
−
=
− −
x e
x f
x
, )
(
) (
2 2
2
2
1 σµ
π σ
当x→ ±∞时,f(x) → 0,
用求导的方法可以证明,
∞
<
<
∞
−
=
− −
x e
x f
x
, )
(
) (
2 2
2
2
1 σµ
π σ
为f (x)的两个拐点的横坐标。
x = μ ± σ
σ σ µ
µ π
σ
σ µ π
σ
π µ σ
π σ
σ µ
σ µ σ
µ
σ µ σ
µ
±
=
⇒
=
− −
−
=
−
−
−
=
−
−
=
∞
<
<
∞
−
=
− −
− −
− −
− −
− −
x x e
x e e
x f
e x
x f
x e
x f
x
x x
x x
) 0 1 (
2
) (
2 ) 1
( ' '
) 2 (
) 1 (
'
2 , ) 1
(
2
2 3
2 ) (
2 ) (
2
2 2
) (
3
2 ) (
3
2 ) (
2 2
2 2 2
2
2 2 2
2
实例 年降雨量问题,我们用上海99年年降雨量的数 据画出了频率直方图。
从直方图,我们可以初步看出,年降雨量近似服从 正态分布。
下面是我们用某大学大学生的身高的数据画出的频 率直方图。
红线是拟合 的正态密度 曲线
可见,某大学大学生的身高应服从正态分布。
人的身高高低不等,但中等身材的占大多数,特高和特 矮的只是少数,而且较高和较矮的人数大致相近,这从 一个方面反映了服从正态分布的随机变量的特点。
除了我们在前面遇到过的年降雨量和身高外,在正常 条件下各种产品的质量指标,如零件的尺寸;纤维的强度 和张力;农作物的产量,小麦的穗长、株高;测量误差,
射击目标的水平或垂直偏差;信号噪声等等,都服从或近 似服从正态分布.
(III) 、设X~ ,
N ( µ , σ
2)
X的分布函数是∞
<
<
∞
−
= ∫
−∞− −
x dt
e x
F
xt
, )
(
) (
2 2
2
2
1
σµπ
σ
dt e
x
x∫
−∞ t=
−Φ
22
2 ) 1
( π
(IV)、标准正态分布
1 ,
0 =
= σ
µ
的正态分布称为标准正态分布.∞
<
<
∞
−
=
e
−x
x
x
2 , ) 1
( 2
2
ϕ π
其密度函数和分布函数常用 和 表示:
ϕ (x ) Φ ( x )
) Φ( x
) ϕ( x
它的依据是下面的定理:
标准正态分布的重要性在于,任何一个 一般的正态分布都可以通过线性变换转化为 标准正态分布.
根据定理1,只要将标准正态分布的分布函数制成表,
就可以解决一般正态分布的概率计算问题.
) ,
(
~ N µ σ
2X σ
µ
=
X
−,则
Y
~N(0,1) 设定理1
dy e
dx e
dx x dy
y
x dx
e x
F
x y
x x
x x
∫
∫
∫
−
∞
−
−
∞
−
− −
∞
−
− −
=
− =
=
∞
<
<
∞
−
=
σ µ σ
µ
σ µ
π π
σ
σ σ µ
π σ
2 2
) (
2 ) (
2 2
2
2 2
2 1 2
1
then ,
Let
2 , ) 1
(
:
Proof
书末附有标准正态分布函数数值表,有了它,可以解决一般 正态分布的概率计算查表.
(V)、正态分布表
) ( 1
)
( − x = − Φ x Φ
dt e
x
x∫
−∞ t=
−Φ
22
2 ) 1
( π
表中给的是x>0时, Φ(x)的值.
当x<0时
− x x
), ,
(
~ N µ σ
2若
X
σ µ
= X −
Y
~N(0,1) 若 X~N(0,1),) (
) (
} {
} {
σ µ σ
µ σ
µ σ
µ
Φ −
− − Φ
=
≤ −
− ≤
=
<
<
a b
Y b P a
b X
a P
) ( )
(
} {
} {
a b
b X
a P b
X a
P
Φ
− Φ
=
≤
<
=
<
<
由标准正态分布的查表计算可以求得,
这说明,X的取值几乎全部集中在[-3,3]区间 内,超出这个范围的可能性仅占不到0.3%.
当X~N(0,1)时,
P(|X| 1)=2 (1)-1=0.6826
≤ Φ
≤ Φ
P(|X| 2)=2 (2)-1=0.9544
≤ Φ
P(|X| 3)=2 (3)-1=0.9974
(VI)、3 准则
σ
将上述结论推广到一般的正态分布,
) ,
(
~ N µ σ
2Y
时,6826 .
0 )
|
(| Y − µ ≤ σ = P
9544 .
0 )
2
|
(| Y − µ ≤ σ = P
9974 .
0 )
3
|
(|
Y
−µ
≤σ
=P
可以认为,Y 的取值几乎全部集中在
] 3
, 3
[ µ − σ µ + σ
区间内.这在统计学上称作“3 准则”
(三倍标准差原则).
σ
例1 (1)假设某地区成年男性的身高(单 位:cm)X~N(170,7.692),求该地区成年 男性的身高超过175cm的概率。
解: (1) 根据假设X~N(170,7.692),则
).
1 , 0 ( 69 ~
. 7
170 N X −
故事件{X>175}的概率为 P {X>175}= 1 − P { X ≤ 175 }
) 65 . 0 ( 1
69 ) . 7
170 (175
1 − = − Φ Φ
−
=
=0.2578
解:设车门高度为h cm,按设计要求 P(X≥ h)≤0.01
或 P(X< h)≥ 0.99,
下面我们来求满足上式的最小的h.
(2)公共汽车车门的高度是按成年男性与车门顶头 碰头机会在0.01以下来设计的,问车门高度应如何 确定?
因为X~N(170,7.692), ~ (0,1) 69
. 7
170
N X
−69 ) . 7 ( − 170 Φ h
≥
故 P(X< h)= 0.99
Φ
查表得 (2.33)=0.9901>0.99
69 . 7
− 170
所以 =2.33,
h
即 h=170+17.92 188
≈
设计车门高度为 188厘米时,可使 男子与车门碰头 机会不超过0.01.
P(X< h ) 0.99
≥
求满足 的最小的h .
若 r.v. X的概率密度为:
则称X服从区间( a, b)上的均匀分布,记作:
X ~ U[a, b]
) ( x
f
a b
≤ ≤
= −
, 其它 0
1 , )
( a x b
a x b
f
二、均匀分布(Uniform)
(注:X ~ U(a, b))
均匀分布常见于下列情形:
如在数值计算中,由于四舍五 入,小数点后某一位小 数引入的误差,例如对小数点后第一位进行四舍五入时,那 么一般认为误差服从(-0.5, 0.5)上的均匀分布。
若
X ~ U[a, b],则对于满足a ≤ c < d ≤ b
的c,d, 总有
a b
c dx d
x f
d X
c
P
dc
−
= −
=
≤
≤ } ∫ ( )
{
则称 X 服从参数为 的指数分布.
λ
指数分布常用于可靠性统计研究中,如元件的寿命.
三、指数分布:若 r.v X具有概率密度
<
=
−≥
0 0
) 0
( x
x x e
f
λx
λ λ > 0
常简记为 X~E( ) .
λ
Exponential Distribution
这一讲,我们介绍了连续型随机变量、概率密度函 数及性质。
还介绍了正态分布,它的应用极为广泛,在本课程 中我们一直要和它打交道。
后面第五章中,我们还将介绍为什么这么多随机现 象都近似服从正态分布;还要给出德莫佛极限定理的证明。
另外我们简单介绍了均匀分布和指数分布。
一、问题的提出
在实际中,人们常常对随机变量的函数
更感兴趣. 例如,已知圆轴截面直径 d 的分布,
4 d
2求截面面积 A=
π
的分布.
第二章第四节
随机变量函数的分布
又如:已知t=t0 时刻噪声电压 V的分布,
求功率 W=V2/R (R为电阻)的分布等.
t t
00
一般地、设随机变量X 的分布已知,Y=g (X) (设g是 连续函数),如何由 X 的分布求出 Y 的分布?
这个问题无论在实践中还是在理论上都是重要的.
二、离散型随机变量函数的分布
解: 当 X 取值 1,2,5 时,
Y 取对应值 5,7,13,
例1 设X
3 . 0
5 5
. 0 2
. 0
2 1
求 Y= 2X + 3 的概率函数.
~
3 0
13 5
0 2
0
7 5
. .
~ . Y
而且X取某值与Y取其对应值是两个同时发生 的事件,两者具有相同的概率.
故
如果g(xk)中有一些是相同的,把它们作适当 并项即可.
一般,若X是离散型 r.v ,X的概率函数为
X
n n
p p
p
x x
x
2 1
2
~ 1
则 Y=g(X) ~
n n
p p
p
x g x
g x
g
2 1
2
1
) ( ) ( )
(
如: X
−
1 . 0
1 6
. 0 3
. 0
0
~
1
则 Y=X2 的概率函数为:
4 0 6
0
1 0
. .
Y ~
三、连续型随机变量函数的分布
解:设Y的分布函数为 FY(y), 例2 设 X ~
< <
= 0 , 其它
4 0
, 8 ) /
( x x
x f
X求 Y=2X+8 的概率密度.
≤ ≤
FY(y)=P{ Y y } = P (2X+8 y )
=P{ X } = F
≤
X( )2
− 8 y 2
− 8 y
于是Y 的密度函数
2 ) 1 2
( 8 )
) (
( = = y − ⋅
dy f y y dF
f
Y Y X0)28(≠−yfX168)28(−=− yyfX
故
− < <
=
, 其它 0
16 8
32 , 8 )
(
y y
y f
Y2 ) 1 2
( 8 )
) (
( = = y − ⋅
dy f y y dF
fY Y X
注意到 0 < x < 4 时, fX ( x) ≠
0
即 8 < y < 16 时, ) 0 2
( y − 8 ≠ fX
此时
16 ) 8
2
( y − 8 = y − fX
Y=2X+8
< <
= 0 , 其它
4 0
, 8 ) /
( x x
x
f
X例3 设 X 具有概率密度 ,求Y=X
f
X ( x2)的概率密度.)
( y X y
P − ≤ ≤
=
求导可得
[ ]
≤
>
−
= +
=
0 ,
0
0 ,
) (
) 2 (
) 1 ) (
(
y y y
f y
y f dy
y y dF
f
Y Y X X当 y>0 时,
F
Y( y ) = P ( Y ≤ y ) = P ( X
2≤ y )
注意到 Y=X2 0,故当 y 0时,
≥ ≤ F
Y( y ) = 0
) ( x F
X)
( y F
Y解: 设Y和X的分布函数分别为 和 ,