1
关键词:
随机变量
概率分布函数 离散型随机变量 连续型随机变量 随机变量的函数
第二章 随机变量及其分布
§1 随机变量
常见的两类试验结果:
示数的——降雨量;
候车人数;
发生交通事故的次数…
示性的——明天天气(晴,云…);
化验结果(阳性,阴性)…
3
s e x
X=f(e) --为 S 上的
单值函数, X 为实数
中心问题:将试验结果数量化4
( )
B e X f e I
即
( ) ( ) .
P X I P B P e f e I
常见的两类随机变量
离散型的
连续型的
6
定义:取值至多可数的随机变量为离散 型的随机变量。概率分布 ( 分布律 ) 为
1
0,
1
i i
i
p p
P
… …
… …
x
1x
2x
ip
1p
2p
iX
§2 离散型随机变量及其分布
概率分布
写出所有可能取值
写出取每个可能取值相应的概率
8
例:若随机变量 X 的概率分布律为
求常数 c.
( ) 0,1, 2, , 0
! c
kP X k k
k
,
解:
0
1 { }
k
P X k
0
!
k k
c k
ce
c e
例:某人骑自行车从学校到火车站,一 路上要经过 3 个独立的交通灯,设各
灯工作独立,且设各灯为红灯的概率为
p
, 0<p<1 ,以 X 表示首次停车时所通过的交通灯数,求 X 的概率分布律。
11
( 0) ( )
1P X P A p ;
( 1) (
1 2) (1 )
P X P A A p p ;
2 1 2 3
( 2) ( ) (1 )
P X P A A A p p ;
3
1 2 3
( 3) ( ) (1 )
P X P A A A p ;
解:设 Ai={ 第 i 个灯为红灯 } ,则 P(Ai)=
p
, i=1,2,3 且 A1,A2,A3 相互独立。12
p
X 0 1 2 3
p p(1-p) (1-p)
2p
(1-p)
3
0 , 1 , 2 3
X X X
X S
注意:
为 的一个划分
几个重要的离散型随机变量
X
p q
0 1
p
随机变量只可 能取 0 、 1 两
个值
(p+q=1,p>0,q>0)
则称 X 服从参数为 p 的 0-1 分布,或两点分布
.若 X 的分布律为:
一、 0 - 1 分布
14
记为它的分布律还可以写为
~ 0 1( ) (1, ) X p 或 B p
( )
k(1 ) ,
1 k0,1.
P X k p p
k
对于一个随机试验,如果它的样本空间只 包含两个元素,即 ,我们总能在 S 上定义一个服从( 0 - 1 )分布的随机 变量。
1 2
{ , }
S
e e
1 2
0, ,
( ) 1, .
X X e e
e
当e 当e
来描述这个随机试验的结果。
16
检查产品的质量是否合格,对新生婴儿
的性别进行登记,检验种子是否发芽以
及前面多次讨论过的“抛硬币”试验都可以
用( 0 - 1 )分布的随机变量来描述 。
一个随机试验 , 设 A 是一随机事件 , 且 P (A)=p,(0<p<1). 若仅考虑事件 A 发生与否 , 定义一个服从参数为 p 的 0-1 分布的随 机变量 :
1, A ,
0, A A .
若发生
若不发生(即发生)
X
来描述这个随机试验的结果。只有两个
可能结果的试验,称为 Bernoulli 试验。
18
二、二项分布
即每次试验结果 在相同条件下 互不影响
重复进行
n 重贝努利试验:设试验 E 只有两个可能的 结果: ,p(A)=p,0<p<1, 将 E 独立地重 复进行 n 次,则称这一串重复的重复 独立试验独立 为 n 重贝努利试验。
A与A
独立重复地抛 n 次硬币,每次只有两个可能 的结果 : 正面,反面,
, , A A
1 2
P 出现正面
1 6
P A
将一颗骰子抛 n 次,设 A={ 得到 1 点 } ,则 每次试验只有两个结果:
20
如果是不放回抽样呢?
, , A A
1 2
P A
从 52 张牌中有放回地取 n 次,设 A={ 取到
红牌 } ,则每次只有两个结果:
21
设 A 在 n 重贝努利试验中发生 X 次,则
( ) nk k (1 )n k 0 1
P X
k
C p
p
,k
,, ,n
~ ( )
X B n p ,
0
1 ( )n n nk k n k 1
k
p q C p q q p
注: 其中
并称 X 服从参数为 p 的二项分布,记
3 1 2 3
( 0) ( ) (1 ) P X P A A A p
3 1 2 3
( 3) ( )
P X P A A A p
2 2 3 2
1 2 3 1 2 3 1 2 3 3
( 2) ( ) (1 )
P X P A A A A A A A A A C p p
1 1 3 1
1 2 3 1 2 3 1 2 3 3
( 1) ( ) (1 )
P X P A A A A A A A A A C p p
(P X k) C pnk k (1 p)n k , k 0,1, 2, , n 一一
推导:设 A
i={ 第 i 次 A 发生 } ,先设 n
=3
例:由 6 位品酒师独立投票评定某种酒是否为 优质酒。若 6 位中有 4 位投票同意,则定该 酒为优质酒,设每位品酒师作出正确判断的 概率为 p , 0<p<1 。求:
( 1 )若该酒为优质酒时,能作出正确判断的 概率 α ;
( 2 )若该酒不为优质酒时,能作出正确判断 的概率 β.
24
6 6
6 4
(1) k k (1 ) k
k
C p p
解:
6 6
6 3
(2)
k k(1 )
kk
C p p
例:有一大批产品,其验收方案如下:
先作第一次检验 , 从中任取 10 件,经
检验无次品接受这批产品,次品数大于
2 拒收;否则作第二次检验,从中任取
5 件,仅当 5 件中无次品便接受这批产
品,设产品的次品率为 p .求这批产品
能被接受的概率 .
26
( 0) (1 2 Y 0) 且=
P X P X
( 0) (1 2) ( 0)
P X P X P Y
10 9 2 8 5
(1 p) [10 (1p p) 45 (1p p) ] (1 p)
( )
P A
( 0) ( 1) ( 2)) ( 0)
P X P X P X P Y
解:设 A={ 接受该批产品 } 。 设 X 为第一次抽 得的次品数, Y 为第 2 次抽得的次品数 .
则 X ~ B(10,p) , Y ~ B(5,p) ,且 {X=i} 与 {Y=j} 独 立。
27
例:设随机变量 X ~ (100, 0.05),B
( 10) ( 10) P X P X
求和
Excel Excel
使用表单:在表单的任一单元格输入“=”
( )F
在主菜单中点击“插入”“函数”
在选择类别的下拉式菜单中选择“统计”
BINOMDIST
选择“”点击“确定”
"0.98852759"
点击“确定”即在单元格中出现。
_ 10, 100, _ 0.05,
Number s Trials Probability s Cumulative TRUE
在函数参数表单中输入
“”
( 10)
"0.016715884"
P X Cumulative TRUE
Cumulative FALSE
计算,只要将上述步骤中“”
改为“”即出现。
泊松分布 (Poisson 分布 )
( ) 0,1, 2, , 0
! ,
ke
P X k k
k
~ ( ) X
若随机变量 X 的概率分布律为
称 X 服从参数为 λ 的泊松分布,记
30
~ (4.8)
X ,
求 (1) 随机观察 1 个单位时间,至少有 3 人候 车的概率;
(2) 随机独立观察 5 个单位时间,恰有 4 个 单位时间至少有 3 人候车的概率。
例:设某汽车停靠站单位时间内候车人数
31
1 (P X 3) 1 P X( 0) P X( 1) P X( 2)
解:
4 4 5
2 5 3
~ (5, ), ( 3) 0.8580 ( 4) (1 ) 0.7696.
Y
Y B p p P X
P Y C p p
设个单位时间内有个单位时间是“至少有人候车”,
则其中,于是
4.8 4.82
1 (1 4.8 ) 0.8580 e 2!
10, 0.1 ,
nk k
1
n k k,
n p
C p p e np
k
二项分布与泊松分布有以下
近似公式:
当 时
! 其中
33
1 n k !( ! )!
k 1 n kk k
n n
k n k n n
C p p
事实上,
( 1)...( 1)
1 1
!
n k
k
k
n n n k
n n
k n
e k
k
!
34
例:某地区一个月内每 200 个成年人中有 1 个会患上某种疾病,设各人是否患病相互独 立。若该地区一社区有 1000 个成年人,求 某月内该社区至少有 3 人患病的概率。
5 5 2 5
5,
5 5
( 3) 1 0.8753
0! 1! 2!
e e e
P X
利用泊松分布进行近似计算,取
36
Excel Excel
注:泊松分布也可以使用表单:在表单的任一单元格输入“=”
( )F
在主菜单中点击“插入”“函数”
在选择类别的下拉式菜单中选择“统计”
POISSON
选择“”点击“确定”
2, 5,
X Mean Cumulative TRUE
在函数参数表单中输入“”
"0.124652019"
点击“确定”即在单元格中出现。
( 3) 1 ( 2) 0.875347981 P X P X
称 X 服从超几何分布
1 1 2
1 2
( ) , , 1,..., ,
max(0, ), min( , ).
k n k a b
n N
P X k C C k l l l C
l n b l a n
其中,
超几何分布
若随机变量 X 的概率分布律为
38
例:一袋中有 a 个白球, b 个红球, a + b
= N, 从中不放回地取 n 个球,设每次取到各 球的概率相等,以 X 表示取到的白球数,则 X 服从超几何分布。
称 X 服从参数 p 的几何分布
( ) (1 ) ,k 1 1, 2,3,..., 0 1.
P X k p p k p
几何分布
若随机变量 X 的概率分布律为
40
例:从生产线上随机抽产品进行检测,设 产品的次品率为 p , 0<p<1 ,若查到一只 次品就得停机检修,设停机时已检测到 X 只产品,则 X 服从参数 p 的几何分布。
称 X 服从参数为 (r,p) 的巴斯卡分布 .
1
( ) 1 (1 ) , , 1, 2,..., 0 1.
r r k r
P X k C pk p k r r r
r p
其中为正整数,
巴斯卡分布
若随机变量 X 的概率分布律为
42
例:独立重复地进行试验,每次试验的结果 为成功或失败,每次试验中成功的概率均为 p
, 0<p<1, 试验进行到出现 r 次成功为止,以 X 表示试验次数,则 X 服从参数为 (r,p) 的巴斯 卡分布。
§3 随机变量的分布函数
, , ( )
X x P X x x
随机变量对实变量应为的函数
, ,
( ) ( )
X x
F x P X x X
定义:随机变量对任意实数称函数
为的概率分布函 数,简称分布函数。
( )
F x 的几何意义:
x
X 任何随机变量
都有相应的分 布函数
44
1 2 2 1
0 P x ( X x ) F x ( ) F x ( )
1) 0 F x ( ) 1
( )的性质:
F x
2) ( ) F x 单调不减,且 F ( ) 0 , F ( ) 1
3) ( ) F x 右连续即 , F x ( 0) F x ( ).
例: p>0,q>0,q+p=1.Xp 0q 1p
1
X F x P X
求的概率分布函数及的值。
46
解:
0 0
( ) 0 1
1 1
x
F x P X x q x x
( 1)
P X p
( P X 1) p x 1 F x ( ) 1
比较 与 当 时,
0 1
q
1
x
F x
一般地,设离散型随机变量的分布律为X
X
x
p
一k
1一2一P
k k的分布函数为 由概率的可列可加性得X
} {
, 2 , 1 ,
) (
k k
k
x X
P p
k x
x x
F
其跳跃值为
处有跳跃,
在
分布函数
x x
k
k
p x
F ) (
48
例:设一物体在 A,B 两点间移动, A,B 之间 距离 3 个单位。该物体停留在 A,B 两点的概率 各为 1/4 ,落在 A,B 间任一子区间的概率与区 间长度成正比。设它离 A 点的距离为 X ,求 X 的分布函数。
0, 0 ( ) ( ) 1 0 3
4 6
1 3
x
F x P X x x x
x
(0 3) 1, P X 解:根据题意,
( 0) ( 3) 1/ 4, (0 3) 3 , P X P X P X k
(0 3) 1 ( 0) ( 3) 1/ 2, 1/ 6 P X P X P X k
§4 连续型随机变量及其概率密度
定义 : 对于随机变量 X 的分布函数 若存在非 负的函数 使对于任意实数 有: f x( ),
( )
x( ) F x f t dt
( ), F x
,
x
则称 X 为连续型随机变量,
( )
f x X
其中称为的概率密度函数,简称 概率密度。
( )
f x
的性质:1) ( ) 0 f x
2) + f x dx( ) 1
21
1 2 2 1
1 2
( )
x ( ) ( ) 0
x
x x x x
P x X x f t dt P X a
3)对于任意的实数 ,
( )
y
f x
面积为1
x
1x
2 1 2
P x X x
52
与物理学中的质量线密度的定义相类似
( ) ( )
P x X x x f x x
0 0
( ) ( ) ( )
( ) '( )
x x
F x x F x P x X x x
f x F x lim lim
x x
( )
f x
的性质:4) 在 f x ( ) 连续点 , x F x '( ) f x ( )
( )
即在
f x
的连续点, ] ( )
X x x x x f x x
这表示落在点附近(的概率近似等于
例:设 X 的概率密度为
(1) 求常数 c 的值;
(2) 写出 X 的概率分布函数;
(3) 要使 求 k 的值。
0 1 ( ) 2 9 3 6
0
c x
f x x
其他
( ) 2
P X k ,3
54
解: 1 1
f t dt( ) 2 ( )F x P X x
x f t dt( )2
3 c
1 6
0 3
2
c dt 9 dt
c 13
0 1 0
1
0 3
0 0 1 0 1 13
1 3
31 2
3 6
3 9
1 6
x
x
x
dt x
dt x
dt dt x
x
0 0
3 0 1 1 3 1 3 (2 3) / 9 3 6 1 6
x
x x
x
x x
x
55
( ) 2 ( ) 4.5P X
k
3F k
k
3 使56
例:一银行服务需要等待,设等待时间 X
(分钟)的概率密度为
1 10
, 0
( ) 10
0, 0
x
e x
f x
x
某人进了银行,且打算过会儿去办另一件事,于是先 等待,如果超过 15 分钟还没有等到服务就离开,设他 实际的等待时间为 Y , (1) 求 Y 的分布函数 ;(2) 问 Y 是离散型随机变量吗?连续型随机变量吗?
10
0, 0
( ) ( ) 1 , 0 15
1, 15
y
y
F y P Y y e y
y
解:(1)
1.5
[0,15]
{ 15} 0
Y
P Y e
Y
(2) 的取值范围为,故不是离散量;
又,因此也不是连续量。
几个重要的连续量
均匀分布定义: X 具有概率密度 1 ( , ) ( )
0
x a b f x b a
其他
称 X 在区间 (a,b) 上服从均匀分布,记为 X ~ U (a,b) f x
0 a b x
b a1
59
( ) c l 1
c
a c c l b
P c X c l dt l c
b a b a
设
- - - -与 无关
0 ( )
1
x a
F x x a a x b b a
x b
F x
0 a b x
1
例:( 1 )在区间 (-1,2) 上随机取一数 X ,试 写出 X 的概率密度。并求 的值;
( 2 )若在该区间上随机取 10 个数,求 10 个 数中恰有两个数大于 0 的概率。
( 0) P X
61
1 , 1 2 ( ) 3
0, f x x
其他
( 0) 2 , P X 3
~ (10, )2
Y B
3 2 2 810
2 1
( 2)
3 3
P Y C
解:( 1 ) X 为在区间 (-1,2) 上均匀分 布
( 2 )设 10 个数中有 Y 个数大于 0 , 则:
例:杭州某长途汽车站每天从早上 6 点(第一 班车)开始,每隔 30 分钟有一班车开往上海。
王先生在早上 6:20 过 X 分钟到达车站,设 X 服从( 0 , 50 )上的均匀分布,
( 1 )求王先生候车时间不超过 15 分钟的概率
;
( 2 )如果王先生一月中有两次按此方式独立 地去候车,求他一次候车不超过 15 分钟,另一 次候车大于 10 分钟的概率。
63
6:20 6:30 6:45 7:00 7:10
解: ( 1 ) P( 候车时间不超过 15 钟 )=25/50
=0.5
(2) P( 候车时间大于 10 分钟 )=30/50=3/5
6:30 6:50
P( 一次候车时间不超过 15 分钟,另一次时间 大于 10 分钟 )=2×1/2×3/5=3/5
指数分布
其中 λ>0 为常数,则称 X 服从参数为 λ 的 指数分布。记为
0 ( ) 0 0
e x x
f x x
~ ( ) ~ ( )
X Exp
或X E
定义:设 X 的概率密度为
65
1 0
( ) 0 0 e
xx
F x x
0 0
( )
( )
P X t t P X t
0 0
1 ( )
1 ( ) F t t
tF t e
P X ( t )
X 具有如下的无记忆性:
例:某大型设备在任何长度为t的区间内
发生故障的次数N t服从参数为λt
的Poi sson分布,记设备无故障运行的时间为T.
1 求T的概率分布函数;
2 已知设备无故障运行10个小时,
求再无故障运行8个小时的概率。
67
P N t k et t k / !, k k 0,1, 2, 一 一 1
0 0
当时, t F t
T
1
F t
T P T t
P T t
0 1 0 1
当时,
t
F t
T P N t
e
t
18 8
2 18 | 10 8
10
P T T P T e P T
P T
68
正态分布
定义:设 X 的概率密度为
2 2
( )
1 2
( )
2
x
f x e x
,
其中 为常数,称 X 服从参数为 的正态分布 (Gauss 分 布 ) ,
记为
~ ( , 2) X N
, 0
,可以验证:
f x dx ( ) 1
+
f x dx ( )
1 222
t x t
e dt
令
2
1 2
2
t
e dt
70
2 2
( )
2 2
x y
I e dxdy
2
2 2
0 0
r
d re dr
I 2
( ) 1
f x dx
2
2
t
I
e dt
记
max
1 ( )
2 ( ) 1
2 3 ( ) 0
关于对称
x
f x x
f f
lim f x
2 2
( ) 2
2
( ) 1
2
~ ( , ):
,
x
f x e x
X N
正态概率密度函数
2 2
( )
1 2
( )
2
x
f x e x
,
, ,
( ) ,
;
σμ
f x x
当固定改变的大小时
图形的形状不变只是沿 着轴作平移变换
, , ( )
, , , , ,
. μσf x
σσ
当固定改变的大小时图形的对称轴
不变而形状在改变越小图形越高越瘦越大 图形越矮越胖
称 μ 为位置参数 ( 决定对称轴位置 ) σ 为尺度参数 ( 决定曲线分散性 )
~ ( ,
2) X N
0
f x
1 x
5
5
0.51.0fxx1.50.7980.3990.2660
X 的取值呈中间多,两头少,对称的特性。
当固定 μ 时, σ 越大,曲线的峰越低,落 在 μ 附近的概率越小,取值就越分散,即 σ 是反映 X 的取值分散性的一个指标。
在自然现象和社会现象中,大量随机变量服 从或近似服从正态分布。
正态分布下的概率计算
t σ e
x
F x σ
μ t
2 d ) 1
( 2
2
2 )
(
}
{X x
P
?
~ (0 1)
若,,称服从标准正态分布 Z N Z
2
1 2
2
x
Z x e
的概率密度:
2
1 2
( )
2
x t
Z x e dt
的分布函数:
x
x 1
( ) y x
( )x
( x)
0
y
x
x
x
~ ( ,
X N
2) 当时( ) ( ) ( )
b a P a X b
(
P a X
b
)
(作变换:)
x t
2 2
( )
1
22
b x
a
e dx
2
1
22
b t
a
e dt
~ ( ,X N 2) 当时
例:
X ~ ( , N
2)
( ) ( )
( ) ( )
( )
(1) ( 1) 2 (1) 1 0.6826
P X P X
P X
( 2 ) 2 (2) 1 0.9544 P X
(P X 3 ) 2 (3) 1 0.9974
99.74%
3 2
68.26%
2 3
95.44%
例:用天平称一实际重量为 的物体,天平的读 数为随机变量 ,设 时,
( 1 )求读数与 的误差小于 0.005 的概率;
( 2 )求读数至少比 多 0.0085 的概率。
~ ( , 0.01 )
2X N a
X
a a
a
82
(
P X a
0.005) 解:(1)2 0.6915 1 0.3830
查附表
===
0.005 0.005
( ) ( )
0.01 0.01
2 (0.5) 1
83
( 0.0085)
P X a Excel
Excel
注:计算使用表单:
在表单的任一单元格输入“=”
( )F
在主菜单中点击“插入”“函数”
在选择类别的下拉式菜单中选择“统计”
NORMDIST
选择“”点击“确定”
0.0085, 0, _ 0.01,
X Mean Standard dev Cumulative TRUE
在函数参数表单中输入
“”
"0.802337508"
点击“确定”即在单元格中出现。
例:一批钢材 ( 线材 ) 长度
(1) 若 μ =100 , σ =2 ,求这批钢材长度小于 97.8cm 的概率;
(2) 若 μ =100 ,要使这批钢材的长度至少
有 90% 落在区间 (97,103) 内,问 σ 至 多取何值?
( ) ~ ( , 2) X cm N
85
( P X 97.8)
解:(1)
( 100 97.8 100)2 2
X
P
1 (1.1)
1 0.8643 0.1357
查附表
===
97 103 90%
(2)需: P X
103 100 97 100 3
( ) ( ) 2 ( ) 1 90%
即
( ) 0.953
3
1.645
1.823797.8 100
( )
2
例:设一天中经过一高速公路某一入口的重型车辆 数 X 近似服从 ,已知有 25 %的天数超过 400 辆,有 33 %的天数不到 350 辆,求
( , 2 ) N