• 沒有找到結果。

§1 随机变量

N/A
N/A
Protected

Academic year: 2021

Share "§1 随机变量"

Copied!
118
0
0

加載中.... (立即查看全文)

全文

(1)

1

关键词:

随机变量

概率分布函数 离散型随机变量 连续型随机变量 随机变量的函数

第二章 随机变量及其分布

(2)

§1 随机变量

常见的两类试验结果:

示数的——降雨量;

候车人数;

发生交通事故的次数…

示性的——明天天气(晴,云…);

化验结果(阳性,阴性)…

(3)

3

s e x

X=f(e) --为 S 上的

单值函数, X 为实数

中心问题:将试验结果数量化

(4)

4

(5)

( )

Be Xf eI

  ( )( ).

P X I   P BP e f eI

常见的两类随机变量

离散型的

连续型的

(6)

6

定义:取值至多可数的随机变量为离散 型的随机变量。概率分布 ( 分布律 ) 为

1

0,

1

  

i i

i

p p

P

x

1

x

2

x

i

p

1

p

2

p

i

X

§2 离散型随机变量及其分布

(7)

概率分布

写出所有可能取值

写出取每个可能取值相应的概率

(8)

8

例:若随机变量 X 的概率分布律为

求常数 c.

( ) 0,1, 2, , 0

! c

k

P X k k

k

 

  ,   

(9)

0

1 { }

k

P X k



  

0

!

k k

c k



  ce

c e

 

(10)

例:某人骑自行车从学校到火车站,一 路上要经过 3 个独立的交通灯,设各

灯工作独立,且设各灯为红灯的概率为

p

, 0<p<1 ,以 X 表示首次停车时所

通过的交通灯数,求 X 的概率分布律。

(11)

11

( 0) ( )

1

P X   P Ap

( 1) (

1 2

) (1 )

P X   P A A   p p

2 1 2 3

( 2) ( ) (1 )

P X   P A A A   p p

3

1 2 3

( 3) ( ) (1 )

P X   P A A A   p

解:设 Ai={ 第 i 个灯为红灯 } ,则 P(Ai)=

p

, i=1,2,3 且 A1,A2,A3 相互独立。

(12)

12

p

X 0 1 2 3

p p(1-p) (1-p)

2

p

(

1-p)

3

     

 

0 , 1 , 2 3

X X X

X S

  

 注意:

为 的一个划分

(13)

几个重要的离散型随机变量

X

p q

0 1

p

随机变量只可 能取 0 、 1 两

个值

(p+q=1,p>0,q>0)

则称 X 服从参数为 p 的 0-1 分布,或两点分布

.

若 X 的分布律为:

一、 0 - 1 分布

(14)

14

记为它的分布律还可以写为

~ 0 1( ) (1, ) XpB p

( )

k

(1 ) ,

1 k

0,1.

P Xkpp

k

(15)

对于一个随机试验,如果它的样本空间只 包含两个元素,即 ,我们总能在 S 上定义一个服从( 0 - 1 )分布的随机 变量。

1 2

{ , }

S

e e

1 2

0, ,

( ) 1, .

X X e e

e

 

    

当e 当e

来描述这个随机试验的结果。

(16)

16

检查产品的质量是否合格,对新生婴儿

的性别进行登记,检验种子是否发芽以

及前面多次讨论过的“抛硬币”试验都可以

用( 0 - 1 )分布的随机变量来描述 。

(17)

一个随机试验 , 设 A 是一随机事件 , 且 P (A)=p,(0<p<1). 若仅考虑事件 A 发生与否 , 定义一个服从参数为 p 的 0-1 分布的随 机变量 :

1, A ,

0, A A .

若发生

若不发生(即发生)

 

X



来描述这个随机试验的结果。只有两个

可能结果的试验,称为 Bernoulli 试验。

(18)

18

二、二项分布

即每次试验结果 在相同条件下 互不影响

重复进行

n 重贝努利试验:设试验 E 只有两个可能的 结果: ,p(A)=p,0<p<1, 将 E 独立地重 复进行 n 次,则称这一串重复的重复 独立试验独立 为 n 重贝努利试验。

AA

(19)

独立重复地抛 n 次硬币,每次只有两个可能 的结果 : 正面,反面,

, , A A

  1 2

P 出现正面 

  1 6

P A

将一颗骰子抛 n 次,设 A={ 得到 1 点 } ,则 每次试验只有两个结果:

(20)

20

如果是不放回抽样呢?

, , A A

  1 2

P A

从 52 张牌中有放回地取 n 次,设 A={ 取到

红牌 } ,则每次只有两个结果:

(21)

21

设 A 在 n 重贝努利试验中发生 X 次,则

( ) nk k (1 )n k 0 1

P X

k

C p

p

k

,, ,

n

~ ( )

X B n p

0

1 ( )n n nk k n k 1

k

p q C p q q p

 

注: 其中

并称 X 服从参数为 p 的二项分布,记

(22)

3 1 2 3

( 0) ( ) (1 ) P X P A A A   p

3 1 2 3

( 3) ( )

P X P A A A p

2 2 3 2

1 2 3 1 2 3 1 2 3 3

( 2) ( ) (1 )

P X P A A A A A A A A A C p p

1 1 3 1

1 2 3 1 2 3 1 2 3 3

( 1) ( ) (1 )

P X   P A A A A A A A A A C p p

(P Xk)  C pnk k (1 p)n k , k  0,1, 2, , n 一一

推导:设 A

i

={ 第 i 次 A 发生 } ,先设 n

=3

(23)

例:由 6 位品酒师独立投票评定某种酒是否为 优质酒。若 6 位中有 4 位投票同意,则定该 酒为优质酒,设每位品酒师作出正确判断的 概率为 p , 0<p<1 。求:

( 1 )若该酒为优质酒时,能作出正确判断的 概率 α ;

( 2 )若该酒不为优质酒时,能作出正确判断 的概率 β.

(24)

24

6 6

6 4

(1) k k (1 ) k

k

C p p

解:

6 6

6 3

(2)

k k

(1 )

k

k

C p p

  

(25)

例:有一大批产品,其验收方案如下:

先作第一次检验 , 从中任取 10 件,经

检验无次品接受这批产品,次品数大于

2 拒收;否则作第二次检验,从中任取

5 件,仅当 5 件中无次品便接受这批产

品,设产品的次品率为 p .求这批产品

能被接受的概率 .

(26)

26

(   0) (1   2 Y 0) 且=

P X P X

( 0) (1 2) ( 0)

P X P X P Y

      

10 9 2 8 5

(1 p) [10 (1p p) 45 (1p p) ] (1 p)

   

( )

P A

( 0) ( 1) ( 2)) ( 0)

P X P X P X P Y

   

解:设 A={ 接受该批产品 } 。 设 X 为第一次抽 得的次品数, Y 为第 2 次抽得的次品数 .

则 X ~ B(10,p) , Y ~ B(5,p) ,且 {X=i} 与 {Y=j} 独 立。

(27)

27

例:设随机变量 X ~ (100, 0.05),B

( 10) ( 10) P XP X

求和

(28)

Excel Excel

使用表单:在表单的任一单元格输入“=”

( )F

在主菜单中点击“插入”“函数”

 在选择类别的下拉式菜单中选择“统计”

BINOMDIST

 选择“”点击“确定”

"0.98852759"

点击“确定”即在单元格中出现。

_ 10, 100, _ 0.05,

Number s Trials Probability s Cumulative TRUE

在函数参数表单中输入

“”

( 10)

"0.016715884"

P X Cumulative TRUE

Cumulative FALSE

计算,只要将上述步骤中“”

改为“”即出现。

(29)

泊松分布 (Poisson 分布 )

( ) 0,1, 2, , 0

!

ke 

P X k k

k

~ ( ) X  

若随机变量 X 的概率分布律为

称 X 服从参数为 λ 的泊松分布,记

(30)

30

~ (4.8)

X

求 (1) 随机观察 1 个单位时间,至少有 3 人候 车的概率;

(2) 随机独立观察 5 个单位时间,恰有 4 个 单位时间至少有 3 人候车的概率。

例:设某汽车停靠站单位时间内候车人数

(31)

31

 1 (P X   3) 1 P X(  0) P X(  1) P X( 2)

解:

 

4 4 5

2 5 3

~ (5, ), ( 3) 0.8580 ( 4) (1 ) 0.7696.

Y

Y B p p P X

P Y C p p

设个单位时间内有个单位时间是“至少有人候车”,

则其中,于是

4.8 4.82

1 (1 4.8 ) 0.8580 e 2!

 

(32)

 

10, 0.1 ,

nk k

1

n k k

,

n p

C p p e np

k

 

 

  

二项分布与泊松分布有以下

近似公式:

当 时

! 其中

(33)

33

1n k !( ! )!

   

k 1 n k

k k

n n

k n k n n

C p p

事实上,

   

( 1)...( 1)

1 1

!

n k

k

k

n n n k

n n

k n

  

e k

k

(34)

34

例:某地区一个月内每 200 个成年人中有 1 个会患上某种疾病,设各人是否患病相互独 立。若该地区一社区有 1000 个成年人,求 某月内该社区至少有 3 人患病的概率。

(35)

5 5 2 5

5,

5 5

( 3) 1 0.8753

0! 1! 2!

e e e

P X

 

利用泊松分布进行近似计算,取

(36)

36

Excel Excel

注:泊松分布也可以使用表单:在表单的任一单元格输入“=”

( )F

在主菜单中点击“插入”“函数”

 在选择类别的下拉式菜单中选择“统计”

POISSON

 选择“”点击“确定”

2, 5,

X Mean Cumulative TRUE

在函数参数表单中输入“”

"0.124652019"

点击“确定”即在单元格中出现。

( 3) 1 ( 2) 0.875347981 P X   P X

(37)

称 X 服从超几何分布

1 1 2

1 2

( ) , , 1,..., ,

max(0, ), min( , ).

k n k a b

n N

P X k C C k l l l C

l n b l a n

 

 

  

其中,

超几何分布

若随机变量 X 的概率分布律为

(38)

38

例:一袋中有 a 个白球, b 个红球, a + b

= N, 从中不放回地取 n 个球,设每次取到各 球的概率相等,以 X 表示取到的白球数,则 X 服从超几何分布。

(39)

称 X 服从参数 p 的几何分布

( ) (1 ) ,k 1 1, 2,3,..., 0 1.

P X k p p k  p

几何分布

若随机变量 X 的概率分布律为

(40)

40

例:从生产线上随机抽产品进行检测,设 产品的次品率为 p , 0<p<1 ,若查到一只 次品就得停机检修,设停机时已检测到 X 只产品,则 X 服从参数 p 的几何分布。

(41)

称 X 服从参数为 (r,p) 的巴斯卡分布 .

1

( ) 1 (1 ) , , 1, 2,..., 0 1.

r r k r

P X k C pk p k r r r

r p

其中为正整数,  

巴斯卡分布

若随机变量 X 的概率分布律为

(42)

42

例:独立重复地进行试验,每次试验的结果 为成功或失败,每次试验中成功的概率均为 p

, 0<p<1, 试验进行到出现 r 次成功为止,以 X 表示试验次数,则 X 服从参数为 (r,p) 的巴斯 卡分布。

(43)

§3 随机变量的分布函数

, , ( )

X x P X x x

随机变量对实变量应为的函数

, ,

( ) ( )

X x

F x P X x X

定义:随机变量对任意实数称函数

为的概率分布函 数,简称布函数。

( )

F x 的几何意义:

x

X 任何随机变量

都有相应的分 布函数

(44)

44

1 2 2 1

0  P x (  Xx )  F x ( )  F x ( )

1) 0  F x ( ) 1 

( )的性质:

F x

2) ( ) F x 单调不减,且 F (   ) 0 , F (   ) 1

3) ( ) F x 右连续即 , F x (  0)  F x ( ).

(45)

例: p>0,q>0,q+p=1.Xp 0q 1p

 

1

X F x P X

求的概率分布函数及的值。

(46)

46

解:

 

0 0

( ) 0 1

1 1

x

F x P X x q x x

 

( 1)

P X   p

( P X   1) p x  1 F x ( ) 1 

比较 与 当 时,

0 1

q

1

x

 

F x

(47)

一般地,设离散型随机变量的分布律为X

X

x

p

k

12

P

k k

的分布函数为 由概率的可列可加性得X

} {

, 2 , 1 ,

) (

k k

k

x X

P p

k x

x x

F

 其跳跃值为

处有跳跃,

分布函数 

x x

k

k

p x

F ) (

(48)

48

例:设一物体在 A,B 两点间移动, A,B 之间 距离 3 个单位。该物体停留在 A,B 两点的概率 各为 1/4 ,落在 A,B 间任一子区间的概率与区 间长度成正比。设它离 A 点的距离为 X ,求 X 的分布函数。

(49)

0, 0 ( ) ( ) 1 0 3

4 6

1 3

x

F x P X x x x

x

  



(0 3) 1, P X 解:根据题意,

( 0) ( 3) 1/ 4, (0 3) 3 , P X P X   P X   k

(0 3) 1 ( 0) ( 3) 1/ 2, 1/ 6 P X   P X   P X  k

(50)

§4 连续型随机变量及其概率密度

定义 : 对于随机变量 X 的分布函数 若存在非 负的函数 使对于任意实数 有: f x( ),

( )

x

( ) F x f t dt

 



( ), F x

,

x

则称 X 为连续型随机变量,

( )

f x X

其中称为的概率密度函数,简称 概率密度。

(51)

( )

f x

的性质:

1) ( ) 0 f x

2) + f x dx( ) 1



 

2

1

1 2 2 1

1 2

( )

x ( ) ( ) 0

x

x x x x

P x X x f t dt P X a

 

 

3)对于任意的实数 ,

( )

y

f x

面积为1

x

1

x

2

1 2

P x X x 

(52)

52

与物理学中的质量线密度的定义相类似

( ) ( )

P xX     x x f x   x

0 0

( ) ( ) ( )

( ) '( )

x x

F x x F x P x X x x

f x F x lim lim

x x

   

     

( )

f x

的性质:

4) 在 f x ( ) 连续点 , x F x '( )  f x ( )

( )

即在

f x

的连续点

, ] ( )

X x x x  x f x x

这表示落在点附近(的概率近似等于

(53)

例:设 X 的概率密度为

(1) 求常数 c 的值;

(2) 写出 X 的概率分布函数;

(3) 要使 求 k 的值。

0 1 ( ) 2 9 3 6

0

c x

f x x

  

   

 其他

( ) 2

P X k  ,3

(54)

54

解:  1 1

 f t dt( )

 2 ( )F x P X x

x f t dt( )

2

3 c

1 6  

0 3

2

c dt 9 dt

 c 13

0 1 0

1

0 3

0 0 1 0 1 13

1 3

31 2

3 6

3 9

1 6

 



 

 



 

x

x

x

dt x

dt x

dt dt x

x

0 0

3 0 1 1 3 1 3 (2 3) / 9 3 6 1 6

 

  

 



x

x x

x

x x

x

(55)

55

 

( ) 2 ( ) 4.5

P X

k

 3

F k

 

k

3 使

(56)

56

例:一银行服务需要等待,设等待时间 X

(分钟)的概率密度为

1 10

, 0

( ) 10

0, 0

x

e x

f x

x

 

  

某人进了银行,且打算过会儿去办另一件事,于是先 等待,如果超过 15 分钟还没有等到服务就离开,设他 实际的等待时间为 Y , (1) 求 Y 的分布函数 ;(2) 问 Y 是离散型随机变量吗?连续型随机变量吗?

(57)

10

0, 0

( ) ( ) 1 , 0 15

1, 15

y

y

F y P Y y e y

y

 

 

      

 



解:(1)

1.5

[0,15]

{ 15} 0

Y

P Y   e

Y

(2) 的取值范围为,故不是离散量;

又,因此也不是连续量。

(58)

几个重要的连续量

均匀分布定义: X 具有概率密度 1 ( , ) ( )

0

x a b f x b a

 

  

 其他

称 X 在区间 (a,b) 上服从均匀分布,记为 X ~ U (a,b) f x 

0 a b x

b a1

(59)

59

( ) c l 1

c

a c c l b

P c X c l dt l c

b a b a

   

  

- - - -与 无关

0 ( )

1

x a

F x x a a x b b a

x b

 

   

 F x 

0 a b x

1

(60)

例:( 1 )在区间 (-1,2) 上随机取一数 X ,试 写出 X 的概率密度。并求 的值;

( 2 )若在该区间上随机取 10 个数,求 10 个 数中恰有两个数大于 0 的概率。

( 0) P X

(61)

61

1 , 1 2 ( ) 3

0, f x x

  

 

 其他

( 0) 2 , P X   3

~ (10, )2

Y B

3 2 2 8

10

2 1

( 2)

3 3

P Y C    

          解:( 1 ) X 为在区间 (-1,2) 上均匀分

( 2 )设 10 个数中有 Y 个数大于 0 , 则:

(62)

例:杭州某长途汽车站每天从早上 6 点(第一 班车)开始,每隔 30 分钟有一班车开往上海。

王先生在早上 6:20 过 X 分钟到达车站,设 X 服从( 0 , 50 )上的均匀分布,

( 1 )求王先生候车时间不超过 15 分钟的概率

( 2 )如果王先生一月中有两次按此方式独立 地去候车,求他一次候车不超过 15 分钟,另一 次候车大于 10 分钟的概率。

(63)

63

6:20 6:30 6:45 7:00 7:10

解: ( 1 ) P( 候车时间不超过 15 钟 )=25/50

=0.5

(2) P( 候车时间大于 10 分钟 )=30/50=3/5

6:30 6:50

P( 一次候车时间不超过 15 分钟,另一次时间 大于 10 分钟 )=2×1/2×3/5=3/5

(64)

指数分布

其中 λ>0 为常数,则称 X 服从参数为 λ 的 指数分布。记为

0 ( ) 0 0

e x x

f x x

 

  

~ ( ) ~ ( )

X Exp

X E

定义:设 X 的概率密度为

(65)

65

1 0

( ) 0 0 e

x

x

F x x

 

   

0 0

( )

( )

P X t t P X t

  

0 0

1 ( )

1 ( ) F t t

t

F t e

 

 

  P X (  t )

X 具有如下的无记忆性:

(66)

 

 

 

例:某大型设备在任何长度为t的区间内

发生故障的次数N t服从参数为λt

的Poi sson分布,记设备无故障运行的时间为T.

1 求T的概率分布函数;

2 已知设备无故障运行10个小时,

求再无故障运行8个小时的概率。

(67)

67

     

P N t k ett k / !, k k 0,1, 2, 一 一 1

 

0 0

当时, tF t

T

   

1

 

F t

T

P T t

  

P T t

     

0 1 0 1

当时,

t

F t

T  

P N t

 

e

t

  

18 8

2 18 | 10 8

10

P T T P T e P T

P T

(68)

68

正态分布

定义:设 X 的概率密度为

2 2

( )

1 2

( )

2

x

f x e x



    

其中 为常数,称 X 服从参数为 的正态分布 (Gauss 分 布 ) ,

记为

~ ( , 2) X N  

, 0

 

    

 

,

(69)

可以验证: 

f x dx ( ) 1



+

f x dx ( )



1 22

2

t x t

e dt









2

1 2

2

t

e dt





(70)

70

2 2

( )

2 2

x y

I e dxdy

  

2

2 2

0 0

r

d re dr



     I 2

( ) 1

f x dx





2

2

t

I

 

e dt



(71)

max

1 ( )

2 ( ) 1

2 3 ( ) 0

关于对称

 

 

 

x

f x x

f f

lim f x

2 2

( ) 2

2

( ) 1

2

~ ( , ):



 

     

x

f x e x

X N

(72)

正态概率密度函数

2 2

( )

1 2

( )

2

x

f x e x



    

(73)

, ,

( ) ,

;

σμ

f x x

当固定改变的大小时

图形的形状不变只是沿 着轴作平移变换

(74)

, , ( )

, , , , ,

. μσf x

σσ

当固定改变的大小时图形的对称轴

不变而形状在改变越小图形越高越瘦越大 图形越矮越胖

(75)

称 μ 为位置参数 ( 决定对称轴位置 ) σ 为尺度参数 ( 决定曲线分散性 )

~ ( ,

2

) X N  

0

 

f x

1 x

5

5

0.51.0fxx1.50.7980.3990.2660

(76)

X 的取值呈中间多,两头少,对称的特性。

当固定 μ 时, σ 越大,曲线的峰越低,落 在 μ 附近的概率越小,取值就越分散,即 σ 是反映 X 的取值分散性的一个指标。

在自然现象和社会现象中,大量随机变量服 从或近似服从正态分布。

(77)

正态分布下的概率计算

t σ e

x

F x σ

μ t

2 d ) 1

( 2

2

2 )

(

}

{X x

P

?

(78)

~ (0 1)

若,,称服从标准正态分布 Z N Z

 

2

1 2

2

x

Zx e

的概率密度:

2

1 2

( )

2

x t

Z x e dt



的分布函数:

 

x

 

x 1

   

( ) y x

( )x

( x)

 

0

y

x

x

x

(79)

~ ( ,

X N  

2) 当时

( ) () ()

 

  b   a P a X b

(

P a X

b

)

(作变换:)

x t

2 2

( )

1

2

2

b x

a

e dx



 

2

1

2

2

b t

a

e dt

 

~ ( ,X N   2) 当时

(80)

例:

X ~ ( , N

  2

)

( ) ( )

( ) ( )

( )

(1) ( 1) 2 (1) 1 0.6826

     

   

     

        

P X P X

P X

( 2 ) 2 (2) 1 0.9544 P X      

(P X  3 ) 2 (3) 1 0.9974   

99.74%

3 2  

68.26%

2 3

 

95.44%

(81)

例:用天平称一实际重量为 的物体,天平的读 数为随机变量 ,设 时,

( 1 )求读数与 的误差小于 0.005 的概率;

( 2 )求读数至少比 多 0.0085 的概率。

~ ( , 0.01 )

2

X N a

X

a a

a

(82)

82

(

P X a

  0.005) 解:(1)

2 0.6915 1 0.3830   

查附表

===

0.005 0.005

( ) ( )

0.01 0.01

    

2 (0.5) 1

 

(83)

83

( 0.0085)

P X a Excel

Excel

注:计算使用表单: 

在表单的任一单元格输入“=”

( )F

 在主菜单中点击“插入”“函数”

 在选择类别的下拉式菜单中选择“统计”

NORMDIST

 选择“”点击“确定”

0.0085, 0, _ 0.01,

X Mean Standard dev Cumulative TRUE

在函数参数表单中输入

“”

"0.802337508"

点击“确定”即在单元格中出现。

(84)

例:一批钢材 ( 线材 ) 长度

(1) 若 μ =100 , σ =2 ,求这批钢材长度小于 97.8cm 的概率;

(2) 若 μ =100 ,要使这批钢材的长度至少

有 90% 落在区间 (97,103) 内,问 σ 至 多取何值?

( ) ~ ( , 2) X cm N  

(85)

85

( P X  97.8)

解:(1)

( 100 97.8 100)

2 2

X

P

1 (1.1)

  

1 0.8643 0.1357  

查附表

===

 

97 103 90%

(2)需: PX  

103 100 97 100 3

( ) ( ) 2 ( ) 1 90%

     

( ) 0.953

  3

1.645

 

1.8237

97.8 100

( )

2

 

(86)

例:设一天中经过一高速公路某一入口的重型车辆 数 X 近似服从 ,已知有 25 %的天数超过 400 辆,有 33 %的天数不到 350 辆,求

( , 2 ) N

 

  , .

參考文獻

相關文件

Hence, we have shown the S-duality at the Poisson level for a D3-brane in R-R and NS-NS backgrounds.... Hence, we have shown the S-duality at the Poisson level for a D3-brane in R-R

We compare the results of analytical and numerical studies of lattice 2D quantum gravity, where the internal quantum metric is described by random (dynamical)

对于二元函数的自变量,我

MASS::lda(Y~.,data) Linear discriminant analysis MASS::qda(Y~.,data) Quadratic Discriminant Analysis class::knn(X,X,Y,k,prob) k-Nearest Neighbour(X 為變數資料;Y 為分類)

[r]

以正六邊形 ABCDEF 的六個頂點為端點所決定非零的向量、有向線段、線段各有

通常把这种过去时期的,具有滞后作用的变量 叫做 滞后变量(Lagged Variable) ,含有滞后变量

[r]