第一节随机变量

(1)

第二章随机变量

第一节随机变量

(2)

一、随机变量概念的产生

在实际问题中，随机试验的结果可以用 数量来表示，由此就产生了随机变量的概念.

(3)

1、有些试验结果本身与数值有关（本身 就是一个数）.

例如，掷一颗骰子面上出现的点数；

七月份郑州的最高温度；

每天从北京站下火车的人数；

昆虫的产卵数；

(4)

2、在有些试验中，试验结果看来与数值无 关，但我们可以引进一个变量来表示它的各 种结果.也就是说，把试验结果数值化.

正如裁判员在运动场上不叫运动员的名字而叫号码一样，

二者建立了一种对 应关系.

(5)

这种对应关系在数学上理解为定义了一种 实值函数.

e. X(e)

Ω _R

这种实值函数与在高等数学中大家接触到 的函数一样吗？

(6)

（1）它随试验结果的不同而取不同的值，

因而在试验之前只知道它可能取值的范围，

而不能预先肯定它将取哪个值.

（2）由于试验结果的出现具有一定的概 率，于是这种实值函数取每个值和每个确 定范围内的值也有一定的概率.

称这种定义在样本空间上的实值函数为

简记为 r.v.(random variable)

(7)

而表示随机变量所取的值 时,一般采用小写字母x,y,z等.

随机变量通常用大写字母

X,Y,Z

或希腊字母

ζ,η

等表示

(8)

例如，从某一学校随机选一 学生，测量他的身高.

我们可以把可能的 身高看作随机变量

X,

然后我们可以提出关于

X的各种问题.

如 P(X>1.7)=？ P(X≤1.5)=?

P(1.5<X<1.7)=?

(9)

有了随机变量,随机试验中的各种事件，

就可以通过随机变量的关系式表达出来.

二、引入随机变量的意义

如：单位时间内某电话交换台收到的呼 叫次数用X表示，它是一个随机变量.

事件{收到不少于1次呼叫} { X 1}

⇔ ≥

{没有收到呼叫} {X= 0}

⇔

(10)

随机变量概念的产生是概率论发展 史上的重大事件. 引入随机变量后，对 随机现象统计规律的研究，就由对事件及事件概率的研究扩大为对随机变量及 其取值规律的研究.

事件及 事件概率

随机变量及其 取值规律

(11)

四、随机变量的分类

通常分为两类：

如“取到次品的个数”，

“收到的呼叫数”等.

随机变量

离散型随机变量

连续型随机变量

所有取值可以逐个 一一列举

例如，“电视机的寿命”，实 际中常遇到的“测量误差”等.

全部可能取值不仅 无穷多，而且还不能 一一列举，而是充满

一个区间.

(12)

这两种类型的随机变量因为都是随机变 量，自然有很多相同或相似之处；但因其取 值方式不同，又有其各自的特点.

随机变

量 连续型随机变量 离散型随机变量

学习时请注意它们各自的特点和描述方法.

(13)

设X是一个离散型随机变量，它可能 取的值是 x₁, x₂

, … .

为了描述随机变量 X ，我们不仅需 要知道随机变量X的取值，而且还应知道

X取每个值的概率.

第二章第二节

离散型随机变量

(14)

这样，我们就掌握了X这个 随机变量取值的概率规律.

从中任取3 个球

取到的白球数X是一个随机变量

X可能取的值是0,1,2

取每个值的概率为

10 ) 1

0 (

₃

5 3 3

=

= C

X C P

10 ) 6

1 (

₃

5 1 2 2

3

=

= C

C X C

P

10 ) 3

2 (

₃

5 2 2 1

3

=

= C

C X C

P

例1

且

∑

=

3

=

1

i

i X

P ( )

(15)

其中 (k=1,2, …) 满足：

p

^k

,

≥ 0

p

k

_{k=1,2, …}

（1）

∑ ⁼

k

p 1

k

（2）

定义1：设x_k(k=1,2, …)是离散型随机变 量X所取的一切可能值，称

k=1,2,…

, )

( X x

_k

p

_k

P = =

为离散型随机变量X的概率分布或分布 律，有的书上也称概率函数.

用这两条性质判断 一个函数是否是

概率分布

一、离散型随机变量概率分布的定义

(16)

解: 依据概率分布的性质:

∑ ⁼ ⁼

k

k X

P ( ) 1

P(X =k)≥0,

! 1 0

0

=

≥

∑

^∞

=

λ

k ae a

a

k

从中解得

欲使上述函数为概率分布 应有

λ

= e

−

a

∑

^∞

=

0

!

:

k

e

_λ

λ k 注

例2. 设随机变量X的概率分布为：

! , )

( X k a k P

λk

=

= k =0,1,2, …,

试确定常数a .

> 0

λ

(17)

二、表示方法

（1）列表法：

（2）公式法













10 3 10

6 10

1

2 1

0

X~

2 , 1 , 0 ,

)

(

₃

5 2 3

3

=

⁻

k

C C k C

X P

k k

再看例1

任取3 个球

X为取到的白球数 X可能取的值 是0,1,2

(18)

三、举例

例3. 某篮球运动员投中篮圈概率是0.9，求 他两次独立投篮投中次数X的概率分布.

解： X可取0、1、2为值 P(X =0)=(0.1)(0.1)=0.01 P(X =1)= 2(0.9)(0.1) =0.18

P(X =2)=(0.9)(0.9)=0.81

且 P(X =0) + P(X =1) + P(X =2) = 1

(19)

常常表示为：

 



 



81 .

0 18

. 0 01

. 0

2 1

~ 0 X

这就是X的概率分布.

(20)

例 4

如上图所示.电子线路中装有两个并联的继电器.假设这两个继电器是否接通具有随机性,且彼此独立.已知每个电器接通的概率为 0.8,记X为线路中接通的继电器的个数.

求:(1)X的分布律.

(2)线路接通的概率.

(21)

解: (

1).记A_i={第i个继电器接通},i=1,2.

∵ 两个继电器是否接通是相互独立的,∴

A₁和A₂相互独立,另外P(A₁)=P(A₂)=0.8.下面求X的分布律.

首先:X可能取0,1,2,三个值.

P{X=0}=P{表示两个继电器都没接通}

04 .

0 2

. 0 2

. 0 )

( )

(

₁ ₂

=

₁ ₂

= × =

= P A A P A P A

(22)

32 .

0 8

. 0 2

. 0 8

. 0

) (

)) (

) ((

2 1

=

× +

×

=

+

=

+

=

∪

=

A P

A A P

A A

P A

A A

A P

P{X=1}=P{恰有一个继电器接通}

64 .

0 8

. 0 8

. 0 )

( )

(

₁ ₂

=

₁ ₂

= × =

= P A A P A P A

P{X=2}=P{两个继电器都接通

}

,

(23)

,

∴ X的分布律为

X

⁰ ¹ ²

p

k 0.04 0.32 0.64

2) ∵是并联电路 ∴ P(线路接通)

=P(只要一个继电器接通)=P{X≥1}

=P{X=1}+P{X=2}=0.32+0.64=0.96.

(24)

(二)常见的离散型随机变量的概率分布 (I) 两点分布

设E是一个只有两种可能结果的

随机试验,用Ω={ ω

₁

, ω

₂

}表示其样本空间.

P({ ω

₁

})=p , P({ ω

₂

})=1-p l 来源

X( ω)=

1, ω= ω

₁

0, ω= ω

₂

(25)

200件产品中,有196件是正品,4件是次品,今从中随机地抽取一件,若规定例 5

X( ω)= 1, 取到合格品

0, 取到不合格品则 P{X=1}=196/200=0.98, P{X=0}=4/200=0.02

故X服从参数为0.98的两点分布.

即 X ∼ B(1,0.98).

(26)

例6 设生男孩的概率为p,生女孩的概率为

q=1-p，令X表示随机抽查出生的4个婴儿

中“男孩”的个数.

贝努里概型和二项分布 (II)

我们来求X的概率分布.

(27)

4 , 3 , 2 , 1 , 0 ,

) 1

( }

{ X = k = C

₄

p − p

⁴⁻

k =

P

^k ^k ^k

X的概率分布是：

男女

X表示随机抽查的4个婴儿中男孩的个数，

生男孩的概率为 p.

X=0 X =1 X =2 X =3 X =4

X可取值0,1,2,3,4.

(28)

例7 将一枚均匀骰子抛掷3次，

令X 表示3次中出现“4”点的次数

3 , 2 , 1 , 0 ,

6 ) ( 5 6 )

( 1 }

{ X = k = C

₃ ³⁻

k =

P

^k ^k ^k

X的概率分布是：

不难求得，

(29)

掷骰子：“掷出4点”，“未掷出4点” 一般地，设在一次试验中我们只考虑两个 互逆的结果：A或，或者形象地把两个互 逆结果叫做“成功”和“失败”.

A

新生儿：“是男孩”，“是女孩” 抽验产品：“是正品”，“是次品”



再设我们重复地进行n次独立试验 ( “重复”

是指这次试验中各次试验条件相同 )

(30)

这样的n次独立重复试验称作n重贝努里 试验，简称贝努里试验或贝努里概型.

每次试验成功的概率都是

p

，失败的概率都是

q =1- _p

.

用X表示n重贝努里试验中事件A（成功）

出现的次数，则

n k

p p

C k

X

P ( = ) =

_n^k ^k

( 1 − )

ⁿ⁻^k

, = 0 , 1 ,  ,

称r.v.X服从参数为n和p的二项分布，记作

X~B(n,p)

(31)

注: 贝努里概型对试验结果没有等可能的 要求，但有下述要求：

（1）每次试验条件相同；

二项分布描述的是n重贝努里试验中出现

“成功”次数X的概率分布.

（2）每次试验只考虑两个互逆结果A或，

A

且P(A)=p ，；

_P ₍ _A ₎ _{= 1} ₋ _p

（3）各次试验相互独立.

(32)

例8 某类灯泡使用时数在2000小时以上视为正 品.已知有一大批这类的灯泡,其次品率是0.2.

随机抽出20只灯泡做寿命试验,求这20只灯泡中恰有3只是次品的概率.

解: 设X为20只灯泡中次品的个数 ,则.

X ~ B (20, 0.2)，

, )

8 . 0 ( ) 2 . 0 ( )

( X k C

₂₀^k ^k ²⁰ ^k

P = =

⁻

. 20 ,...,

1 ,

= 0

k

(33)

下面我们研究二项分布B(n,p)和两点分布B(1,p)之间的一个重要关系.

¹ 说明

设试验E只有两个结果:

A

和 .

记p=P(A),则P( )= 1- p ,0<p<1,

A A

我们把试验E在相同条件下,相互独立地进行 n次,且记X为n次独立试验中结果A出现的次数.把描述第i次实验的随机变量记作X_i

则 X_i ∼ B(1,p), 且X¹,X₂ ,… ,X_n也是相互独立的(随机变量相互独立的严格定义第三章再讲).则有

X= X₁+X₂+…+X_n

(34)

一、泊松分布的定义及图形特点

) (

~ ,

0 ; ,

2 , 1 , 0

! ; }

{ )

; (

λ λ

λ

^λ

P X

X

k k e

k X

P k

P

k

的泊松分布是服从参数为

称

>

=

⁻



设随机变量X所有可能取的值为0 , 1 , 2 , … , 且概率分布为：

(III) 泊松分布

(35)

易见



 



=

≥

=

∑

^∞

=

− 0

! 1

, 2 , 1 , 0 0

} {

k

k e

k k

X P

λ

^

例9

某一无线寻呼台,每分钟收到寻呼的次数X服从参数λ=3的泊松分布.

求:(1)一分钟内恰好收到3次寻的概率.

(2)一分钟内收到2至5次寻呼的概率

. 解:

(1) P{X=3}=p(3;3)=(3³/3!)e^-3≈0.2240

(2) P{2≤X≤5}

=P{X=2}+P{X=3}+P{X=4}+P{X=5}

=[(3²/2!)+(3³/3!)+(3⁴/4!)+(3⁵/5!)]e^-3 ≈0.7169

(36)

解:

例10

某一城市每天发生火灾的次数X服从参数为0.8的泊松分布.

求:该城市一天内发生3次以上火灾的概率.

P{X≥3}=1- P{X<3}

=1-[P{X=0}+ P{X=1}+P{X=2}]

=1-[(0.8⁰/0!)+(0.8¹/1!)+(0.8²/2!)]e^-0.8

≈0.0474

(37)

泊松分布的图形特点： X~P( )

λ

(38)

对于二项分布B(n,p),当n充分大,p又很小时,则对任意固定的非负 整数k,有近似公式

历史上，泊松分布是作为二项分布的近 似，于1837年由法国数学家泊松引入的 .

二、二项分布与泊松分布

l命题

np k e

p p

C

k k

n k

k

n

−

⁻

≈ λ

⁻_λ

λ =

! , )

1 (

(39)

. fixed

for as

) 1

.(

3 ; fixed

for as

) .(

2 ; )

1 ! (

) 1 (

) 1

( .

1 : Proof

! , )

1 (

k n

n e n p

j n

p j

n

n n p k

p k

n p

n np

p p

C

np k e

p p

C

k n

k n k

n k

k n

k k

n k

k n

∞

→

−

∞

→

−

+ −

−

= −

−

=

≈

−

λ

λ λ



(40)

由泊松定理，n重贝努里试验中稀有事件 出现的次数近似地服从泊松分布.

我们把在每次试验中出现概率很小的事 件称作稀有事件. 如地震、火山爆发、特大洪水、意外事故等等

(41)

解:

例11

某出租汽车公司共有出租车400辆,设每天每辆出租车出现故障的概率为0.02,求:一天内没有出租车出现故障的概率

.

将观察一辆车一天内是否出现故障看成一次试验E.因为每辆车是否出现故障与其它车无关,于是观察400辆出租车是否出现故障就是做400次独立试验,设X表示一天内出现故障的出租车数,则: X ∼ B(400, 0.02).

令λ=np=400×0.02=8 于是:

P{一天内没有出租车出现故障}=P{X=0}

=B(0;400,0.02) ≈(8⁰/0!)e^-8=0.0003355

(42)

对于离散型随机变量，如果知道了它的 概率分布,也就知道了该随机变量取值的概率 规律. 在这个意义上，我们说

这一讲，我们介绍了离散型随机变量及 其概率分布.

离散型随机变量由它的概率分布唯一确定.

两点分布、二项分布、泊松分布 及其关系

(43)

第二章第三节

连续型随机变量

(44)

连续型随机变量X所有可能取值充满一个区间, 对 这种类型的随机变量, 不能象离散型随机变量那样, 以指定它取每个值概率的方式, 去给出其概率分布, 而是通过给出所谓“概率密度函数”的方式.

下面我们就来介绍对连续型随机变量的描述方法.

第二章第三节

连续型随机变量

(45)

（I）直方图

(一) 概率密度函数

∫

=

≤

^b

a

f x dx b

X a

P ( ) ( )

,使得对任意 , 有

a ≤ b

∈ ⁽ ^−∞ ^, ^+∞ ⁾

对于随机变量 X ,如果存在非负可积函数f(x) , x

则称 X为连续型r.v.,称 f(x)为 X 的概率密度函 数，简称为概率密度或密度.

(II) 连续型r.v.及其概率密度函数的定义

(46)

(III) 概率密度函数的性质 1 ^o

f ( x ) ≥ 0

2 ^o

∫

−^∞∞

f ( x ) dx = 1

这两条性质是判定一个 函数 f(x)是否为某r.vX的 概率密度函数的充要条件.

f (x)

o

x

面积为1

(47)

故 X的密度 f(x) 在 x 这一点的值，恰好是 X落在区间上的概率与区间长度

之比的极限. 这里，如果把概率理解为质量， f (x)相当于线密 度.

∆ x

] ,

( x x + ∆ x

若x是 f(x)的连续点，则：

x

x x

X x

P

x

∆

) lim ( < ≤ +

→0

x

) ( lim

0

∆

= ∫

⁺^∆

→

∆

x x

dt t

f

=f(x) 3. 对 f(x)的进一步理解:

(48)

要注意的是，密度函数 f (x)在某点处a的高度，并不 反映X取值的概率. 但是，这个高度越大，则X取a附近的 值的概率就越大. 也可以说，在某点密度曲线的高度反映了概率集中在该点附近的程度.

f (x)

o

x

(49)

若不计高阶无穷小，有：

x x

f x

x X

x

P

{ < ≤ + ∆ } = ( )∆

它表示随机变量 X 取值于的概率近似等 于 .

] ,

( x x + ∆ x x

x f ( ) ∆ x

x

f ( ) ∆

在连续型r.v理论中所起的作用与

k

p

x X

P ( = ) =

在离散型r.v理论中所起的 作用相类似.

(50)

4. 连续型r.v取任一指定值的概率为0.

即：

P ( X = a ) = 0 ,

^{a为任一指定值}

这是因为

) (

lim )

( X a

0

P a X a x

P

x

∆

≤ < +

=

→

∫

⁺

=

→ ^a ^x

x a ^∆

f x dx

∆

lim ( )

0

= 0

(51)

由此得，

) (

)

( a X b P a X b

P ≤ ≤ = < ≤ = P ( a ≤ X < b )

1) 对连续型 r.v X,有

) ( a X b P < <

=

2) 由P(X=a)=0 可推知

{ } ⁾ ⁽ ⁾ ⁽ ⁾ ¹

( X ∈ R − a = ∫

−^∞∞

f x dx − P X = a = P

而 {X=a} 并非不可能事件,

可见，由P(A)=0, 不能推出

A = φ

并非必然事件

}}

{ {

X

∈

R

−

a

由P(B)=1, 不能推出 B=

Ω

(52)

（二）、随机变量的分布函数

^设X(ω)是一个随机变量.称函数 F(x):= P{X≤x},-∞<x<∞

为随机变量X的分布函数.

l分布函数的性质

（1）∀a<b,总有F(a)≤F(b)(单调非减性)

（2）F(x)是一个右连续的函数

（3）∀x∈R¹ ,总有0≤F(x)≤1(有界性),且

l定义

1 )

( lim

, 0 )

(

lim = =

∞

→

−∞

→

F x F x

x x

(53)

证明: 仅证(1)

∵{a<X≤b}={X≤b}∩{X>a}

={X≤b}-{X≤a},而{X≤a}⊂{X≤b}.

∴ P{a<X≤b}= P{X≤b}- P{X≤a}

=F(b)- F(a).

又∵P{a<X≤b}≥0, ∴F(a)≤F(b).

上述证明中我们得到一个重要公式:

P{a<X≤b}=F(b)- F(a).

它表明随机变量落在区间(a,b]上的概率可以通过它的分布函数来计算.

注意

(54)

设离散型随机变量X的分布律为

p

_k

= P{X=x

_k

} , k=1,2,…, 则X的分布函数为

离散型随机变量的分布函数

{ } _ ^





 



 =

=

≤

=



≤ x x

k

x X

P x

X P

x

F ( ) { }

{ } ∑

∑

≤ ≤

=

∴

x x

k x

x

k

k k

p x

X P

x

F ( )

(55)

分布函数F(x)是一个右连续的函数,在 x=x_k(k=1,2…)处有跳跃值 p_k=P{X=x_k},

如下图所示

(56)

F(x)=

0 x<0 0.04 0≤X<1 0.36 1≤X<2 1 2≤X

(57)

连续型 r.v.的分布函数

即分布函数是密度函数的可变上限的定积分.

若 X 是连续型r.v.， X f (x) , 则 F(x) = P(X x) =

∫

−∞

x

f ( t ) dt

～

≤

由上式可得，在 f (x)的连续点，

) ) (

( f x

dx x

dF =

(58)

下面我们来求一个连续型 r.v 的分布函数.

例设r.v X 的密度函数为 f (x)





 − − ≤ ≤

=

0, 其它

1 1

, 2 1

) (

2

x

x x

f π

^{求 F(x).}

F(x) = P(X x) =

∫

−∞

x

f ( t ) dt

≤

解：

(59)

对 x < -1，F(x) = 0

∫

−

∞

−

⋅ + −

= dt

^x

t dt

x

F

1

1 2

2 1 0

)

( π

2 arcsin 1

1 −

²

+ 1 +

= x x x

π π

, 1 1 ≤ ≤

− x

对

对 x>1， F (x) = 1

(60)

 

 



>

≤

− +

+

−

<

=

1 ,

1 1 1

2 , arcsin 1

1 1

1 ,

0 )

(

²

x

x x

F π π

即

(61)

(三)常见的连续型随机变量

正态分布、均匀分布、指数分布

(62)

正态分布是应用最广泛的一种连续型分布.

正态分布在十九世纪前叶由高斯

(Gauss)加以推广，所以通常称为高斯分布.

德莫佛

德莫佛（De Moivre)最早发现了二项分布的一个近似公式，这一公式被认为是正态分布的首次露面.

一、正态分布

(63)

高尔顿钉板试验

这条曲线就近似我们将要介绍的正态分布的密度曲线。

(64)

(I)、正态分布的定义

若r.v. X 的概率密度为

) ,

(

~ ^N µ σ

²

记作

X

f (x)所确定的曲线叫作正态曲线.

∞

<

∞

−

=

− −

x e

x f

x

, )

(

) (

2 2

2

1 _σ^µ

π σ

其中和都是常数，任意， >0，

则称X服从参数为和的正态分布.

µ σ σ

µ _σ µ

(Normal)

(65)

(II)、正态分布的图形特点

N ( µ , σ

²

)

正态分布的密度曲线是一条关于对称的钟形曲线.

µ

特点是“两头小，中间大，左右对称”.

(66)

决定了图形的中心位置，决定了图形中峰的陡峭程度.

µ ^σ

正态分布的图形特点

N

(

µ

,

σ

² )

(67)

故f(x)以μ为对称轴，并在x=μ处达到最大值:

∞

<

∞

−

=

− −

x e

x f

x

, )

(

) (

2 2

2

1 _σ^µ

π σ

令x=μ+c, x=μ-c (c>0), 分别代入f (x), 可得 f (μ+c)=f (μ-c)

且 f (μ+c) ≤f (μ), f (μ-c)≤f (μ)

σ µ π

2 ) 1

( =

f

(68)

这说明曲线 f(x)向左右伸展时，越来越贴近x轴。即f (x) 以x轴为渐近线。

∞

<

∞

−

=

− −

x e

x f

x

, )

(

) (

2 2

2

1 _σ^µ

π σ

当x→ ±∞时，f(x) → 0,

(69)

用求导的方法可以证明，

∞

<

∞

−

=

− −

x e

x f

x

, )

(

) (

2 2

2

1 _σ^µ

π σ

为f (x)的两个拐点的横坐标。

x = μ ± σ

(70)

σ σ µ

µ π

σ

σ µ π

σ

π µ σ

π σ

σ µ

σ µ σ

µ

σ µ σ

µ

±

=

⇒

 =



 



 − −

−

=











 −

−

=

−

=

∞

<

∞

−

=

− −

x x e

x e e

x f

e x

x f

x e

x f

x

x x

) 0 1 (

2

) (

2 ) 1

( ' '

) 2 (

) 1 (

'

2 , ) 1

(

2

2 3

2 ) (

2

2 2

) (

3

2 ) (

3

2 ) (

2 2

2 2 2

2

2 2 2

2

(71)

实例年降雨量问题，我们用上海99年年降雨量的数据画出了频率直方图。

从直方图，我们可以初步看出，年降雨量近似服从正态分布。

(72)

下面是我们用某大学大学生的身高的数据画出的频率直方图。

红线是拟合的正态密度曲线

可见，某大学大学生的身高应服从正态分布。

(73)

人的身高高低不等，但中等身材的占大多数，特高和特矮的只是少数，而且较高和较矮的人数大致相近，这从一个方面反映了服从正态分布的随机变量的特点。

(74)

除了我们在前面遇到过的年降雨量和身高外,在正常条件下各种产品的质量指标，如零件的尺寸；纤维的强度和张力；农作物的产量，小麦的穗长、株高；测量误差，

射击目标的水平或垂直偏差；信号噪声等等，都服从或近似服从正态分布.

(75)

(III) 、设X~ ,

N ( µ , σ

²

)

^{X的分布函数是}

∞

<

∞

−

= ∫

−∞

− −

x dt

e x

F

^x

t

, )

(

) (

2 2

2

1

_σ^µ

π

σ

(76)

dt e

x

^x

∫

−∞ t

=

−

Φ

²

2

2 ) 1

( π

(IV)、标准正态分布

1 ,

0 =

= σ

µ

的正态分布称为标准正态分布.

∞

<

∞

−

=

e

⁻

x

2 , ) 1

( ²

2

ϕ π

其密度函数和分布函数常用和表示：

ϕ (x ) Φ ( x )

) Φ( x

) ϕ( x

(77)

它的依据是下面的定理：

标准正态分布的重要性在于，任何一个一般的正态分布都可以通过线性变换转化为标准正态分布.

根据定理1,只要将标准正态分布的分布函数制成表，

就可以解决一般正态分布的概率计算问题.

) ,

(

~ N µ σ

²

X σ

µ

=

X

−

,则

Y

~N(0,1) 设

定理1

(78)

dy e

dx e

dx x dy

y

x dx

e x

F

x y

x x

∫

−

∞

−

∞

−

− −

∞

−

− −

=

− =

=

∞

<

∞

−

=

σ µ σ

µ

σ µ

π π

σ

σ σ µ

π σ

2 2

) (

2 ) (

2 2

2

2 2

2 1 2

1 then ,

Let

2 , ) 1

(

:

Proof

(79)

书末附有标准正态分布函数数值表，有了它，可以解决一般正态分布的概率计算查表.

（V）、正态分布表

) ( 1

)

( − x = − Φ x Φ

dt e

x

^x

∫

−∞ t

=

−

Φ

²

2

2 ) 1

( π

表中给的是x>0时, Φ(x)的值.

当x<0时

− x x

(80)

), ,

(

~ ^N µ σ

²

若

X

σ µ

= X −

Y

~N(0,1) 若 X～N(0,1),

) (

} {

σ µ σ

µ σ

µ

Φ −

− − Φ

=

≤ −

− ≤

=

<

a b

Y b P a

b X

a P

) ( )

(

} {

a b

b X

a P b

X a

P

Φ

− Φ

=

≤

<

=

<

(81)

由标准正态分布的查表计算可以求得，

这说明，X的取值几乎全部集中在[-3,3]区间 内，超出这个范围的可能性仅占不到0.3%.

当X～N(0,1)时，

P(|X| 1)=2 (1)-1=0.6826

≤ Φ

P(|X| 2)=2 (2)-1=0.9544

≤ Φ

P(|X| 3)=2 (3)-1=0.9974

（VI）、3 准则

σ

(82)

将上述结论推广到一般的正态分布,

) ,

(

~ N µ σ

²

Y

^时，

6826 .

0 )

|

(| Y − µ ≤ σ = P

9544 .

0 )

2 |

(| Y − µ ≤ σ = P

9974 .

0 )

3

|

(|

Y

−

µ

≤

σ

=

P

可以认为，Y 的取值几乎全部集中在

] 3

, 3

[ µ − σ µ + σ

^区间内.

这在统计学上称作“3 准则”

（三倍标准差原则）.

σ

(83)

例1 （1）假设某地区成年男性的身高（单 位：cm）X～N(170,7.69²)，求该地区成年男性的身高超过175cm的概率。

解: (1) 根据假设X～N(170,7.69²)，则

).

1 , 0 ( 69 ~

. 7

170 N X −

故事件{X>175}的概率为 P {X>175}= ¹ ⁻ ^P ^{ ^X ^≤ ¹⁷⁵ ^}

) 65 . 0 ( 1

69 ) . 7

170 (175

1 − = − Φ Φ

−

=

=0.2578

(84)

解:设车门高度为h cm,按设计要求 P(X≥ h)≤0.01

或 P(X< h)≥ 0.99，

下面我们来求满足上式的最小的h.

(2)公共汽车车门的高度是按成年男性与车门顶头碰头机会在0.01以下来设计的，问车门高度应如何确定?

(85)

因为X～N(170,7.69²), ~ (0,1) 69

. 7

170

N X

−

69 ) . 7 ( − 170 Φ h

≥

故 P(X< h)= 0.99

Φ

查表得 (2.33)=0.9901>0.99

69 . 7

− 170

所以 =2.33,

h

即 h=170+17.92 188

≈

设计车门高度为 188厘米时，可使男子与车门碰头机会不超过0.01.

P(X< h ) 0.99

≥

求满足 的最小的h .

(86)

若 r.v. X的概率密度为：

则称X服从区间( a, b)上的均匀分布，记作：

X ～ U[a, b]

) ( x

f

a b



 

 ≤ ≤

= −

, 其它 0

1 , )

( a x b

a x b

f

二、均匀分布(Uniform)

（注：X ～ U（a, b））

(87)

均匀分布常见于下列情形：

如在数值计算中，由于四舍五入，小数点后某一位小数引入的误差，例如对小数点后第一位进行四舍五入时，那么一般认为误差服从（-0.5, 0.5）上的均匀分布。

若

X ～ U[a, b]，则对于满足

a ≤ c < d ≤ b

的c,d, 总有

a b

c dx d

x f

d X

c

P

^d

c

−

= −

=

≤

≤ ^} ∫ ⁽ ⁾

{

(88)

则称 X 服从参数为的指数分布.

λ

指数分布常用于可靠性统计研究中，如元件的寿命.

三、指数分布：若 r.v X具有概率密度

 



<

=

⁻

≥

0 0

) 0

( x

x x e

f

λx

λ λ > 0

常简记为 X~E( ) .

λ

(89)

Exponential Distribution

(90)

这一讲，我们介绍了连续型随机变量、概率密度函数及性质。

还介绍了正态分布，它的应用极为广泛，在本课程中我们一直要和它打交道。

后面第五章中，我们还将介绍为什么这么多随机现象都近似服从正态分布;还要给出德莫佛极限定理的证明。

另外我们简单介绍了均匀分布和指数分布。

(91)

一、问题的提出

在实际中，人们常常对随机变量的函数

更感兴趣. 例如，已知圆轴截面直径 d 的分布，

4 d

2

求截面面积 A=

π

的分布.

_{第二章第四节}

随机变量函数的分布

(92)

又如：已知t=t₀ 时刻噪声电压 V的分布，

求功率 W=V²/R (R为电阻）的分布等.

t t

0

一般地、设随机变量X 的分布已知，Y=g (X) (设g是 连续函数），如何由 X 的分布求出 Y 的分布？

这个问题无论在实践中还是在理论上都是重要的.

(93)

二、离散型随机变量函数的分布

解：当 X 取值 1，2，5 时，

Y 取对应值 5，7，13，

例1 设X

 



 



3 . 0

5 5

. 0 2

. 0

2 1

求 Y= 2X + 3 的概率函数.

～

 



 



3 0

13 5

0 2

0 7 5

. .

~ . Y

而且X取某值与Y取其对应值是两个同时发生 的事件，两者具有相同的概率.

故

(94)

如果g(x_k)中有一些是相同的，把它们作适当并项即可.

一般，若X是离散型 r.v ，_{X的概率函数为}

X

 



 



n n

p p

p

x x

x



2 1

2

～ 1

则 Y=g(X) ～

 



 



n n

p p

p

x g x

g x

g



2 1

2

1

) ( ) ( )

(

(95)

如： X

 



 

−

1 . 0

1 6

. 0 3

. 0

0

～

1

则 Y=X²的概率函数为：

 



 



4 0 6

0 1 0

. .

Y ～

(96)

三、连续型随机变量函数的分布

解：设Y的分布函数为 F_Y(y)，例2 设 X ~

 

 < <

= 0 , 其它

4 0

, 8 ) /

( x x

x f

_X

求 Y=2X+8 的概率密度.

≤ ≤

F_Y(y)=P{ Y y } = P (2X+8 y )

=P{ X } = F

≤

_X( )

2

− 8 y 2

− 8 y

于是Y 的密度函数

2 ) 1 2

( 8 )

) (

( = = y − ⋅

dy f y y dF

f

_Y ^Y _X

(97)

0)28(≠−yfX168)28(−=− yyfX

故





 − < <

=

, 其它 0

16 8

32 , 8 )

(

y y

y f

_Y

2 ) 1 2

( 8 )

) (

( = = y − ⋅

dy f y y dF

f_Y ^Y _X

注意到 0 < x < 4 时， f_X ( x) ≠

0

即 8 < y < 16 时， ) 0 2

( y − 8 ≠ f_X

此时

16 ) 8

2

( y − 8 = y − f_X

Y=2X+8

 

 < <

= 0 , 其它

4 0

, 8 ) /

( x x

x

f

_X

(98)

例3 设 X 具有概率密度 ,求Y=X

f

_X ( x²)的概率密度.

)

( y X y

P − ≤ ≤

=

求导可得

[ ]







≤

>

−

= +

=

0 ,

0

0 ,

) (

) 2 (

) 1 ) (

(

y y y

f y

y f dy

y y dF

f

_Y ^Y ^X ^X

当 y>0 时,

F

_Y

( y ) = P ( Y ≤ y ) = P ( X

²

≤ y )

注意到 Y=X² 0，故当 y 0时，

≥ ≤ ^F

^Y

^{( y} ⁾ ⁼ ⁰

) ( x F

_X

)

( y F

_Y

解：设Y和X的分布函数分别为和 ，

) (

)

( y F y

F

_X

−

_X

−

=

第一节 随机变量

第二章 随机变量