• 沒有找到結果。

概率统计复习 概率统计复习  

N/A
N/A
Protected

Academic year: 2021

Share "概率统计复习 概率统计复习  "

Copied!
106
0
0

加載中.... (立即查看全文)

全文

(1)

概率统计复习

(2)

概率:

( ) A

n

n A f A

n

频率: 发生次 总次数

(一)概率

1. 非负性:; P A ( ) 0  2. 规范性:; P S ( ) 1 

1, ,...2

3. A A

两两互

可列可加性 :

,

(3)

( ) 1 ( ) P A   P A 性质:

( ) ( ) ( ) ( ) P A B   P AP BP AB

1 1

1

1 1 1 2

( ) ( ) ( )

( ) ( 1) ( )

n n

i i i j

i i j n

i

n

i j k n

i j k n

P A P A P A A

P A A A P A A A

  

   

 

     

 

(4)

( ) ( ) 0 ( | )

( )

P A P B A P AB

P A

率:

B A

在中所占的概率比例

( | )

P A

注:也是一个概率

( | ) 1 ( | )

P B A P B A

  S

B AB A

(5)

乘法公式

当下面的条件概率都有意义时:

( ) ( ) ( | ) P ABP A P B A

1 2

1 2 1 3 1 2 1 1

( )

( ) ( | ) ( | ) ( | )

n

n n

P A A A

P A P A A P A A A P A A A

 

 

(6)

1, 2, , n

B B  B S

定义称为的一个: 划分,

1 2

( ) i

不漏

BB  B

n

S ,

( )

ii

不重

B B

i j  ,

i

j

.

B

1

B

2

B

3

B

4

B

n

(7)

1, , ,2 n ( ) 0.i

B B



B S P B

设为的一个划分

全概

且则有 率公式:

1

( ) n ( )j ( | j )

j

P A P B P A B

1

( ) 0

( ) ( | ) ( | )

( ) ( | )

i i

i n

j j

j

P A

P B P A B P B A

P B P A B

 

Bayes

对有

式:

(8)

( )

j j

, ( |

j

)

j

, 1,2,..., . P Bp P A Bq jn

1

( )

n j j

j

P A p q

 

q1

B1

S A

p1

p2

pn

q2

qn

B2

Bn

P B A ( | )

i

1

i i n

j j j

p q p q

 

(9)

,

X X

若随机变量的取值为有限个或可数 离散

型随

个 则称为 机变量.

(二)随机变量

分布律为:

P

x

1

x

2

x

k

p

1

p

2

p

k

X

( k ) k , 1,2, . P X x p k

1

0,

: k k 1

k

p p



分布律的性质

(10)

X

, ,

( ) ( )

: X x

F x P X x X

随机变量对任意实数称函数

为的概率分布函数

,简称

布函数.

( )

F x 的几何意义

x

]

( ) ( ( , ]) F x P X   x

(11)

( )

F x 的性质:

(1) 0 F x( ) 1;

(4) ( )F x 是右连续函数即 , F x(  0) F x( ).

(2) ( )F x 单调不减;

(3) (F  ) 0, F( ) 1;

1 2, 0 ( 1 2) x x P x  X x

对有 F x( )2 F x( ).1

( ) ( 0) ( ) F x F x   P X x

(12)

 

, 1,2,

( ) .

k

k k

k x x

P X x p k

F x p

一般地,离散型随机变量的分布函数为阶梯函数.

如果分布律为 那么分布函数为

 

( ) , 1,2,

{ }.

k

k k

F x x x k

p P X x

在处有跳跃,

其跳跃值为

(13)

 

( )

: ,

,

X F x

f x x

对于随机变量的分布函数 若存在非负 的函数使对于任意实数

定义

有:

( ) x ( )

F x f t dt



, ( ) ,

X f x X

则称为其中称连续型随机变量 概率密度

为的 简称

函数 概率密度.

(14)

( ) y f x 面积为1

x

( ) f x

(2) 

f x d x

( ) 1; 0

    

(1) ( ) 0; f x  

( )

f x

的性质:

(3) ( ) ( ) , .

P X D

 

D

f x d x

 

任意 

D R

(4)在连续点

f x

( ) 

x F x

, '( )

f x

( ).

(15)

定义:设 E 是一个随机试验,样 本空间 S={e} ;设 X=X(e) 和 Y=Y(e) 是定义在 S 上的 随机变量,由它们构成的 向量 (X,Y) 称为二维随机 向量或二元随机变量。

y

x

e S

0

.

X e Y e( ), ( )

( ) X e ( )

Y e

(三)二元随机变量

(16)

( , ) ,

( , ) ( , ) ( , )

X Y

x y

F x y P X x Y y X Y

定义:设是二元随机变量,对于任意 实数,二元函数

称为 二元随机变量的 合分布函数

0 x

x y,

联合分布函数 y

(17)

( ), ( ),X Y

X Y

和也有它们自己的分布函数,分别记为:

F x F y

并称他们为边际分布函数

( ) ( ) ( , ) ( ) ( ) ( , )

X Y

F x P X x F x

F y P Y y F y

  

  

(18)

( ) 0,

P Y y  Y y X 定义:

若则在条件下,的 条件分布函数为:

|

( , ) ( | ) ( | )

( )

X Y

P X x Y y F x y P X x Y y

P Y y

 

   

 条件分布函数

(19)

| 0

0

( | ) ( | )

( , )

( )

F

X Y

x y lim P X x y Y y P X x y Y y lim P y Y y

  

  

  

( | ).

P X x Y y

  此时仍记为

| ( | ) (

=

| ).

F

X Y

x y P X x Y y

  即:

( ) 0, 0, ( ) 0,

P Y y P y Y y

Y y X

     

若但对任一

则在条件下,的条件分布函数定义为:

(20)

二元离散型随机变量

定义:若二元随机变量 (X,Y) 全部可能取 到的不同值是有限对或可列无限 对,则称 (X,Y) 是二元离散型随机 变量。

(21)

   

 

 

, , ,

, , , 1, 2, ,

i j

i j ij

X Y x y

P X x Y y p i j

X Y

设所有可能取值为称

为二元离散型随机变量 的联合分布律

离散随机变量的联合概率分布律

y1 y2 … yj

X Y

p11 p12 p1j p21 p22 p2j pi1 pi2 pij

x1

x2

xi

1

p

ij  0,

1 1

2 1



ij

i j

p

(22)

X,Y 的边际分布律为:

P X x ( 

i

) 

1

(

j

)

ij j

i

P Y y

p p

  

记为

=

1

ij i

j

p p

记为=

Y y j X

在条件下,的条件分布律为:

( )

( | ) 1, 2

( )

i j ij

i j

j j

P X x Y y p

P X x Y y i

P Y y p

X x i Y

在条件下,的条件分布律为:

(23)

X Y,

连续型

称为二元随机变量.

 

,

,

f x y X Y

(联合)

并称为二元随机 概率密度

变量的

(函数)。

   

 

, , ,

, ,

( , ) x y ( , )

X Y F x y

f x y x y

F x y f u v dudv

 

 

定义:对于二元随机变量的分布函数

如果存在非负函数,使对于任意,

联合概率密度函数

(24)

概率密度的性质:

 

1. f x y, 0

2.   f x y dxdy( , ) 1

 

 

 

3. ,

(( , ) ) ( , )

D

D xoy X Y D

P X Y  D



f x y dxdy

设是平面上的区域,点落在内的概率为:

2 ( , )

( , ) , F x y ( , ).

f x y x y f x y

4.在的连续点( ),有

(25)

( ) ( , ) ( ) ( , )

X

Y

f x f x y dy f y f x y dx









,

X Y 的边际密度函数为:

(26)

( ) 0,

f yY Y y X

若则在的条件下,的条件密度函数为:

( ) 0,

f xX X x Y

若则在的条件下,的条件密度函数为:

|

( , ) ( | )

X Y ( )

Y

f x y f x y

f y

|

( , ) ( | )

Y X ( )

X

f x y f y x

f x

( | ) Y X| ( | )

D

P Y D X x

f y x dy 条件概率

(27)

( , )

( i, j) ij, , 1,2,...

X Y

P X x Y y p i j 二元离散型随机变量

联合分布律

二元离散型与连续型随机变量分布比较

( , ) ( , ) X Y f x y

二元连续型随机变量 联合概率密度

1

( i) ij i , 1,2,...

j

X

P X x p p i

 

的边际分布律

( ) ( , )

X

X

f x f x y dy



的边际概率密度

( ) , 1, 2,...

i

ij

j i

i

X x Y

P Y y X x p j p

时的条件分布律

( , ) ( )

Y X ( )

X x Y

f x y f y x

f x

时的条件概率密度

27

(28)

( ) ( ) ( ) ,

P AB P A P B A B

如果,则称两个事件相互独立 (四)独立性

( ) 0

( | ) ( )

P A P B A P B

当时

( ) 0

( | ) ( )

P A P B A P B

当时

A B

直观含义:发生与否都不会改变发生的概率

(29)

相互独立两两独立 

两两独立不能推出相互独立

1 2

  

1 2

1

1 1 2

, , , 2 ,

,... ,

, , ,

k j

n

k

k

i i i i

j n

A A A n k n

i i

P A A A P A

A A A

 

设为个随机事件,若对 以及不同的均有:

则称相互独立

(30)

 

( , ) ,

, ( ) , ( )

,

( , ) ( ) ( )

X Y

F x y X Y

F x X F y

Y x y

P X x Y y    P X x P Y y   设是二元随机变量的分布

函数是的边际分布函数

是的边际分布函数,若对所有有:

即 ( , ) =

X

( ) ( )

Y

F x y F x F y ,

X Y

称随机变量 互独立 。

(31)

独立性等价判断:

用分布律判断。对一切都成立 ,i j p

ij

p p

i  j

(

i

,

j

) (

i

) (

j

), , P X x Y y    P X x P Y y    i j 离 散

型 即

(

j

|

i

) (

j

), P Y y X x P Y y j

     

Y Y

即条件分布律与的边际分布律相等

(32)

独立性等价判断:

续 连 型

( , ) X ( ) ( )Y

f x y

f x f y .

即在平面上除去“面积”为零的集合以外,

上述等式处处成立。

( , ) x y 用密度函数判断。对在平面的点

几乎处处成立

|

( | ) ( )

Y X Y

f y x f y

 

Y Y

即的条件密度函数与的边际密度函数相等

(33)

(五)随机变量函数的分布

 

 

, ,

, .

X Y g X

g Y

问题:已知随机变量的分布

函数已知求的分布

1, ,2 , ;

{ } ,

( ) ( );

j j

j

Y Y

y y y

Y y X D

P Y y P X D

{ }

 

若为离散型随机变量,则先写出的可能取值:

再找出的等价事件得

(34)

, 1

( ) ( )

, ( ) ( )

( ) ( ).

Y

Y

Y Y

Y

Y

Y F y P Y y

Y y X D F y P X D

F y Y f y

{ } { }

若为连续型随机变量则

()确定的取值范围;

(2)写出的分布函数:,

找出的等价事件得;

(3)对求导得的概率密度函数

( ( ( )) d F h y

注意常用到复合函数求导:

(35)

~ ( ), , ( ) '( ) 0 ( '( ) 0),

( ( )) '( ) , , ( ) 0,

X

X Y

X f x x

Y g X g x g x Y

f h y h y y

f y  

    

 

 

定理 设随机变量

,或

则具有概 率密度为:

其他.

( , )

( ) ( ).

Y h g

h y x y g x

 

      

   

其中是的取值范围,是的反函数,即

(36)

(

k

) (

i

,

k i

)

i

P Z z    P Xx Y   z x

离散型:

连续型:

Z   X Y

(

k i

,

i

)

i

P X z y Y y

    

 

(37)

( ) ( ) F z

M

P Mz

max( , ,

1 n

) MXX

(

1

, ,

n

) P X z X z

   

1

1 2

, , n

( ) ( ) ( )

n

X X

X X X

F z F z F z

如果相互独立

(38)

1  F z

N

( )  P N z (  ) min( , ,

1 n

) NXX

(

1

, ,

n

) P X z X z

   

1

1

, , n

(1 ( )) (1 ( ))

n

X X

X X

F z F z

  

如果相互独立

(39)

(六)数字特征

期望(数学期望,均值)

, ( )

( ) ,

i i i

x p X

E X

xf x dx X

 

-

若是离散型 若是连续型 ( ) ,

( ( ))

( ) ( ) ,

i i

i

g x p X

E g X

g x f x dx X

 

-

若是离散型 若是连续型

(40)

( , ) , ( , ) ( ( , ))

( , ) ( , ) , ( , )

i j ij

i

g x y p X Y E g X Y

g x y f x y dxdy X Y

 

 

 

-

若是离散型

若是连续型

( , )

( ) ( , ) ( ) ( , )

X Y

E X xf x y dxdy E Y yf x y dxdy

 

 

 

 

特别地,若是连续型,则

(41)

2

( ) ( ) [ ( )] . D X Var X E X E X

2 2

( ) [ ( )]

E X E X

= 方差:

2 2

( ) ( ) [ ( )]

E X Var X E X

标准差: ( )X Var X( )

(42)

1.

( i i ) i ( )i

i i

E b

a X  b

a E X

均值具有线性性 性质:

2.Var aX b(  ) a Var X2 ( )

3.Var X Y( ) Var X( ) Var Y( ) 2 Cov X Y( , )

(43)

协方差:

( ) ( ) ( ) E XY E X E Y

 

( , ) [ ( )][ ( )]

Cov X Y

E X

E X Y

E Y

( ) ( , ) ( ) ( ) E XY Cov X Y E X E Y

性质:

3.

( i i, ) i ( , )i

i i

Cov

a X Y

a Cov X Y

线性性

1.对称性Cov X Y( , ) Cov Y X( , ) 2.Cov X X( , ) Var X( )

(44)

( , ,X1 Xn )的协方差矩阵:

( ) ,ij n n ij ( ,i j )

A

a

其中

a

Cov X X

X Y与的相关系数:

( , ) ( ) ( )

XY

Cov X Y D X D Y

 

1 

XY

1

  

(45)

XY 0

X Y与不相关:

 

Cov X Y

( , ) 0

X Y与独立与不相关 X Y 反之不一定成立

( ) ( ) ( ) E XY E X E Y

 

( ) ( ) ( )

Var X Y Var X Var Y

   

(46)

(七)九大分布

0 1 ( )

~ 0 1( ) ~ ) 1

(1 .

,

X p X B p

记为 或

分布或两点分布

0 1

1 0 1.

X

P p p 其中 p

(P X k ) pk (1 p) ,1k k 0, 1.

分布律还可写为

( ) , ( ) (1 ) E X p Var X p p

(47)

{ } nk k(1 )n k 0,1,..., P X k  C p p k n

2.

二项分布,

记为 X B n p

~ ( , )

0 1

n  p

这里是正整数,

( ) , ( ) (1 ) E X np Var X np p

(48)

3.参数为的记为 或

泊松分布, X ~ ( )

 

X P ( )

( ) , 0,1, 2, ,

! 0

ke

P X k k

k



其中

( ) ( )

E X Var X

(49)

1 , ( , );

( )

0,

x a b f x b a

 其他.

( , ) , ~ ( ,

4.

a b

上的均匀分布 记为

X U a b

)

[ , ] [ , ], ( [ , ])

a b c d

P X c d d c

b a

  

 性质:对任何的子区间

( )2

( ) , ( )

2 12

a b b a

E X Var X

(50)

, 0;

( )

0 , 0, e x x

f x x

 

1 , 0;

( ) 0, 0.

e x x

F x x

 

  分布函数为

~ ( )

0

X E

指数分布

5.

参数为的

,

记为

0,

( | ) ( ) t

t s

P X s t X s P X t e

      无记忆性:对,

(51)

~ ( 2 )

X N

 

6.

正态分布,,记为

2 2

( )

1 2

( ) , ,

2

x

f x e x



    

(1) X (0,1)

N

性质:

(2) ( ) ( ), ( ) (0,1)

F x x x

N

 

分布函数其中为标准 正态分布的分布函数

(3) ( ) 1    x ( )x ( ) 1z  , z1  z (4) ( )E X ,Var X( ) 2

(52)

( , ) 1 ( , ) ( , )

0

D X Y

x y D f x y D

 



, ,

假设的面积有限,的联合密度函数为:

的面积 其他

1 1 1

, (( , ) )

D D

P X Y D D

D

:对的任何子区域都有

的面积

的面积

( , ) ~ ( )

D X Y U D

7.

平面区域上的均匀分布, 记为

(53)

2 2

1 2 1 2

( , )

X Y

N

( ,    , , , ) 二元正态分布

8 . ,

记为

2 2

1 1 2 2

(1)X N ( ,  ), Y N ( ,  ) 性质:

(2)  XY

(3)X Y与独立与不相关 =0 X Y

(54)

9.

多元正态分布

(1)( , ,X1 Xn )正态每个分 Xi

性:

正态

( , ,1 )

i n

X X X

每个分量正态,且相互独立正态

1 1

(2)( , , n) n i i

i

X X a X

正态所有线性组合正态

1

1 1

(3)( , , )

, , ( , , )

n

i n m

X X

Y X X Y Y

正态

若每个都是的线性组合,则正态

(4) ( , ,若正态,则相互独立X X ) X , , X

(55)

(八)大数定律和中心极限定理

1.

P

n a

n   X

 如果:

当时,

依概率收敛

0,lim (| n | ) 0

n P X a

    对任意的

(1) , ( ) ,

( ) ( )

n P n P

X a f x a

f X f a





若在点连续则 性质:

.

(2) , , ( , )

( , ( , ).

P P

n n

n n P

X a Y b g a b

g X Y g a b

 



若在连续,

则)

(56)

 

 

2

2

( )

0, ( ) .

1 ( ) .

2.

X Var X

Var X P X E X

Var X P X E X

 

的方差存在,则

对于任意都

为:

等价

有:

比雪夫不等式

(57)

1 2

1

, , , , ,

1

3.

n

n P

k k

X X X

n n X

 



设相互独立,具有相同的均值

同分布或同方差,则当时,

.

大数定律

,

A

A P

n n A

A p

n p n

n   

设为重贝努里试验中事件发生的次数,并记

事件在每次试验中发生的概率为,则有

当时.

贝努利大数定律:

(58)

   

2

2 2

1 1

( , )

, , , , , ,

4.

n

i i

i i

X X Xn E X V

n

ar X X N n n

近似

设独立同分布,

当充时分大~

中心极限定理

2 1

1 ( , )

n

i i

X N

n n

近似

( , ) ~ ( , (1 )).

n B n p 近似 N np np p 当充分大时,

特别地,

(59)

59

(九)统计量与抽样分布

1. 总体:

随机变量X

简单随

2. 机样本:

满足以下两个条件的 (X1,X2,…,Xn) 称为容量是

n 的简单随机样本:

(1) 代表性 : 每个 Xi 与 X 同分布;

(2) 独立性 : X1,X2,…,Xn 是相互独立的随机变

(60)

3. 统计量:样本的不含任何未知参数的函数。

1 2 1 2

1 2

, ,..., ) , ,..., ) , ,..., )

( , (

, ( .

n n

n

X X X g X X X

g X X X 设为样本若

不含任何未知参数则称为统计量

(61)

1

1 n i,

i

X X

n

样本均值

2 2

1 2

1 ( )

1 n i ,

i

S X X

n

S S

样本方差

样本标准差

1

1

1

1 ( )

n k

k i

i

n k

k i

i

A X

n

k B n X

k

X

样本阶原点矩:

样本阶中心矩:

4. 常用统计量:

(62)

 

 

2 2

1

1

, , 0,1

i

n n

i

X X

n

N

X

,

设相互独立,都服从则

2

5. 分布:

     

2

2 2

2

,

, 2

(1) . 设则    n E

n Va r

n

   

 

2

2 2

1 1 2 2 1 2

(2).

2

, ,

:

, .

Y n Y n Y

n

Y

Y Yn

 

  

 

设且相互独立,则

分布的可加性

(63)

(0,1),

2

( / .

, ( )

)

X N Y n X Y

X t n Y n

 

设且和相互独立.

6. t

分布:

(1) . t

1

( ) n   t n

( )

(2) .n  45, ( ) t n

z

(64)

7. F

分布:

   

 

1

1 2

2

2 2

1 , 2 , ,

/ ~ ,

/

X n F n n

X n

Y n

Y n X Y

设且独立,则

1 2

1

2 1

~ ( , ), ~ ( , ).

F F n n F n n (1) 若则 F

2 1

1 1 2

( , ) 1

( , )

F n n

F n n

(2)

參考文獻

相關文件

這兩個問題所牽涉到的極限類型是一樣的,而我們特別把這 種割線斜率的極限稱為導數 (derivative)

對於給定的一個 x 值,經過某一對應方式後得到「唯一」的 y 值,這種對應方式我們稱 為函數,其中 x 是自變數,y 是應變數。. 而在表

二、多元函数的概念 三、多元函数的极限

二年愛班有 7 位同學假日相約去爬山,秀秀帶了 113 個聖女小番茄分給大家品嚐,已知男生每 人分得 14 個,女生每人分得 17 個,剛好分完所有的小番茄,假設男生有

某班級做學生通車上學距離調查結果如下表,有 60%的男生、75%的女生通車上學的距離在一 公里內,且這些女生的人數比這些男生的人數多 6

对于二元函数的自变量,我

MASS::lda(Y~.,data) Linear discriminant analysis MASS::qda(Y~.,data) Quadratic Discriminant Analysis class::knn(X,X,Y,k,prob) k-Nearest Neighbour(X 為變數資料;Y 為分類)

⒊复习:有限信息最大或然法 (LIML,Limited Information Maximum Likelihood ). •