概率统计复习
概率:
( ) A
n
n A f A
n
频率: 发生次数 总次数
(一)概率
1. 非负性:; P A ( ) 0 2. 规范性:; P S ( ) 1
1, ,...2
3. A A
两两互
可列可加性 :
斥,
即( ) 1 ( ) P A P A 性质:
( ) ( ) ( ) ( ) P A B P A P B P AB
1 1
1
1 1 1 2
( ) ( ) ( )
( ) ( 1) ( )
n n
i i i j
i i j n
i
n
i j k n
i j k n
P A P A P A A
P A A A P A A A
( ) ( ) 0 ( | )
( )
P A P B A P AB
时
P A
条件概率: ,定义B A
在中所占的概率比例( | )
P A
注:也是一个概率
( | ) 1 ( | )
P B A P B A
S
B AB A
乘法公式
当下面的条件概率都有意义时:
( ) ( ) ( | ) P AB P A P B A
1 2
1 2 1 3 1 2 1 1
( )
( ) ( | ) ( | ) ( | )
n
n n
P A A A
P A P A A P A A A P A A A
1, 2, , n
B B B S
定义称为的一个: 划分,若
1 2
( ) i
不漏B B B
n S ,
( )ii
不重B B
i j ,i
j
.B
1B
2B
3B
4B
n1, , ,2 n ( ) 0.i
B B
B S P B
设为的一个划分全概
且则有 率公式:
1
( ) n ( )j ( | j )
j
P A P B P A B
1
( ) 0
( ) ( | ) ( | )
( ) ( | )
i i
i n
j j
j
P A
P B P A B P B A
P B P A B
Bayes
公对有
式:( )
j j, ( |
j)
j, 1,2,..., . P B p P A B q j n 设
1
( )
n j jj
P A p q
则
q1
B1
S A
p1
p2
pn
q2
qn
B2
Bn
P B A ( | )
i1
i i n
j j j
p q p q
,
X X
若随机变量的取值为有限个或可数 离散
型随
个 则称为 机变量.
(二)随机变量
分布律为:
P
… …
… …
x
1x
2x
kp
1p
2p
kX
( k ) k , 1,2, . P X x p k 或
1
0,
: k k 1
k
p p
分布律的性质X
, ,
( ) ( )
: X x
F x P X x X
随机变量对任意实数称函数
为的概率分布函数 分
定
,简称 义
布函数.
( )
F x 的几何意义
x
]( ) ( ( , ]) F x P X x
( )
F x 的性质:
(1) 0 F x( ) 1;
(4) ( )F x 是右连续函数即 , F x( 0) F x( ).
(2) ( )F x 单调不减;
(3) (F ) 0, F( ) 1;
1 2, 0 ( 1 2) x x P x X x
对有 F x( )2 F x( ).1
( ) ( 0) ( ) F x F x P X x
, 1,2,( ) .
k
k k
k x x
P X x p k
F x p
一般地,离散型随机变量的分布函数为阶梯函数.
如果分布律为 那么分布函数为
( ) , 1,2,
{ }.
k
k k
F x x x k
p P X x
在处有跳跃,
其跳跃值为
( )
: ,
,
X F x
f x x
对于随机变量的分布函数 若存在非负 的函数使对于任意实数
定义
有:
( ) x ( )
F x f t dt
, ( ) ,
X f x X
则称为其中称连续型随机变量 概率密度
为的 简称
函数 概率密度.
( ) y f x 面积为1
x
( ) f x
(2)
f x d x
( ) 1; 0
(1) ( ) 0; f x
( )f x
的性质:(3) ( ) ( ) , .
P X D
Df x d x
任意
D R
(4)在连续点f x
( ) x F x
, '( ) f x
( ).定义:设 E 是一个随机试验,样 本空间 S={e} ;设 X=X(e) 和 Y=Y(e) 是定义在 S 上的 随机变量,由它们构成的 向量 (X,Y) 称为二维随机 向量或二元随机变量。
y
x
e S
0
.
X e Y e( ), ( )( ) X e ( )
Y e
(三)二元随机变量
( , ) ,
( , ) ( , ) ( , )
X Y
x y
F x y P X x Y y X Y
定义:设是二元随机变量,对于任意 实数,二元函数
称为 二元随机变量的 联合分布函数。
0 x
x y,
联合分布函数 y( ), ( ),X Y
X Y
和也有它们自己的分布函数,分别记为:F x F y
并称他们为边际分布函数( ) ( ) ( , ) ( ) ( ) ( , )
X Y
F x P X x F x
F y P Y y F y
( ) 0,
P Y y Y y X 定义:
若则在条件下,的 条件分布函数为:
|
( , ) ( | ) ( | )
( )
X Y
P X x Y y F x y P X x Y y
P Y y
条件分布函数
| 0
0
( | ) ( | )
( , )
( )
F
X Yx y lim P X x y Y y P X x y Y y lim P y Y y
( | ).
P X x Y y
此时仍记为| ( | ) (
=
| ).F
X Yx y P X x Y y
即:( ) 0, 0, ( ) 0,
P Y y P y Y y
Y y X
若但对任一
则在条件下,的条件分布函数定义为:
二元离散型随机变量
定义:若二元随机变量 (X,Y) 全部可能取 到的不同值是有限对或可列无限 对,则称 (X,Y) 是二元离散型随机 变量。
, , ,
, , , 1, 2, ,
i j
i j ij
X Y x y
P X x Y y p i j
X Y
设所有可能取值为称
为二元离散型随机变量 的联合分布律。
离散随机变量的联合概率分布律
y1 y2 … yj …
X Y
p11 p12 … p1j … p21 p22 … p2j … pi1 pi2 … pij …
… … …
…
… … …
…
x1
x2
xi
1
p
ij 0,1 1
2 1
ij
i j
p
X,Y 的边际分布律为:
P X x (
i)
1
(
j)
ij ji
P Y y
p p
记为=
1
ij i
j
p p
记为=Y y j X
在条件下,的条件分布律为:
( )
( | ) 1, 2
( )
i j ij
i j
j j
P X x Y y p
P X x Y y i
P Y y p
,
X x i Y
在条件下,的条件分布律为:
X Y,
连续型称为二元随机变量.
,
,
f x y X Y
(联合)
并称为二元随机 概率密度
变量的
(函数)。
, , ,
, ,
( , ) x y ( , )
X Y F x y
f x y x y
F x y f u v dudv
定义:对于二元随机变量的分布函数
如果存在非负函数,使对于任意,
有
联合概率密度函数
概率密度的性质:
1. f x y, 0
2. f x y dxdy( , ) 1
3. ,
(( , ) ) ( , )
D
D xoy X Y D
P X Y D
f x y dxdy设是平面上的区域,点落在内的概率为:
2 ( , )
( , ) , F x y ( , ).
f x y x y f x y
4.在的连续点( ),有
( ) ( , ) ( ) ( , )
X
Y
f x f x y dy f y f x y dx
,
X Y 的边际密度函数为:
( ) 0,
f yY Y y X
若则在的条件下,的条件密度函数为:
( ) 0,
f xX X x Y
若则在的条件下,的条件密度函数为:
|
( , ) ( | )
X Y ( )
Y
f x y f x y
f y
|
( , ) ( | )
Y X ( )
X
f x y f y x
f x
( | ) Y X| ( | )
D
P Y D X x
f y x dy 条件概率( , )
( i, j) ij, , 1,2,...
X Y
P X x Y y p i j 二元离散型随机变量
联合分布律
二元离散型与连续型随机变量分布比较
( , ) ( , ) X Y f x y
二元连续型随机变量 联合概率密度
1
( i) ij i , 1,2,...
j
X
P X x p p i
的边际分布律( ) ( , )
X
X
f x f x y dy
的边际概率密度
( ) , 1, 2,...
i
ij
j i
i
X x Y
P Y y X x p j p
时的条件分布律
( , ) ( )
Y X ( )
X x Y
f x y f y x
f x
时的条件概率密度
27
( ) ( ) ( ) ,
P AB P A P B A B
如果,则称两个事件相互独立 (四)独立性
( ) 0
( | ) ( )
P A P B A P B
当时
( ) 0
( | ) ( )
P A P B A P B
当时
A B
直观含义:发生与否都不会改变发生的概率
相互独立两两独立
两两独立不能推出相互独立
1 2
1 2
1
1 1 2
, , , 2 ,
,... ,
, , ,
k j
n
k
k
i i i i
j n
A A A n k n
i i
P A A A P A
A A A
设为个随机事件,若对 以及不同的均有:
则称相互独立
( , ) ,
, ( ) , ( )
,
( , ) ( ) ( )
X Y
F x y X Y
F x X F y
Y x y
P X x Y y P X x P Y y 设是二元随机变量的分布
函数是的边际分布函数
是的边际分布函数,若对所有有:
即 ( , ) =
X( ) ( )
YF x y F x F y ,
X Y 相
称随机变量 互独立 。
独立性等价判断:
用分布律判断。对一切都成立 ,i j p
ij p p
i j(
i,
j) (
i) (
j), , P X x Y y P X x P Y y i j 离 散
型 即
(
j|
i) (
j), P Y y X x P Y y j
Y Y
即条件分布律与的边际分布律相等
独立性等价判断:
续 连 型
( , ) X ( ) ( )Y
f x y
f x f y .
即在平面上除去“面积”为零的集合以外,
上述等式处处成立。
( , ) x y 用密度函数判断。对在平面的点
几乎处处成立
|
( | ) ( )
Y X Y
f y x f y
Y Y
即的条件密度函数与的边际密度函数相等
(五)随机变量函数的分布
, ,
, .
X Y g X
g Y
问题:已知随机变量的分布
函数已知求的分布
1, ,2 , ;
{ } ,
( ) ( );
j j
j
Y Y
y y y
Y y X D
P Y y P X D
{ }
若为离散型随机变量,则先写出的可能取值:
再找出的等价事件得
, 1
( ) ( )
, ( ) ( )
( ) ( ).
Y
Y
Y Y
Y
Y
Y F y P Y y
Y y X D F y P X D
F y Y f y
{ } { }
若为连续型随机变量则
()确定的取值范围;
(2)写出的分布函数:,
找出的等价事件得;
(3)对求导得的概率密度函数
( ( ( )) d F h y
注意常用到复合函数求导:
~ ( ), , ( ) '( ) 0 ( '( ) 0),
( ( )) '( ) , , ( ) 0,
X
X Y
X f x x
Y g X g x g x Y
f h y h y y
f y
定理 设随机变量
,或
:
则具有概 率密度为:
其他.
( , )
( ) ( ).
Y h g
h y x y g x
其中是的取值范围,是的反函数,即
(
k) (
i,
k i)
i
P Z z P X x Y z x
离散型:
连续型:
Z X Y
(
k i,
i)
i
P X z y Y y
( ) ( ) F z
M P M z
max( , ,
1 n) M X X
(
1, ,
n) P X z X z
1
1 2
, , n
( ) ( ) ( )
n
X X
X X X
F z F z F z
如果相互独立
1 F z
N( ) P N z ( ) min( , ,
1 n) N X X
(
1, ,
n) P X z X z
1
1
, , n
(1 ( )) (1 ( ))
n
X X
X X
F z F z
如果相互独立
(六)数字特征
期望(数学期望,均值)
, ( )
( ) ,
i i i
x p X
E X
xf x dx X
-若是离散型 若是连续型 ( ) ,
( ( ))
( ) ( ) ,
i i
i
g x p X
E g X
g x f x dx X
-若是离散型 若是连续型
( , ) , ( , ) ( ( , ))
( , ) ( , ) , ( , )
i j ij
i
g x y p X Y E g X Y
g x y f x y dxdy X Y
-若是离散型
若是连续型
( , )
( ) ( , ) ( ) ( , )
X Y
E X xf x y dxdy E Y yf x y dxdy
特别地,若是连续型,则
2
( ) ( ) [ ( )] . D X Var X E X E X
2 2
( ) [ ( )]
E X E X
= 方差:
2 2
( ) ( ) [ ( )]
E X Var X E X
标准差: ( )X Var X( )
1.
( i i ) i ( )i
i i
E b
a X b
a E X均值具有线性性 性质:
2.Var aX b( ) a Var X2 ( )
3.Var X Y( ) Var X( ) Var Y( ) 2 Cov X Y( , )
协方差:
( ) ( ) ( ) E XY E X E Y
( , ) [ ( )][ ( )]
Cov X Y
E X
E X Y
E Y
( ) ( , ) ( ) ( ) E XY Cov X Y E X E Y
性质:
3.
( i i, ) i ( , )i
i i
Cov
a X Y
a Cov X Y线性性
1.对称性Cov X Y( , ) Cov Y X( , ) 2.Cov X X( , ) Var X( )
( , ,X1 Xn )的协方差矩阵:
( ) ,ij n n ij ( ,i j )
A
a
其中a
Cov X X
X Y与的相关系数:( , ) ( ) ( )
XY
Cov X Y D X D Y
1
XY1
XY 0
X Y与不相关:
Cov X Y
( , ) 0X Y与独立与不相关 X Y 反之不一定成立
( ) ( ) ( ) E XY E X E Y
( ) ( ) ( )
Var X Y Var X Var Y
(七)九大分布
0 1 ( )
~ 0 1( ) ~ ) 1
(1 .
,
X p X B p
记为 或
分布或两点分布
0 1
1 0 1.
X
P p p 其中 p
(P X k ) pk (1 p) ,1k k 0, 1.
分布律还可写为
( ) , ( ) (1 ) E X p Var X p p
{ } nk k(1 )n k 0,1,..., P X k C p p ,k n
2.
二项分布,记为 X B n p
~ ( , )0 1
n p
这里是正整数,
( ) , ( ) (1 ) E X np Var X np p
3.参数为的记为 或
泊松分布, X ~ ( )
X P ( )
( ) , 0,1, 2, ,
! 0
ke
P X k k
k
其中
( ) ( )
E X Var X
1 , ( , );
( )
0,
x a b f x b a
其他.
( , ) , ~ ( ,
4.
a b
上的均匀分布 记为X U a b
)[ , ] [ , ], ( [ , ])
a b c d
P X c d d c
b a
性质:对任何的子区间
( )2
( ) , ( )
2 12
a b b a
E X Var X
, 0;
( )
0 , 0, e x x
f x x
1 , 0;
( ) 0, 0.
e x x
F x x
分布函数为
~ ( )
0
X E
指数分布5.
参数为的,
记为0,
( | ) ( ) t
t s
P X s t X s P X t e
无记忆性:对,
~ ( 2 )
X N
6.
正态分布,,记为2 2
( )
1 2
( ) , ,
2
x
f x e x
(1) X (0,1)
N
性质:
(2) ( ) ( ), ( ) (0,1)
F x x x
N
分布函数其中为标准 正态分布的分布函数
(3) ( ) 1 x ( )x ,( ) 1z , z1 z (4) ( )E X ,Var X( ) 2
( , ) 1 ( , ) ( , )
0
D X Y
x y D f x y D
, ,
假设的面积有限,的联合密度函数为:
的面积 其他
1 1 1
, (( , ) )
D D
P X Y D D
D
:对的任何子区域都有 质
的面积 性
的面积
( , ) ~ ( )
D X Y U D
7.
平面区域上的均匀分布, 记为2 2
1 2 1 2
( , )
X Y
~N
( , , , , ) 二元正态分布8 . ,
记为2 2
1 1 2 2
(1)X N ( , ), Y N ( , ) 性质:
(2) XY
(3)X Y与独立与不相关 =0 X Y
9.
多元正态分布(1)( , ,X1 Xn )正态每个分 Xi 质
量 性:
正态
( , ,1 )
i n
X X X
每个分量正态,且相互独立正态
1 1
(2)( , , n) n i i
i
X X a X
正态所有线性组合正态
1
1 1
(3)( , , )
, , ( , , )
n
i n m
X X
Y X X Y Y
正态
若每个都是的线性组合,则正态
(4) ( , ,若正态,则相互独立X X ) X , , X
(八)大数定律和中心极限定理
1.
P
n a
n X
如果:当时,
依概率收敛
0,lim (| n | ) 0
n P X a
对任意的
(1) , ( ) ,
( ) ( )
n P n P
X a f x a
f X f a
若在点连续则 性质:
.
(2) , , ( , )
( , ( , ).
P P
n n
n n P
X a Y b g a b
g X Y g a b
若在连续,
则)
2
2
( )
0, ( ) .
1 ( ) .
2.
X Var XVar X P X E X
Var X P X E X
的方差存在,则
对于任意都
为:
等价
有:
: 比雪夫不等式 设 切
1 2
1
, , , , ,
1
3.
n
n P
k k
X X X
n n X
设相互独立,具有相同的均值
同分布或同方差,则当时,
.
大数定律:
,
A
A P
n n A
A p
n p n
n
设为重贝努里试验中事件发生的次数,并记
事件在每次试验中发生的概率为,则有
当时.
贝努利大数定律:
2
2 2
1 1
( , )
, , , , , ,
4.
n
i i
i i
X X Xn E X V
n
ar X X N n n
近似
设独立同分布,
则当充时分大~
: 中心极限定理
2 1
1 ( , )
n
i i
X N
n n
近似~( , ) ~ ( , (1 )).
n B n p 近似 N np np p 当充分大时,
特别地,
59
(九)统计量与抽样分布
1. 总体:
随机变量X简单随
2. 机样本:
满足以下两个条件的 (X1,X2,…,Xn) 称为容量是
n 的简单随机样本:
(1) 代表性 : 每个 Xi 与 X 同分布;
(2) 独立性 : X1,X2,…,Xn 是相互独立的随机变 量
3. 统计量:样本的不含任何未知参数的函数。
1 2 1 2
1 2
, ,..., ) , ,..., ) , ,..., )
( , (
, ( .
n n
n
X X X g X X X
g X X X 设为样本若
不含任何未知参数则称为统计量
1
1 n i,
i
X X
n
样本均值
2 2
1 2
1 ( )
1 n i ,
i
S X X
n
S S
样本方差
样本标准差
1
1
1
1 ( )
n k
k i
i
n k
k i
i
A X
n
k B n X
k
X
样本阶原点矩:
样本阶中心矩:
4. 常用统计量:
2 2
1
1
, , 0,1
i
n n
i
X X
n
N
X
,
设相互独立,都服从则
2
5. 分布:
22 2
2
,
, 2(1) . 设则 n E
n Va r
n
2
2 2
1 1 2 2 1 2
(2).
2, ,
:
, .
Y n Y n Y
n
Y
Y Y n
设且相互独立,则
分布的可加性
(0,1),
2( / .
, ( )
)
X N Y n X Y
X t n Y n
设且和相互独立.
则
6. t
分布:(1) . t
1( ) n t n
( )
(2) . 当 n 45, ( ) t n
z
7. F
分布:
1
1 2
2
2 2
1 , 2 , ,
/ ~ ,
/
X n F n n
X n
Y n
Y n X Y
设且独立,则
1 2
1
2 1~ ( , ), ~ ( , ).
F F n n F n n (1) 若则 F
2 1
1 1 2
( , ) 1
( , )
F n n
F n n