2-3: 多维随机变量
张伟平
课件 http://staff.ustc.edu.cn/~zwp/
论坛 http://fisher.stat.ustc.edu.cn
第二章随机变量及其分布
2.3 多维分布与边际分布
. . . . 1
2.3.1 多维分布. . . . 1
2.3.2 边缘分布. . . 14
2.3 多维分布与边际分布
2.3.1 多维分布
在实际应用中,经常需要对所考虑的问题用多个变量来描述. 我 们把多个随机变量放在一起组成向量,称为多维随机变量或者随机向 量.
↑Example
从一副扑克牌中抽牌时, 可以用纸牌的花色和数字来说明其特征.
↓Example
↑Example
考虑一个打靶的试验. 在靶面上取定一个直角坐标系. 则命中的 位置可由其坐标 (X, Y ) 来刻划. X,Y 都是随机变量.
↓Example
Previous Next First Last Back Forward 1
设 X = (X1, . . . , Xn). 如果每个 Xi 都是一个随机变量,
i = 1,· · · , n,则称 X 为 n 维随机变量或者随机向量. Definition
我们可以按照对常用一维随机变量的分类把常用的随机向量分 为离散型、连续型以及其他类型.
如果每一个 Xi 都是一个离散型随机变量,i = 1, ..., n,则称 X = (X1, . . . , Xn) 为一 n 维离散随机变量. 设 Xi 的所有 可能取值 (有限或可数个) 为 {ai1, ai2,· · · }, i = 1, . . . , n, 则称
p(j1,· · · , jn) = P (X1= a1j1, . . . , Xn= anjn), j1, ..., jn= 1, 2, ...
(2.1) 为 n 维随机变量 X 的概率函数.
Definition
容易证明概率函数具有下列性质:
(1) p(j1, . . . , jn)≥ 0, ji= 1, 2,· · · , i = 1, 2, . . . , n;
(2) ∑
j1,··· ,jn
p(j1, . . . , jn) = 1.
Previous Next First Last Back Forward 3
↑Example
设 A1,· · · , An 为某一实验下的完备事件群,即 A1,· · · , An 两 两互斥且和为 Ω。记 pk = P (Ak)(k = 1, . . . , n),则 pk ≥ 0, p1+
· · · + pn = 1。现将实验独立的重复作 N 次,分别用 Xi 表示事
件 Ai 出现的次数 (i = 1,· · · , n)。则 X = (X1, . . . , Xn) 为一离散 型随机向量,试求 X 的概率函数。此分布律称为多项分布, 记为
M (N ; p1, . . . , pn). ↓Example
解: 由于试验独立进行, 总的结果数为 N ,记结果 Ai 出现的次数为 ki,则 k1+· · · + kn= N 。因此相当于多组组合,所以
P (X1= k1,· · · , Xn= kn) = N !
k1!· · · kn!P (A1· · · A1. . . An· · · An)
= N !
k1!· · · kn!pk11· · · pknn, 其中 k1, . . . , kn 为非负整数且 k1+· · · + kn= N .
我们来看一下 Xi的分布:此时我们把试验结果分为两类, Ai 和 A¯i,则显然就是一个 N 重贝努里试验,因此
P (Xi= ki) = (
N ki
)
pkii(1− pi)N−ki, ki= 1,· · · , N.
类似我们也可以找出 (Xi, Xj)(i̸= j) 的联合分布律,即为 M(N, pi, pj, 1− pi− pj).
Previous Next First Last Back Forward 5
我们具体来看一下二维离散分布. 设二维离散型随机变量 (X, Y ) 的所有可能取值为{(xi, yj) : i = 1, ..., n, j = 1, 2, ..., m}. 这里 n, m 为有限数或者无穷. 我们经常以列联表的形式来表示二维离散型随机 变量的概率分布. 记
pij= P (X = xi, Y = yj), i = 1, ..., n, j = 1, ..., m.
则 (X, Y ) 的概率函数可以用下表表示:
HHX HHHH
Y y1 x2 · · · ym 行和
x1 p11 p12 · · · p1m p1·
x2 p12 p22 · · · p2m p2·
... ... ... ... ... ... xn pn1 pn2 ... pnm pn·
列和 p·1 p·2 · · · p·m 1
↑Example
从一个包含五个黑球, 六个白球和七个红球的罐子里抽取四个 球. 令 X 是抽到白球的数目, Y 是抽到红球的数目. 则二维随机变量 (X, Y ) 的概率函数为
p(x, y) = (6
x
)(7 y
)( 5 4−x−y
) (18
4
) , 0≤ x + y ≤ 4. (2.2)
↓Example
以列联表表示, 即为
Previous Next First Last Back Forward 7
HHY HHHH
X 0 1 2 3 4 行和
0 1
612 1 51
5 102
5 153
1 204
11 102
1 7
306 7 51
35 204
7 153
77 204
2 7
102 7 34
7 68
7 17
3 61235 1027 61277
4 6127 6127
列和 99
612 22 51
11 34
4 51
1
204 1
类似于一维连续型随机变量, 连续型随机向量的也是由密度函数 来刻画的.
称 X = (X1, . . . , Xn) 为 n 维连续型随机变量,如果存在 Rn 上的非负函数 f (x1, . . ., xn),使得对任意的 −∞ <
a1≤ b1< +∞, ..., −∞ < an≤ bn< +∞, 有 P (a1≤ X1 ≤ b1, ..., an≤ Xn≤ bn) =
∫ bn
an
...
∫ b1
a1
f (x1, . . . , xn)dx1· · · dxn,
则称 f 为 X 的概率密度函数.
Definition
Previous Next First Last Back Forward 9
称 X = (X1, . . . , Xn) 为 n 维连续型随机变量,如果存在 Rn 上的非负函数 f (x1, . . ., xn),使得对任意的 −∞ <
x1< +∞, ..., −∞ < xn< +∞, 有 F (x1, ..., xn) =
∫ xn
−∞
...
∫ x1
−∞
f (t1, . . . , tn)dt1· · · dtn,
则称 f 为 X 的概率密度函数.
Definition
对 n 维随机变量我们也有分布函数的概念.
设 X = (X1, . . . , Xn) 为 n 维 随 机 变 量. 对 任 意 的 (x1, . . . , xn)∈ Rn,称
F (x1, . . . , xn) = P (X1≤ x1, . . . , Xn≤ xn) (2.3) 为 n 维随机变量 X 的 (联合) 分布函数.
Definition
可以验证分布函数 F (x1, . . . , xn) 具有下述性质:
(1) F (x1,· · · , xn) 对每个变元单调非降;
(2) 对任意的 1≤ j ≤ n 有, lim
xj→−∞F (x1,· · · , xn) = 0;
(3) lim
x1→∞,··· ,xn→∞F (x1,· · · , xn) = 1.
Previous Next First Last Back Forward 11
对 n 维连续型随机变量, 从密度的定义我们有,
F (x1, . . . , xn) =
∫ xn
−∞
...
∫ x1
−∞
f (x1, ..., xn)dx1...dxn.
对高维离散型随机变量, 一般我们不使用分布函数.
↑Example
考虑二维随机变量 X = (X1, X2),其概率密度函数为
f (x1, x2) =
{ 1/[(b− a)(d − c)] 当 a ≤ x1 ≤ b, c ≤ x2≤ d,
0 其它.
称此概率密度为 [a, b]× [c, d] 上的均匀分布. ↓Example
↑Example
设 (X, Y ) 的概率密度函数有形式
f (x, y) = 1
2πσ1σ2
√1− ρ2exp {
− 1
2(1− ρ2)
[(x− a)2 σ12
−2ρ(x− a)(y − b) σ1σ2
+(y− b)2 σ22
]}
其中−∞ < a, b < ∞, 0 < σ1, σ2<∞, −1 ≤ ρ ≤ 1. 称 (X, Y ) 服从
参数为 a, b, σ1, σ2, ρ 的二元正态分布,记为 N (a, b, σ21, σ22, ρ). ↓Example
Previous Next First Last Back Forward 13
2.3.2 边缘分布
设 (X1, ..., Xn) ∼ F 已知. 令 (i1, ..., im) ⊂ (1, ..., n), 则 Xi1, ..., Xim 的分布称为 X1, ..., Xn 或 F 的一个m 维边缘分布. 如何得到该分布?
我们先考虑离散型随机向量. 设二维离散随机变量 (X, Y ) 的所 有可能取值为{(xi, yj) : i = 1, ..., n, j = 1, 2, ..., m.}(这里 n, m 为有 限数或者无穷),则 (X, Y ) 的联合分布律为
P (X = xi, Y = yj) = pij i = 1, ..., n, j = 1, 2, ..., m.
以列联表的形式表示就是 HHY HHHH
X x1 x2 · · · xn 行和
y1 p11 p21 · · · pn1 p·1 y2 p12 p22 · · · pn2 p·2 ... ... ... ... ... ... ym p1m p2m ... pnm p·m 列和 p1· p2· · · · pn· 1
从上述列联表我们可以计算随机变量 X 和 Y 的分布. 固定某个 xi. 因为 Y 在使得 X = xi 的那些样本点上必取值为 y1, ..., ym中之 一, 故有
pX(xi) = P (X = xi) =
∑m j
P (X = xi, Y = yj) =
∑m j
pij= pi·, i = 1, 2,· · · n.
Previous Next First Last Back Forward 15
所以上述列联表的行和所表示的正是 X 的分布. 因为这个分布是从 X 和 Y 的联合分布推导出来的, 我们称其为 X 的边缘分布.
类似可以得到 Y 的边缘分布律
pY(yj) = P (Y = yj) =
∑n i
pij= p·j, j = 1, 2,· · · m.
它是上述列联表的列和.
n 维场合:
类 似 地, 可 对 n (n > 2) 维 的 随 机 变 量 定 义 边 缘 分 布. 设 X1, ..., Xn为 n 维随机变量,其概率分布 F 已知. 令 i1<· · · < im 为 1, ..., n 的任一子集,则 Xi1, ..., Xim 的概率函数为
pi1...im(ji1, ..., jim) = P (Xi1= ai1ji1, ..., Xim = aimjim)
= P (Xi1= ai1ji1, ..., Xim = aimjim)
= ∑
jim+1,...,jin
P (X1= a1j1, ..., Xi1= ai1ji1, ..., Xim = aimjim,
Xim+1 = aim+1jim+1, ..., Xn= anjn)
= ∑
除ji1,...,jim的所有
p(j1, ..., jn).
其中和是对除 Xi1, ..., Xim 之外的所有变量来求和.
Previous Next First Last Back Forward 17
↑Example
袋中有 5 张外形相同的卡片,其中 3 张写上数字”0”,另 2 张写 上”1”。现从袋中任取两张卡片,分别以 ξ, η 表示第一张和第二张卡 片上的数字,试求分别在有放回和不放回两种情形下 (ξ, η) 的联合分
布律及边际分布律. ↓Example
解:简单计算得到
η\ξ 0 1 p·j
0 9/25 6/25 3/5 1 6/25 4/25 2/5 pi· 3/5 2/5 1
η\ξ 0 1 p·j
0 6/20 6/20 3/5 1 6/20 2/20 2/5 pi· 3/5 2/5 1
这个例子说明边际分布律不能决定联合分布律。
现考虑连续型随机向量的边缘分布. 先考虑二维的情形. 设 (X, Y ) 有概率密度函数 f (x, y). 则
P (x1≤ X ≤ x2) = P (x1≤ X ≤ x2,−∞ < Y < +∞)
=
∫ +∞
−∞
∫ x2
x1
f (u, v)dudv
=
∫ x2
x1
fX(u)du, (2.4)
其中
fX(u) =
∫ +∞
−∞
f (u, v)dv. (2.5)
从 (2.4) 我们可以看出, X 的边缘密度函数即为 (2.5). 类似地, Y 的 边缘密度函数为
fY(u) =
∫+∞
−∞
f (u, v)du. (2.6)
Previous Next First Last Back Forward 19
当 n > 2 时, 令 f (x1, ..., xn) 为 n 维连续型随机变量 (X1, ..., Xn) 的概率密度函数. 设 (i1,· · · , im) 为 (1, 2, ..., n) 的一个子集. 则同上 可证, 则 (Xi1, ..., Xim) 的概率密度函数是联合密度函数 f (x1, ..., xn) 对除 Xi1, ..., Xim 之外的所有变量求积分.
↑Example
设 (X1, X2) 服从 N (a, b, σ12, σ22, ρ). 则可证明 X1 的边缘分布为
N (a, σ12),X2 的边缘分布为 N (b, σ22). ↓Example
例2.3.2说明了虽然 n 维随机变量 X = (X1, ..., Xn) 的分布可以 唯一决定其所有的边缘分布,但边缘分布不足以决定 X 的联合分布.
↑Example
考虑两个概率密度函数
p(x, y) = x + y, 0 < x, y < 1 q(x, y) = (x +1
2)(y +1
2), 0 < x, y < 1 试求边际概率密度。
↓Example
解:易得所求边际概率密度都是如下形式
f (t) = t + 1
2, 0 < t < 1.
说明边际概率密度不能决定联合概率密度。
Previous Next First Last Back Forward 21
↑Example
设 (X, Y ) 的联合概率密度有形式 (∀(x, y) ∈ R2)
f (x, y) = 1
2πσ1σ2
√1− ρ2exp {
− 1
2(1− ρ2)
[(x− a)2 σ12
−2ρ(x− a)(y − b) σ1σ2
+(y− b)2 σ22
]}
其中−∞ < a, b < ∞; 0 < σ1, σ2<∞; −1 ≤ ρ ≤ 1. 则称 (X, Y ) 服 从参数为 a, b, σ1, σ2, ρ 的二元正态分布,记为 N (a, b, σ21, σ22, ρ). 试
计算 X 和 Y 的边际概率密度。 ↓Example
解:
fX(x) =
∫∞
−∞
f (x, y)dy
=
∫∞
−∞
1 2πσ1σ2
√1− ρ2exp {
− 1
2(1− ρ2)
[(x− a)2 σ12
−2ρ(x− a)(y − b) σ1σ2
+(y− b)2 σ22
]}
dy
=
∫∞
−∞
1 2πσ1
√1− ρ2exp {
−u2− 2ρuv + v2 2(1− ρ2)
} dv
=
∫∞
−∞
1 2πσ1
exp{−1
2[(√v− ρu
1− ρ2)2+ u2]}dv
= 1
√2πσ1
exp{−(x− a)2 2σ21 }
即 X ∼ N(a, σ12). 类 似 可 得 Y ∼ N(b, σ22), 其 边 际 概 率 密 度 为 fY(y) =√ 1
2πσ2exp{−(y−b)2σ22 2 }.
PreviousNextFirst Last Back Forward 23