2-3: 多维随机变量

(1)

2-3: 多维随机变量

张伟平

课件 http://staff.ustc.edu.cn/~zwp/

论坛 http://fisher.stat.ustc.edu.cn

(2)

第二章随机变量及其分布

2.3 多维分布与边际分布

. . . . 1

2.3.1 多维分布

. . . . 1

2.3.2 边缘分布

. . . 14

(3)

2.3 多维分布与边际分布

2.3.1 多维分布

在实际应用中，经常需要对所考虑的问题用多个变量来描述. 我们把多个随机变量放在一起组成向量，称为多维随机变量或者随机向量.

↑Example

从一副扑克牌中抽牌时, 可以用纸牌的花色和数字来说明其特征.

↓Example

↑Example

考虑一个打靶的试验. 在靶面上取定一个直角坐标系. 则命中的 位置可由其坐标 (X, Y ) 来刻划. X,Y 都是随机变量.

↓Example

Previous Next First Last Back Forward 1

(4)

设 X = (X1, . . . , Xn). 如果每个 Xi 都是一个随机变量，

i = 1,· · · , n，则称 X 为 n 维随机变量或者随机向量. ^Deﬁnition

我们可以按照对常用一维随机变量的分类把常用的随机向量分为离散型、连续型以及其他类型.

(5)

如果每一个 Xi 都是一个离散型随机变量，i = 1, ..., n，则称 X = (X1, . . . , Xn) 为一 n 维离散随机变量. 设 Xi 的所有可能取值 (有限或可数个) 为 {aⁱ¹, ai2,· · · }, i = 1, . . . , n, 则称

p(j1,· · · , jⁿ) = P (X1= a1j₁, . . . , Xn= anjn), j1, ..., jn= 1, 2, ...

(2.1) 为 n 维随机变量 X 的概率函数.

Deﬁnition

容易证明概率函数具有下列性质:

(1) p(j₁, . . . , jn)≥ 0, ji= 1, 2,· · · , i = 1, 2, . . . , n;

(2) ∑

j₁,··· ,jn

p(j1, . . . , jn) = 1.

(6)

↑Example

设 A1,· · · , Aⁿ 为某一实验下的完备事件群，即 A1,· · · , Aⁿ 两 两互斥且和为 Ω。记 pk = P (Ak)(k = 1, . . . , n)，则 pk ≥ 0, p¹+

· · · + pⁿ = 1。现将实验独立的重复作 N 次，分别用 Xi 表示事

件 Ai 出现的次数 (i = 1,· · · , n)。则 X = (X¹, . . . , Xn) 为一离散 型随机向量，试求 X 的概率函数。此分布律称为多项分布, 记为

M (N ; p1, . . . , pn). _↓Example

解: 由于试验独立进行, 总的结果数为 N ，记结果 Ai 出现的次数为 ki，则 k1+· · · + kⁿ= N 。因此相当于多组组合，所以

P (X1= k1,· · · , Xⁿ= kn) = N !

k1!· · · kⁿ!P (A1· · · A¹. . . An· · · Aⁿ)

= N !

k1!· · · kⁿ!p^k₁¹· · · p^kⁿⁿ, 其中 k1, . . . , kn 为非负整数且 k1+· · · + kⁿ= N .

(7)

我们来看一下 Xi的分布：此时我们把试验结果分为两类, Ai 和 A¯i，则显然就是一个 N 重贝努里试验，因此

P (Xi= ki) = (

N ki

)

p^k_iⁱ(1− pⁱ)^N^−kⁱ, ki= 1,· · · , N.

类似我们也可以找出 (Xi, Xj)(i̸= j) 的联合分布律，即为 M(N, pⁱ, pj, 1− pi− p^j).

(8)

我们具体来看一下二维离散分布. 设二维离散型随机变量 (X, Y ) 的所有可能取值为{(xⁱ, yj) : i = 1, ..., n, j = 1, 2, ..., m}. 这里 n, m 为有限数或者无穷. 我们经常以列联表的形式来表示二维离散型随机变量的概率分布. 记

pij= P (X = xi, Y = yj), i = 1, ..., n, j = 1, ..., m.

则 (X, Y ) 的概率函数可以用下表表示:

HH^X HHHH

Y y1 x2 · · · ym 行和

x1 p11 p12 · · · p1m p1·

x2 p12 p22 · · · p2m p2·

... ... ... ... ... ... xn pn1 pn2 ... pnm p_n·

列和 p_·1 p_·2 · · · p_·m 1

(9)

↑Example

从一个包含五个黑球, 六个白球和七个红球的罐子里抽取四个 球. 令 X 是抽到白球的数目, Y 是抽到红球的数目. 则二维随机变量 (X, Y ) 的概率函数为

p(x, y) = (6

x

)(7 y

)( 5 4−x−y

) (₁₈

4

) , 0≤ x + y ≤ 4. (2.2)

↓Example

以列联表表示, 即为

(10)

HH^Y HHHH

X 0 1 2 3 4 行和

0 ¹

612 1 51

5 102

5 153

1 204

11 102

1 ⁷

306 7 51

35 204

7 153

77 204

2 ⁷

102 7 34

7 68

7 17

3 ₆₁₂³⁵ ₁₀₂⁷ ₆₁₂⁷⁷

4 ₆₁₂⁷ ₆₁₂⁷

列和 ⁹⁹

612 22 51

11 34

4 51

1

204 1

类似于一维连续型随机变量, 连续型随机向量的也是由密度函数来刻画的.

(11)

称 X = (X1, . . . , Xn) 为 n 维连续型随机变量，如果存在 Rⁿ 上的非负函数 f (x1, . . ., xn)，使得对任意的 −∞ <

a1≤ b¹< +∞, ..., −∞ < aⁿ≤ bⁿ< +∞, 有 P (a1≤ X¹ ≤ b¹, ..., an≤ Xⁿ≤ bⁿ) =

∫ b_n

a_n

...

∫ b₁

a₁

f (x1, . . . , xn)dx1· · · dxⁿ,

则称 f 为 X 的概率密度函数.

Deﬁnition

(12)

称 X = (X1, . . . , Xn) 为 n 维连续型随机变量，如果存在 Rⁿ 上的非负函数 f (x1, . . ., xn)，使得对任意的 −∞ <

x1< +∞, ..., −∞ < xⁿ< +∞, 有 F (x1, ..., xn) =

∫ xn

−∞

...

∫ x1

−∞

f (t1, . . . , tn)dt1· · · dtⁿ,

则称 f 为 X 的概率密度函数.

Deﬁnition

对 n 维随机变量我们也有分布函数的概念.

(13)

设 X = (X1, . . . , Xn) 为 n 维随机变量. 对任意的 (x1, . . . , xn)∈ Rⁿ，称

F (x1, . . . , xn) = P (X1≤ x¹, . . . , Xn≤ xⁿ) (2.3) 为 n 维随机变量 X 的 (联合) 分布函数.

Deﬁnition

可以验证分布函数 F (x1, . . . , xn) 具有下述性质:

(1) F (x₁,· · · , xn) 对每个变元单调非降;

(2) 对任意的 1≤ j ≤ n 有， lim

x_j→−∞F (x1,· · · , xⁿ) = 0;

(3) lim

x₁→∞,··· ,xn→∞F (x1,· · · , xn) = 1.

(14)

对 n 维连续型随机变量, 从密度的定义我们有,

F (x1, . . . , xn) =

∫ x_n

−∞

...

∫ x₁

−∞

f (x1, ..., xn)dx1...dxn.

对高维离散型随机变量, 一般我们不使用分布函数.

↑Example

考虑二维随机变量 X = (X1, X2)，其概率密度函数为

f (x1, x2) =

{ 1/[(b− a)(d − c)] 当 a ≤ x¹ ≤ b, c ≤ x²≤ d,

0 其它.

称此概率密度为 [a, b]× [c, d] 上的均匀分布. _↓Example

(15)

↑Example

设 (X, Y ) 的概率密度函数有形式

f (x, y) = 1

2πσ1σ2

√1− ρ²exp {

− 1

2(1− ρ²)

[(x− a)² σ₁²

−2ρ(x− a)(y − b) σ1σ2

+(y− b)² σ²₂

]}

其中−∞ < a, b < ∞, 0 < σ¹, σ2<∞, −1 ≤ ρ ≤ 1. 称 (X, Y ) 服从

参数为 a, b, σ1, σ2, ρ 的二元正态分布，记为 N (a, b, σ²1, σ²2, ρ). _↓Example

(16)

2.3.2 边缘分布

设 (X1, ..., Xn) ∼ F 已知. 令 (i¹, ..., im) ⊂ (1, ..., n), 则 Xi₁, ..., Xi_m 的分布称为 X1, ..., Xn 或 F 的一个m 维边缘分布. 如何得到该分布?

我们先考虑离散型随机向量. 设二维离散随机变量 (X, Y ) 的所 有可能取值为{(xⁱ, yj) : i = 1, ..., n, j = 1, 2, ..., m.}(这里 n, m 为有 限数或者无穷)，则 (X, Y ) 的联合分布律为

P (X = xi, Y = yj) = pij i = 1, ..., n, j = 1, 2, ..., m.

(17)

以列联表的形式表示就是 HH^Y HHHH

X x1 x2 · · · xn 行和

y1 p11 p21 · · · pn1 p_·1 y2 p12 p22 · · · pn2 p_·2 ... ... ... ... ... ... ym p1m p2m ... pnm p_·m 列和 p1· p2· · · · pn· 1

从上述列联表我们可以计算随机变量 X 和 Y 的分布. 固定某个 xi. 因为 Y 在使得 X = xi 的那些样本点上必取值为 y1, ..., ym中之一, 故有

pX(xi) = P (X = xi) =

∑m j

P (X = xi, Y = yj) =

∑m j

pij= pi·, i = 1, 2,· · · n.

(18)

所以上述列联表的行和所表示的正是 X 的分布. 因为这个分布是从 X 和 Y 的联合分布推导出来的, 我们称其为 X 的边缘分布.

类似可以得到 Y 的边缘分布律

pY(yj) = P (Y = yj) =

∑n i

pij= p_·j, j = 1, 2,· · · m.

它是上述列联表的列和.

(19)

n 维场合:

类似地, 可对 n (n > 2) 维的随机变量定义边缘分布. 设 X1, ..., Xn为 n 维随机变量，其概率分布 F 已知. 令 i1<· · · < i^m 为 1, ..., n 的任一子集，则 Xi₁, ..., Xi_m 的概率函数为

pi1...im(ji1, ..., jim) = P (Xi1= ai1j_i1, ..., Xim = aimj_im)

= P (Xi₁= ai₁j_i1, ..., Xi_m = ai_mj_im)

= ∑

j_im+1,...,j_in

P (X1= a1j₁, ..., Xi₁= ai₁j_i1, ..., Xi_m = ai_mj_im,

Xi_m+1 = ai_m+1j_im+1, ..., Xn= anj_n)

= ∑

除j_i1,...,j_im的所有

p(j1, ..., jn).

其中和是对除 Xi₁, ..., Xi_m 之外的所有变量来求和.

(20)

↑Example

袋中有 5 张外形相同的卡片，其中 3 张写上数字”0”，另 2 张写 上”1”。现从袋中任取两张卡片，分别以 ξ, η 表示第一张和第二张卡 片上的数字，试求分别在有放回和不放回两种情形下 (ξ, η) 的联合分

布律及边际分布律. _↓Example

解：简单计算得到

η\ξ 0 1 p_·j

0 9/25 6/25 3/5 1 6/25 4/25 2/5 pi· 3/5 2/5 1

η\ξ 0 1 p_·j

0 6/20 6/20 3/5 1 6/20 2/20 2/5 pi· 3/5 2/5 1

这个例子说明边际分布律不能决定联合分布律。

(21)

现考虑连续型随机向量的边缘分布. 先考虑二维的情形. 设 (X, Y ) 有概率密度函数 f (x, y). 则

P (x1≤ X ≤ x²) = P (x1≤ X ≤ x²,−∞ < Y < +∞)

=

∫ +∞

−∞

∫ x₂

x₁

f (u, v)dudv

=

∫ x2

x1

fX(u)du, (2.4)

其中

fX(u) =

∫ +∞

−∞

f (u, v)dv. (2.5)

从 (2.4) 我们可以看出, X 的边缘密度函数即为 (2.5). 类似地, Y 的边缘密度函数为

fY(u) =

∫+∞

−∞

f (u, v)du. (2.6)

(22)

当 n > 2 时, 令 f (x1, ..., xn) 为 n 维连续型随机变量 (X1, ..., Xn) 的概率密度函数. 设 (i1,· · · , i^m) 为 (1, 2, ..., n) 的一个子集. 则同上 可证, 则 (Xi₁, ..., Xim) 的概率密度函数是联合密度函数 f (x1, ..., xn) 对除 Xi₁, ..., Xi_m 之外的所有变量求积分.

↑Example

设 (X1, X2) 服从 N (a, b, σ₁², σ²₂, ρ). 则可证明 X1 的边缘分布为

N (a, σ1²)，X2 的边缘分布为 N (b, σ²₂). _↓Example

(23)

例2.3.2说明了虽然 n 维随机变量 X = (X1, ..., Xn) 的分布可以 唯一决定其所有的边缘分布，但边缘分布不足以决定 X 的联合分布.

↑Example

考虑两个概率密度函数

p(x, y) = x + y, 0 < x, y < 1 q(x, y) = (x +1

2)(y +1

2), 0 < x, y < 1 试求边际概率密度。

↓Example

解：易得所求边际概率密度都是如下形式

f (t) = t + 1

2, 0 < t < 1.

说明边际概率密度不能决定联合概率密度。

(24)

↑Example

设 (X, Y ) 的联合概率密度有形式 (∀(x, y) ∈ R²)

f (x, y) = 1

2πσ1σ2

√1− ρ²exp {

− 1

2(1− ρ²)

[(x− a)² σ₁²

−2ρ(x− a)(y − b) σ1σ2

+(y− b)² σ²₂

]}

其中−∞ < a, b < ∞; 0 < σ¹, σ2<∞; −1 ≤ ρ ≤ 1. 则称 (X, Y ) 服 从参数为 a, b, σ1, σ2, ρ 的二元正态分布，记为 N (a, b, σ²1, σ2², ρ). 试

计算 X 和 Y 的边际概率密度。 _↓Example

(25)

解:

fX(x) =

∫_∞

−∞

f (x, y)dy

=

∫_∞

−∞

1 2πσ1σ2

√1− ρ²exp {

− 1

2(1− ρ²)

[(x− a)² σ₁²

−2ρ(x− a)(y − b) σ1σ2

+(y− b)² σ₂²

]}

dy

=

∫_∞

−∞

1 2πσ1

√1− ρ²exp {

−u²− 2ρuv + v² 2(1− ρ²)

} dv

=

∫_∞

−∞

1 2πσ1

exp{−1

2[(√v− ρu

1− ρ²)²+ u²]}dv

= 1

√2πσ1

exp{−(x− a)² 2σ²₁ }

即 X ∼ N(a, σ1²). 类似可得 Y ∼ N(b, σ²2), 其边际概率密度为 fY(y) =√ ¹

2πσ₂exp{−^(y−b)_2σ2² 2 }.

PreviousNextFirst Last Back Forward 23