• 沒有找到結果。

2-3: 多维随机变量

N/A
N/A
Protected

Academic year: 2021

Share "2-3: 多维随机变量"

Copied!
25
0
0

加載中.... (立即查看全文)

全文

(1)

2-3: 多维随机变量

张伟平

课件 http://staff.ustc.edu.cn/~zwp/

论坛 http://fisher.stat.ustc.edu.cn

(2)

第二章随机变量及其分布

2.3 多维分布与边际分布

. . . . 1

2.3.1 多维分布

. . . . 1

2.3.2 边缘分布

. . . 14

(3)

2.3 多维分布与边际分布

2.3.1 多维分布

在实际应用中,经常需要对所考虑的问题用多个变量来描述. 我 们把多个随机变量放在一起组成向量,称为多维随机变量或者随机向 量.

↑Example

从一副扑克牌中抽牌时, 可以用纸牌的花色和数字来说明其特征.

↓Example

↑Example

考虑一个打靶的试验. 在靶面上取定一个直角坐标系. 则命中的 位置可由其坐标 (X, Y ) 来刻划. X,Y 都是随机变量.

↓Example

Previous Next First Last Back Forward 1

(4)

设 X = (X1, . . . , Xn). 如果每个 Xi 都是一个随机变量,

i = 1,· · · , n,则称 X 为 n 维随机变量或者随机向量. Definition

我们可以按照对常用一维随机变量的分类把常用的随机向量分 为离散型、连续型以及其他类型.

(5)

如果每一个 Xi 都是一个离散型随机变量,i = 1, ..., n,则称 X = (X1, . . . , Xn) 为一 n 维离散随机变量. 设 Xi 的所有 可能取值 (有限或可数个) 为 {ai1, ai2,· · · }, i = 1, . . . , n, 则称

p(j1,· · · , jn) = P (X1= a1j1, . . . , Xn= anjn), j1, ..., jn= 1, 2, ...

(2.1) 为 n 维随机变量 X 的概率函数.

Definition

容易证明概率函数具有下列性质:

(1) p(j1, . . . , jn)≥ 0, ji= 1, 2,· · · , i = 1, 2, . . . , n;

(2) ∑

j1,··· ,jn

p(j1, . . . , jn) = 1.

Previous Next First Last Back Forward 3

(6)

↑Example

设 A1,· · · , An 为某一实验下的完备事件群,即 A1,· · · , An两互斥且和为 Ω。记 pk = P (Ak)(k = 1, . . . , n),则 pk ≥ 0, p1+

· · · + pn = 1。现将实验独立的重复作 N 次,分别用 Xi 表示事

件 Ai 出现的次数 (i = 1,· · · , n)。则 X = (X1, . . . , Xn) 为一离散 型随机向量,试求 X 的概率函数。此分布律称为多项分布, 记为

M (N ; p1, . . . , pn). ↓Example

解: 由于试验独立进行, 总的结果数为 N ,记结果 Ai 出现的次数为 ki,则 k1+· · · + kn= N 。因此相当于多组组合,所以

P (X1= k1,· · · , Xn= kn) = N !

k1!· · · kn!P (A1· · · A1. . . An· · · An)

= N !

k1!· · · kn!pk11· · · pknn, 其中 k1, . . . , kn 为非负整数且 k1+· · · + kn= N .

(7)

我们来看一下 Xi的分布:此时我们把试验结果分为两类, AiA¯i,则显然就是一个 N 重贝努里试验,因此

P (Xi= ki) = (

N ki

)

pkii(1− pi)N−ki, ki= 1,· · · , N.

类似我们也可以找出 (Xi, Xj)(i̸= j) 的联合分布律,即为 M(N, pi, pj, 1− pi− pj).

Previous Next First Last Back Forward 5

(8)

我们具体来看一下二维离散分布. 设二维离散型随机变量 (X, Y ) 的所有可能取值为{(xi, yj) : i = 1, ..., n, j = 1, 2, ..., m}. 这里 n, m 为有限数或者无穷. 我们经常以列联表的形式来表示二维离散型随机 变量的概率分布. 记

pij= P (X = xi, Y = yj), i = 1, ..., n, j = 1, ..., m.

则 (X, Y ) 的概率函数可以用下表表示:

HHX HHHH

Y y1 x2 · · · ym 行和

x1 p11 p12 · · · p1m p1·

x2 p12 p22 · · · p2m p2·

... ... ... ... ... ... xn pn1 pn2 ... pnm p

列和 p·1 p·2 · · · p·m 1

(9)

↑Example

从一个包含五个黑球, 六个白球和七个红球的罐子里抽取四个 球. 令 X 是抽到白球的数目, Y 是抽到红球的数目. 则二维随机变量 (X, Y ) 的概率函数为

p(x, y) = (6

x

)(7 y

)( 5 4−x−y

) (18

4

) , 0≤ x + y ≤ 4. (2.2)

↓Example

以列联表表示, 即为

Previous Next First Last Back Forward 7

(10)

HHY HHHH

X 0 1 2 3 4 行和

0 1

612 1 51

5 102

5 153

1 204

11 102

1 7

306 7 51

35 204

7 153

77 204

2 7

102 7 34

7 68

7 17

3 61235 1027 61277

4 6127 6127

列和 99

612 22 51

11 34

4 51

1

204 1

类似于一维连续型随机变量, 连续型随机向量的也是由密度函数 来刻画的.

(11)

称 X = (X1, . . . , Xn) 为 n 维连续型随机变量,如果存在 Rn 上的非负函数 f (x1, . . ., xn),使得对任意的 −∞ <

a1≤ b1< +∞, ..., −∞ < an≤ bn< +∞, 有 P (a1≤ X1 ≤ b1, ..., an≤ Xn≤ bn) =

bn

an

...

b1

a1

f (x1, . . . , xn)dx1· · · dxn,

则称 f 为 X 的概率密度函数.

Definition

Previous Next First Last Back Forward 9

(12)

称 X = (X1, . . . , Xn) 为 n 维连续型随机变量,如果存在 Rn 上的非负函数 f (x1, . . ., xn),使得对任意的 −∞ <

x1< +∞, ..., −∞ < xn< +∞, 有 F (x1, ..., xn) =

xn

−∞

...

x1

−∞

f (t1, . . . , tn)dt1· · · dtn,

则称 f 为 X 的概率密度函数.

Definition

对 n 维随机变量我们也有分布函数的概念.

(13)

设 X = (X1, . . . , Xn) 为 n 维 随 机 变 量. 对 任 意 的 (x1, . . . , xn)∈ Rn,称

F (x1, . . . , xn) = P (X1≤ x1, . . . , Xn≤ xn) (2.3) 为 n 维随机变量 X 的 (联合) 分布函数.

Definition

可以验证分布函数 F (x1, . . . , xn) 具有下述性质:

(1) F (x1,· · · , xn) 对每个变元单调非降;

(2) 对任意的 1≤ j ≤ n 有, lim

xj→−∞F (x1,· · · , xn) = 0;

(3) lim

x1→∞,··· ,xn→∞F (x1,· · · , xn) = 1.

Previous Next First Last Back Forward 11

(14)

对 n 维连续型随机变量, 从密度的定义我们有,

F (x1, . . . , xn) =

xn

−∞

...

x1

−∞

f (x1, ..., xn)dx1...dxn.

对高维离散型随机变量, 一般我们不使用分布函数.

↑Example

考虑二维随机变量 X = (X1, X2),其概率密度函数为

f (x1, x2) =

{ 1/[(b− a)(d − c)] 当 a ≤ x1 ≤ b, c ≤ x2≤ d,

0 其它.

称此概率密度为 [a, b]× [c, d] 上的均匀分布. ↓Example

(15)

↑Example

设 (X, Y ) 的概率密度函数有形式

f (x, y) = 1

2πσ1σ2

√1− ρ2exp {

1

2(1− ρ2)

[(x− a)2 σ12

−2ρ(x− a)(y − b) σ1σ2

+(y− b)2 σ22

]}

其中−∞ < a, b < ∞, 0 < σ1, σ2<∞, −1 ≤ ρ ≤ 1. 称 (X, Y ) 服从

参数为 a, b, σ1, σ2, ρ 的二元正态分布,记为 N (a, b, σ21, σ22, ρ). ↓Example

Previous Next First Last Back Forward 13

(16)

2.3.2 边缘分布

设 (X1, ..., Xn) ∼ F 已知. 令 (i1, ..., im) ⊂ (1, ..., n), 则 Xi1, ..., Xim 的分布称为 X1, ..., Xn 或 F 的一个m 维边缘分布. 如何得到该分布?

我们先考虑离散型随机向量. 设二维离散随机变量 (X, Y ) 的所 有可能取值为{(xi, yj) : i = 1, ..., n, j = 1, 2, ..., m.}(这里 n, m 为有 限数或者无穷),则 (X, Y ) 的联合分布律为

P (X = xi, Y = yj) = pij i = 1, ..., n, j = 1, 2, ..., m.

(17)

以列联表的形式表示就是 HHY HHHH

X x1 x2 · · · xn 行和

y1 p11 p21 · · · pn1 p·1 y2 p12 p22 · · · pn2 p·2 ... ... ... ... ... ... ym p1m p2m ... pnm p·m 列和 p1· p2· · · · pn· 1

从上述列联表我们可以计算随机变量 X 和 Y 的分布. 固定某个 xi. 因为 Y 在使得 X = xi 的那些样本点上必取值为 y1, ..., ym中之 一, 故有

pX(xi) = P (X = xi) =

m j

P (X = xi, Y = yj) =

m j

pij= pi·, i = 1, 2,· · · n.

Previous Next First Last Back Forward 15

(18)

所以上述列联表的行和所表示的正是 X 的分布. 因为这个分布是从 X 和 Y 的联合分布推导出来的, 我们称其为 X 的边缘分布.

类似可以得到 Y 的边缘分布律

pY(yj) = P (Y = yj) =

n i

pij= p·j, j = 1, 2,· · · m.

它是上述列联表的列和.

(19)

n 维场合:

类 似 地, 可 对 n (n > 2) 维 的 随 机 变 量 定 义 边 缘 分 布. 设 X1, ..., Xn为 n 维随机变量,其概率分布 F 已知. 令 i1<· · · < im 为 1, ..., n 的任一子集,则 Xi1, ..., Xim 的概率函数为

pi1...im(ji1, ..., jim) = P (Xi1= ai1ji1, ..., Xim = aimjim)

= P (Xi1= ai1ji1, ..., Xim = aimjim)

= ∑

jim+1,...,jin

P (X1= a1j1, ..., Xi1= ai1ji1, ..., Xim = aimjim,

Xim+1 = aim+1jim+1, ..., Xn= anjn)

= ∑

ji1,...,jim的所有

p(j1, ..., jn).

其中和是对除 Xi1, ..., Xim 之外的所有变量来求和.

Previous Next First Last Back Forward 17

(20)

↑Example

袋中有 5 张外形相同的卡片,其中 3 张写上数字”0”,另 2 张写 上”1”。现从袋中任取两张卡片,分别以 ξ, η 表示第一张和第二张卡 片上的数字,试求分别在有放回和不放回两种情形下 (ξ, η) 的联合分

布律及边际分布律. ↓Example

解:简单计算得到

η\ξ 0 1 p·j

0 9/25 6/25 3/5 1 6/25 4/25 2/5 pi· 3/5 2/5 1

η\ξ 0 1 p·j

0 6/20 6/20 3/5 1 6/20 2/20 2/5 pi· 3/5 2/5 1

这个例子说明边际分布律不能决定联合分布律。

(21)

现考虑连续型随机向量的边缘分布. 先考虑二维的情形. 设 (X, Y ) 有概率密度函数 f (x, y). 则

P (x1≤ X ≤ x2) = P (x1≤ X ≤ x2,−∞ < Y < +∞)

=

+

−∞

x2

x1

f (u, v)dudv

=

x2

x1

fX(u)du, (2.4)

其中

fX(u) =

+

−∞

f (u, v)dv. (2.5)

从 (2.4) 我们可以看出, X 的边缘密度函数即为 (2.5). 类似地, Y 的 边缘密度函数为

fY(u) =

+

−∞

f (u, v)du. (2.6)

Previous Next First Last Back Forward 19

(22)

当 n > 2 时, 令 f (x1, ..., xn) 为 n 维连续型随机变量 (X1, ..., Xn) 的概率密度函数. 设 (i1,· · · , im) 为 (1, 2, ..., n) 的一个子集. 则同上 可证, 则 (Xi1, ..., Xim) 的概率密度函数是联合密度函数 f (x1, ..., xn) 对除 Xi1, ..., Xim 之外的所有变量求积分.

↑Example

设 (X1, X2) 服从 N (a, b, σ12, σ22, ρ). 则可证明 X1 的边缘分布为

N (a, σ12),X2 的边缘分布为 N (b, σ22). ↓Example

(23)

例2.3.2说明了虽然 n 维随机变量 X = (X1, ..., Xn) 的分布可以 唯一决定其所有的边缘分布,但边缘分布不足以决定 X 的联合分布.

↑Example

考虑两个概率密度函数

p(x, y) = x + y, 0 < x, y < 1 q(x, y) = (x +1

2)(y +1

2), 0 < x, y < 1 试求边际概率密度。

↓Example

解:易得所求边际概率密度都是如下形式

f (t) = t + 1

2, 0 < t < 1.

说明边际概率密度不能决定联合概率密度。

Previous Next First Last Back Forward 21

(24)

↑Example

设 (X, Y ) 的联合概率密度有形式 (∀(x, y) ∈ R2)

f (x, y) = 1

2πσ1σ2

√1− ρ2exp {

1

2(1− ρ2)

[(x− a)2 σ12

−2ρ(x− a)(y − b) σ1σ2

+(y− b)2 σ22

]}

其中−∞ < a, b < ∞; 0 < σ1, σ2<∞; −1 ≤ ρ ≤ 1. 则称 (X, Y ) 服 从参数为 a, b, σ1, σ2, ρ 的二元正态分布,记为 N (a, b, σ21, σ22, ρ). 试

计算 X 和 Y 的边际概率密度。 ↓Example

(25)

解:

fX(x) =

−∞

f (x, y)dy

=

−∞

1 2πσ1σ2

√1− ρ2exp {

1

2(1− ρ2)

[(x− a)2 σ12

−2ρ(x− a)(y − b) σ1σ2

+(y− b)2 σ22

]}

dy

=

−∞

1 2πσ1

√1− ρ2exp {

−u2− 2ρuv + v2 2(1− ρ2)

} dv

=

−∞

1 2πσ1

exp{−1

2[(√v− ρu

1− ρ2)2+ u2]}dv

= 1

√2πσ1

exp{−(x− a)2 21 }

即 X ∼ N(a, σ12). 类 似 可 得 Y ∼ N(b, σ22), 其 边 际 概 率 密 度 为 fY(y) = 1

2πσ2exp{−(y−b)22 2 }.

PreviousNextFirst Last Back Forward 23

參考文獻

相關文件

随机向量 很多随机现象只用一个随机变量来描述是不够的,需 要用几个随机变量同时来描述.如:

On the basis of forward kinematics analysis, the forward kinematics error model for the posture error analysis of the multilegged walking robot has been formulated by the

5.学习前进增益:Learn Forward Gain 此参数是由速度和加、减速度来提供. Learn

定义:若二元随机变量 (X,Y) 全部可能取到的 不同值是有限对或可列无限对,则称 (X,Y) 是

[r]

课件 http://staff.ustc.edu.cn/~zwp/.

我们已经知道, 随机变量 X 的数学期望就是它的平均值, 因此从 一定意义上, 数学期望刻画了随机变量所取之值的 “中心位置”.

[r]