• 沒有找到結果。

2.5: 随机变量的函数的分布

N/A
N/A
Protected

Academic year: 2021

Share "2.5: 随机变量的函数的分布"

Copied!
33
0
0

加載中.... (立即查看全文)

全文

(1)

2.5: 随机变量的函数的分布

张伟平

课件 http://staff.ustc.edu.cn/~zwp/

论坛 http://fisher.stat.ustc.edu.cn

(2)

第二章随机变量及其分布

2.5 随机变量的函数的概率分布 . . . 1

2.5.1 离散型随机变量的情形. . . 1

2.5.2 连续型随机变量的情形. . . 5

2.5.3 极小值和极大值的分布. . . 28

(3)

2.5 随机变量的函数的概率分布

最简单的情形,是由一维随机变量 X 的概率分布去求其一给定 函数 Y = g(X) 的分布。较常见的,是由 (X1, X2,· · · , Xn) 的分布去 求 Y = g(X1, X2,· · · , Xn) 的分布。更一般地,由 (X1, X2,· · · , Xn) 的分布去求 (Y1, Y2,· · · , Ym) 的分布,其中 Yi= gi(X1, X2,· · · , Xn), i = 1, 2,· · · , m。

这一部分内容,与数理统计中求统计量的分布有密切的联系。

2.5.1 离散型随机变量的情形

设 X 的分布律为

P (X = xi) = pi, i = 1, 2,· · · g : R→ R,令 Y = g(X),则 Y 的分布律为

(4)

↑Example

设 X 的概率函数为

X -1 0 1 2

P 1/4 1/2 1/8 1/8

试求 Y = X2, Z = X3+ 1 的分布律。 ↓Example

解: 容易求得 Y 的分布律为:

Y 0 1 4

P 1/2 3/8 1/8 Z 的分布律

Z 0 1 2 9

P 1/4 1/2 1/8 1/8

(5)

上述结论可以推广到多维随机变量的情形:

设随机向量 X 的分布律为 P (X = x),则 X 的函数 Y = g(X) 的分布律为

P (Y = y) = P (g(X) = y) =

x:g(x)=y

P (X = x)

特别当 ξ, η 是相互独立的非负整值随机变量,各有分布律{ak} 与 {bk}. 那么 ξ + η 有分布律

P (ξ + η = n) =

n k=0

akbn−k

称此公式为离散卷积公式

(6)

↑Example

设 X∼ B(n, p),Y ∼ B(m, p) 且 X 和 Y 相互独立,则 X+Y ∼

B(n + m, p)。 ↓Example

这种性质称为再生性。可推广至多项和:设 Xi∼ B(ni, p), (i = 1, 2,· · · , m),且 X1, X2,· · · , Xm 独立,则有:∑m

i=1

Xi∼ B(m

i=1

ni, p)。

特别,若 X1, X2,· · · , Xn 为独立同分布,且 Xi ∼ B(1, p), i = 1,· · · , n. 则有:n

i=1

Xi∼ B(n, p)。此结论揭示了二项分布与 0 − 1 分 布之间的密切关系。

↑Example

设 X ∼ P (λ),Y ∼ P (µ),且 X 和 Y 独立,则有 X + Y ∼

P (λ + µ)。即 P oisson 分布亦具有再生性。 ↓Example

(7)

2.5.2 连续型随机变量的情形

定理 1. [密度变换公式] 设随机变量 X 有概率密度函数 f (x), x (a, b)(a, b 可以为∞), 而 y = g(x) 在 x ∈ (a, b) 上是严格单调的连 续函数,存在唯一的反函数 x = h(y), y∈ (α, β) 并且 h(y) 存在且 连续,那么 Y = g(X) 也是连续型随机变量且有概率密度函数

p(y) = f (h(y))|h(y)|, y ∈ (α, β).

(8)

↑Example

设随机变量 X∼ U(−π2,π2), 求 Y = tgX 的概率密度函数。

↓Example

解: 由于函数 g(x) = tg(x) = y 为单调可微函数,其反函数 x = arctg(y) 连续可微,因此由密度变换公式知 Y 的概率密度函数为

f (y) = 1

πarctg(y) = 1

π(1 + y2), −∞ < y < ∞

此分布称为 Cauchy 分布。本题我们也可以用一般的方法求解,即先 求出分布函数,然后对分布函数求导数得到。

F (y) = P (Y ≤ y) = P (tg(X) ≤ y)

= P (X≤ arctg(y)) =

arctg(y)

π2

1 πdy = 1

πarctg(y) +1 2. 所以 Y 的概率密度为

f (y) = F(y) = 1 π(1 + y2).

(9)

这种方法更具有一般性。

注: 当 g 不是在全区间上单调而是逐段单调时,密度变换公式为 下面的形式:

设随机变量 ξ 的密度函数为 pξ(x), a < x < b. 如果可 以把 (a, b) 分割为一些 (有限个或可列个) 互不重叠的子 区间的和 (a, b) =

jIj, 使得函数 u = g(t), t∈ (a, b) 在每个子区间上有唯一的反函数 hj(u), 并且 hj(u) 存 在连续, 则 η = g(ξ) 是连续型随机变量, 其密度函数为:

pη(x) =

j

pξ(hj(x))|hj(x)| .

(10)

↑Example

设 X∼ N(0, 1),求 Y = X2 的概率密度。

↓Example

解: 由于函数 y = x2 在 (−∞, 0) 和 [0, ∞) 上严格单调,因此由上述 定理知 Y 的概率密度为

f (y) = ϕ(−√ y)| −√

y|I{y>0}+ ϕ(√ y)|√

y|I{y>0}

= 1

√2πy12ey2I{y>0}

(11)

定理 2. 设 (ξ1, ξ2) 是 2 维 连 续 型 随 机 向 量, 具 有 联 合 密 度 函 数 p(x1, x2), 设 ζj = fj1, ξ2), j = 1, 2. 若 (ξ1, ξ2) 与 (ζ1, ζ2) 一一对 应, 逆映射 ξj= hj1, ζ2), j = 1, 2. 假定每个 hj(y1, y2) 都有一阶连 续偏导数. 则 (ζ1, ζ2) 亦为连续型随机向量, 且其联合概率密度为

q(y1, y2) =

{ p (h1(y1, y2), hn(y1, y2))|J|, (y1, y2)∈ D,

0, (y1, y2)̸∈ D, (2.1) 其中D 是随机向量 (ζ1, ζ2) 的所有可能值的集合, J 是变换的 J accobi 行列式,即

J =

∂h1

∂y1

∂h1

∂y2

∂h2

∂y1

∂h2

∂y2

(12)

在多元随机变量场合,更一般地有

定理 3. 如果 (ξ1,· · · , ξn) 是 n 维连续型随机向量, 具有联合密度函 数 p(x1,· · · , xn). 假设存在 n 个 n 元函数

yj= fj(x1,· · · , xn), j = 1,· · · , n, 使得

ζj= fj1,· · · , ξn), j = 1,· · · , n,

若 (ξ1,· · · , ξn) 与 (ζ1,· · · , ζn) 之间一一对应, 逆映射为 ξj= hj1,· · · , ζn), j = 1,· · · , n. 其中每个 hj(y1,· · · , yn) 都有一阶连续偏导数, 那么随 机向量 (ζ1,· · · , ζn) 是连续型的, 且具有联合密度函数

q(y1,· · · , yn) =

{ p (h1(y1,· · · , yn),· · · , hn(y1,· · · , yn))|J|, (y1,· · · , yn)∈ D,

0, (y1,· · · , yn)̸∈ D, (2.2)

(13)

其中D 是随机向量 (ζ1,· · · , ζn) 的所有可能值的集合, J 是变换 的 Jaccobi 行列式,即

J =

∂h1

∂y1 · · · ∂h∂yn1

... ... ...

∂hn

∂y1 · · · ∂h∂ynn

(14)

↑Example

在直角坐标平面上随机选取一点, 分别以随机变量 ξ 与 η 表示其 横坐标和纵坐标, 可以认为 ξ 与 η 相互独立. 如果 ξ 与 η 都服从正态 分布 N (0, 1), 试求其极坐标 (ρ, θ) 的分布.

↓Example

解: 易知 {

x = r cos t y = r sin t

是 (0,∞) × [0, 2π) 与 R2(原点除外) 之间的一一变换, 变换的 Jaccobi 行列式

J =

∂x

∂r

∂x

∂t

∂y

∂r

∂y

∂t

=

cos t −r sin t sin t r cos t

= r.

(15)

由于 (ξ, η) 的联合密度为

p(x, y) = 1 exp

{

−x2+ y2 2

} ,

所以由 (??) 式得知, (ρ, θ) 的联合密度为

q(r, t) = 1 2πr exp

{

−r2 2

}

= q1(r)q2(t), r > 0, t∈ [0, 2π). (2.3)

其中 q1(r) = r exp{

r22}

, r > 0; q2(t) = 1, t∈ [0, 2π). 这一 结果表明: θ 与 ρ 相互独立, 其中 θ 服从 [0, 2π) 上的均匀分布; 而 ρ 则服从 Weibull 分布 (参数 λ = 1/2, α = 2).

(16)

在计算两个随机变量之和时,我们还经常用到如下定理

定理 4. 设 X, Y 的联合概率密度为 f (x, y),则 X + Y 的概率密度 p(z) 为

p(z) =

−∞

f (x, z− x)dx =

−∞

f (z− y, y)dy

证一: 先求 X + Y 的分布函数 F (z). 我们有

F (z) = P (X + Y ≤ z) =∫ ∫

x+y≤z

f (x, y)dxdy =

−∞

dx

z−x

−∞

f (x, y)dy

=

−∞

du

z

−∞

f (x, t− x)dt =z

−∞

{∫

−∞

f (x, t− x)dx }

dt.

这就说明,X + Y 的分布函数 F (z) 是其中的花括弧中的函数在区间 (−∞, z) 上的积分, 所以 X + Y 是连续型随机变量, 其密度函数如定 理所述。

(17)

证二: 令 X = Z1, X + Y = Z2, 利用单调映射的密度变换公式 (2.1) 可求得 (Z1, Z2) 的联合概率密度函数为 g(z1, z2) = f (z1, z2− z1). 再 对 g(z1, z2) 关于 z1 在 R 上积分, 便求得 Z2= X + Y 的密度为

−∞

g(z1, z2)dz1=

−∞

f (z1, z2− z1)dz1,

故得所证.

特别,当 X 与 Y 独立时,分别记 X 和 Y 的概率密度为 f1(x) 和 f2(y),则 X + Y 的概率密度为

p(z) =

−∞

f1(x)f2(z− x)dx =

−∞

f1(z− y)f2(y)dy , f1∗ f2(z) = f2∗ f1(z)

称此公式为卷积公式。

(18)

↑Example

设 X 服从期望为 2 的指数分布,Y ∼ U(0, 1),且 X 和 Y 相

互独立。求 X− Y 的概率密度和 P (X ≤ Y )。 ↓Example 解一: 由题设知−Y ∼ U(−1, 0),并记 X 和 −Y 的密度分别为 f1

和 f2,从而由卷积公式有

fX−Y(z) =

−∞

f1(x)f2(z− x)dx

=







ez2(1− e12), z≥ 0 1− ez+12 , −1 < z < 0

0, z≤ −1 所以 P (X≤ Y ) = P (X − Y ≤ 0) = 2e12 − 1。

(19)

解二: 由于

P (X− Y ≤ z) =

P (X≤ z + y|Y = y)f(y)dy

=







1

0 P (X≤ z + y)dy z≥ 0

1

−zP (X≤ z + y)dy −1 < z < 0

0 z≤ −1

=







1− 2e−z/2(1− e−1/2), z≥ 0 z + 2e−(z+1)/2− 1, −1 < z < 0

0, z≤ −1

再对分布函数求导数即得所求.

(20)

↑Example

设 X1, . . . , Xni.i.d∼ N(0, 1), 试求 Yn=∑n

i=1Xi2 的分布.

↓Example

解: 由前例知 Y1= X12 的概率密度函数为

f1(y) = 1

√2πy−1/2e−y/2I(y > 0) = 1

21/2Γ(12)y1/2−1e−y/2I(y > 0) 由卷积公式知 Y2 = X12+ X22 的概率密度函数为

f2(z) =

R

f1(y)f2(z− y)dy

= 1

2(12)e−z/2I(z > 0)

1 0

t−1/2(1− t)−1/2dt

= 1

22/2Γ(22)z2/2−1e−z/2I(z > 0)

从而由归纳法, 假设 Yn−1= X12+· · · + Xn2−1的概率密度函数

(21)

fn−1(z) = 1

2(n−1)/2Γ(n−12 )z(n−1)/2−1e−z/2I(z > 0) 则 Yn= Yn−1+ Xn2 的概率密度函数可由卷积公式得

fn(z) =

R

fn−1(y)f1(z− y)dy

= 1

2n/2Γ(n−12 )Γ(12)zn/2−1e−z/2I(z > 0)

1 0

t(n−1)/2−1(1− t)1/2−1dt

= 1

2n/2Γ(n2)zn/2−1e−z/2I(z > 0)

(22)

由归纳法得 Yn的密度函数. 称 Yn 的分布为自由度 n 的卡方分 布, 记为 Yn∼ χ2n.

• χ2n具有再生性

• X∼ χ2n, 则 EX = n, V ar(X) = 2n.

• http://en.wikipedia.org/wiki/Chi-squared_distribution

(23)

一些连续型随机变量,也有再生性性质。

↑Example

设 X∼ N(µ1, σ12), Y ∼ N(µ2, σ22) 且 X 与 Y 相互独立,则:

X + Y ∼ N(µ1+ µ2, σ21+ σ22).

更一般地, 设 Xi ∼ N(µi, σi2), i = 1,· · · , n, X1,· · · , Xn 相互独立.

a1,· · · , an, b 为任意 n + 1 个实数, 其中 a1,· · · , an 不全为零. 令 X =

n i=1

aiXi+ b, 则 有: X ∼ N(µ, σ2), 其 中 µ =

n i=1

aiµi+ b, σ2=

n i=1

a2iσ2i.

↓Example

↑Example

设 X1 ∼ χ2n, X2 ∼ χm2 , 且 X1 和 X2 相互独立, 则 X1+ X2

(24)

我们把具有再生性性质的分布总结一下为

• 二项分布 (关于试验次数具有再生性)

• P oisson 分布 (关于参数 λ 具有再生性)

• P ascal 分布 (关于成功次数 r 具有再生性)

• 正态分布 (关于两个参数都具有再生性)

• χ2 分布具有再生性

(25)

有时我们还会碰到计算随机变量之商的概率密度. 我们有

定理 5. 如果 (ξ, η) 是二维连续型随机向量, 它们的联合密度为 f (x, y), 则它们的商 ξ/η 是连续型随机变量, 具有密度函数

pξ η

(x) =

−∞|t|f(xt, t)dt, ∀ x ∈ R.

而 pη ξ(x) =

−∞|u|f(u, xu)du, ∀ x ∈ R.

(2.4)

(26)

↑Example

设随机变量 ξ 与 η 相互独立, 同服从参数 λ = 1 的指数分布, 试

求 ξ/η 的密度函数. ↓Example

解: 我们利用 (2.4) 式求 pξ η

(x). 由于 (ξ, η) 的联合密度为

p(u, v) = e−u−v, u > 0, v > 0,

所以欲 (2.4) 式中的被积函数 |t|p(xt, t) ̸= 0, 当且仅当, t > 0 和 xt > 0, 从而知有

pξ η

(x) = { ∫

0 t e−xt−tdt =(1+x)1 2 x > 0;

0 x≤ 0.

易见 pη

ξ(x) 同上。

(27)

↑Example

设 X1∼ N(0, 1),X2∼ χ2n,且 X1与 X2独立。求 Y = X1

X2/n

的概率密度函数. ( 记 Y ∼ tn, 称为自由度为 n 的 t 分布)。 ↓Example 解: 先求 Z =

X2/n 的密度 g(z):

g(z) = 2nzfX2(nz2)I(z > 0)

其中 fX2 为 X2 的密度函数. 利用商的密度变换公式, 可得

fY(y) = fX1/Z(y) =

R

|t|ϕ(yt)g(t)dt

=

R

|t| 1

√2πe−(yt)2/2 2nt

2n/2Γ(n2)(nt2)n/2−1e−nt2/2I(t > 0)dt

= 1

2nn/2 2n/2Γ(n)

tne−(y2+n)t2/2dt

(28)

令 x = (n + y2)t2/2, 则上述积分为

fY(y) = 1

√2π 2nn/2 2n/2Γ(n2)

0

x(n−1)/2e−xdx·1 2

( 2 n + y2

)(n+1)/2

= Γ(n+12 )

√nπΓ(n2) (

1 +y2 n

)n+12

• tn的分布关于原点对称

• limn→∞fY(y) = ϕ(y).

• http://en.wikipedia.org/wiki/Student's_t-distribution

(29)

↑Example

设 X1∼ χ2n,X2 ∼ χm2,且 X1 与 X2 独立,求 Y = XX1/n

2/m

概率密度函数. (记 Y ∼ Fn,m, 称为自由度为 n, m 的 F 分布)。 ↓Example 解: 由密度变换公式易知 X1/n 的密度函数为 ngn(nz), 类似 X2/m

的密度为 mgm(mz), 其中 gn为自由度 n 的 χ2n的密度函数. 从而 Y 的密度函数为

fY(y) =

R

|t|ngn(nty)mgm(mt)I(t > 0)dz

= [2(n+m)/2Γ(m 2)Γ(n

2)]−1nn/2mm/2yn/2−1

·

0

e−(ny+m)t/2t(n+m)/2−1dt

= Γ(n+m2 )

Γ(n2)Γ(m2)nn/2mm/2yn/2−1(ny + m)−(n+m)/2

(30)

2.5.3 极小值和极大值的分布

对于 n 个随机变量 X1, ..., Xn, 我们可以考察它们的最大值和最 小值:

X(n)= max{X1, ..., Xn}, X(1)= min{X1, ..., Xn}.

如此定义的 X(n)与 X(1)也是随机变量.

当 X1, ..., Xn相互独立时, 我们不难利用它们的分布函数 F1(x), ..., Fn(x) 求出 X(n)与 X(1) 的分布函数 FX(n)(x) 和 FX(1)(x).

事实上,

FX(n)(x) = P (X(n)≤ x) = P (max{X1,· · · , Xn} ≤ x) = P ( n

k=1

(Xk≤ x) )

=

n k=1

P (Xk≤ x) =

n k=1

Fk(x); (2.5)

(31)

而利用关系式

(X(1)> x) = (X1> x, ... , Xn> x) =

n k=1

(Xk> x)

可得

FX(1)(x) = P (X(1)≤ x) = 1 − P (X(1)> x) = 1− P ( n

k=1

(Xk> x) )

= 1

n k=1

P (Xk> x) = 1−

n k=1

(1− Fk(x)). (2.6)

在 X1, . . . , Xn还是同分布时候, (2.5) 和 (2.6) 还可以简化.

(32)

↑Example

设 X1, . . . , Xni.i.d∼ U(0, θ), θ > 0, 求 X(n)= max1≤i≤nXi

密度函数. ↓Example

解: 由于对任意 0 < x < θ,

FX(n)(x)=P (X(n)≤ x) = P (max{X1,· · · , Xn} ≤ x) =

n k=1

Fk(x)

= (x

θ )n

从而所求密度为

g(x) = FX(n)(x) = nxn−1

θn I(0 < x < θ).

(33)

目前我们接触到的分布的关系为

• n 个独立同分布 B(1, p) 的 0-1 分布随机变量之和为二项分布 B(n, p);

• 有限个独立二项随机变量 (成功的概率相同) 之和仍为二项分 布;

• 有限个独立的 P oisson 分布随机变量之和服从 P oisson 分布,

参数相加;

• r 个独立同分布几何分布 G(p) 的随机变量之和服从参数为 r 和 p 的 P ascal 分布;

• 任意有限个独立的正态分布随机变量的线性组合仍然服从正态 分布;

參考文獻

相關文件