2.5: 随机变量的函数的分布

(1)

2.5: 随机变量的函数的分布

张伟平

课件 http://staff.ustc.edu.cn/~zwp/

论坛 http://fisher.stat.ustc.edu.cn

(2)

第二章随机变量及其分布

2.5 随机变量的函数的概率分布 . . . 1

2.5.1 离散型随机变量的情形. . . 1

2.5.2 连续型随机变量的情形. . . 5

2.5.3 极小值和极大值的分布. . . 28

(3)

2.5 随机变量的函数的概率分布

最简单的情形，是由一维随机变量 X 的概率分布去求其一给定 函数 Y = g(X) 的分布。较常见的，是由 (X1, X2,· · · , Xⁿ) 的分布去 求 Y = g(X1, X2,· · · , Xⁿ) 的分布。更一般地，由 (X1, X2,· · · , Xⁿ) 的分布去求 (Y1, Y2,· · · , Y^m) 的分布，其中 Yi= gi(X1, X2,· · · , Xⁿ), i = 1, 2,· · · , m。

这一部分内容，与数理统计中求统计量的分布有密切的联系。

2.5.1 离散型随机变量的情形

设 X 的分布律为

P (X = xi) = pi, i = 1, 2,· · · g : R→ R，令 Y = g(X)，则 Y 的分布律为

(4)

↑Example

设 X 的概率函数为

X -1 0 1 2

P 1/4 1/2 1/8 1/8

试求 Y = X², Z = X³+ 1 的分布律。 _↓Example

解: 容易求得 Y 的分布律为:

Y 0 1 4

P 1/2 3/8 1/8 Z 的分布律

Z 0 1 2 9

P 1/4 1/2 1/8 1/8

(5)

上述结论可以推广到多维随机变量的情形:

设随机向量 X 的分布律为 P (X = x)，则 X 的函数 Y = g(X) 的分布律为

P (Y = y) = P (g(X) = y) = ∑

x:g(x)=y

P (X = x)

特别当 ξ, η 是相互独立的非负整值随机变量，各有分布律{ak} 与 {b^k}. 那么 ξ + η 有分布律

P (ξ + η = n) =

∑n k=0

akbn−k

称此公式为离散卷积公式

(6)

↑Example

设 X∼ B(n, p)，Y ∼ B(m, p) 且 X 和 Y 相互独立，则 X+Y ∼

B(n + m, p)。 _↓Example

这种性质称为再生性。可推广至多项和：设 Xi∼ B(nⁱ, p), (i = 1, 2,· · · , m)，且 X¹, X2,· · · , X^m 独立，则有:∑^m

i=1

Xi∼ B(∑^m

i=1

ni, p)。

特别，若 X1, X2,· · · , Xⁿ 为独立同分布，且 Xi ∼ B(1, p), i = 1,· · · , n. 则有:∑ⁿ

i=1

Xi∼ B(n, p)。此结论揭示了二项分布与 0 − 1 分布之间的密切关系。

↑Example

设 X ∼ P (λ)，Y ∼ P (µ)，且 X 和 Y 独立，则有 X + Y ∼

P (λ + µ)。即 P oisson 分布亦具有再生性。 _↓Example

(7)

2.5.2 连续型随机变量的情形

定理 1. [密度变换公式] 设随机变量 X 有概率密度函数 f (x), x∈ (a, b)(a, b 可以为∞), 而 y = g(x) 在 x ∈ (a, b) 上是严格单调的连 续函数，存在唯一的反函数 x = h(y), y∈ (α, β) 并且 h^′(y) 存在且 连续，那么 Y = g(X) 也是连续型随机变量且有概率密度函数

p(y) = f (h(y))|h^′(y)|, y ∈ (α, β).

(8)

↑Example

设随机变量 X∼ U(−^π2,^π₂), 求 Y = tgX 的概率密度函数。

↓Example

解: 由于函数 g(x) = tg(x) = y 为单调可微函数，其反函数 x = arctg(y) 连续可微，因此由密度变换公式知 Y 的概率密度函数为

f (y) = 1

πarctg^′(y) = 1

π(1 + y²), −∞ < y < ∞

此分布称为 Cauchy 分布。本题我们也可以用一般的方法求解，即先求出分布函数，然后对分布函数求导数得到。

F (y) = P (Y ≤ y) = P (tg(X) ≤ y)

= P (X≤ arctg(y)) =

∫arctg(y)

−^π₂

1 πdy = 1

πarctg(y) +1 2. 所以 Y 的概率密度为

f (y) = F^′(y) = 1 π(1 + y²).

(9)

这种方法更具有一般性。

注: 当 g 不是在全区间上单调而是逐段单调时，密度变换公式为 下面的形式:

设随机变量 ξ 的密度函数为 pξ(x), a < x < b. 如果可 以把 (a, b) 分割为一些 (有限个或可列个) 互不重叠的子 区间的和 (a, b) =∪

jIj, 使得函数 u = g(t), t∈ (a, b) 在每个子区间上有唯一的反函数 hj(u), 并且 h^′j(u) 存 在连续, 则 η = g(ξ) 是连续型随机变量, 其密度函数为:

pη(x) =∑

j

pξ(hj(x))|h^′j(x)| .

(10)

↑Example

设 X∼ N(0, 1)，求 Y = X² 的概率密度。

↓Example

解: 由于函数 y = x² 在 (−∞, 0) 和 [0, ∞) 上严格单调，因此由上述 定理知 Y 的概率密度为

f (y) = ϕ(−√ y)| −√

y^′|I{y>0}+ ϕ(√ y)|√

y^′|I{y>0}

= 1

√2πy⁻¹²e⁻^y²I_{y>0}

(11)

定理 2. 设 (ξ1, ξ2) 是 2 维连续型随机向量, 具有联合密度函数 p(x1, x2), 设 ζj = fj(ξ1, ξ2), j = 1, 2. 若 (ξ1, ξ2) 与 (ζ1, ζ2) 一一对 应, 逆映射 ξj= hj(ζ1, ζ2), j = 1, 2. 假定每个 hj(y1, y2) 都有一阶连 续偏导数. 则 (ζ1, ζ2) 亦为连续型随机向量, 且其联合概率密度为

q(y1, y2) =

{ p (h1(y1, y2), hn(y1, y2))|J|, (y¹, y2)∈ D,

0, (y1, y2)̸∈ D, (2.1) 其中D 是随机向量 (ζ¹, ζ2) 的所有可能值的集合, J 是变换的 J accobi 行列式，即

J =

∂h1

∂y₁

∂h1

∂y₂

∂h₂

∂y₁

∂h₂

∂y₂

(12)

在多元随机变量场合，更一般地有

定理 3. 如果 (ξ1,· · · , ξⁿ) 是 n 维连续型随机向量, 具有联合密度函 数 p(x1,· · · , xⁿ). 假设存在 n 个 n 元函数

yj= fj(x1,· · · , xⁿ), j = 1,· · · , n, 使得

ζj= fj(ξ1,· · · , ξⁿ), j = 1,· · · , n,

若 (ξ1,· · · , ξⁿ) 与 (ζ1,· · · , ζⁿ) 之间一一对应, 逆映射为 ξj= hj(ζ1,· · · , ζⁿ), j = 1,· · · , n. 其中每个 h^j(y1,· · · , yⁿ) 都有一阶连续偏导数, 那么随 机向量 (ζ₁,· · · , ζn) 是连续型的, 且具有联合密度函数

q(y1,· · · , yⁿ) =

{ p (h1(y1,· · · , yⁿ),· · · , hⁿ(y1,· · · , yⁿ))|J|, (y¹,· · · , yⁿ)∈ D,

0, (y1,· · · , yⁿ)̸∈ D, (2.2)

(13)

其中D 是随机向量 (ζ¹,· · · , ζⁿ) 的所有可能值的集合, J 是变换 的 Jaccobi 行列式，即

J =

∂h1

∂y₁ · · · ^∂h∂y_n¹

... ... ...

∂hn

∂y₁ · · · ^∂h∂yⁿ_n

(14)

↑Example

在直角坐标平面上随机选取一点, 分别以随机变量 ξ 与 η 表示其 横坐标和纵坐标, 可以认为 ξ 与 η 相互独立. 如果 ξ 与 η 都服从正态 分布 N (0, 1), 试求其极坐标 (ρ, θ) 的分布.

↓Example

解: 易知 {

x = r cos t y = r sin t

是 (0,∞) × [0, 2π) 与 R²(原点除外) 之间的一一变换, 变换的 Jaccobi 行列式

J =

∂x

∂r

∂x

∂t

∂y

∂r

∂y

∂t

=

cos t −r sin t sin t r cos t

= r.

(15)

由于 (ξ, η) 的联合密度为

p(x, y) = 1 2πexp

{

−x²+ y² 2

} ,

所以由 (??) 式得知, (ρ, θ) 的联合密度为

q(r, t) = 1 2πr exp

{

−r² 2

}

= q1(r)q2(t), r > 0, t∈ [0, 2π). (2.3)

其中 q₁(r) = r exp{

−^r₂²}

, r > 0; q2(t) = _2π¹, t∈ [0, 2π). 这一 结果表明: θ 与 ρ 相互独立, 其中 θ 服从 [0, 2π) 上的均匀分布; 而 ρ 则服从 Weibull 分布 (参数 λ = 1/2, α = 2).

(16)

在计算两个随机变量之和时，我们还经常用到如下定理

定理 4. 设 X, Y 的联合概率密度为 f (x, y)，则 X + Y 的概率密度 p(z) 为

p(z) =

∫ _∞

−∞

f (x, z− x)dx =∫ _∞

−∞

f (z− y, y)dy

证一: 先求 X + Y 的分布函数 F (z). 我们有

F (z) = P (X + Y ≤ z) =∫ ∫

x+y≤z

f (x, y)dxdy =

∫ _∞

−∞

dx

∫ z−x

−∞

f (x, y)dy

=

∫ _∞

−∞

du

∫ z

−∞

f (x, t− x)dt =∫ z

−∞

{∫ _∞

−∞

f (x, t− x)dx }

dt.

这就说明,X + Y 的分布函数 F (z) 是其中的花括弧中的函数在区间 (−∞, z) 上的积分, 所以 X + Y 是连续型随机变量, 其密度函数如定 理所述。

(17)

证二: 令 X = Z1, X + Y = Z2, 利用单调映射的密度变换公式 (2.1) 可求得 (Z1, Z2) 的联合概率密度函数为 g(z1, z2) = f (z1, z2− z¹). 再 对 g(z1, z2) 关于 z1 在 R 上积分, 便求得 Z2= X + Y 的密度为

∫ _∞

−∞

g(z1, z2)dz1=

∫ _∞

−∞

f (z1, z2− z¹)dz1,

故得所证.

特别，当 X 与 Y 独立时，分别记 X 和 Y 的概率密度为 f1(x) 和 f₂(y)，则 X + Y 的概率密度为

p(z) =

∫ _∞

−∞

f1(x)f2(z− x)dx =∫ _∞

−∞

f1(z− y)f²(y)dy , f¹∗ f²(z) = f2∗ f¹(z)

称此公式为卷积公式。

(18)

↑Example

设 X 服从期望为 2 的指数分布，Y ∼ U(0, 1)，且 X 和 Y 相

互独立。求 X− Y 的概率密度和 P (X ≤ Y )。 _↓Example 解一: 由题设知−Y ∼ U(−1, 0)，并记 X 和 −Y 的密度分别为 f¹

和 f2，从而由卷积公式有

f_X−Y(z) =

∫ _∞

−∞

f1(x)f2(z− x)dx

=









e⁻^z²(1− e⁻¹²), z≥ 0 1− e⁻^z+1² , −1 < z < 0

0, z≤ −1 所以 P (X≤ Y ) = P (X − Y ≤ 0) = 2e⁻¹² − 1。

(19)

解二: 由于

P (X− Y ≤ z) =

∫

P (X≤ z + y|Y = y)f(y)dy

=









∫1

0 P (X≤ z + y)dy z≥ 0

∫1

−zP (X≤ z + y)dy −1 < z < 0

0 z≤ −1

=









1− 2e^−z/2(1− e^−1/2), z≥ 0 z + 2e^−(z+1)/2− 1, −1 < z < 0

0, z≤ −1

再对分布函数求导数即得所求.

(20)

↑Example

设 X1, . . . , Xni.i.d∼ N(0, 1), 试求 Yⁿ=∑n

i=1Xi² 的分布.

↓Example

解: 由前例知 Y1= X₁² 的概率密度函数为

f1(y) = 1

√2πy^−1/2e^−y/2I(y > 0) = 1

2^1/2Γ(¹₂)y^1/2−1e^−y/2I(y > 0) 由卷积公式知 Y2 = X₁²+ X₂² 的概率密度函数为

f2(z) =

∫

R

f1(y)f2(z− y)dy

= 1

2Γ²(¹₂)e^−z/2I(z > 0)

∫ 1 0

t^−1/2(1− t)^−1/2dt

= 1

2^2/2Γ(²₂)z^2/2⁻¹e^−z/2I(z > 0)

从而由归纳法, 假设 Yn−1= X1²+· · · + Xn²−1的概率密度函数

(21)

为

fn−1(z) = 1

2^(n−1)/2Γ(ⁿ⁻¹₂ )z⁽ⁿ^−1)/2−1e^−z/2I(z > 0) 则 Yn= Y_n−1+ X_n² 的概率密度函数可由卷积公式得

fn(z) =

∫

R

fn−1(y)f1(z− y)dy

= 1

2^n/2Γ(ⁿ⁻¹₂ )Γ(¹₂)z^n/2⁻¹e^−z/2I(z > 0)

∫ 1 0

t⁽ⁿ^−1)/2−1(1− t)^1/2⁻¹dt

= 1

2^n/2Γ(ⁿ₂)z^n/2⁻¹e^−z/2I(z > 0)

(22)

由归纳法得 Yn的密度函数. 称 Yn 的分布为自由度 n 的卡方分 布, 记为 Yn∼ χ²n.

• χ²_n具有再生性

• X∼ χ²n, 则 EX = n, V ar(X) = 2n.

• http://en.wikipedia.org/wiki/Chi-squared_distribution

(23)

一些连续型随机变量，也有再生性性质。

↑Example

设 X∼ N(µ¹, σ₁²), Y ∼ N(µ², σ²₂) 且 X 与 Y 相互独立，则:

X + Y ∼ N(µ¹+ µ2, σ²₁+ σ₂²).

更一般地, 设 X_i ∼ N(µⁱ, σ_i²), i = 1,· · · , n, X¹,· · · , Xⁿ 相互独立.

a1,· · · , aⁿ, b 为任意 n + 1 个实数, 其中 a1,· · · , aⁿ 不全为零. 令 X =

∑n i=1

aiXi+ b, 则有: X ∼ N(µ, σ²), 其中 µ =

∑n i=1

aiµi+ b, σ²=

∑n i=1

a²_iσ²_i.

↓Example

↑Example

设 X1 ∼ χ²n, X2 ∼ χm² , 且 X1 和 X2 相互独立, 则 X1+ X2∼

(24)

我们把具有再生性性质的分布总结一下为

• 二项分布 (关于试验次数具有再生性)

• P oisson 分布 (关于参数 λ 具有再生性)

• P ascal 分布 (关于成功次数 r 具有再生性)

• 正态分布 (关于两个参数都具有再生性)

• χ² 分布具有再生性

(25)

有时我们还会碰到计算随机变量之商的概率密度. 我们有

定理 5. 如果 (ξ, η) 是二维连续型随机向量, 它们的联合密度为 f (x, y), 则它们的商 ξ/η 是连续型随机变量, 具有密度函数

pξ η

(x) =

∫ _∞

−∞|t|f(xt, t)dt, ∀ x ∈ R.

而 pη ξ(x) =

∫ _∞

−∞|u|f(u, xu)du, ∀ x ∈ R.

(2.4)

(26)

↑Example

设随机变量 ξ 与 η 相互独立, 同服从参数 λ = 1 的指数分布, 试

求 ξ/η 的密度函数. _↓Example

解: 我们利用 (2.4) 式求 pξ η

(x). 由于 (ξ, η) 的联合密度为

p(u, v) = e^−u−v, u > 0, v > 0,

所以欲 (2.4) 式中的被积函数 |t|p(xt, t) ̸= 0, 当且仅当, t > 0 和 xt > 0, 从而知有

pξ η

(x) = { ∫_∞

0 t e^−xt−tdt =_(1+x)¹ ₂ x > 0;

0 x≤ 0.

易见 p^η

ξ(x) 同上。

(27)

↑Example

设 X1∼ N(0, 1)，X²∼ χ²n，且 X1与 X2独立。求 Y = √^X¹

X₂/n

的概率密度函数. ( 记 Y ∼ tⁿ, 称为自由度为 n 的 t 分布)。 _↓Example 解: 先求 Z =√

X2/n 的密度 g(z):

g(z) = 2nzfX₂(nz²)I(z > 0)

其中 f_X₂ 为 X₂ 的密度函数. 利用商的密度变换公式, 可得

fY(y) = fX₁/Z(y) =

∫

R

|t|ϕ(yt)g(t)dt

=

∫

R

|t| 1

√2πe^−(yt)²^/2 2nt

2^n/2Γ(ⁿ₂)(nt²)^n/2⁻¹e^−nt²^/2I(t > 0)dt

= 1

√ 2n^n/2 2^n/2Γ(ⁿ)

∫ _∞

tⁿe^−(y²^+n)t²^/2dt

(28)

令 x = (n + y²)t²/2, 则上述积分为

fY(y) = 1

√2π 2n^n/2 2^n/2Γ(ⁿ₂)

∫ _∞

0

x⁽ⁿ^−1)/2e^−xdx·1 2

( 2 n + y²

)(n+1)/2

= Γ(ⁿ⁺¹₂ )

√nπΓ(ⁿ₂) (

1 +y² n

)−ⁿ⁺¹₂

• tn的分布关于原点对称

• limn→∞fY(y) = ϕ(y).

• http://en.wikipedia.org/wiki/Student's_t-distribution

(29)

↑Example

设 X1∼ χ²n，X2 ∼ χm²，且 X1 与 X2 独立，求 Y = _X^X¹^/n

2/m 的

概率密度函数. (记 Y ∼ F^n,m, 称为自由度为 n, m 的 F 分布)。 _↓Example 解: 由密度变换公式易知 X1/n 的密度函数为 ngn(nz), 类似 X2/m

的密度为 mgm(mz), 其中 gn为自由度 n 的 χ²_n的密度函数. 从而 Y 的密度函数为

fY(y) =

∫

R

|t|ngⁿ(nty)mgm(mt)I(t > 0)dz

= [2^(n+m)/2Γ(m 2)Γ(n

2)]⁻¹n^n/2m^m/2y^n/2⁻¹

·

∫ _∞

0

e^−(ny+m)t/2t^(n+m)/2⁻¹dt

= Γ(^n+m₂ )

Γ(ⁿ₂)Γ(^m₂)n^n/2m^m/2y^n/2−1(ny + m)^−(n+m)/2

(30)

2.5.3 极小值和极大值的分布

对于 n 个随机变量 X1, ..., Xn, 我们可以考察它们的最大值和最小值:

X(n)= max{X1, ..., Xn}, X₍₁₎= min{X¹, ..., Xn}.

如此定义的 X_(n)与 X₍₁₎也是随机变量.

当 X1, ..., Xn相互独立时, 我们不难利用它们的分布函数 F1(x), ..., Fn(x) 求出 X_(n)与 X₍₁₎ 的分布函数 FX_(n)(x) 和 FX₍₁₎(x).

事实上,

FX_(n)(x) = P (X(n)≤ x) = P (max{X¹,· · · , Xⁿ} ≤ x) = P ( _n

∩

k=1

(Xk≤ x) )

=

∏n k=1

P (Xk≤ x) =

∏n k=1

Fk(x); (2.5)

(31)

而利用关系式

(X(1)> x) = (X1> x, ... , Xn> x) =

∩n k=1

(Xk> x)

可得

FX₍₁₎(x) = P (X(1)≤ x) = 1 − P (X(1)> x) = 1− P ( _n

∩

k=1

(Xk> x) )

= 1−

∏n k=1

P (Xk> x) = 1−

∏n k=1

(1− F^k(x)). (2.6)

在 X1, . . . , Xn还是同分布时候, (2.5) 和 (2.6) 还可以简化.

(32)

↑Example

设 X1, . . . , Xni.i.d∼ U(0, θ), θ > 0, 求 X(n)= max_1≤i≤nXi 的

密度函数. _↓Example

解: 由于对任意 0 < x < θ,

FX_(n)(x)=P (X(n)≤ x) = P (max{X¹,· · · , Xⁿ} ≤ x) =

∏n k=1

Fk(x)

= (x

θ )n

从而所求密度为

g(x) = FX^′_(n)(x) = nxⁿ⁻¹

θⁿ I(0 < x < θ).

(33)

目前我们接触到的分布的关系为

• n 个独立同分布 B(1, p) 的 0-1 分布随机变量之和为二项分布 B(n, p);

• 有限个独立二项随机变量 (成功的概率相同) 之和仍为二项分布;

• 有限个独立的 P oisson 分布随机变量之和服从 P oisson 分布，

参数相加；

• r 个独立同分布几何分布 G(p) 的随机变量之和服从参数为 r 和 p 的 P ascal 分布；

• 任意有限个独立的正态分布随机变量的线性组合仍然服从正态分布;