2.5: 随机变量的函数的分布
张伟平
课件 http://staff.ustc.edu.cn/~zwp/
论坛 http://fisher.stat.ustc.edu.cn
第二章随机变量及其分布
2.5 随机变量的函数的概率分布 . . . 1
2.5.1 离散型随机变量的情形. . . 1
2.5.2 连续型随机变量的情形. . . 5
2.5.3 极小值和极大值的分布. . . 28
2.5 随机变量的函数的概率分布
最简单的情形,是由一维随机变量 X 的概率分布去求其一给定 函数 Y = g(X) 的分布。较常见的,是由 (X1, X2,· · · , Xn) 的分布去 求 Y = g(X1, X2,· · · , Xn) 的分布。更一般地,由 (X1, X2,· · · , Xn) 的分布去求 (Y1, Y2,· · · , Ym) 的分布,其中 Yi= gi(X1, X2,· · · , Xn), i = 1, 2,· · · , m。
这一部分内容,与数理统计中求统计量的分布有密切的联系。
2.5.1 离散型随机变量的情形
设 X 的分布律为
P (X = xi) = pi, i = 1, 2,· · · g : R→ R,令 Y = g(X),则 Y 的分布律为
↑Example
设 X 的概率函数为
X -1 0 1 2
P 1/4 1/2 1/8 1/8
试求 Y = X2, Z = X3+ 1 的分布律。 ↓Example
解: 容易求得 Y 的分布律为:
Y 0 1 4
P 1/2 3/8 1/8 Z 的分布律
Z 0 1 2 9
P 1/4 1/2 1/8 1/8
上述结论可以推广到多维随机变量的情形:
设随机向量 X 的分布律为 P (X = x),则 X 的函数 Y = g(X) 的分布律为
P (Y = y) = P (g(X) = y) = ∑
x:g(x)=y
P (X = x)
特别当 ξ, η 是相互独立的非负整值随机变量,各有分布律{ak} 与 {bk}. 那么 ξ + η 有分布律
P (ξ + η = n) =
∑n k=0
akbn−k
称此公式为离散卷积公式
↑Example
设 X∼ B(n, p),Y ∼ B(m, p) 且 X 和 Y 相互独立,则 X+Y ∼
B(n + m, p)。 ↓Example
这种性质称为再生性。可推广至多项和:设 Xi∼ B(ni, p), (i = 1, 2,· · · , m),且 X1, X2,· · · , Xm 独立,则有:∑m
i=1
Xi∼ B(∑m
i=1
ni, p)。
特别,若 X1, X2,· · · , Xn 为独立同分布,且 Xi ∼ B(1, p), i = 1,· · · , n. 则有:∑n
i=1
Xi∼ B(n, p)。此结论揭示了二项分布与 0 − 1 分 布之间的密切关系。
↑Example
设 X ∼ P (λ),Y ∼ P (µ),且 X 和 Y 独立,则有 X + Y ∼
P (λ + µ)。即 P oisson 分布亦具有再生性。 ↓Example
2.5.2 连续型随机变量的情形
定理 1. [密度变换公式] 设随机变量 X 有概率密度函数 f (x), x∈ (a, b)(a, b 可以为∞), 而 y = g(x) 在 x ∈ (a, b) 上是严格单调的连 续函数,存在唯一的反函数 x = h(y), y∈ (α, β) 并且 h′(y) 存在且 连续,那么 Y = g(X) 也是连续型随机变量且有概率密度函数
p(y) = f (h(y))|h′(y)|, y ∈ (α, β).
↑Example
设随机变量 X∼ U(−π2,π2), 求 Y = tgX 的概率密度函数。
↓Example
解: 由于函数 g(x) = tg(x) = y 为单调可微函数,其反函数 x = arctg(y) 连续可微,因此由密度变换公式知 Y 的概率密度函数为
f (y) = 1
πarctg′(y) = 1
π(1 + y2), −∞ < y < ∞
此分布称为 Cauchy 分布。本题我们也可以用一般的方法求解,即先 求出分布函数,然后对分布函数求导数得到。
F (y) = P (Y ≤ y) = P (tg(X) ≤ y)
= P (X≤ arctg(y)) =
∫arctg(y)
−π2
1 πdy = 1
πarctg(y) +1 2. 所以 Y 的概率密度为
f (y) = F′(y) = 1 π(1 + y2).
这种方法更具有一般性。
注: 当 g 不是在全区间上单调而是逐段单调时,密度变换公式为 下面的形式:
设随机变量 ξ 的密度函数为 pξ(x), a < x < b. 如果可 以把 (a, b) 分割为一些 (有限个或可列个) 互不重叠的子 区间的和 (a, b) =∪
jIj, 使得函数 u = g(t), t∈ (a, b) 在每个子区间上有唯一的反函数 hj(u), 并且 h′j(u) 存 在连续, 则 η = g(ξ) 是连续型随机变量, 其密度函数为:
pη(x) =∑
j
pξ(hj(x))|h′j(x)| .
↑Example
设 X∼ N(0, 1),求 Y = X2 的概率密度。
↓Example
解: 由于函数 y = x2 在 (−∞, 0) 和 [0, ∞) 上严格单调,因此由上述 定理知 Y 的概率密度为
f (y) = ϕ(−√ y)| −√
y′|I{y>0}+ ϕ(√ y)|√
y′|I{y>0}
= 1
√2πy−12e−y2I{y>0}
定理 2. 设 (ξ1, ξ2) 是 2 维 连 续 型 随 机 向 量, 具 有 联 合 密 度 函 数 p(x1, x2), 设 ζj = fj(ξ1, ξ2), j = 1, 2. 若 (ξ1, ξ2) 与 (ζ1, ζ2) 一一对 应, 逆映射 ξj= hj(ζ1, ζ2), j = 1, 2. 假定每个 hj(y1, y2) 都有一阶连 续偏导数. 则 (ζ1, ζ2) 亦为连续型随机向量, 且其联合概率密度为
q(y1, y2) =
{ p (h1(y1, y2), hn(y1, y2))|J|, (y1, y2)∈ D,
0, (y1, y2)̸∈ D, (2.1) 其中D 是随机向量 (ζ1, ζ2) 的所有可能值的集合, J 是变换的 J accobi 行列式,即
J =
∂h1
∂y1
∂h1
∂y2
∂h2
∂y1
∂h2
∂y2
在多元随机变量场合,更一般地有
定理 3. 如果 (ξ1,· · · , ξn) 是 n 维连续型随机向量, 具有联合密度函 数 p(x1,· · · , xn). 假设存在 n 个 n 元函数
yj= fj(x1,· · · , xn), j = 1,· · · , n, 使得
ζj= fj(ξ1,· · · , ξn), j = 1,· · · , n,
若 (ξ1,· · · , ξn) 与 (ζ1,· · · , ζn) 之间一一对应, 逆映射为 ξj= hj(ζ1,· · · , ζn), j = 1,· · · , n. 其中每个 hj(y1,· · · , yn) 都有一阶连续偏导数, 那么随 机向量 (ζ1,· · · , ζn) 是连续型的, 且具有联合密度函数
q(y1,· · · , yn) =
{ p (h1(y1,· · · , yn),· · · , hn(y1,· · · , yn))|J|, (y1,· · · , yn)∈ D,
0, (y1,· · · , yn)̸∈ D, (2.2)
其中D 是随机向量 (ζ1,· · · , ζn) 的所有可能值的集合, J 是变换 的 Jaccobi 行列式,即
J =
∂h1
∂y1 · · · ∂h∂yn1
... ... ...
∂hn
∂y1 · · · ∂h∂ynn
↑Example
在直角坐标平面上随机选取一点, 分别以随机变量 ξ 与 η 表示其 横坐标和纵坐标, 可以认为 ξ 与 η 相互独立. 如果 ξ 与 η 都服从正态 分布 N (0, 1), 试求其极坐标 (ρ, θ) 的分布.
↓Example
解: 易知 {
x = r cos t y = r sin t
是 (0,∞) × [0, 2π) 与 R2(原点除外) 之间的一一变换, 变换的 Jaccobi 行列式
J =
∂x
∂r
∂x
∂t
∂y
∂r
∂y
∂t
=
cos t −r sin t sin t r cos t
= r.
由于 (ξ, η) 的联合密度为
p(x, y) = 1 2πexp
{
−x2+ y2 2
} ,
所以由 (??) 式得知, (ρ, θ) 的联合密度为
q(r, t) = 1 2πr exp
{
−r2 2
}
= q1(r)q2(t), r > 0, t∈ [0, 2π). (2.3)
其中 q1(r) = r exp{
−r22}
, r > 0; q2(t) = 2π1, t∈ [0, 2π). 这一 结果表明: θ 与 ρ 相互独立, 其中 θ 服从 [0, 2π) 上的均匀分布; 而 ρ 则服从 Weibull 分布 (参数 λ = 1/2, α = 2).
在计算两个随机变量之和时,我们还经常用到如下定理
定理 4. 设 X, Y 的联合概率密度为 f (x, y),则 X + Y 的概率密度 p(z) 为
p(z) =
∫ ∞
−∞
f (x, z− x)dx =∫ ∞
−∞
f (z− y, y)dy
证一: 先求 X + Y 的分布函数 F (z). 我们有
F (z) = P (X + Y ≤ z) =∫ ∫
x+y≤z
f (x, y)dxdy =
∫ ∞
−∞
dx
∫ z−x
−∞
f (x, y)dy
=
∫ ∞
−∞
du
∫ z
−∞
f (x, t− x)dt =∫ z
−∞
{∫ ∞
−∞
f (x, t− x)dx }
dt.
这就说明,X + Y 的分布函数 F (z) 是其中的花括弧中的函数在区间 (−∞, z) 上的积分, 所以 X + Y 是连续型随机变量, 其密度函数如定 理所述。
证二: 令 X = Z1, X + Y = Z2, 利用单调映射的密度变换公式 (2.1) 可求得 (Z1, Z2) 的联合概率密度函数为 g(z1, z2) = f (z1, z2− z1). 再 对 g(z1, z2) 关于 z1 在 R 上积分, 便求得 Z2= X + Y 的密度为
∫ ∞
−∞
g(z1, z2)dz1=
∫ ∞
−∞
f (z1, z2− z1)dz1,
故得所证.
特别,当 X 与 Y 独立时,分别记 X 和 Y 的概率密度为 f1(x) 和 f2(y),则 X + Y 的概率密度为
p(z) =
∫ ∞
−∞
f1(x)f2(z− x)dx =∫ ∞
−∞
f1(z− y)f2(y)dy , f1∗ f2(z) = f2∗ f1(z)
称此公式为卷积公式。
↑Example
设 X 服从期望为 2 的指数分布,Y ∼ U(0, 1),且 X 和 Y 相
互独立。求 X− Y 的概率密度和 P (X ≤ Y )。 ↓Example 解一: 由题设知−Y ∼ U(−1, 0),并记 X 和 −Y 的密度分别为 f1
和 f2,从而由卷积公式有
fX−Y(z) =
∫ ∞
−∞
f1(x)f2(z− x)dx
=
e−z2(1− e−12), z≥ 0 1− e−z+12 , −1 < z < 0
0, z≤ −1 所以 P (X≤ Y ) = P (X − Y ≤ 0) = 2e−12 − 1。
解二: 由于
P (X− Y ≤ z) =
∫
P (X≤ z + y|Y = y)f(y)dy
=
∫1
0 P (X≤ z + y)dy z≥ 0
∫1
−zP (X≤ z + y)dy −1 < z < 0
0 z≤ −1
=
1− 2e−z/2(1− e−1/2), z≥ 0 z + 2e−(z+1)/2− 1, −1 < z < 0
0, z≤ −1
再对分布函数求导数即得所求.
↑Example
设 X1, . . . , Xni.i.d∼ N(0, 1), 试求 Yn=∑n
i=1Xi2 的分布.
↓Example
解: 由前例知 Y1= X12 的概率密度函数为
f1(y) = 1
√2πy−1/2e−y/2I(y > 0) = 1
21/2Γ(12)y1/2−1e−y/2I(y > 0) 由卷积公式知 Y2 = X12+ X22 的概率密度函数为
f2(z) =
∫
R
f1(y)f2(z− y)dy
= 1
2Γ2(12)e−z/2I(z > 0)
∫ 1 0
t−1/2(1− t)−1/2dt
= 1
22/2Γ(22)z2/2−1e−z/2I(z > 0)
从而由归纳法, 假设 Yn−1= X12+· · · + Xn2−1的概率密度函数
为
fn−1(z) = 1
2(n−1)/2Γ(n−12 )z(n−1)/2−1e−z/2I(z > 0) 则 Yn= Yn−1+ Xn2 的概率密度函数可由卷积公式得
fn(z) =
∫
R
fn−1(y)f1(z− y)dy
= 1
2n/2Γ(n−12 )Γ(12)zn/2−1e−z/2I(z > 0)
∫ 1 0
t(n−1)/2−1(1− t)1/2−1dt
= 1
2n/2Γ(n2)zn/2−1e−z/2I(z > 0)
由归纳法得 Yn的密度函数. 称 Yn 的分布为自由度 n 的卡方分 布, 记为 Yn∼ χ2n.
• χ2n具有再生性
• X∼ χ2n, 则 EX = n, V ar(X) = 2n.
• http://en.wikipedia.org/wiki/Chi-squared_distribution
一些连续型随机变量,也有再生性性质。
↑Example
设 X∼ N(µ1, σ12), Y ∼ N(µ2, σ22) 且 X 与 Y 相互独立,则:
X + Y ∼ N(µ1+ µ2, σ21+ σ22).
更一般地, 设 Xi ∼ N(µi, σi2), i = 1,· · · , n, X1,· · · , Xn 相互独立.
a1,· · · , an, b 为任意 n + 1 个实数, 其中 a1,· · · , an 不全为零. 令 X =
∑n i=1
aiXi+ b, 则 有: X ∼ N(µ, σ2), 其 中 µ =
∑n i=1
aiµi+ b, σ2=
∑n i=1
a2iσ2i.
↓Example
↑Example
设 X1 ∼ χ2n, X2 ∼ χm2 , 且 X1 和 X2 相互独立, 则 X1+ X2∼
我们把具有再生性性质的分布总结一下为
• 二项分布 (关于试验次数具有再生性)
• P oisson 分布 (关于参数 λ 具有再生性)
• P ascal 分布 (关于成功次数 r 具有再生性)
• 正态分布 (关于两个参数都具有再生性)
• χ2 分布具有再生性
有时我们还会碰到计算随机变量之商的概率密度. 我们有
定理 5. 如果 (ξ, η) 是二维连续型随机向量, 它们的联合密度为 f (x, y), 则它们的商 ξ/η 是连续型随机变量, 具有密度函数
pξ η
(x) =
∫ ∞
−∞|t|f(xt, t)dt, ∀ x ∈ R.
而 pη ξ(x) =
∫ ∞
−∞|u|f(u, xu)du, ∀ x ∈ R.
(2.4)
↑Example
设随机变量 ξ 与 η 相互独立, 同服从参数 λ = 1 的指数分布, 试
求 ξ/η 的密度函数. ↓Example
解: 我们利用 (2.4) 式求 pξ η
(x). 由于 (ξ, η) 的联合密度为
p(u, v) = e−u−v, u > 0, v > 0,
所以欲 (2.4) 式中的被积函数 |t|p(xt, t) ̸= 0, 当且仅当, t > 0 和 xt > 0, 从而知有
pξ η
(x) = { ∫∞
0 t e−xt−tdt =(1+x)1 2 x > 0;
0 x≤ 0.
易见 pη
ξ(x) 同上。
↑Example
设 X1∼ N(0, 1),X2∼ χ2n,且 X1与 X2独立。求 Y = √X1
X2/n
的概率密度函数. ( 记 Y ∼ tn, 称为自由度为 n 的 t 分布)。 ↓Example 解: 先求 Z =√
X2/n 的密度 g(z):
g(z) = 2nzfX2(nz2)I(z > 0)
其中 fX2 为 X2 的密度函数. 利用商的密度变换公式, 可得
fY(y) = fX1/Z(y) =
∫
R
|t|ϕ(yt)g(t)dt
=
∫
R
|t| 1
√2πe−(yt)2/2 2nt
2n/2Γ(n2)(nt2)n/2−1e−nt2/2I(t > 0)dt
= 1
√ 2nn/2 2n/2Γ(n)
∫ ∞
tne−(y2+n)t2/2dt
令 x = (n + y2)t2/2, 则上述积分为
fY(y) = 1
√2π 2nn/2 2n/2Γ(n2)
∫ ∞
0
x(n−1)/2e−xdx·1 2
( 2 n + y2
)(n+1)/2
= Γ(n+12 )
√nπΓ(n2) (
1 +y2 n
)−n+12
• tn的分布关于原点对称
• limn→∞fY(y) = ϕ(y).
• http://en.wikipedia.org/wiki/Student's_t-distribution
↑Example
设 X1∼ χ2n,X2 ∼ χm2,且 X1 与 X2 独立,求 Y = XX1/n
2/m 的
概率密度函数. (记 Y ∼ Fn,m, 称为自由度为 n, m 的 F 分布)。 ↓Example 解: 由密度变换公式易知 X1/n 的密度函数为 ngn(nz), 类似 X2/m
的密度为 mgm(mz), 其中 gn为自由度 n 的 χ2n的密度函数. 从而 Y 的密度函数为
fY(y) =
∫
R
|t|ngn(nty)mgm(mt)I(t > 0)dz
= [2(n+m)/2Γ(m 2)Γ(n
2)]−1nn/2mm/2yn/2−1
·
∫ ∞
0
e−(ny+m)t/2t(n+m)/2−1dt
= Γ(n+m2 )
Γ(n2)Γ(m2)nn/2mm/2yn/2−1(ny + m)−(n+m)/2
2.5.3 极小值和极大值的分布
对于 n 个随机变量 X1, ..., Xn, 我们可以考察它们的最大值和最 小值:
X(n)= max{X1, ..., Xn}, X(1)= min{X1, ..., Xn}.
如此定义的 X(n)与 X(1)也是随机变量.
当 X1, ..., Xn相互独立时, 我们不难利用它们的分布函数 F1(x), ..., Fn(x) 求出 X(n)与 X(1) 的分布函数 FX(n)(x) 和 FX(1)(x).
事实上,
FX(n)(x) = P (X(n)≤ x) = P (max{X1,· · · , Xn} ≤ x) = P ( n
∩
k=1
(Xk≤ x) )
=
∏n k=1
P (Xk≤ x) =
∏n k=1
Fk(x); (2.5)
而利用关系式
(X(1)> x) = (X1> x, ... , Xn> x) =
∩n k=1
(Xk> x)
可得
FX(1)(x) = P (X(1)≤ x) = 1 − P (X(1)> x) = 1− P ( n
∩
k=1
(Xk> x) )
= 1−
∏n k=1
P (Xk> x) = 1−
∏n k=1
(1− Fk(x)). (2.6)
在 X1, . . . , Xn还是同分布时候, (2.5) 和 (2.6) 还可以简化.
↑Example
设 X1, . . . , Xni.i.d∼ U(0, θ), θ > 0, 求 X(n)= max1≤i≤nXi 的
密度函数. ↓Example
解: 由于对任意 0 < x < θ,
FX(n)(x)=P (X(n)≤ x) = P (max{X1,· · · , Xn} ≤ x) =
∏n k=1
Fk(x)
= (x
θ )n
从而所求密度为
g(x) = FX′(n)(x) = nxn−1
θn I(0 < x < θ).
目前我们接触到的分布的关系为
• n 个独立同分布 B(1, p) 的 0-1 分布随机变量之和为二项分布 B(n, p);
• 有限个独立二项随机变量 (成功的概率相同) 之和仍为二项分 布;
• 有限个独立的 P oisson 分布随机变量之和服从 P oisson 分布,
参数相加;
• r 个独立同分布几何分布 G(p) 的随机变量之和服从参数为 r 和 p 的 P ascal 分布;
• 任意有限个独立的正态分布随机变量的线性组合仍然服从正态 分布;