2-2: 连续型随机变量
张伟平
课件 http://staff.ustc.edu.cn/~zwp/
论坛 http://fisher.stat.ustc.edu.cn
第二章随机变量及其分布
2.2 连续型随机变量
. . . . 1
2.2.1 正态分布
. . . 11
2.2.2 指数分布
. . . 16
2.2.3 均匀分布
. . . 21
2.2 连续型随机变量
离散随机变量只取有限个或可数无限个值,而连续型随机变量取 不可数个值. 这就决定了不能用描述离散型随机变量的办法来刻划连 续型随机变量.
考虑一个例子. 假定步枪射手瞄准靶子在固定的位置进行一系 列的射击. 令 X 是命中点与过靶心垂线的水平偏离值,设 X 取值 [−5cm, 5cm]. X 是一个连续随机变量.
为了计算 X 落在某区间的概率,将 [−5, 5] 分为长为 1 厘米的 小区间. 对于每个小区间,以落在这个小区间的弹孔数除以弹孔总数 得到落在这个区间的弹孔的相对频数. 设总弹孔数为 100. 我们得到 下表:
区间 弹孔数 相对频数 [−5, −4] 1 0.01 [−4, −3] 1 0.01 [−3, −2] 6 0.06 [−2, −1] 13 0.13 [−1, 0] 24 0.24 [0, 1] 27 0.27 [1, 2] 16 0.16 [2, 3] 7 0.07 [3, 4] 3 0.03 [4, 5] 2 0.02
上表可以用下图来表示:
图 2.1: 弹孔位点分布图
我们注意每个矩形的底等于 1,高为该矩形的区间所对应的相对 频数,所以面积为相对频数. 全部矩形的面积是 1. 对于 [−5, 5] 的任 一子区间,我们可以根据上图估计弹孔落在该子区间的概率. 例如要 估计 0 < X≤ 2 的概率,只要把区间中的两个矩形面积加起来,结
果得到 0.43. 再譬如说要估计−0.25 < X ≤ 1.5 中的概率,我们应 当计算该区间上的面积,结果得到:
0.06 + 0.27 + 0.08 = 0.41.
如果第二批的 100 颗子弹射在靶子上,我们就将获得另一个经 验分布. 它与第一个经验分布多半是不同的,尽管它们的外表可能相 似. 如果把观察到的相对频数看作为某一 “真” 概率的估计,则我们 假定有一个函数,它将给出任何区间中的精确概率. 这些概率由曲线 下的面积给出. 由此我们得到如下定义:
X 称为连续型随机变量,如果存在一个函数 f ,叫做 X 的 概率密度函数,它满足下面的条件:
1. 对所有的 −∞ < x < +∞, 有 f(x) ≥ 0;
2. ∫+∞
−∞f (x)dx = 1;
3. 对于任意的 −∞ < a ≤ b < +∞, 有 P (a ≤ X ≤ b) =
∫b af (x)dx.
Definition
注 1. 对于任意的−∞ < x < +∞, 有 P (X = x) =∫x
x f (u)du = 0.
注 2. 如果 f 只取某有限区间 [a, b] 的值, 令
f (x) =˜
{ f (x) x∈ [a, b],
0 其它.
则 ˜f 是定义在 (−∞, +∞) 上的密度函数, 且 f(x) 和 ˜f (x) 给出相同 的概率分布.
注 3. 假设有总共一个单位的质量连续地分布在 a≤ x ≤ b 上. 那么 f (x) 表示在点 x 的质量密度且∫d
c f (x)dx 表示在区间 [c, d] 上的全 部质量.
由于连续随机变量的概率是用积分给出的, 我们可以直接处理密 度的积分而不是密度本身.
设 X 为一连续型随机变量. 则
F (x) =
∫ x
−∞
f (u)du, −∞ < x < +∞ (2.1)
称为 X 的 (累积) 分布函数.
Definition
注 4. F (x) 表示的是随机变量的数值小于或等于 x 的概率, 即 F (x) = P (X≤ x) − ∞ < x < +∞. (2.2) 由式 (2.2) 定义的 F 为 X 的 (累积) 分布函数的一般定义. 它适用于 任意的随机变量. 设 X 为一离散型随机变量, 它以概率{p1, ..., pn, ..} 取值{a1, ..., an, ...}. 则
F (x) = ∑
ai≤x
pi.
分布函数 F 具有下列性质:
(1) F 是非减的函数;
对任何 x1< x2 都有, F (x2)− F (x1) = P (x1< X≤ x2)≥ 0 (2) 0≤ F (x) ≤ 1, x ∈ R, 且 lim
x→−∞F (x) = 0; lim
x→+∞F (x) = 1.
(3) F (x) 右连续;
F (x) = P (X≤ x) = ∑
i:ai≤x
P (X = ai) = ∑
i:ai≤x
pi
对于连续随机变量, 如果 F (x) 在点 x 的导数存在, 则 f (x) = F′(x).
连续随机变量的分布函数的图象如下图所示.
F(x) 1.0
0 x
下面我们介绍常见的连续型分布. 它们包括正态分布, 指数分布 和均匀分布.
2.2.1 正态分布
如果一个随机变量 X 具有概率密度函数
f (x) = 1
√2πσexp {
−(x− µ)2 2σ2
}
, −∞ < x < +∞� (2.3) 其中−∞ < µ < +∞� σ2 > 0,则称 X 为一正态随机变量,记为 X∼ N(µ, σ2). 以 (2.3) 为密度的分布称为参数为 µ 和 σ2 的正态分 布.
具有参数 µ = 0, σ = 1 的正态分布称为标准正态分布. 用 Φ(x) 和 ϕ(x) 表示标准正态分布 N (0, 1) 的分布函数和密度函数.
−5 0 5
0.00.10.20.30.4
f(x)
mu=−2,sigma=2
mu=1,sigma=1
mu=4,sigma=1.5
in R
↑Code
x <- seq(-4, 4, length = 401)
plot(x, dnorm(x), type = 'l') # N(0, 1) N(1, 1.52):
lines(x, dnorm(x, mean = 1, sd = 1.5), lty = 'dashed')
↓Code
从上图可以看出, 正态分布的密度函数是以 x = µ 为对称轴的 对称函数. µ 称为位置参数. 密度函数在 x = µ 处达到最大值,在 (−∞, µ) 和 (µ, +∞) 内严格单调. 同时我们看到, σ 的大小决定了密 度函数的陡峭程度. 通常称 σ 为正态分布的形状参数.
以 F (x) 记正态分布 N (µ, σ2) 的概率分布函数,则恒有 F (x) = Φ(x−µσ ). 所以任一正态分布的概率分布函数都可通过标准正态分布 的分布函数计算出来.
↑Example
设 X∼ N(µ, σ2), 则 X−µσ ∼ N(0, 1).
↓Example
证: 由
P(X− µ σ ≤ x)
= P (X≤ σx + µ)
=
∫ σx+µ
−∞
√1
2πσe−(t−µ)2/(2σ2)dt
t=σz+µ
=
∫x
−∞
√1
2πe−z2/2dz
↑Example
求数 k 使得对于正态分布的变量有 P (µ− kσ < x < µ + kσ) =
0.95. ↓Example
解: 令 F 为正态分布 N (µ, σ2) 的分布函数, 则有
P (µ− kσ < x < µ + kσ) = F (µ + kσ) − F (µ − kσ) = Φ(k) − Φ(−k) = 0.95.(2.4) 从关系式 Φ(−k) = 1 − Φ(k), 我们得 2Φ(k) − 1 = 0.95. 所以
Φ(k) = 0.975. 查正态分布表, 得 k = 1.96.
2.2.2 指数分布
若随机变量 X 具有概率密度函数
f (x) =
{ λe−λx x > 0,
0 x≤ 0, (2.5) 其中 λ > 0 为常数, 则称 X 服从参数为 λ 的指数分布.
指数分布的分布函数为
F (x) =
{ 1− e−λx x > 0,
0 x≤ 0. (2.6)
0 2 4 6 8 10
0.00.10.20.30.40.5
x
f(x)
lambda=0.5 lambda=1
lambda=3
in R
↑Code
dexp, rexp, pexp, qexp
↓Code
从图 (2.5) 可以看出, 参数 λ 愈大, 密度函数下降得愈快.
指数分布经常用于作为各种” 寿命” 的分布的近似. 令 X 表示某 元件的寿命. 我们引进 X 的失效率函数如下:
h(x) = lim
∆x→0
P (x≤ X ≤ x + ∆x|X > x)
∆x .
失效率表示了元件在时刻 x 尚能正常工作, 在时刻 x 以后, 单位时间 内发生失效的概率. 则如果
h(x)≡ λ (常数), 0 < x < +∞, X 服从指数分布. 即指数分布描述了无老化时的寿命分布.
↑Example
设 X 表示某种电子元件的寿命,F (x) 为其分布函数。若假设元 件无老化,即元件在时刻 x 正常工作的条件下,其失效率保持为某 个常数 λ,与 x 无关。试证明 X 服从指数分布。
↓Example
解:失效率即单位时间内失效的概率,因此由题设知 P (x≤ X ≤ x + h|X > x)/h = λ, h → 0
因为
P (x≤ X ≤ x+h|X > x) =P ({x ≤ X ≤ x + h}{X > x})
P (X > x) = F (x + h)− F (x) 1− F (x) 所以有
lim
h→0P (x≤ X ≤ x + h|X > x)/h = F′(x) 1− F (x) = λ 即得到微分方程 F′(x)
1−F (x) = λ, 解此方程得到
F (x) = 1− e−λx
从而结论得证。
指数分布的最重要的特点是 “无记忆性”. 即若 X 服从指数分布,
则对任意的 s, t > 0 有
P (X > s + t| X > s) = P (X > t). (2.7) 即寿命是无老化的. 可以证明, 指数分布是唯一具有性质 (2.7) 的连 续型分布.
2.2.3 均匀分布
设−∞ < a < b < +∞,如果随机变量 X 具有密度函数
f (x) = { 1
b−a a≤ x ≤ b ,
0 其它, (2.8)
则称该随机变量为区间 [a, b] 上的均匀分布, 记作 U [a, b]. 如此定义 的 f (x) 显然是一个概率密度函数. 容易算出其相应的分布函数为
F (x) =
0, x≤ a,
x−a
b−a, a < x≤ b, 1, x > b.
in R
↑Code
dunif, runif, punif, qunif
↓Code
在计算时因四舍五入而产生的误差可以用均匀分布来描述.