• 沒有找到結果。

2-2: 连续型随机变量

N/A
N/A
Protected

Academic year: 2021

Share "2-2: 连续型随机变量"

Copied!
24
0
0

加載中.... (立即查看全文)

全文

(1)

2-2: 连续型随机变量

张伟平

课件 http://staff.ustc.edu.cn/~zwp/

论坛 http://fisher.stat.ustc.edu.cn

(2)

第二章随机变量及其分布

2.2 连续型随机变量

. . . . 1

2.2.1 正态分布

. . . 11

2.2.2 指数分布

. . . 16

2.2.3 均匀分布

. . . 21

(3)

2.2 连续型随机变量

离散随机变量只取有限个或可数无限个值,而连续型随机变量取 不可数个值. 这就决定了不能用描述离散型随机变量的办法来刻划连 续型随机变量.

考虑一个例子. 假定步枪射手瞄准靶子在固定的位置进行一系 列的射击. 令 X 是命中点与过靶心垂线的水平偏离值,设 X 取值 [−5cm, 5cm]. X 是一个连续随机变量.

为了计算 X 落在某区间的概率,将 [−5, 5] 分为长为 1 厘米的 小区间. 对于每个小区间,以落在这个小区间的弹孔数除以弹孔总数 得到落在这个区间的弹孔的相对频数. 设总弹孔数为 100. 我们得到 下表:

(4)

区间 弹孔数 相对频数 [−5, −4] 1 0.01 [−4, −3] 1 0.01 [−3, −2] 6 0.06 [−2, −1] 13 0.13 [−1, 0] 24 0.24 [0, 1] 27 0.27 [1, 2] 16 0.16 [2, 3] 7 0.07 [3, 4] 3 0.03 [4, 5] 2 0.02

(5)

上表可以用下图来表示:

图 2.1: 弹孔位点分布图

我们注意每个矩形的底等于 1,高为该矩形的区间所对应的相对 频数,所以面积为相对频数. 全部矩形的面积是 1. 对于 [−5, 5] 的任 一子区间,我们可以根据上图估计弹孔落在该子区间的概率. 例如要 估计 0 < X≤ 2 的概率,只要把区间中的两个矩形面积加起来,结

(6)

果得到 0.43. 再譬如说要估计−0.25 < X ≤ 1.5 中的概率,我们应 当计算该区间上的面积,结果得到:

0.06 + 0.27 + 0.08 = 0.41.

如果第二批的 100 颗子弹射在靶子上,我们就将获得另一个经 验分布. 它与第一个经验分布多半是不同的,尽管它们的外表可能相 似. 如果把观察到的相对频数看作为某一 “真” 概率的估计,则我们 假定有一个函数,它将给出任何区间中的精确概率. 这些概率由曲线 下的面积给出. 由此我们得到如下定义:

(7)

X 称为连续型随机变量,如果存在一个函数 f ,叫做 X 的 概率密度函数,它满足下面的条件:

1. 对所有的 −∞ < x < +∞, 有 f(x) ≥ 0;

2. ∫+∞

−∞f (x)dx = 1;

3. 对于任意的 −∞ < a ≤ b < +∞, 有 P (a ≤ X ≤ b) =

b af (x)dx.

Definition

注 1. 对于任意的−∞ < x < +∞, 有 P (X = x) =x

x f (u)du = 0.

(8)

注 2. 如果 f 只取某有限区间 [a, b] 的值, 令

f (x) =˜

{ f (x) x∈ [a, b],

0 其它.

则 ˜f 是定义在 (−∞, +∞) 上的密度函数, 且 f(x) 和 ˜f (x) 给出相同 的概率分布.

注 3. 假设有总共一个单位的质量连续地分布在 a≤ x ≤ b 上. 那么 f (x) 表示在点 x 的质量密度且d

c f (x)dx 表示在区间 [c, d] 上的全 部质量.

由于连续随机变量的概率是用积分给出的, 我们可以直接处理密 度的积分而不是密度本身.

(9)

设 X 为一连续型随机变量. 则

F (x) =

x

−∞

f (u)du, −∞ < x < +∞ (2.1)

称为 X 的 (累积) 分布函数.

Definition

注 4. F (x) 表示的是随机变量的数值小于或等于 x 的概率, 即 F (x) = P (X≤ x) − ∞ < x < +∞. (2.2) 由式 (2.2) 定义的 F 为 X 的 (累积) 分布函数的一般定义. 它适用于 任意的随机变量. 设 X 为一离散型随机变量, 它以概率{p1, ..., pn, ..} 取值{a1, ..., an, ...}. 则

F (x) =

ai≤x

pi.

(10)

分布函数 F 具有下列性质:

(1) F 是非减的函数;

对任何 x1< x2 都有, F (x2)− F (x1) = P (x1< X≤ x2)≥ 0 (2) 0≤ F (x) ≤ 1, x ∈ R, 且 lim

x→−∞F (x) = 0; lim

x→+∞F (x) = 1.

(3) F (x) 右连续;

(11)

F (x) = P (X≤ x) =

i:ai≤x

P (X = ai) = ∑

i:ai≤x

pi

对于连续随机变量, 如果 F (x) 在点 x 的导数存在, 则 f (x) = F(x).

连续随机变量的分布函数的图象如下图所示.

(12)

F(x) 1.0

0 x

(13)

下面我们介绍常见的连续型分布. 它们包括正态分布, 指数分布 和均匀分布.

2.2.1 正态分布

如果一个随机变量 X 具有概率密度函数

f (x) = 1

√2πσexp {

−(x− µ)2 2

}

, −∞ < x < +∞� (2.3) 其中−∞ < µ < +∞� σ2 > 0,则称 X 为一正态随机变量,记为 X∼ N(µ, σ2). 以 (2.3) 为密度的分布称为参数为 µ 和 σ2 的正态分 布.

具有参数 µ = 0, σ = 1 的正态分布称为标准正态分布. 用 Φ(x) 和 ϕ(x) 表示标准正态分布 N (0, 1) 的分布函数和密度函数.

(14)

−5 0 5

0.00.10.20.30.4

f(x)

mu=−2,sigma=2

mu=1,sigma=1

mu=4,sigma=1.5

(15)

in R

↑Code

x <- seq(-4, 4, length = 401)

plot(x, dnorm(x), type = 'l') # N(0, 1) N(1, 1.52):

lines(x, dnorm(x, mean = 1, sd = 1.5), lty = 'dashed')

↓Code

从上图可以看出, 正态分布的密度函数是以 x = µ 为对称轴的 对称函数. µ 称为位置参数. 密度函数在 x = µ 处达到最大值,在 (−∞, µ) 和 (µ, +∞) 内严格单调. 同时我们看到, σ 的大小决定了密 度函数的陡峭程度. 通常称 σ 为正态分布的形状参数.

以 F (x) 记正态分布 N (µ, σ2) 的概率分布函数,则恒有 F (x) = Φ(x−µσ ). 所以任一正态分布的概率分布函数都可通过标准正态分布 的分布函数计算出来.

(16)

↑Example

设 X∼ N(µ, σ2), 则 X−µσ ∼ N(0, 1).

↓Example

证: 由

P(X− µ σ ≤ x)

= P (X≤ σx + µ)

=

σx+µ

−∞

1

2πσe−(t−µ)2/(2σ2)dt

t=σz+µ

=

x

−∞

1

2πe−z2/2dz

(17)

↑Example

求数 k 使得对于正态分布的变量有 P (µ− kσ < x < µ + kσ) =

0.95. ↓Example

解: 令 F 为正态分布 N (µ, σ2) 的分布函数, 则有

P (µ− kσ < x < µ + kσ) = F (µ + kσ) − F (µ − kσ) = Φ(k) − Φ(−k) = 0.95.(2.4) 从关系式 Φ(−k) = 1 − Φ(k), 我们得 2Φ(k) − 1 = 0.95. 所以

Φ(k) = 0.975. 查正态分布表, 得 k = 1.96.

(18)

2.2.2 指数分布

若随机变量 X 具有概率密度函数

f (x) =

{ λe−λx x > 0,

0 x≤ 0, (2.5) 其中 λ > 0 为常数, 则称 X 服从参数为 λ 的指数分布.

指数分布的分布函数为

F (x) =

{ 1− e−λx x > 0,

0 x≤ 0. (2.6)

(19)

0 2 4 6 8 10

0.00.10.20.30.40.5

x

f(x)

lambda=0.5 lambda=1

lambda=3

(20)

in R

↑Code

dexp, rexp, pexp, qexp

↓Code

从图 (2.5) 可以看出, 参数 λ 愈大, 密度函数下降得愈快.

指数分布经常用于作为各种” 寿命” 的分布的近似. 令 X 表示某 元件的寿命. 我们引进 X 的失效率函数如下:

h(x) = lim

∆x→0

P (x≤ X ≤ x + ∆x|X > x)

∆x .

失效率表示了元件在时刻 x 尚能正常工作, 在时刻 x 以后, 单位时间 内发生失效的概率. 则如果

h(x)≡ λ (常数), 0 < x < +∞, X 服从指数分布. 即指数分布描述了无老化时的寿命分布.

(21)

↑Example

设 X 表示某种电子元件的寿命,F (x) 为其分布函数。若假设元 件无老化,即元件在时刻 x 正常工作的条件下,其失效率保持为某 个常数 λ,与 x 无关。试证明 X 服从指数分布。

↓Example

解:失效率即单位时间内失效的概率,因此由题设知 P (x≤ X ≤ x + h|X > x)/h = λ, h → 0

因为

P (x≤ X ≤ x+h|X > x) =P ({x ≤ X ≤ x + h}{X > x})

P (X > x) = F (x + h)− F (x) 1− F (x) 所以有

lim

h→0P (x≤ X ≤ x + h|X > x)/h = F(x) 1− F (x) = λ 即得到微分方程 F(x)

1−F (x) = λ, 解此方程得到

F (x) = 1− e−λx

(22)

从而结论得证。

指数分布的最重要的特点是 “无记忆性”. 即若 X 服从指数分布,

则对任意的 s, t > 0 有

P (X > s + t| X > s) = P (X > t). (2.7) 即寿命是无老化的. 可以证明, 指数分布是唯一具有性质 (2.7) 的连 续型分布.

(23)

2.2.3 均匀分布

−∞ < a < b < +∞,如果随机变量 X 具有密度函数

f (x) = { 1

b−a a≤ x ≤ b ,

0 其它, (2.8)

则称该随机变量为区间 [a, b] 上的均匀分布, 记作 U [a, b]. 如此定义 的 f (x) 显然是一个概率密度函数. 容易算出其相应的分布函数为

F (x) =







0, x≤ a,

x−a

b−a, a < x≤ b, 1, x > b.

in R

↑Code

dunif, runif, punif, qunif

↓Code

(24)

在计算时因四舍五入而产生的误差可以用均匀分布来描述.

參考文獻

相關文件

下面我们将用 这一点将一元函数的 Taylor 展开推广到多元函数.. 我们希望借助此给出多元函数

一般说来, 对于一个区间上单调的函数的 图形都存在一个需要判别弧段位于相应的弦线

4、任给空间中某一点,及某一方向,过该定点且垂

为此, 我们需要建立函 数的差商与函数的导数间的基本关系式, 这些关系式称为“微分学中值定理”...

(1) 若 A、B 电荷固定不动,在它们连线的中 点放入带电量为+2Q 的电荷 C, 电荷 C 受到的静电力是多少?.. (2) 若 A、B

本章我们又一次经历了用函数研究变化规律的过程 ,用反比例函数刻画具 有反比例关系的两个变量之间的对应关系 :在变量y 随变量x 的变化而变化的

• 回忆一下DLA模型,这是扩散控制下的完全随机模型。引入与 界面位置有关的吸附概率P i =t 5-n

11.了解傅里叶级数的概念和狄利克雷收敛定理,会将 定义在 上的函数展开为傅里叶级数, 会 将定义在