隨機向量之變換
Chapter 4 期望值
儘管隨機變數之密度函數或分配函數,已經能提供吾人有關其分布一個相當完整的形象,但若要 比較二個以隨機變數之分布, 則需要有更進一步的概念與方法. 最先被想到的, 自然是一分布之
“中心” ,通常是指 “期望值” , (期望值不存在時則以中位數代之),其次則是 “變異數” ,此乃用 以討論該分布之分散程度, 本章中以此二概念為主軸, 探討各項有關性質及基本定理, 並進而為 更重要之機率理論做準備.
§ 4.1 隨機變數之期望值
期望值的最初觀念可能與賭博有關:假設一賭博,賭者可能 (自莊家)得到x1 元, x2 元, · · · , xr 元, 假定得到x1 元之機率為f (x1), · · · , 得到 xr 元之機率為f (xr), (f (x1) + · · · + f (xr) = 1), 此一賭博總共進行N 次,其中x1 元出現N1 次, · · · , xr元出現Nr 次, (N1+ · · · + Nr = N), 則N 次後賭者全部所得為
SN = x1N1+ · · · + xrNr; 平均每次所得為
SN
N = x1· N1
N + · · · + xr· Nr N ; 令N → +∞, 則我們可“期望”每次之所得平均為
N →+∞lim
SN
N = x1f (x1) + · · · + xrf (xr) =
r
X
j=1
xjf (xj).
我們將利用隨機變數建構式之定義 (參考定理 2.6), 以界定期望值.
121
4.1 隨機變數之期望值 122 定義 4.1
設 X 為 (Ω, F , P ) 上一隨機變數. 我們將界定 X 之 期望值或數學期望值(expected value or mathematical expectation) EX (亦寫作E(X) 或E[X]) 如下:
1◦ 若 X 為一簡單隨機變數, (參見定義 2.5), 即X =Pn
j=1xjIAj, 則規定
EX =
n
X
j=1
xjP (Aj);
2◦ 若X為一非負隨機變數,則由定理2.6知,存在 一非負簡單隨機變數序列{Xn}n 使得 Xn↑ X; 我們規定
EX = lim
n→+∞EXn (∈ [0, +∞]);
3◦ 若 X 為一般隨機變數, 則 X = X+− X−. 如果 E[X+] 或 E[X−] 為有限, 則 稱 EX 存在且規定
EX = E[X+] − E[X−].
如果 E[X+]及E[X−]均為有限,則稱 X 為可積(integrable) 或X 具有限期望 值(finite expectation). 如果 E[X+] = E[X−] = +∞, 則稱 X 之期望值不存 在.
上述定義中之 2◦, 與所選之序列 {Xn}n 無關, 我們將在附錄五中予以證明. 為不使初學讀 者感到過分深奧,以下有關期望值之討論, 除非特別聲明, 均限制在可積之情形.
定理 4.2
設X為一離散型隨機變數, 即存在R之一有限或可數子集合A使得P {X ∈ A} = 1.
則EX =X
x∈A
xf (x), 內 f 為 X 之密度函數.
證 1◦ 若 A 為有限, 即 X 為一簡單隨機變數, 令A = {x1, · · · , xn}, 則X 可寫為 X =n
X
j=1
xjI{X=xj}, 由上述定義知,
EX =
n
X
j=1
xjP {X = xj} =
n
X
j=1
xjf (xj) =X
x∈A
xf (x).
4.1 隨機變數之期望值 123
4.1 隨機變數之期望值 124 定理 4.3
設X 為(Ω, F , P )上一 k 維隨機向量, FX 為 X 之分配函數, 而函數 g : Rk → R 為 Borel可測.
Ω ......................X........................................ ..........................Rk
.. . .. .. . .. . .. .. .. . .. .. . .. . .. .. .. . .. .. . .. . .. .. .. . .. .. . .. .. . .. .. . . . .. . .. .. . . . .. . ...... .....................................................................................................................
g ◦ X g
R (1) 若隨機變數 g ◦ X 為可積,則 E(g ◦ X) =
Z
Rk
g(x)dFX(x);
(2) 若 X 為離散型, fX 為其密度函數, 則 E(g ◦ X) = X x∈A
g(x)fX(x), 其中 A = {x ∈ Rk| fX(x) > 0};
(3) 若 X 為絕對連續型, fX 為其密度函數,則 E(g ◦ X) = Z
Rk
g(x)fX(x)dx.
證 (1) 須利用抽象積分之變數代換觀念才能證明, 超出本書之程度, 有興趣之讀者請參閱 Lo`eve [11] p.168.(2) 因 X 為離散型, 存在一有限或可數集合A = {xj | j ∈ J} ⊂ Rk 使得
P {X ∈ A} = 1. 顯然 g ◦ X 為離散型, 此因 {X ∈ A} ⊂ {g ◦ X ∈ g(A)},是以有 P {g ◦ X ∈ g(A)} = 1. 此外, 由於
g ◦ X =X
j∈J
g(xj)I{X=xj},
由定理 4.2 知,
E(g ◦ X) =X
j∈J
g(xj)P {X = xj}
=X
j∈J
g(xj)fX(xj) =X x∈A
g(x)fX(x).
(3) 當 k = 1 時,
E(g ◦ X) = Z
R
g(x)dFX(x)
= Z
R
g(x)fX(x) dx, (因FX′ = fX a.e.)
當 k ≥ 1 時, 涉及多維 Lebesgue-Stieltjes 積分之變換, 有興趣之讀者 請參閱實變
函數論書籍以證明之.
4.2 期望值之性質及定理 125 定義 4.4
設X 為一可積之隨機變數.
(1) 若 r > 0, 則 E|X|r 稱為 X 之 r 階絕對動差 (r-th absolute moment), 而 E|X − EX|r 稱為 X 之r 階絕對中央動差 (r-th absolute central moment).
(2) 若n ∈ N, 則E[Xn] 稱為X 之n 階動差 (n-th moment), 而E[(X − EX)n]稱 為 X 之n 階中央動差 (n-th central moment).
(3) X 之二階中央動差E[(X −EX)2]又稱為X 之變異數(variance),並記為Var X 或 σ2X. 變異數之平方根 σX 又稱為 X 之標準差 (standard deviation).
註: (1) 若X 為離散型. 設A = {x ∈ R | f (x) > 0}, 則 E|X|r=X
x∈A
|x|rf (x), E|X − EX|r =X
x∈A
|x − EX|rf (x), E[Xn] =X
x∈A
xnf (x), E[(X − EX)n] =X
x∈A
(x − EX)nf (x), Var X =X
x∈A
(x − EX)2f (x).
(2) 若X 為絕對連續型, 則 E|X|r =
Z
R
|x|rf (x) dx,
E|X − EX|r= Z
R
|x − EX|rf (x) dx,
E[Xn] = Z
R
xnf (x) dx,
E[(X − EX)n] = Z
R
(x − EX)nf (x) dx,
Var X = Z
R
(x − EX)2f (x) dx.
§ 4.2 期望值之性質及定理
4.2 期望值之性質及定理 126 定理 4.5 (線性性質)
設X, Y 均為可積, c ∈ R (常數),則 (1) X = c ⇒ E[X] = c;
(2) E[cX] = cE[X];
(3) X + Y 亦為可積且 E[X + Y ] = E[X] + E[Y ].
證 (1) 常數函數乃為一簡單隨機變數,故E[X] = cP {X = c} = c · 1 = c.
(2) 我們將分三步驟證明之: 1◦ 若X =
n
X
j=1
xjIAj 為一簡單隨機變數,則 cX =
n
X
j=1
cxjIAj 亦為一簡單隨機變 數, 故
E[cX] =
n
X
j=1
cxjP (Aj) = c
n
X
j=1
xjP (Aj) = cE[X].
2◦ 若 c ≥ 0, X 為一非負隨機變數, 則存在一非負簡單隨機變數 序列 {Xn}n 使 得 Xn ↑ X;此時, cXn ↑ cX, 是以
E[cX] = lim
n→+∞E[cXn] = lim
n→+∞cE[Xn] = cE[X].
3◦ 若 X 為一般隨機變數, 則 X = X+− X−, 當c ≥ 0 時, 則 cX = (cX)+− (cX)−, 是以
E[cX] = E[(cX)+] − E[(cX)−]
= cE[X+] − cE[X−], (由2◦)
= cE[X].
當 c < 0時, 先證: E[−X] = −E[X],此因
(−X)+= max{−X, 0} = X−, (−X)−= max{X, 0} = X+, 是以
E[−X] = E[(−X)+] − E[(−X)−] = E[X−] − E[X+] = −E[X].
故得 E[cX] = E[(−1)(−c)X] = (−1)(−c)E[X] = cE[X].
(3) 我們亦分三步驟證明之:
4.2 期望值之性質及定理 127
4.2 期望值之性質及定理 128 定理 4.6
(1) 若 X ≥ 0 a.s.,則 E[X] ≥ 0.
(2) 若 X ≥ Y a.s., 則E[X] ≥ E[Y ].