期望值 - 隨機向量之變換

隨機向量之變換

Chapter 4 期望值

儘管隨機變數之密度函數或分配函數_,已經能提供吾人有關其分布一個相當完整的形象_,但若要比較二個以隨機變數之分布_, 則需要有更進一步的概念與方法_. 最先被想到的_, 自然是一分布之

“中心_{” ,}通常是指 _“期望值_{” , (}期望值不存在時則以中位數代之_),其次則是 _“變異數_{” ,}此乃用以討論該分布之分散程度_, 本章中以此二概念為主軸_, 探討各項有關性質及基本定理_, 並進而為更重要之機率理論做準備_.

§ 4.1 隨機變數之期望值

期望值的最初觀念可能與賭博有關_:假設一賭博,賭者可能 ₍自莊家₎得到_x₁ 元, x₂ 元, · · · , x_r 元_, 假定得到_x₁ 元之機率為_{f (x}₁_{), · · · ,} 得到 _x_r 元之機率為_{f (x}_r_{), (f (x}₁) + · · · + f (x_r) = 1), 此一賭博總共進行_N 次_,其中_x₁ 元出現_N₁ 次, · · · , xr元出現_N_r 次_{, (N}₁+ · · · + Nr = N), 則_N 次後賭者全部所得為

SN = x1N1+ · · · + xrNr; 平均每次所得為

S_N

N = x₁· N₁

N + · · · + x_r· N_r N ; 令_{N → +∞,} 則我們可_“期望_”每次之所得平均為

N →+∞lim

N = x₁f (x₁) + · · · + x_rf (x_r) =

j=1

x_jf (x_j).

我們將利用隨機變數建構式之定義 ₍參考定理 _2.6), 以界定期望值_.

121

4.1 隨機變數之期望值 ₁₂₂ 定義 _4.1

設 _X 為 (Ω, F , P ) 上一隨機變數_. 我們將界定 _X 之期望值或數學期望值_(expected value or mathematical expectation) EX (亦寫作_E(X) 或_E[X]) 如下_:

1^◦ 若 _X 為一簡單隨機變數_{, (}參見定義 _2.5), 即_{X =}^Pⁿ

j=1xjIAj, 則規定

EX =

j=1

xjP (Aj);

2^◦ 若_X為一非負隨機變數_,則由定理_2.6知_,存在一非負簡單隨機變數序列_{X_n_}_n 使得 X_n↑ X; 我們規定

EX = lim

n→+∞EXn (∈ [0, +∞]);

3^◦ 若 _X 為一般隨機變數_, 則 _{X = X}⁺_{− X}⁻_. 如果 _E[X⁺_] 或 _E[X⁻_] 為有限_, 則稱 _EX 存在且規定

EX = E[X⁺] − E[X⁻].

如果 _E[X⁺_]及_E[X⁻_]均為有限_,則稱 _X 為可積(integrable) 或_X 具有限期望值(finite expectation). 如果 _E[X⁺_{] = E[X}⁻_{] = +∞,} 則稱 _X 之期望值不存在_.

上述定義中之 ₂^◦_, 與所選之序列 _{X_n_}_n 無關_, 我們將在附錄五中予以證明_. 為不使初學讀者感到過分深奧_,以下有關期望值之討論, 除非特別聲明_, 均限制在可積之情形.

定理 _4.2

設_X為一離散型隨機變數_, 即存在R之一有限或可數子集合_A使得P {X ∈ A} = 1.

則_{EX =}^X

x∈A

xf (x), 內 _f 為 _X 之密度函數_.

^證 ¹^◦ ^若 ^A ^為有限^, ^即 ^X ^{為一簡單隨機變數}^, ^令^{A = {x}¹, · · · , x_n}, 則X 可寫為 X =

j=1

xjI{X=xj}, 由上述定義知_,

EX =

j=1

x_jP {X = x_j} =

j=1

x_jf (x_j) =X

x∈A

xf (x).

4.1 隨機變數之期望值 ₁₂₃

4.1 隨機變數之期望值 ₁₂₄ 定理 _4.3

設X 為(Ω, F , P )上一 _k 維隨機向量_{, F}_X 為 X 之分配函數_, 而函數 _{g : R}^k _{→ R} 為 Borel可測_.

Ω ^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.X^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^{. .}^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.^.R^k

.. . .. .. . .. . .. .. .. . .. .. . .. . .. .. .. . .. .. . .. . .. .. .. . .. .. . .. .. . .. .. . . . .. . .. .. . . . .. . ...... .....................................................................................................................

g ◦ X g

R (1) 若隨機變數 _{g ◦ X} 為可積_,則 _{E(g ◦ X) =}

R^k

g(x)dF_X(x);

(2) 若 X 為離散型_{, f}_X 為其密度函數_, 則 _{E(g ◦ X) =} ^X x∈A

g(x)f_X(x), 其中 A = {x ∈ R^k| f_X(x) > 0};

(3) 若 X 為絕對連續型_{, f}_X 為其密度函數_,則 _{E(g ◦ X) =} Z

R^k

g(x)f_X(x)dx.

^證 ⁽¹⁾ 須利用抽象積分之變數代換觀念才能證明_, 超出本書之程度_, 有興趣之讀者請參閱 Lo`eve [11] p.168.

(2) 因 X 為離散型_, 存在一有限或可數集合_{A = {x}_j | j ∈ J} ⊂ R^k 使得

P {X ∈ A} = 1. 顯然 _{g ◦ X} 為離散型_, 此因 {X ∈ A} ⊂ {g ◦ X ∈ g(A)},是以有 P {g ◦ X ∈ g(A)} = 1. 此外_, 由於

g ◦ X =X

j∈J

g(xj)I_{X=xj},

由定理 _4.2 知_,

E(g ◦ X) =X

j∈J

g(xj)P {X = xj}

j∈J

g(xj)f_X(xj) =X x∈A

g(x)f_X(x).

(3) 當 _{k = 1} 時_,

E(g ◦ X) = Z

g(x)dFX(x)

= Z

g(x)fX(x) dx, (因_F_X^′ _{= f}_X _a.e.)

當 _{k ≥ 1} 時_, 涉及多維 Lebesgue-Stieltjes 積分之變換_, 有興趣之讀者請參閱實變

函數論書籍以證明之_.

4.2 期望值之性質及定理 ₁₂₅ 定義 _4.4

設_X 為一可積之隨機變數_.

(1) 若 _{r > 0,} 則 _E|X|^r 稱為 _X 之 _r 階絕對動差 (r-th absolute moment), 而 E|X − EX|^r 稱為 _X 之r 階絕對中央動差 (r-th absolute central moment).

(2) 若_{n ∈ N,} 則_E[Xⁿ_] 稱為_X 之_n 階動差 (n-th moment), 而_{E[(X − EX)}ⁿ_]稱為 _X 之_n 階中央動差 (n-th central moment).

(3) X 之二階中央動差_{E[(X −EX)}²_]又稱為_X 之變異數(variance),並記為_{Var X} 或 _σ²_X_. 變異數之平方根 _σ_X 又稱為 _X 之標準差 (standard deviation).

註_: ₍₁₎ 若_X 為離散型_. 設A = {x ∈ R | f (x) > 0}, 則 E|X|^r=X

x∈A

|x|^rf (x), E|X − EX|^r =X

x∈A

|x − EX|^rf (x), E[Xⁿ] =X

x∈A

xⁿf (x), E[(X − EX)ⁿ] =X

x∈A

(x − EX)ⁿf (x), Var X =X

x∈A

(x − EX)²f (x).

(2) 若_X 為絕對連續型_, 則 E|X|^r =

|x|^rf (x) dx,

E|X − EX|^r= Z

|x − EX|^rf (x) dx,

E[Xⁿ] = Z

xⁿf (x) dx,

E[(X − EX)ⁿ] = Z

(x − EX)ⁿf (x) dx,

Var X = Z

(x − EX)²f (x) dx.

§ 4.2 期望值之性質及定理

4.2 期望值之性質及定理 ₁₂₆ 定理 _4.5 ₍線性性質₎

設_{X, Y} 均為可積_{, c ∈ R (}常數_),則 (1) X = c ⇒ E[X] = c;

(2) E[cX] = cE[X];

(3) X + Y 亦為可積且 E[X + Y ] = E[X] + E[Y ].

^證 ⁽¹⁾ 常數函數乃為一簡單隨機變數_,故

E[X] = cP {X = c} = c · 1 = c.

(2) 我們將分三步驟證明之_: 1^◦ 若_{X =}

j=1

xjIAj 為一簡單隨機變數_,則 _{cX =}

j=1

cxjIAj 亦為一簡單隨機變數_, 故

E[cX] =

j=1

cxjP (Aj) = c

j=1

xjP (Aj) = cE[X].

2^◦ 若 _{c ≥ 0, X} 為一非負隨機變數_, 則存在一非負簡單隨機變數序列 _{X_n_}_n 使得 _X_n _{↑ X;}此時_{, cX}_n _{↑ cX,} 是以

E[cX] = lim

n→+∞E[cX_n] = lim

n→+∞cE[X_n] = cE[X].

3^◦ 若 _X 為一般隨機變數_, 則 _{X = X}⁺_{− X}⁻_, 當_{c ≥ 0} 時_, 則 cX = (cX)⁺− (cX)⁻, 是以

E[cX] = E[(cX)⁺] − E[(cX)⁻]

= cE[X⁺] − cE[X⁻], (由₂^◦₎

= cE[X].

當 _{c < 0}時_, 先證: E[−X] = −E[X],此因

(−X)⁺= max{−X, 0} = X⁻, (−X)⁻= max{X, 0} = X⁺, 是以

E[−X] = E[(−X)⁺] − E[(−X)⁻] = E[X⁻] − E[X⁺] = −E[X].

故得 E[cX] = E[(−1)(−c)X] = (−1)(−c)E[X] = cE[X].

(3) 我們亦分三步驟證明之_:

4.2 期望值之性質及定理 ₁₂₇

4.2 期望值之性質及定理 ₁₂₈ 定理 _4.6

(1) 若 X ≥ 0 a.s.,則 E[X] ≥ 0.

(2) 若 X ≥ Y a.s., 則E[X] ≥ E[Y ].

在文檔中機率論 (頁 128-135)