證因參數為 λ 之負指數分配乃 G(1, 1/λ) 分配之故

x · x^α−1e^−x/βdx

= 1

Γ(α)β^α Z +∞

x^αe^−x/βdx

= Γ(α + 1)β^α+1 Γ(α)β^α

Z +∞

Γ(α + 1)β^α+1x^αe^−x/βdx

= Γ(α + 1)β^α+1

Γ(α)β^α , (因被積函數為 G(α + 1, β) 之 _p.d.f.)

= αβ.

仿照上述方法_, 可得 E[X²] = 1

Γ(α)β^α Z +∞

x^α+1e^−x/βdx = Γ(α + 2)β^α+2

Γ(α)β^α = α(α + 1)β². 故

Var X = E[X²] − (EX)² = α(α + 1)β²− α²β²= αβ².

(VII) 若隨機變數_{X ∼ χ}²_r_, 則 E[X] = r, Var X = 2r.

^證 ^因^χ² ^分配乃 ^{G(r/2, 2)}^分配之故^.

(VIII) 若隨機變數_X 具負指數分配_, 參數為 _λ, 則E[X] = 1/λ, Var X = 1/λ².

^證 ^因參數為 ^λ^{之負指數分配乃} ^{G(1, 1/λ)} ^分配之故^.

(IX) 若隨機變數 _X 具 Cauchy 分配, 則X 之期望值不存在.

^證 ^只證 µ = 0, σ = 1之情形_, 一般情形讀者自證之_{, (}習題_). 由於 E[X⁺] = E[max{X, 0}]

= Z +∞

−∞

max{x, 0}f (x) dx

= Z 0

−∞

max{x, 0}f (x) dx + Z +∞

max{x, 0}f (x) dx

= 0 + 1 π

Z +∞

x · dx 1 + x²

= 1

2π ln(1 + x²)

+∞

0 = +∞;

4.4 Chebyshev 不等式 ₁₃₄ E[X⁻] = E[max{−X, 0}]

= Z +∞

−∞

max{−x, 0}f (x) dx

= Z 0

−∞

max{−x, 0}f (x) dx + Z +∞

max{−x, 0}f (x) dx

= 1 π

Z 0

−∞

(−x) · dx 1 + x² + 0

= − 1

2πln(1 + x²)

−∞= +∞;

故_X 之期望值不存在_.

我們知道上述 _Cauchy 密度函數 _{f (x) =} ¹ π · 1

1 + x² 之圖形對稱於 _Y 軸_, 直觀的看來_,

x = 0 應該是此一分布的中心_, 然而其期望值卻不存在_. 這正說明_: 期望值雖是一種中央趨勢之

測度 (measure of central tendency), 但與直觀之『中央』_, 並非完全一致_. 對於不為可積之隨機變數_, 我們通常以中位數代表其中心_.

§ 4.4 Chebyshev 不等式

以賭博方式來解釋最初的期望值觀念_, 當然是十分傳神的_. 與期望值具有同等重要性的標準差_, 目的在於測度某一分配『分散』的程度_, 似乎並不能由其定義直接顯示出它的含義_. 本節中_, 我們將介紹早期機率論中一個重要的定理—– Chebyshev 不等式_:

∀k > 0, P {|X − EX| ≥ kσX} ≤ 1 k².

此一不等式可以顯示出以標準差做為分配函數分散程度的一種測度乃是十分合理的_. 此外_, 我們還要證明標準差為 ₀就是分配完全不分散的觀念_.

定理 _4.13 _[ 基本不等式 (Basic inequality) ] 設_Y 為(Ω, F , P ) 上一非負隨機變數_, 則

∀c > 0, P {Y ≥ c} ≤ EY c .

^證 ^由於

Y = Y I{Y ≥c}+ Y I{Y <c}≥ Y I{Y ≥c}≥ c I{Y ≥c}, 是以

E[Y ] ≥ c · E[I{Y ≥c}] = c · P {Y ≥ c}.

4.4 Chebyshev 不等式 ₁₃₅ 註_: 若_Y 不為可積, 此不等式亦為真_, 因其右端為+∞.

定理 _4.14 _{[ Markov} 不等式 _]

設_X 為一可積隨機變數, µ = EX, r > 0, 則

∀c > 0, P {|X − µ| ≥ c} ≤ E|X − µ|^r c^r .

^證 ^令Y = |X − µ|^r, 則_Y 為一非負隨機變數_, 由基本不等式知, ∀c > 0, P {|X − µ| ≥ c} = P {|X − µ|^r ≥ c^r}

= P {Y ≥ c^r}

≤ EY

c^r = E|X − µ|^r

c^r .

定理 _4.15 [ Chebyshev 不等式 _]

設_X 為一可積隨機變數, µ = EX, σ² = Var X, 則

∀c > 0, P {|X − µ| ≥ c} ≤ Var X

c² . (1)

再者_,若 _{σ > 0,} 則

∀k > 0, P {|X − µ| ≥ kσ} ≤ 1

k². (2)

^證 ^在^Markov ^不等式中^, ^令^{r = 2} ^即得⁽¹⁾ ^式^; ^至於 ⁽²⁾ ^式^, ^係令 c = kσ > 0 而得_.

對於初學者而言_, 以標準差做為某一隨機變數之分配之『分散程度』的一種測度_, 並不十分

容易接受. Chebyshev 不等式中恰巧可提供我們_, 對此一概念一個很好的解釋_:

一、設 _µ 及_σ 分別表某隨機變數 _X 之期望值及標準差_, 由 _Chebyshev 不等式知_, P {µ − kσ < X < µ + kσ} = P {|X − µ| < kσ} ≥ 1 − 1

k².

意思是 _X 值在區間 (µ − kσ, µ + kσ) 內之機率至少為 _{1 −} _k¹₂ _, 當 _{k = 2} 時_, 上式表示 X 值在區間 (µ − 2σ, µ + 2σ) 內之機率至少為 3/4. 當_{k = 3} 時_, 上式表示 X 值在區間

4.4 Chebyshev 不等式 ₁₃₆

4.4 Chebyshev 不等式 ₁₃₇

4.5 Cauchy-Schwarz 不等式與協方差 ₁₃₈ 系 _4.17

隨機變數 _X 為退化之充要條件為_{Var X = 0.}

§ 4.5 Cauchy-Schwarz 不等式與協方差

本節中我們將研究二隨機變數間之相互關係_. 我們是以 Cauchy-Schwarz 不等式做為基礎_, 進而研究協方差以及相關係數的概念_.

定理 _4.18 [ Cauchy-Schwarz 不等式 _]

設_X 與_Y 均為隨機變數_. 若 _E[X²] < +∞, E[Y²] < +∞,則 (1) E|XY | < +∞;

(2) (E|XY |)² ≤ (E[X²])(E[Y²]).

^證 (1) 0 ≤ (|X| − |Y |)² = |X|²+ |Y |²− 2|XY |

⇒ 2|XY | ≤ |X|²+ |Y |²

⇒ 2E|XY | ≤ E|X|²+ E|Y |² < +∞.

(2) 0 ≤ (|X|t + |Y |)², ∀t ∈ R

⇒ 0 ≤ E(|X|t + |Y |)²

= E|X|²t²+ 2E|XY | t + E|Y |², ∀t ∈ R (令_{A = E|X|}², B = 2E|XY |, C = E|Y |²)

⇒ 0 ≤ A t²+ B t + C, ∀t ∈ R

⇒ △ = B²− 4AC ≤ 0, (二次方程式之判別式₎

⇒ 4(E|XY |)²− 4E|X|²· E|Y |² ≤ 0

⇒ (E|XY |)² ≤ (E[X²])(E[Y²]).

系 _4.19

X 與_Y 為二隨機變數_. 若_{EX = µ}₁_{, EY = µ}₂, Var X = σ₁², Var Y = σ₂² 均為有限_, 則

(1) −σ1σ2 ≤ E(X − µ1)(Y − µ2) ≤ σ1σ2;

(2) E(X − µ1)(Y − µ2) = σ1σ2 ⇔ P {σ1(Y − µ2) = σ2(X − µ1)} = 1;

(3) E(X − µ1)(Y − µ2) = −σ1σ2 ⇔ P {σ1(Y − µ2) = −σ2(X − µ1)} = 1.

4.5 Cauchy-Schwarz 不等式與協方差 ₁₃₉

^證 ^若^σ¹ ^{= 0} ^或^σ² ^{= 0,} ^即^{X = µ}¹ ^a.s. ^或 ^{Y = µ}² ^a.s. 則上述三結論顯然均成立 _,故以下之證明設 _σ₁ 與_σ₂ 均為正_.

(1) 令 _X₁ ₌ ^{X − µ}¹ σ1

, Y1 = Y − µ2

σ2

EX =µ1, EY = µ2, Var X = σ²₁, Var Y = σ₂²

⇒ E[X1] = 0, E[Y1] = 0, Var X1 = 1, Var Y1 = 1

⇒ E[X1] = 0, E[Y1] = 0, E[X₁²] = 1, E[Y₁²] = 1

⇒ (E|X₁Y₁|)² ≤ (E[X₁²])(E[Y₁²]) = 1, (^∵ Cauchy-Schwarz 不等式)

⇒ (E|(X − µ1)(Y − µ2)|)² ≤ σ₁²σ₂²

⇒ (E(X − µ1)(Y − µ2))² ≤ σ₁²σ₂². (定理 _4.8) (2) P {σ1(Y − µ2) = σ2(X − µ1)} = 1

⇒ X1 = Y1 a.s.

⇒ Eh(X − µ1)(Y − µ2) σ1σ2

i= E[X1Y1] = E[X₁²] = 1

⇒ E(X − µ1)(Y − µ2) = σ1σ2. 反之_,

E(X − µ1)(Y − µ2) = σ1σ2

⇒ E[X1Y1] = 1

⇒ E(X1− Y1)² = E[X₁²] − 2E[X1Y1] + E[Y₁²] = 0

⇒ Var (X₁− Y₁) = 0

⇒ X1 = Y1 a.s., (系_4.19)

⇒ P {σ1(Y − µ2) = σ2(X − µ1)} = 1.

(3) 同理_,讀者自證之_.

定義 _4.20

設_X 與_Y 為二可積之隨機變數_. 且_{EX = µ}₁_{, EY = µ}₂, Var X = σ₁², Var Y = σ₂². (1) 若 _{E(X − µ}₁_{)(Y − µ}₂₎ 存在_, 則稱其為 _X 與 _Y 之協方差(covariance), 並以

Cov(X, Y )或 _{C(X, Y )} 表之_. (2) 若_σ₁_{, σ}₂ 均為有限正數_, 則令

ρ(X, Y ) = ρ_{X, Y} = C(X, Y ) σ1σ2

, 並稱其為 _X 與_Y 之相關係數(correlation coefficient).

4.5 Cauchy-Schwarz 不等式與協方差 ₁₄₀ 定理 _4.21 ₍ 協方差之性質 )

(1) C(X, Y ) = E[XY ] − (EX)(EY ).

(2) C(X, X) = Var X .

在文檔中機率論 (頁 140-147)

證 因參數為 λ 之負指數分配乃 G(1, 1/λ) 分配之故

§ 4.4 Chebyshev 不等式

§ 4.5 Cauchy-Schwarz 不等式與協方差

證因參數為 λ 之負指數分配乃 G(1, 1/λ) 分配之故