• 沒有找到結果。

5-1-1機率與統計-隨機變數

N/A
N/A
Protected

Academic year: 2021

Share "5-1-1機率與統計-隨機變數"

Copied!
5
0
0

加載中.... (立即查看全文)

全文

(1)(99 課綱) 選修數學甲上冊 第一章 機率與統計 1-1 隨機變數 近代以來﹐統計學的發展十分快速﹐且深入各個學科領域﹐舉凡物理、生物、醫 藥、社會、經濟、教育、…﹐涵蓋了自然科學及社會科學﹒以醫藥為例﹐由於許 多病症的致病原因仍不清楚﹐需要從統計上研究藥物與治療的關係;再以教育為 例﹐中學生參加課外補習的利弊得失﹐確是一個值得以統計方法探究的議題﹒統 計研究的對象﹐通常是龐大的族群﹐而且著重大致的通性﹐較不強調少數特例﹐ 故常使用抽樣調查﹐所謂一葉知秋、見微知著﹒然而抽樣調查有可能有以偏概全 的危險﹐必須依循機率理論﹐才能使樣本具有代表性﹒因此﹐機率論是統計學的 基礎﹒ 【目標】 建立隨機變數的基本概念﹐能分辨離散型與連續型的差異﹐並藉由機率質量函數 理解離散型隨機變數的機率分布﹐進一步認識隨機變數的數學期望值、變異數及 標準差﹐熟習其相關的性質﹒ 【討論】 種瓜得瓜、種豆得豆﹐有些事情其因果是必然的﹐但有些結果卻不必然﹐而是或 然、隨機的﹐例如兩人猜拳比輸贏、投擲硬幣看正反﹒所謂隨機﹐就是事前不能 預知會是什麼結果﹒ 隨機變數的概念:這類具有隨機性的變數稱為隨機變數﹐常以大寫的英文字母 X﹐ Y﹐Z 表示﹒隨機變數有離散型、連續型兩種主要類型﹒離散型隨機變數的可能 值是離散的﹐其所有可能值可形成有限數列或無窮數列;而連續型隨機變數的可 能值則為連續的實數﹒本書將以討論有限可能值的離散型隨機變數為主﹒ 【定義】 1 機率質量函數: 設離散型隨機變數 X 的可能值為 x1 , x2 , L, xn ﹐通常以函數 f X ( xk ) 表 X = xk 的 機率 pk ﹐即 f X ( xk ) = P( X = xk ) = pk ﹐ k = 1, 2, L, n ﹒或寫成表格 x1 x2 xn … X fX p1 p2 pn … 其中每一個 pk > 0 ﹐且 p1 + p2 + L + pn = 1 ﹒ f X 稱為隨機變數 X 的機率質量函 數(簡稱機率函數)﹐也就是隨機變數 X 的機率分布﹐當不致混淆時﹐ f X ( xk ) 可寫成 f ( xk ) ﹒機率質量函數的圖形是一些離散的點﹐其中橫軸為變數 X﹐ 縱軸為機率 P﹐兩軸的單位長不必取成相同﹒. 1.

(2) 機率密度函數: 連續型隨機變數 X 的機率分布用機率密度函數 f ( x) 來描述﹐機率密度曲線 y = f ( x) 下方與 x 軸所圍成的面積恆為 1;事件「 a ≤ X ≤ b 」的機率 P (a ≤ X ≤ b) 就是曲線 y = f ( x) 下方﹐x 軸上方在 x = a 與 x = b 之間圍成的區域面積﹒ 3 等機率分布:. 2. 當 X = x1 , x2 , L, xn ﹐且 f ( x1 ) = f ( x2 ) = L = f ( xn ) =. 1 時﹐X 即遵循等機率分布﹒ n. 白努利分布: 假設隨機變數 X 的可能值只有 0 與 1﹐且機率函數為 f (1) = p ﹐ f (0) = 1 − p ﹐ 其中 0 < p < 1 ﹐此種機率分布稱為參數是 p 的白努利分布﹒ 5 相對次數分布圖: 假設一筆數據 a1 , a2 , L, am 共 m 個數﹐其中有相同的數﹐經整理相異數有 x1 , x2 , L, xn ﹐且 x1 出現 i1 次﹐x2 出現 i2 次﹐…﹐xn 出現 in 次﹐i1 + i2 + L + in = m ﹐ 4. i i i1 ﹐ p2 = 2 ﹐…﹐ pn = n ﹐則 p1 , p2 , L, pn 依序表 x1 , x2 , L, xn 出現的 m m m 相對次數﹐且 p1 + p2 + L + pn = 1 ﹒在坐標平面上﹐點 ( x1 , p1 ) ﹐ ( x2 , p2 ) ﹐…﹐ ( xn , pn ) 所成的圖形稱為該筆數據的相對次數分布圖﹐它類似機率質量函數. 令 p1 =. 6. 圖﹒ 加權平均數: 我們知道 n 個數 x1 , x2 , L, xn 的算術平均數為. x1 + x2 + L + xn 1 1 1 = x1 + x2 + L + xn ﹒一般而言﹐設 x1 , x2 , L, xn 是 n 個實數﹐ n n n n 若 p1 , p2 , L, pn 都是正數﹐且 p1 + p2 + L + pn = 1 ﹐則 x1 p1 + x2 p2 + L + xn pn 稱為 x1 , x2 , L, xn 的一個(算術)加權平均數﹐而 p1 , p2 , L, pn 為權數﹒. 7. 數學期望值: 設離散型隨機變數 X 的可能值為 x1 , x2 , L, xn ﹐機率函數 f ( xk ) = pk > 0 ﹐ k = 1, 2, L , n ﹐此時﹐ p1 + p2 + L + pn = 1 ﹒若以機率 p1 , p2 , L , pn 為權數﹐取 x1 , x2 , L, xn 的加權平均數 x1 p1 + x2 p2 + L + xn pn ﹐則此數稱為隨機變數 X 的數 學期望值﹐簡稱期望值﹐記為 E ( X ) ﹒又可稱為平均數﹐以 μ X 表示﹐即 n. E ( X ) = μ X = x1 p1 + x2 p2 + L + xn pn = ∑ xk pk ﹐當不致混淆時﹐ μ X 簡記為 μ ﹒ k =1. 2.

(3) 【性質】 1 數學期望值的性質: 設離散型隨機變數 X 的可能值為 x1 , x2 , L, xn ﹐機率函數 f ( xk ) = pk ﹐ k = 1, 2, L , n ﹐則 X 2 也是隨機變數﹐可能值為 x1 , x2 , L , xn ﹐其對應的機率 2. 2. 2. n. 為 p1 , p2 , L, pn ﹐故期望值 E ( X 2 ) = x12 p1 + x2 2 p2 + L + xn 2 pn = ∑ xk 2 pk ﹒一般而 k =1. 言﹐若 Y 是 X 的多項式﹐則 Y 也是隨機變數﹐特別地﹐ Y = aX 2 + bX + c 時﹐Y 的可能值為 yk = axk 2 + bxk + c ﹐ k = 1, 2, L, n ﹐而 Y 的期望值 n. n. E (Y ) = ∑ (axk + bxk + c) pk = ∑ ( axk pk + bxk pk + cpk ) 2. k =1. n. 2. k =1. n. n. k =1. k =1. = a ∑ xk pk + b∑ xk pk + c∑ pk = aE ( X 2 ) + bE ( X ) + c ﹒ 2. k =1. 由此可知 E ( aX + bX + c) = aE ( X 2 ) + bE ( X ) + c ﹒ 2 數學期望值的性質: 設 X 是隨機變數﹐a﹐b﹐c 是常數﹐則 E ( aX 2 + bX + c) = aE ( X 2 ) + bE ( X ) + c ﹒ 特別地﹐ E (bX + c) = bE ( X ) + c ﹒ 【定義】 1 隨機變數的變異數、標準差: 設隨機變數 X 的平均數為 μ﹐則 ( X − μ ) 2 的期望值 E (( X − μ ) 2 ) 稱為 X 的變異 2. n. 數﹐記為 Var ( X ) ﹐即 Var ( X ) = E (( X − μ ) ) = ∑ ( xk − μ ) 2 pk ﹐而 2. k =1. E (( X − μ ) ) = E ( X − 2μX + μ ) = E ( X ) − 2μE ( X ) + μ 2 = E ( X 2 ) − 2μ 2 + μ 2 = E ( X 2 ) − μ 2 ﹒設隨機變數 X 的平均數為 μ﹐則 X 的變異數 2. 2. 2. 2. Var ( X ) = E (( X − μ ) 2 ) = E ( X 2 ) − μ 2 = E ( X 2 ) − ( E ( X )) 2 ﹒ 【範例】 1 求下列隨機變數 X 的變異數﹒ (1)X 遵循等機率分布且可能值為 x1 , x2 , L, xn ﹒ (2)X 遵循參數為 p 的白努利分布﹒ 解答: 1 n. X 的平均數 μ = ( x1 + x2 + L + xn ) =. 1 n ∑ xk ﹐ n k =1. n 1 1 n Var ( X ) = ∑ ( xk − μ ) 2. = ∑ ( xk − μ ) 2 ﹐另一方面﹐由於 Var ( X ) = E ( X 2 ) − μ 2 ﹐ n n k =1 k =1 1 n 1 n 故 X 的變異數亦可表為 Var ( X ) = ∑ xk 2 −( ∑ xk )2 ﹒ n k =1 n k =1 2 2 2 μ = E ( X ) = p ﹐又 E ( X ) = 0 .(1 − p ) + 1 .p = p ﹐. 於是﹐ Var ( X ) = E ( X 2 ) − μ 2 = p − p 2 = p(1 − p) ﹒. 3.

(4) 【性質】 1 設 X 是隨機變數﹐且隨機變數 Y = aX + b ﹐其中 a﹐b 是常數﹐則 Var (Y ) = E (Y 2 ) − [ E (Y )]2 = E (a 2 X 2 + 2abX + b 2 ) − [aE ( X ) + b]2 = a 2 E ( X 2 ) + 2abE ( X ) + b 2 − a 2 [ E ( X )]2 − 2abE ( X ) − b 2 = a 2 {E ( X 2 ) − [ E ( X )]2 }. = a 2Var ( X ) ﹒. 2 變異數的性質: 設 X 為隨機變數﹐a﹐b 為常數﹐則 Var (aX + b) = a 2Var ( X ) ﹒ 3 隨機變數 X 的變異數 Var ( X ) = E ( X − μ ) 2 ﹐它是 ( X − μ ) 2 以機率作加權的平均 值﹐由於 ( X − μ )2 ≥ 0 ﹐故 E ( X − μ )2 ≥ 0 ﹐即 Var ( X ) ≥ 0 ﹒ Var ( X ) 的大小可以衡 量 X 之值的離散程度﹐ Var ( X ) 愈大﹐X 的值愈偏離 μ﹐其機率分布的離散度 大; Var ( X ) 愈小﹐X 的值愈緊靠 μ﹐其機率分布的離散度小﹒ Var ( X ) 代表 X 與 μ 偏差平方的平均值﹐它可以表現 X 的離散性﹐但若要更精確地描述 X 與 μ 的偏差﹐而非偏差平方﹐則可再取 Var ( X ) 的正平方根﹐稱為隨機變數 X 的 標準差﹐以 σ X 表示﹐即 σ X = Var ( X ) = E ( X − μ )2 ﹒ 當不致混淆時﹐σ X 簡記為 σ ﹒在本書第二冊中曾定義一筆數據 X 的標準差為 其變異數的正平方根﹒由於等機率分布變數 X 的變異數恰為其可能值 x1 , x2 , L, xn 所成數據的變異數﹐故等機率變數 X 的標準差亦為其可能值 x1 , x2 , L , xn 所成數據的標準差﹒ 4 標準差的性質: 設 X 為隨機變數﹐a﹐b 為常數﹐則 σ aX +b = | a | σ X ﹒. 4.

(5) 【問題】 1. 期望值計算出來的結果必與樣本空間中的某一個基本事件值相同? 2. 設彩券每張賣 100 元,獎金及機率如下表, 獎金 50000 10000 2000 500 0 名額 1 9 90 900 9000 1 9 90 900 9000 機率 4 4 4 10 10 10 10 4 10 4 且計算出買一張彩券的期望值為 1 9 90 900 9000 E ( X ) = 50000 × 4 + 10000 × 4 + 2000 × 4 + 500 × 4 + 0 × 4 = 77 元, 10 10 10 10 10 下列問題何者正確? (1) 每買一張彩券得 E ( X ) 元?(解:錯誤) (2) 花 E ( X ) 元,必會中獎至少一張?(解:錯誤) (3) 買很多張後,每張得 E ( X ) 元?(解:錯誤) (4) 買很多張後,平均每張得 E ( X ) 元?(解:錯誤) (5) 要中任一獎項,至少要花 E ( X ) 元?(解:錯誤) (6) 開獎前,每張彩券期望價值為 E ( X ) 元?(解:正確) (7) 開獎後,每張彩券價值為 E ( X ) 元?(解:錯誤) (8) 每張彩券至少要賣 E ( X ) 元,才不會虧損?(解:正確) 【注意】 求 n 次隨機試驗的期望值,通常在計算機率時會比較複雜,若利用期望值的性質 E (nX ) = nE ( X ) 及 E ( X + c) = E ( X ) + c 求時,將會大大降低計算過程,也就是將 執行一次隨機試驗的期望值乘以 n 即可。. 5.

(6)

參考文獻

相關文件

experiment may be said to exist only in order to give the facts a chance of disproving the

• 一個簡單有效的 Hash function,又稱 RK 算法 (Rabin- Karp Algorithm/ Rabin fingerprint ).

自己設計 random function 自己設計 random function... 自己設計 random function 自己設計

自己設計 random function.. 自己設計

自己設計 random function.. 自己設計

有一個統計是美國每 10 萬人有 14 人因流感而死亡,可是有些州的死亡率遠超過這個數 字,如(1) Alabama 20.2 (2) Arkansas 19.8 (3) Hawaii 29.6 (4) Mississippi 23 (5) Nebraska

[r]

在【逐步解析 1】中,共需要輸入 2 個答案,為了避免「後面 輸入的答案(數學分數)」取代「前面的答案(國文分數)」,我 們要利用 2 個不同的變數來區別兩者,並以變數