談高中新教材中機率統計的缺失與改進

全文

(1)

談高中新教材中機率統計的缺失與改進

丁村成

在高中 98數學課綱之機率統計新教材中, 其課程設計和教材編寫不但忽視學生的認知, 甚 至在教科書上仍然存在一些錯誤的概念。 例如, 在介紹二項分配前對超幾何分配隻字不提, 導致 優秀學生把簡單的超幾何分配問題利用二項分配來處理, 教師在課堂教學時如何改進這項缺失? 其次, 在提到中央極限定理的時候, 每本教科書都指出它是非常重要的定理, 但卻又認為超出高 中範圍不宜多作說明, 難道就沒有通俗簡單的方式讓學生理解嗎? 至於錯誤的觀念部分, 有些 教科書將信心水準定義為母體百分比 p 會落在信賴區間的機率。 教科書的使用攸關全國十幾萬 的高中生, 這種錯誤之統計概念竟然會出現在經過審核的教科書上, 也難怪在 98 年學測中一道 有關信心水準的試題, 不但學生看了以後感到一頭霧水, 甚至連老師都不知道要如何選擇正確 答案。 雖然到目前為止數學教育研究還沒有建立一套標準, 但經過各方討論初步有一點已達成 共識, 那就是: 數學教育研究必須走進課堂解決教與學的實際問題。 本文將透過台北市一所高中 在課堂中進行實際教學, 針對以上的缺失與錯誤儘量用通俗易懂的方式提出解決之道, 以提供 給有興趣的學生與教師作為參考與改進的依據, 更盼望能在制定 99 課綱中得到更多的迴響, 以 嘉惠於廣大青年學子為幸。

.

超幾何分配與二項分配的關係

筆者翻遍 98年高中教科書的機率統計內容, 發現每一本都只提到二項分配, 而對於更簡單 的超幾何分配卻隻字不提。 或許有學者會認為在實務上所面臨超幾何分配可被二項分配作極佳 的逼近, 但站在基礎數學教育的觀點是不能這樣處理的, 就像常態分配可以很好的近似於二項 分配, 難道我們也不需要學習二項分配了嗎? 為了暸解新教材的這種內容安排對學生有什麼影 嚮, 筆者曾經對學過高三機率統計的自然組學生提出下列問題: 年終為了替孤兒院的孩子募集壓歲錢, 百貨公司印製了 100張彩券義賣, 已知彩券 中 50% 是有獎品的。 今某人購買了 3 張彩券, 問恰有 2 張中獎之機率 =? 9

(2)

在全班 48人的答案中, 有 39人之答案為 C3 2 1 2 21 2 = 3 8, 有 6 人答案為 C250C150 C100 3 = 25 66, 有 2 人計算出其他答案, 有 1 人空白未予以作答。 本題從調查資料結果顯示, 竟然有高達 81% 學生直觀的將之視為二項分配問題, 研究中為了進一步追蹤比較不同程度的學生反應, 又再度 對已學過高三機率統計的社會組學生, 在一份問卷中同時提出下列兩個問題: 1. 年終為了替孤兒院的孩子募集壓歲錢, 百貨公司印製了一批彩券義賣。 己知彩 券中 50%是有獎品的。 今某人購買了 3 張彩券, 問恰有 2 張中獎之機率 =? 2. 年終為了替孤兒院的孩子募集壓歲錢, 百貨公司印製了 100 張彩券義賣, 已知 彩券中 50% 是有獎品的。 今某人購買了 3 張彩券, 問恰有 2 張中獎之機率 =? 班上 32人答案中, 第一題有 31人答案為 C3 2 1 2 21 2 = 3 8, 有 1 人之答案為 1 − (0.125 × 2) − (0.375) = 0.375; 第二題有 19 人的答案為 C3 2 1 2 21 2 = 3 8, 有 12 人的答案為 C250C150 C3100 = 25 66, 有 1人空白未予以作答。 從這兩次的問卷結果可以看出, 把兩個不同問題同時並列提出讓學生作 答, 對於一般平均數學程度較差的社會組, 有大約 38% 學生意識到兩個問題的差異性, 轉而更 仔細的去思考問題的意義, 因而做出了較高比率的正確答案, 使得藉由直觀所產生的錯誤降為 59%。 由此可以證實教學過程中之問題經由適當的設計, 確實可以降低學生在學習機率概念的 一些直觀錯誤。

上述所提兩個問題其實就是二項分配 (Binomial distribution) 與超幾何分配 (Hyper-geometic distribution) 的概念, 從問卷結果中顯示它們是學生極易產生混淆的兩個觀念。 為 了釐清這兩種分配所呈現問題的差異, 教學時筆者採取了鷹架教學 (Scaffolding instruction) 的方法, 讓學生透過師生對話討論出正確的想法。 課堂上提出下列問題與學生作對話式討論: 百貨公司年終印製彩券義賣, 已知彩券中有一半是有獎品的, 請問購買3張有2張 中獎之機率 =? 學生 A: 買 3 張有 2 張中獎之機率 P = C3 2 1 2 21 2 = 3 8。 學生 B: 我認為不能確定其機率, 因為我們根本不知道公司印了幾張彩券? 學生 C: 憑直覺我認為不管印幾張都沒關係, 每種情況中獎機率應該都是 1 2。 學生 D: 若印 4 張彩券時, 買 3 張恰中 2 張之機率 P = C 2 2C12 C34 = 1 2, 若印 6 張彩券時, 買 3 張恰 中 2 張之機率 P = C 3 2C13 C6 3 = 9 20, 所以我贊成 B 同學的想法。

(3)

筆 者: 既然我們不知道彩券印幾張, 那同學不妨假設印了 2n 張, 再計算取 3張恰中 2張的機 率看看嘛! 學生 D: 照老師的講法從 2n 張中取 3 張恰中 2 張之機率 Pn= Cn 1C2n C32n = 3n3 − 3n2 8n3− 12n2+ 4n, 會隨著 n 不同而得到不同答案。 筆 者: 同學想一想當 n 趨近於無限大時, 你們有沒有發現 Pn 的值會趨近於多少呢? 學生 A: 好奇怪喔! lim n→∞Pn= limn→∞ 3n3 − 3n2 8n3− 12n2+ 4n = 3 8, 答案竟然跟我利用 C 3 2 1 2 21 2 = 3 8 一樣耶! 至此, 學生已經開始慢慢體會出本題已不是單純的二項分配問題。 由於考慮學生相關先備知識 (Preknowledge) 之不足, 在證明超幾何分配與二項分配關係前, 筆者先提出下面基本問題讓 學生作為比較其差異性的鷹架: 袋中有紅球 6 個和白球 3 個, 今由袋中每次任取一球, 請問 (1) 在取後不放回的 情況下, 連取 5 次得 3 紅球之機率 =? (2) 在取後又放回的情況下, 連取 5 次 得 3 紅球之機率 =? 這時有學生求出情形 (1) 的機率 P = 5! 3!2! · 6 9· 5 8· 4 7· 3 6· 2 5 = 10 21, 筆者告訴學生取後不放回 使得每次取到紅球或白球之機率不恆相同, 這種機率模型稱為超幾何分配 (Hypergeometic distribution), 超幾何分配之每次試驗並非獨立。 也有學生求出情形 (2) 的機率 P = C5 3 6 9 33 9 2 = 80 243, 筆者此時特別強調取後再放回可視為袋中有無限多個球, 使得每次取到紅球之機率恆 為 6 9 而取到白球之機率恆為 3 9, 這種機率模型為二項分配 (Binomial distribution), 二項分 配之每次試驗都是獨立的。 經過上面一連串的討論與說明之後, 才正式提出兩種機率分配的定義, 並證明超幾何分配 之極限是二項分配的事實 (丁村成, 1997)。 (1) 若 N 件產品中有 M 件不良品, 在取後不放回的情形下, 則取 n 件恰有 r 件不良品之機 率 P = C M r Cn−rN −M CN n , 此為超幾何分配 (Hypergeometic distribution)。 (2) 若 N 件產品中有 M 件不良品, 在取後又放回的情形下, 則取 n 件恰有 r 件不良品之機 率 P = Cn r M N r 1 −MN n−r, 此為二項分配 (Binomial distribution)。

(4)

底下進一步向學生證明 : 當 N → ∞ 時 CM r Cn−rN −M CN n → Cn r M N r 1 −MNn−r。 CM r Cn−rN −M CN n = M! (M − r)!r! · (N − M)! (N − M − n + r)!(n − r)! N! (N − n)!n! = M! (M − r)!r! · (N − M)! (N − M − n + r)!(n − r)! · (N − n)!n! N! = n! (n − r)!r! · M· · · (M − r + 1) Nr · (N − M) · · · (N − M − (n − r) + 1) Nn−r · N n N(N − 1) · · · (N − n + 1) = n! (n − r)!r! M N · · · M− r + 1 N N − M N · · · N − M − (n − r) + 1 N  ·NN NN − 1· · · N N − n + 1  當 n, r 固定時因為 lim N →∞ M N · M − 1 N · · · M − r + 1 N = limN →∞ M N · limN →∞ M− 1 N · · · limN →∞ M − r + 1 N = lim N →∞ M N · limN →∞ M N − 1 N  · · · lim N →∞ M N − r− 1 N  = lim N →∞ M N r 而且 lim N →∞ (N − M)(N − M − 1) · · · (N − M − (n − r) + 1) Nn−r = lim N →∞ N − M N · limN →∞ N − M − 1 N · · · limN →∞ N − M − (n − r) + 1 N = lim N →∞  1 − MN· lim N →∞  1 −MNN1· · · lim N →∞  1 − MN − n− r − 1N  = lim N →∞  1 − MNn−r

(5)

lim N →∞ Nn N(N − 1) · · · (N − n + 1) = limN →∞ N N · limN →∞ N N − 1· · · limN →∞ N N − n − 1 = 1 · 1 · · · 1 = 1 因此得到當 N → ∞ 時 C M r Cn−rN −M CN n → Cn r M N r 1 − MN n−r 最後, 筆者舉了一道生活中的應用問題, 讓學生瞭解上述結論在實際上的應用: 工廠之 1000 個產品中的不良品比率為 0.1, 從其中任意抽取 3 個產品出來, 請問恰有一個不良品之機 率 =? 由超幾何分配得其機率 P =C 100 1 · C2900 C1000 3 ;0.2434598, 但產品的樣本數量頗大而不易 計算, 若用二項分配近似於超幾何分配, 可得其機率 P = C3 1(0.1)(0.9)2 = 0.243。 因此, 可以 看出在 N 很大的情況下, 利用二項分配算出的機率與超幾何分配非常接近。

.

二項分配近似於常態分配之教學

自然界有許多事物的分佈情形都有一個特徵, 就是數值資料大多集中於其平均數附近, 而 位在兩個極端的資料數量並不多, 且它們都會均勻分佈在平均數的左右兩邊。 例如: 某一地區 居民的總收入, 某一學校學生之數學成績 · · · 等等, 其分佈曲線都是呈現單一高峰的左右對 稱曲線, 這種曲線稱為常態曲線 (Normal curve)。 常態曲線有一個最高點, 此點的橫座標就是 資料的平均數 µ, 曲線的左右兩端會對稱於 x = µ, 而資料的離散程度可以用標準差 σ 描述。 一般只要我們知道了平均數與標準差, 整個資料的常態曲線就完全被確定了, 其中的平均數決 定了曲線的中心, 而標準差確定了曲線的形狀。 在統計上只要樣本資料符合常態曲線, 這些樣本 分佈在範圍 [µ − σ, µ + σ]、 [µ − 2σ, µ + 2σ]、 [µ − 3σ, µ + 3σ]之比率大約為 68.3%、 95.4% 、 99.7%, 我們稱之為常態分配的經驗法則 (Empirical rule), 亦即約有 68.3% 的資料會落在 距平均數一個標準差內; 約有 95.4% 的資料會落在距離平均數兩個標準差內; 約有 99.7% 的 資料會落在距平均數三個標準差內, 如下圖。

(6)

在 1733 年棣美弗 (De Moivre) 首先由二項分配 (Bionomial distribution) 的逼近推 出了常態分配 (Normal distribution) 之表達式 f (x) = √1 2πσe −(x−µ)2 2σ2 (王幼軍, 2007)。 但 他當時二項逼近的工作並未引起人們的重視, 使得常態分配也僅停留於數學表達的層面, 在實 際應用中也沒有找到適合存活的土壤。陳希孺認為, 棣美弗本人並不是一位統計學家, 他並未從 統計學的觀點去考慮這項逼近工作的意義, 其出發點僅把 p 作為已知數去研究如何用二項分配 逼近常態分配, 而不是將 p 看作未知數並通過觀察結果對它進行推論 (陳希孺, 2005)。 因此, 在 棣美弗時代要使常態分配成為一種機率模型的時機尚不成熟, 但他對二項分配與常態分配的 研究成果讓中央極限定理之發展有著承先啟後的作用。 正是在此基礎上拉普拉斯 (Laplace) 於 1780 年對棣美弗的結果進行推廣, 並建立了棣美弗−拉普拉斯極限定理 (De Moivre-Laplace Limit Theorem)(Hald, 1998)。 進入十八世紀數學出現一個很重要的特徵, 那就是數學研究的 目標在於處理人類碰到之實際問題, 生活中無論對自然現象或社會現象進行觀測, 總會產生誤差 這一點在很早以前人們就注意到了, 但是對於其觀測值所呈現的隨機性人們卻認識模糊。 雖然 歷史上有很多天文學家和數學家曾對誤差理論作過研究, 但都沒有從棣美弗的著作中得到任何 有關常態分配的啟發。 直到1809年高斯(Gauss) 在研究測量誤差之機率分配時, 才讓棣美弗所 發表的常態分配表達式得到了機率分配的身份, 又因高斯對常態分配所作的研究對後世的影嚮 極大, 使得後人對於常態分配又有高斯分配的稱呼 (Hald, 1998)。 德國10 馬克的紙鈔上曾印 有高斯肖像與常態分配的圖案, 這表示數學王子高斯一生中在科學上, 對於全人類最大的貢獻 就是常態分配。 在二項分配近似於常態分配的高中教材中, 有教科書是利用投均勻硬幣20次中會出現幾次 正面, 然後讓全班每位同學投一硬幣20次, 可能有人會擲出 8次正面也有人可能擲出12次正面, 如果將每人所擲出的正面次數記錄下來, 那麼這些次數之平均數就相當接近 10 次, 最後就直接 得出結論: 機率裡的期望值就是統計試驗中大量數據的平均值。 也有教科書先利用 EXCEL 計 算二項分配再寫一些連老師都看不下去的計算式子, 然後利用二項分配的期望值與標準差求比 率 p 的 95% 信賴區間, 我真不知道編者有沒有考慮到教與學之問題。 至於在教導高中學生的 時候要如何來表達這個概念呢? 以下是個人在課堂中之教學片斷, 首先介紹二項分配的期望值 與標準差。 對於每次只有成功與失敗兩種結果的試驗中, 若繼續重複作 n 次試驗且每次試驗是獨立 的, 則在 n 次中恰有 k 次成功的機率為 P = Cn kpk(1 − p)n−k, 這種機率分配我們稱之為具 有參數 (n, p) 的二項分配。 在具有參數 (n, p) 的二項分配中若令 X 表示其成功次數, 則有下 列結論: 1. X 的期望值 µ = E(X) = np, 2. X 的標準差 σ = SX =pnp(1 − p)。

(7)

證明如下: 次數 0 1 2 · · · n 機率 Cn 0p0(1 − p)n C1np1(1 − p)n−1 C2np2(1 − p)n−2 · · · Cnnpn(1 − p)0 X 的期望值µ= E(X) = n X k=0 kCknpk(1 − p)n−k = n X k=0 k· n! k!(n − k)!p k (1 − p)n−k = n X k=1 n! (k − 1)!(n − k)!p k (1 − p)n−k = np · n X k=1 (n − 1)! (k − 1)!(n − k)!p k−1· (1 − p)n−k = np[p + (1 − p)]n−1 = np X2 的期望值E(X2) = n X k=0 k2· Ckn· pk· (1 − p)n−k = n X k=0 k(k − 1) · Ckn· pk· (1 − p)n−k+ n X k=0 k· Ckn· pk· (1 − p)n−k = n X k=0 k(k − 1) · n! k!(n − k)! p k · (1 − p)n−k+ np = n X k=2 n! (k − 2)!(n − k)!p k · (1 − p)n−k+ np = n(n − 1)p2 n X k=2 (n − 2)! (k − 2)!(n − k)!p k−2· (1 − p)n−k + np = n(n − 1)p2[p + (1 − p)]n−2+ np = n(n − 1)p2 + np 因此我們得到 X 的標準差σ= SX = p E(X2) − E2(X) =pn(n − 1)p2+ np − (np)2 =pnp(1 − p)

(8)

關於常態分配是二項分配的近似, 為了讓學生很快的瞭解這個重要的概念, 筆者在上課中簡單 提出了一個 p = 1 2 與 p 6= 1 2 的例子說明如下: 一. 投擲一公正硬幣 4 次, 令 X 表示在 4 次試驗出現的正面次數, 求 P (X = k) =? 並作其二項分配機率圖形如右: P(X = 0) = C04(1 2) 0(1 2) 4 = 1 16 P(X = 1) = C14(1 2) 1(1 2) 3 = 4 16 P(X = 2) = C24(1 2) 2(1 2) 2 = 6 16 P(X = 3) = C34(1 2) 3(1 2) 1 = 4 16 P(X = 4) = C44(1 2) 4(1 2) 0 = 1 16 二. 投擲一公正骰子 4 次, 令 X 表示在 4 次中出現一點或四點之次數, 求 P (X = k) 並作其二項分配機率圖形如右: P(X = 0) = C04(1 3) 0(2 3) 4 = 16 81 P(X = 1) = C14(1 3) 1(2 3) 3 = 32 81 P(X = 2) = C24( 1 3) 2(2 3) 2 = 24 81 P(X = 3) = C34(1 3) 3(2 3) 1 = 8 81 P(X = 4) = C4 4( 1 3) 4(2 3) 0 = 1 81 由上面例題我們可以告訴學生, 當具有參數 (n, p) 之二項分配中的 n 足夠大時 (n ≥ 30), 它會近似於平均數 µ = np, 標準差 σ =pnp(1 − p) 之常態分配, 課堂上只要對 n 逐漸增大 加以說明或配合電腦模擬實驗, 根據我的經驗學生很容易接受這個事實。 此一觀念是機率中計 算繁瑣二項機率的重要依據, 但由於其機率牽涉到近似的概念, 所以在評量學生問題的時候, 最 好採選擇型式並配合近似的觀念來命題。 例如: 投擲一枚不公正銅板 72 次, 其出現正面的機率 為 1 3, 則此硬幣出現正面次數介於 16 次與 32 次之間的機率最接近下列何者? (A) 0.64 (B) 0.68 (C) 0.80 (D) 0.95 (E) 0.99

(9)

: 令 X 表示出現正面之次數, 則出現正面次數介於 16∼32 次之機率為 P(16 < X < 32) = P (X = 17) + P (X = 18) + · · · + P (X = 31) = C1772 1 3 172 3 55 + C1872 1 3 182 3 54 + · · · + C3172 1 3 312 3 41 這是一個非常繁瑣的式子, 我們必須另謀其他方法求機率值。 但當試驗次數 n 足夠大時二項 分配會近似於常態分配, 本題出現正面的次數 X 近似於 µ = np = 721 3  = 24, σ = q 72(13)(23) = 4 之常態分配, 因此可以得到其機率 P(16 < X < 32) = P (µ − 2σ < X < µ + 2σ) = 0.954最接近上述答案中的0.95 有關二項分配近似於常態分配就是歷史上的棣美弗−拉普拉斯極限定理, 它告訴我們當二項分 配的參數 n 足夠大時, 可利用常態分配來求其近似值。 此定理首先由棣美弗在1733 年證明出 p = 1 2 的情形, 後來才由拉普拉斯將其結果推廣到一般的 p, 其中 0 < p < 1。 此定理敘述如 下 (丁村成, 1997):

De Moivre-Laplace Limit Theorem

設 Sn 表示進行 n 次獨立試驗的成功次數, 且每次試驗成功的機率為 p, 則當 n→ ∞ 可得到 P  a Sn− np np(1 − p) ≤ b  = Z b a 1 √ 2πe −x 2 2 dx

.

中央極限定理通俗的表達方式

中央極限定理 (Central Limit Theorem) 是連接機率與統計之重要橋樑, 它指出: 從具 有平均數 µ 與標準差 σ 的母體 (Population) 中隨機取出 n 個樣本 X1, X2, . . . , Xn, 當 n 足夠大時 ¯X = n1 Pn i=1Xi 的抽樣分配會近似於平均數 µ 而標準差 √σn 之常態分配。 至於樣 本數 n 要多大才能使得常態分配給 ¯X 之抽樣分配提供更良好的近似呢? 其答案依賴於被抽 樣的母體而定, 但一般對於大多數母體取樣本數 n ≥ 30 是足夠的 (Mc Clave et al. 2008)。 目前的高中教科書介紹這個定理大都採取了電腦摸擬加以說明, 但這並無助於學生對此一重要 定理的瞭解, 因為學生從電腦模擬中無法親自體會 ¯X 抽樣分配之隨機性。 上課中為加深同學對 ¯ X 這個分配之個數及變化, 我特別設計了下面問題來說明。

(10)

從母體 0, 3, 6, 9, 12 中任意抽取三個樣本 X1, X2, X3, 求出所有可能樣本平均數 ¯X = 1 3 Pn i=1Xi 之抽樣分配並繪出其抽樣分配機率圖形為何? 首先可由 C5 3 = 10 得知我們共可抽出十組不同的樣本, 因此也會得到十種 ¯X 的不同情 形, 將之列表並計算每一組之 ¯X 如下: H H H H H H HH 組別 樣本 一 二 三 四 五 六 七 八 九 十 X1 0 0 0 0 0 0 3 3 3 6 X2 3 3 3 6 6 9 6 6 9 9 X3 6 9 12 9 12 12 9 12 12 12 ¯ X 3 4 5 5 6 7 6 7 8 9 若將 ¯X 按大小順序排列可得到其對應的機率分配如下表: ¯ X 3 4 5 6 7 8 9 機率 1 10 1 10 2 10 2 10 2 10 1 10 1 10 因此, 可以繪出 ¯X 抽樣分配之機率圖形於下: 此抽樣分配 ¯X 之平均數 E( ¯X) = 1 10(3 + 4 + 5 + 6 + 7 + 8 + 9) = 1 10(60) = 6

(11)

若利用除以 n 的公式得 ¯X 的標準差 SX¯ =r 1 10[(3−6) 2+ (4−6)2+ (5−6)2+ · · · + (8−6)2+ (9−6)2)] =r 1 10(9 + 4 + 1 + 1 + 0 + 1 + 0 + 1 + 4 + 9) = r 1 10(30) = √ 3 ; 1.73 這個例子不但可讓學生瞭解 ¯X 抽樣分配的平均數與標準差不易求得, 亦可使他們體會到 ¯X 抽 樣分配對於 n = 3 的情形已具有常態分配之趨向, 這就是給予中央極限定理很直觀的視覺化 (Visualization) 表達方式。 要證明 ¯X 的平均數 E(X) = µ 與標準差 SX¯ = √σn 並不難, 因為 E( ¯X) = EX1+ X2+ · · · + Xn n  = 1 n n X i=1 E(Xi) = 1 n n X i=1 µ= 1 n · nµ = µ SX¯ = r VarX1+ X2+ · · · + Xn n  = v u u t 1 n2 n X i=1 Var(Xi) = v u u t 1 n2 n X i=1 σ2 =r 1 n2 · nσ2 = r σ2 n = σ √ n 最後再提出中央極限定理的結論: 從具有平均數 µ 及標準差 σ 之母體中隨機取出 n 個 樣本, 當 n 足夠大時樣本平均數 ¯X 的抽樣分配會近似於平均數 µ 及標準差 √σ n 之常態分配。 個人透過實際教學大部分學生都能清楚此定理的意義, 此一教法更有助於讓學生正確掌握信心 水準的觀念。 至於比較一般的中央極限定理之形式如下(Ross, 2006):

The Central Limit Theorem

Let X1, X2, . . . , Xn be a sequence of independent and identically

dis-tributed random variables each having mean µ and variance σ2. Then

the disrtibution of Pn

i=1xi− nµ

σ√n tends to the standard normal as n → ∞. That is, for −∞ < a < ∞, limn→∞P

Pn i=1xi− nµ σ√n ≤ a  = 1 √ 2π Ra −∞e −x 2 2 dx.

(12)

這是拉普拉斯最早所提出的一般形式, 但他本人對此定理的證明並不十分嚴格。 真正嚴格的證 明是李雅普諾夫(Lyapunov) 在1901∼1902年之間所完成, 並在證明中首創利用了嶄新的特徵 函數 (Characteristic function), 透過特徵函數方法實現了機率分析的革新, 才使得機率中有 關極限定理的證明得到更大的發展 (Adams, 2009)。 中央極限定理早期的應用顯示測量誤差 近似於常態分配, 這在科學上發展出很多非常重要的貢獻, 所以十七世紀至十八世紀它通常被 稱為誤差頻率定律 (Law of frequency of errors)。 至於 「The Central Limit Theorem」 這 個名稱, 是由波利亞(Polya) 於 1920 年在其博士論文中所提出的。

.

信賴區間與信心水準之正確解讀

在選舉前有民調中心想要調查某位候選人的支持度, 最準確的方法當然是調查所有合格選 民, 若在 N 個會去投票者中有 M 個支持該候選人, 則其真正的支持度 p = M N 即為母體支 持率。 但是這樣的調查方法往往耗費太多的人力與物力, 根據統計學一般會採取隨機的方式進 行抽樣調查。 為估計未知的母體支持度 p, 民調中心隨機抽取了一份 n 個人的樣本, 若調查結 果有 m 個人支持這位候選人, 則其樣本之支持率 ˆp = m n, 這只是對該候選人支持率的一個估 計。 如果重新隨機再抽取 n 個人的樣本, 由於組成另一個樣本的人不一定與上次相同, 使得對 該候選人的支持率 ˆp 也可能隨之改變。 因此, 在抽取 n 個樣本的抽樣中可產生 CN n 組不同的 樣本, 則對該候選人的樣本支持率 ˆp 就可能有 n0,1n,2n, . . . ,n n 不同變化, 其發生的機率分別列 表如下: ˆ p 值 n0 n1 n2 · · · n n 機率 Cn 0p0(1 − p)n C1np1(1 − p)n−1 C2np2(1 − p)n−2 · · · Cnnpn(1 − p)0 因此可得到 ˆ p 期望值 E(ˆp) = n X k=0 k nC n kpk(1 − p)n−k = 1 n n X k=0 kCknpk(1 − p)n−k = 1 n · np = p

(13)

ˆ p2期望值 E(ˆp2) = n X k=0 k n 2 Cknpk(1 − p)n−k = 1 n2 n X k=0 k2Cknpk(1 − p)n−k = 1 n2[n(n − 1)p 2+ np] = (n − 1)p2+ p n ∴ p 的標準差 σˆ =pE(ˆp2) − [E(ˆp)]2 = r (n − 1)p2+ p n − p 2 = r p(1 − p) n 根據中央極限定理當 n 足夠大時, ˆp 產生的分配會趨近於平均數 p 與標準差 q p(1−p) n 之常態 分配, 再由常態分配的經驗法則可得知 ˆp 值有大約95% 的比例會落在hp− 1.96 q p(1−p) n , p+ 1.96 q p(1−p) n i 。 一般在抽樣時我們並不知道母體真正值 p, 但當抽取樣本數 n 足夠大時, 每一 組樣本所產生的 ˆp 都會近似於 p, 所以也可以利用 ˆp 來估計 p, 我們稱hpˆ− 1.96 q ˆ p(1−ˆp) n ,pˆ+ 1.96 q ˆ p(1−ˆp) n i 為 p 的 95% 信賴區間 (Confidence interval)。 因為統計學家有某種程度的信 心認為該區間會包含 p, 所以給它取名為信賴區間, 其理由是當我們收集了許多不同的樣本, 並 對每個樣本都得到了一個信賴區間, 這些信賴區間有足夠的信心使其中的 95% 包含了母體之 真正值, 則 95% 這個值就被稱為信心水準 (Confidence level)(Iversen, et al. 1997)。 95% 這個值在統計是比較常用的, 當然你也可以使用其他值 90% 或 99% 來作信心水準。 在大多數情況下, 調查人員收集數據時都只取一組樣本, 可是沒有人能夠知道這組樣本所 產生的信賴區間是否包含 p。 至於這個區間是否包含 p 呢? 注意! 它只有兩種答案, 即它包含 p 或不包含 p, 採用機率的觀點來看就是 Pphpˆ− 1.96 q ˆ p(1−ˆp) n ,pˆ+ 1.96 q ˆ p(1−ˆp) n i = 1 或 0, 亦即信心水準 95% 並不是一個機率值, 所以不可以將之解讀為真正 p 值會落在此信賴 區間的機率是 0.95。 因此, 統計學上才假設做了足夠多次抽樣後, 借助其近似於常態分配的經 驗法則來探討信心水準, 並創造出信賴區間這樣的名詞來描述它。 我們之所以用這種拐彎抹角 的表達方式, 其原因在於母體真正值是未知的固定數, 而抽樣比率 ˆp 所得到的信賴區間卻是變 動的, 若重複這個作法會得到一些不同的信賴區間, 在這個意義下信賴區間是一個隨機區間, 此 區間會隨著所取樣本的不同而不同。 一個區間就像為了捕獲未知的 p 而撒出去的網, 並非每一 次撒網的地點都能捕獲真正值 p。 因此, 信心水準 95% 的意義是多次抽樣中大約有 95% 的信 賴區間會包含未知的母體真正值 p, 或通俗的解讀為我們大約有 95% 的 「信心」 確定這次調查 得到的信賴區間會包未知的母體真正值 p。 在 98年學測考試有一道題目:

(14)

某廠商委託民調機構在甲乙兩地調查聽過某項產品的居民佔當地居民之百分比 (以下簡稱為 「知名度」), 結果如下: 在 95% 信心水準之下, 該產品在甲、 乙兩 地的知名度之信賴區間分別為 [0.50, 0.58]、 [0.08, 0.16]。 試問下列哪些選項是正 確的? (1) 甲地本次的參訪者中有 54%的人聽過該產品 (2) 此次民調在乙地的參 訪人數少於在甲地的參訪人數 (3) 此次調查結果可解讀為: 甲地全體居民中有一 半以上的人聽過該產品的機率大於 95% (4) 若在乙地以同樣方式進行多次民調, 所得知名度有 95% 的機會落在區間 [0.08, 0.16] (5) 經密集廣告宣傳後在乙地再 次進行民調, 並增加參訪人數達原人數的四倍, 則在 95% 信心水準之下該產品的 知名度之信賴區間寬度會減半。 本題大考中心公佈的正確答案為選項 (1)(2), 並統計全體考生答對率只有 7% 而鑑別度 為 −0.01。 雖然題目在敘述上之用字遣詞不是非常完美, 但個人對於這題的命題委員之用心表 示欽佩, 因為他在選項 (4) 中點到了未知殺手 p, 也在選項 (5) 中考慮到了 ˆp 的隨機性。 如 果學生未能瞭解 p 的未知性與 ˆp 之隨機性, 那就無法對這兩個選項作出是否正確的判斷, 這也 是個人一再強調教師在使用中央極限定理之前, 必須對抽樣分配 ¯X 的隨機性作一番解說, 才能 讓學生對於理解 ˆp 的隨機性有所幫助。 在目前各版本教科書對此觀念都語焉不詳的情況下, 我 實在不敢指望學生能夠瞭解選項 (4) 與 (5) 的意義。 筆者建議教師在課堂中將本題改成下面題 目, 對於學生在理解此一概念會有更好的效果: 某廠商委託民調機構在甲地調查聽過某項產品的居民佔當地居民之百分比 (以下 簡稱為 「知名度」), 其結果如下: 在 95% 信心水準下該產品在甲地的知名度之信 賴區間為 [0.50, 0.58]。 試問下列哪些選項是正確的? (1) 此次調查在甲地參訪者 中有 54% 的人聽過該產品, 且其抽樣誤差為正負 4 個百分點 (2) 此次調查有 95% 信心可確定甲地全體居民中, 聽過該項產品的比率為會落在 0.50∼0.58 (3) 若在甲地再次進行民調並增加參訪人數達原人數的四倍, 得到在 95% 信心水準下 該產品知名度之信賴區間寬度會減半 (4) 若在甲地以同樣方式進行多次民調, 所 得到信賴區間中大約有 95% 會包含其真正的知名度 (5) 若在甲地以同樣方式進 行多次民調, 所得的知名度會落在其信賴區間之機會大約為 95%。 本題筆者設計其正確選項為 (1)(2)(4)。 切記! 電腦在數學教學上只是一種幫助瞭解與計 算的輔助工具, 如果在教學的過程中處處依賴電腦而不深入思考, 根據數學教育一些相關研究 結果已經表明, 這對於學習抽象與推理能力將是有害無益的, 這也是為什麼有教科書趕時髦附 上隨機區間電腦模擬實驗, 卻又在書上寫出 「p 落在信賴區間的機率稱為信心水準」 這種不合

(15)

理的定義了。(98 年 9 月筆者曾向該教科書編輯群提出這項錯誤, 但直到 99 年 2 月數學四修訂版 232頁還是存在這個定義。 在這次修訂版的定義下雖加註了 「信心水準與機率兩者有不同涵義」, 卻於同書 241頁又作了一些和此定義自相矛盾的說明, 令人不解與遺憾。)

.

參考資料

1. 丁村成, 機率論複習札記-升研究所及高普考專用叢書, 台北儒林圖書有限公司, 1997。 2. 王幼軍, 拉普拉斯概率理論的歷史研究, 上海交通大學科學史與科學哲學系博士論文, 上海交通大學 出版社, 2007。

3. 陳希孺, 數理統計學簡史 (副標題 Concise history of statistics), 湖南教育出版社, 2005。 4. Adams, W. J., The Life and Times of the Central Limit Theorem (Second Edition).

American Mathematical Society & London Mathematical Society, 2009.

5. Hald, A., A History of Mathematical Statistics from 1750 to 1930. New York: Wiley, 1998.

6. Iversen, G. R. and Gergen, M., Statistics — The Conceptual Approach. New York: Springer, 1997.

7. McClave, J. T. et al., Statistics for Business and Economics. (10th Edition). N. J.:

Pearson, 2008.

8. Ross, S., A First Course in Probability (Seventh Edition). N. J.: Pearson Prentice Hall, 2006.

數據

Updating...

參考文獻

Updating...

相關主題 :