從標準差除以 n 或除以 n-1 談起

全文

(1)

從標準差除以

n

或除以

n − 1

談起

丁村成

1.

前言

根據民國八十四年教育部頒佈的高級中學數學課程標準, 所編寫出的教科書自八十八年九 月開始使用。 當初大家對統計教材中 「標準差是除以 n 或 n − 1」 的疑問, 在國立編譯館的主 導之下, 現行版本一律選取了除以 n − 1 的情形。 如今, 雖然教師與學生都己經默默的接受, 但 是否代表在教與學已經沒有任何爭議了呢? 值得我們進一步反思。 筆者也藉此機會, 探討這一 批新教材存活下來的六種教科書, 為什麼會找不到一本獨具創意的版本? 其問題的癥結也將在 文章最後做扼要說明。 在新課程標準修訂已接近完成之際, 即將有新教材要在九十五年開始實 施, 筆者願以參與教學的實際經驗, 提出最誠摯具體的建議, 給下一波要編寫高中數學教科書的 專家學者們參考。

2.

從高觀點看標準差之定義

統計學是關於數據資料之收集、 整理、 分析和推論的一門學科, 其內容可區分為敘述統計 學 (descriptive statistics) 和推論統計學 (inferential statistics) 兩大部分。 敘述統計學 在探討數據的收集、 資料的整理與描述等。 如果研究中可以得到整個母體 (population) 資料 X1, X2, . . . , XN, 那麼其分佈狀況即已完全獲得掌握。 我們特別有興趣的母體平均數 µ= 1 N N X i=1 Xi = X, 母體變異數 σ2 = 1 N N X i=1 (Xi− µ) 2 , 母體標準差 σ= v u u t 1 N N X i=1 (Xi− µ)2. 9

(2)

亦因而可以得到。 一般若不作全面性的普查 (census), 母體之 µ 與 σ 的真正數值根本無法得到。 在研究上 為了節省時間與經費, 實際作法往往只抽取一部分代表性樣本 x1, x2, . . . , xn, 並以樣本平均數 x= 1 n n X i=1 xi, 樣本變異數 s2 = 1 n− 1 n X i=1 (xi− x) 2 , 樣本標準差 s= v u u t 1 n− 1 n X i=1 (xi− x)2. 分別推估 µ, σ2 和 σ。 至於式中之除數為 n 或 n − 1, 其背景就跟推論統計學所要研究的不偏 估計理論有關。 在統計上一個好的估計量 (estimator) 常被要求滿足不偏性 (unbiasedness)、 一致性 (consistency)、 充分性 (sufficiency) 等性質 (Mood, Graybill and Boes, 1974)。 母體參 數 θ 之不偏估計量的意義是: 將任意抽取之樣本視作母體計算參數, 若值 ˆθ 之數學期望值 (mathematical expectation 或 mean value) 等於母體真正值 θ, 那麼我們稱它為不偏估計 量 (unbiased estimator), 表示的方式為 E(ˆθ) = θ. 不偏估計的條件 E(ˆθ) = θ 等價於 E(ˆθ− θ) = 0, 其中 ˆθ− θ 是估計值 ˆθ 與其真正值 θ 之 偏差。 由於抽樣調查中抽取樣本的隨機性 (randomness), 導致偏差 ˆθ− θ 也是隨機的, 其值可 大可小亦可正可負。 所以, 不偏估計之具體意義是: 每次使用 ˆθ 來推估 θ 是會存在偏差的, 但 若能舉遍全部樣本, 則所有這類偏差的平均數 (或數學期望值) 為 0。 舉個例子, 我們每天喝標 示 200c.c 的瓶裝鮮奶時, 今天可能多喝了 2c.c, 明天可能少喝了 2c.c, 但長期喝此種鮮奶的偏 差之平均值是 0, 此乃不偏多也不偏少之意。 假設樣本資料 x1, x2, . . . , xn 是從一個平均數 µ 而變異數 σ 2 之母體中經由簡單隨機抽 樣 (simple random sampling) 而來, 若所選取之樣本可以再放回, 亦即 xi 的選取與 xj 之

選取彼此不相關 (i 6= j)。 我們可以證得樣本平均數 x 是母體平均數 µ 之不偏估計量, 因為 E(x) = E x 1+ x2+ · · · + xn n  = 1 nE(x1+ x2+ · · · + xn)

(3)

= 1

n[E(x1) + E(x2) + · · · + E(xn)] = 1 n(µ + µ + · · · + µ) = 1 n(nµ) = µ. 也可以證明樣本變異數 s2 是母體變異數 σ2 的不偏估計量, 由於 E(s2 ) = E 1 n− 1 n X i=1 (xi− x) 2 ) ! = 1 n− 1E n X i=1 x2i − 2x · n X i=1 xi+ nx 2 ! = 1 nE n X i=1 x2i − 2nx2 + nx2 ! = 1 n− 1E n X i=1 x2i − nx2 ! = 1 n− 1 " n X i=1 E(x2 i) − nE(x 2 ) # = 1 n− 1{n[Var (xi) + E 2 (xi)] = n[Var (x) + E 2 (x)]} = 1 n− 1 " n(σ2 + µ2 ) − n σ 2 n + µ 2 !# = 1 n− 1(nσ 2 − σ2 ) = σ2 . 其中 Var (X) = E(X2 ) − E2 (X) 為 X 之變異數 (Variance)。 上述證明中所用到的 Var (x) = σ2 n, 只有當各樣本為獨立時才成立。 但一般的簡單隨機抽 樣是不放回的, 此時任二樣本皆不彼此獨立, 若我們接受樣本變異數 s2 = 1 n− 1 n X i=1 (xi− x) 2 而母體變異數為 S2 = 1 N − 1 N X i=1 (Xi− X) 2 則 x 是 X 之不偏估計量而 s 是 S 之不偏估計量 (Cochran, 1977), 證明如下: 首先 E(x) = N1 n  X x= n!(N − n)! n· N! X (x1+ x2+ · · · + xn)

(4)

其中P 表示對所有 N n  種可能的組合求和。 由排列組合概念知 X (x1+ x2 + · · · + xn) = N − 1 n− 1 ! · (X1+ X2+ · · · + XN) = (N − 1)! (n − 1)!(N − n)!(X1+ X2+ · · · + XN) 故得到 E(x) =n!(N − n)! n· N! · (N − 1)! (n − 1)!(N − n)!· (X1+ X2+ · · · + XN) =X1+ X2+ · · · + XN N = X 另外由於 n X i=1 (xi− x) 2 = n X i=1 (xi− X + X − x) 2 = n X i=1 (xi− X) 2 + 2(X − x) · n X i=1 (xi− X) + n(X − x) 2 = n X i=1 (xi− X) 2 − n(x − X)2 又因為 E " 1 n n X i=1 (xi− X) 2 # = 1 nE " n X i=1 (xi− X) 2 # = 1 n · n N · N X i=1 (Xi− X) 2 = 1 N N X i=1 (Xi− X) 2 以及 E(x − X)2 = 1 n2E(x1− X+ x2− X + · · · + xn− X) 2 = 1 n2E " n X i=1 (xi− X) 2 # + 1 n2E   n X i6=j (xi− X)(xj − X)   = 1 n2 · N−1 n−1  N n  N X i=1 (Xi− X) 2 + 1 n2 N−2 n−2  N n  N X i6=j (Xi − X)(Xj− X)

(5)

= 1 nN N X i=1 (Xi− X) 2 − 1 n2 · n(n − 1) N(N − 1) · N X i=1 (Xi− X) 2 = N − n nN(N − 1) N X i=1 (Xi− X) 2 可知 E " 1 n n X i=1 (xi− x) 2 # = " 1 N − N − n nN(N − 1) # · N X i=1 (Xi− X) 2 = n− 1 n · 1 N − 1 · N X i=1 (Xi− X) 2 因此得到 E(s2 ) = E " 1 n− 1· n X i=1 (xi− x) 2 # =n− 1 n− 1· 1 N − 1 · N X i=1 (Xi − X) 2 = 1 N − 1 · N X i=1 (Xi− X) 2 = S2 所以 1 n−1 Pn i=1(xi− x) 2 在不偏性的考慮下, 當然要比 1 n Pn i=1(xi− x) 2 具有優勢。 至於樣本平均數是母體平均數之不偏估計量, 以及樣本變異數是母體變異數之不偏估計量, 此時是否就表示估計值與真正值恰好相等? 這是統計教學上一個容易受到誤解的概念。 統計上 我們說樣本平均數 (變異數) 是母體平均數 (變異數) 的估計量, 在以往所學的確定性數學中 「是」 就被理解成 「等於」, 但在隨機性數學中 「是」 卻包含有 「機率的含義」, 亦即上面的 「是」 並非樣本平均數恰好等於母體平均數。 它的實際意義應解釋為: 如果我們知道了樣本平均數的 時候, 那麼母體平均數有很大機會落在樣本平均數之附近。

3.

標準差是除以 n 或除以 n

− 1

新教材經過了第一年的爭執與討論之後, 有些現行教科書為了說明標準差除以 n − 1 的理 由, 在第二年之教材內容中補上了下列的證明: 1 n n X i=1 (xi− µ) 2 = 1 n n X i=1 [(xi− x) + (x − µ)] 2 = 1 n n X i=1 [(xi− x) 2 + 2(xi − x)(x − µ) + (x − µ) 2 ]

(6)

= 1 n n X i=1 (xi − x) 2 + 1 n n X i=1 (x − µ)2 ≥ 1 n n X i=1 (xi − x) 2 . 據此來解釋 1 n Pn i=1(xi− x) 2 當作 σ2 = 1 N N X i=1 (xi− µ) 2 的估計會有低估的現象, 因而統計學 家改以 1 n−1 n X i=1 (xi− x) 2 作為 σ2 = 1 N N X i=1 (xi− µ) 2 之估計。 試問: 僅憑上面一段證明就可以 確定 1 n n X i=1 (xi − x) 2 完全不合適嗎? 換成除以 n − 1 後難道不怕會高估 σ2 嗎? 為何不除以 其他數而偏偏要找 n − 1 呢? 面對學生 (尤其是程度好的學生) 這一連串的疑惑, 不知道老師 們在教學時要如何解釋? 根據筆者之實際教學經驗, 要表達一群數據資料之間的離散程度, 很自然會想到利用資料 離開其中心值有多遠來表示。 假設我們要考慮樣本資料 x1, x2, . . . , xn 與其平均數 x 的差異 xi − x, 由於 x = 1 n n X i=1 xi 恆可得到 n X i=1 (xi − x) = n X i=1 xi − nx = 0, 利用 1 n n X i=1 (xi − x) 會因為正負抵消的緣故, 根本無法呈現資料間的分散程度。 若將 xi− x 改成 |xi− x| 而計算 1 n n X i=1 |xi − x|, 就可以得知這群資料間的離散程度, 它代表所有樣本資料到其中心值的平均距 離。 但因數學上處理絕對值的運算較為麻煩, 促使統計上必須找一種新的差異量數, 使其既能代 表資料間之分散情形又能從事簡單的代數運算, 轉而採取了 1 n n X i=1 (xi − x) 2 的作法。 其次, 為 了兼顧此差異量數與原來資料的單位一致, 我們還將 1 n X (xi − x) 2 開平方根, 最後才定義了 樣本標準差為 v u u t 1 n n X i=1 (xi− x)2. 從上面的討論可知, 在高中課程中採取除以 n 的定義, 不論在教與學都比較符合高中學生的思 維, 否則學習者很難將新的學習內容與其舊經驗取得關聯, 他們會轉而偏向機械式記憶。 美國當 代認知心理學家 Ausubel 主張要讓學生之學習成為有意義學習 (meaningful learning), 其先 決條件就是學習者能將所學內容與本身已有的先備知識 (preknowledge) 聯結起來, 整個學習 活動才容易被引導進入有意義學習活動 (余民寧, 2003)。 因此, 大多數學生在高中階段之認知 (cognition) 根本無法瞭解不偏估計的意義, 怎能盼望他們可以掌握 s2 = 1 n−1 n X i=1 (xi− x) 2 中 要除以 n−1 之理由呢? 課程的設計與教材之編寫必須從學生認知結構 (cognitive structure) 的角度出發, 才能使學習者取得較佳的學習效果。 當然, 筆者也同意要儘量站在高觀點的立場來 編寫教材, 但是當此立場與學習者之認知有所衝突時, 便應該以學生的可接受性為主要考量。 否

(7)

則, 獲得的知識若沒有完備結構作聯結, 那是一種多半會被遺忘的知識, 一串不連貫的論據在記 憶中僅有短促的可憐的壽命 (李士錡, 2001), 也難怪很多人學完統計就 「統統忘記」 了。 如果真 的需要再進一步說明, 也僅能輕描淡寫指出統計理論上也有採用 s = v u u t 1 n−1 n X i=1 (xi− x) 2 來定 義樣本標準差, 其目的是為了消除它在估計理論上的偏差。 在高中階段對於樣本標準差的定義, 我們不可能去分成樣本獨立時 E(s2 ) = σ2 , 樣本不獨立時 E(s2 ) = S2 來討論, 畢竟這是一 段學生不可負荷的認知過程。 事實上, 在估計理論 s2 = 1 n−1 n X i=1 (xi− x) 2 是 σ2 或 S2 的不偏估計, 但必須注意 s 並 非 σ 或 S 之不偏估計, 因此不論統計上使用哪種方法, 對標準差的估計都有其誤差存在。 正因 為其誤差的不可避免, 雖然有些電腦上之樣本標準差採用除以 n − 1 來設計, 但在國外的中學 (grade 9∼12) 教材大都仍然以 v u u t 1 n n X i=1 (xi− x) 2 進行教學。 高中統計教材所涉及的數學知識 不多也不難, 這一階段的統計須著重於概念的理解與掌握, 教學之目標應引導學生貼近生活。 要 成功地實施統計內容的教與學, 教材與老師不僅要重視隨機性數學的預備知識, 還必須讓學生 瞭解它與確定性數學之差異, 而不是把統計當成計算標準答案的工具。 因為在統計的教學中, 面 對一組數據可能會有不一樣的解釋, 同一個問題也有可能產生不同的答案, 所以在教材上根本 沒有必要規定統一的公式作為分析數據之絕對標準。

4.

一些想法與建議

看到擺在書房的高中數學教科書, 再仔細比較各版本的內容, 使我想起了數學傳播二十四 卷第三期 65頁一段審稿人的話 「· · · 試問: 有多少教師瞭解或設法瞭解課程更改的用意? 有多 少教師肯以學生的學習立場來檢討自己的教學? 有多少編者肯為那些在學習上居於弱勢的學生 用心寫一份妥適的教材? 如今有了新課程與新教材, 但我一點都沒有高興, 心情只是更加的沉 悶」 (數學傳播, 2000)。 看了這位學者語重心長的言論, 讓身兼教師與編者雙重身份的我, 內心 感到無限慚愧而且百感交集。 在新課程標準及教材即將誕生的時刻, 任何耳目一新的改革都是 令人期待的。面對整個數學教育的改革浪潮, 對學生之數學學習尋求更好的教學方法, 為學生的 學習內容設計適當之課程規劃, 應是數學界上下共同的責任和目標。 筆者認為每一次的課程改革, 除了要求負責課程標準制定與編寫課程內容的人員有所變革 之外, 也在暗示基層教師在教法上必須作些改變, 甚至對於教學內容要多付出一些心力。 舉一 個高中教師都感到困擾的例子: 當老師在教 「極限的應用」 這個單元時, 師生都會不耐煩於一 再重覆 「分割 → 求和 → 取極限」 的題目, 教學中往往有學生反應 「算式太麻煩了啦! 聯 考怎麼可能考?」, 「利用補習班的方法, 直接積分多快啊!」, 以致很多學校老師也直接教積分公

(8)

式或乾脆簡單帶過, 這些都是不負責的教學方法。 筆者在教這一部分的時候, 課堂上我先介紹 y = f (x) = x2 在 0 ≤ x ≤ 1 與 x 軸所圍的面積, 並探討分割所得 「上和」 Un 與 「下和」 Ln 誤差 |Un− Ln| < 1 100 之最小自然數 n 應取多少? 為了不讓學生因冗長的計算感到不耐 煩, 緊接著我就舉了下列的問題: 設曲線 y = f (x) 與 y = 0 在 0 ≤ x ≤ 1, 1 ≤ x ≤ 2, 2 ≤ x ≤ 3, 3 ≤ x ≤ 4 所 圍的面積分別為 5 2, 3 2, 4 3, 8 3, 求下列各極限值為何? lim n→∞ 1 n n X k=1 f k n ! =? lim n→∞ 2 n n X k=1 f 2k n ! =? lim n→∞ 1 n n X k=1 f 2 + k n ! =? lim n→∞ 3 n n X k=1 f 1 + 3k n ! =? lim n→∞ 4 n n X k=1 f 1 + 3k n ! =? 當講解完前面 3小題的時候, 大部分學生臉上開始露出愉快的表情, 甚至有學生已直觀的看出後 面兩小題之答案, 也排除了聯考不可能考或計算太麻煩的疑慮, 使學生在上課中仍然維持良好 的學習態度。 教學中教師應恰當地利用相對直觀的東西作為抽象概念規定的表徵 (representa-tion), 讓學生能逐步地學會其核心概念的數學化 (mathematising)。 荷蘭數學教育學家 Freuden-thal 認為數學化在現實世界裡是瞭解和深化理論的過程, 其目的是要把生活世界之概念引向符 號世界 (Freudenthal, 1991)。 因此, 教師若能充分了解課程安排的用意, 進而提出更符合學生 認知的學習內容和方法, 往往能透過課堂上之教學將教科書的缺點降到最低。 總之, 筆者要不厭其煩的再次強調, 教科書的編寫必須深入探討學生原有的認知結構, 如 此才能選擇更適合學生特點的知識, 並且也讓教師在課堂上順利的進行教學。 在這種兼顧教與 學之理念基礎上, 教師不應僅僅是教材的使用者, 更應該也是教材的開發與修正者。 畢竟一本完 善的教科書不管是由教師的教學適用性, 抑或從學生之學習需求性, 都必須透過實際的課堂教 學活動來檢驗。 最近在 Notices of the AMS 有一篇文章中作者提到: 「若數學家願意從事善意 和有建設性的評論, 而不是傲慢與反諷的批評, 那麼美國數學戰爭的結果才不會繼續造成數學 教育界的傷害」 (Ralston, 2004)。 不可否認, 數學家所擁有的數學知識, 使得他們對於高中數 學什麼概念是重要的, 具備有較寬廣的洞察能力, 但數學家並不完全了解有些想法在課堂上是

(9)

不易實行的。 因此, 當高中教師與大學教授有機會一起編寫教材時, 必須避免教授的權威凌架在 教師之上的心態, 唯有透過理性的討論才能呈現更符合教學需求的內容。 另外, 也希望負責課程 標準制訂與審查的專家學者, 應該抱持較具彈性的眼光來審查課程內容。 只要合乎數學理論的 規範與系統, 應該留給編寫作者們更大的發揮空間, 如此才能期盼寫出更有特色的全新教材, 否 則所有版本之內容千篇一律, 感覺有點浪費資源。 如果當初編譯館不要硬性規定標準差的定義, 或許目前會出現其他各種更有創意的表達方式。 畢竟, 開放版本也正是發展多元教材的最佳時 機, 我們豈能錯過這一大好的改革機會。

參考文獻

1. 李士錡 (2001), PME: 數學教育心理, 上海華東師範大學出版社, p22∼p63。 2. 余民寧 (2003), 有意義的學習—概念構圖之研究, 台北商鼎文化出版社, p41∼p58。

3. A. M. Mood, F. A. Graybill and D. C. Boes (1974), Introduction to the Theory of Statistics, McGraw-Hill Book Company, p315∼p321.

4. W. G. Cochran (1977), Sampling Techniques, Third Edition, John Wiley & Sons, Inc, p.18∼p.27.

5. H. Freudenthal, Revisiting Mathematics Education, Kluwer Academic Publishers, Dor-drecht/Boston/London, 1991, p30∼p42.

6. A. Ralston (2004), Research Mathematicians and Mathematics Education: A Critique, Notices of The AMS, April 2004, p403∼p411.

數據

Updating...

參考文獻

Updating...

相關主題 :