從標準差除以 n 或除以 n-1 談起

(1)

從標準差除以

n

或除以

_{n − 1}

談起

丁村成

1. 前言

根據民國八十四年教育部頒佈的高級中學數學課程標準, 所編寫出的教科書自八十八年九月開始使用。當初大家對統計教材中「標準差是除以 n 或 n − 1」的疑問, 在國立編譯館的主導之下, 現行版本一律選取了除以 n − 1 的情形。如今, 雖然教師與學生都己經默默的接受, 但是否代表在教與學已經沒有任何爭議了呢? 值得我們進一步反思。筆者也藉此機會, 探討這一批新教材存活下來的六種教科書, 為什麼會找不到一本獨具創意的版本? 其問題的癥結也將在文章最後做扼要說明。在新課程標準修訂已接近完成之際, 即將有新教材要在九十五年開始實施, 筆者願以參與教學的實際經驗, 提出最誠摯具體的建議, 給下一波要編寫高中數學教科書的專家學者們參考。

2. 從高觀點看標準差之定義

統計學是關於數據資料之收集、整理、分析和推論的一門學科, 其內容可區分為敘述統計學 (descriptive statistics) 和推論統計學 (inferential statistics) 兩大部分。敘述統計學在探討數據的收集、資料的整理與描述等。如果研究中可以得到整個母體 (population) 資料 X1, X2, . . . , X_N, 那麼其分佈狀況即已完全獲得掌握。我們特別有興趣的母體平均數 µ= 1 N N X i=1 Xi = X, 母體變異數 σ2 = 1 N N X i=1 (Xi− µ) 2 , 母體標準差 σ= v u u t 1 N N X i=1 (Xi− µ)2. 9

(2)

亦因而可以得到。一般若不作全面性的普查 (census), 母體之 µ 與 σ 的真正數值根本無法得到。在研究上為了節省時間與經費, 實際作法往往只抽取一部分代表性樣本 x1, x2, . . . , x_n, 並以樣本平均數 x= 1 n n X i=1 xi, 樣本變異數 s2 = 1 n− 1 n X i=1 (xi− x) 2 , 樣本標準差 s= v u u t 1 n− 1 n X i=1 (xi− x)2. 分別推估 µ, σ2 和 σ。至於式中之除數為 n 或 n − 1, 其背景就跟推論統計學所要研究的不偏估計理論有關。在統計上一個好的估計量 (estimator) 常被要求滿足不偏性 (unbiasedness)、一致性 (consistency)、充分性 (sufficiency) 等性質 (Mood, Graybill and Boes, 1974)。母體參數 θ 之不偏估計量的意義是: 將任意抽取之樣本視作母體計算參數, 若值 ˆθ 之數學期望值 (mathematical expectation 或 mean value) 等於母體真正值 θ, 那麼我們稱它為不偏估計量 (unbiased estimator), 表示的方式為 E(ˆθ) = θ. 不偏估計的條件 E(ˆθ) = θ 等價於 E(ˆθ− θ) = 0, 其中 ˆθ− θ 是估計值 ˆθ 與其真正值 θ 之偏差。由於抽樣調查中抽取樣本的隨機性 (randomness), 導致偏差 ˆθ− θ 也是隨機的, 其值可大可小亦可正可負。所以, 不偏估計之具體意義是: 每次使用 ˆθ 來推估 θ 是會存在偏差的, 但若能舉遍全部樣本, 則所有這類偏差的平均數 (或數學期望值) 為 0。舉個例子, 我們每天喝標示 200c.c 的瓶裝鮮奶時, 今天可能多喝了 2c.c, 明天可能少喝了 2c.c, 但長期喝此種鮮奶的偏差之平均值是 0, 此乃不偏多也不偏少之意。假設樣本資料 x1, x2, . . . , x_n 是從一個平均數 µ 而變異數 σ 2 之母體中經由簡單隨機抽樣 (simple random sampling) 而來, 若所選取之樣本可以再放回, 亦即 xi 的選取與 xj 之

選取彼此不相關 (i 6= j)。我們可以證得樣本平均數 x 是母體平均數 µ 之不偏估計量, 因為 E(x) = E _x 1+ x2+ · · · + x_n n = 1 nE(x1+ x2+ · · · + xn)

(3)

= 1

n[E(x1) + E(x2) + · · · + E(xn)] = 1 n(µ + µ + · · · + µ) = 1 n(nµ) = µ. 也可以證明樣本變異數 s2 是母體變異數 σ2 的不偏估計量, 由於 E(s2 ) = E 1 n− 1 n X i=1 (xi− x) 2 ) ! = 1 n− 1E n X i=1 x2_i − 2x · n X i=1 xi+ nx 2 ! = 1 nE n X i=1 x2_i − 2nx2 + nx2 ! = 1 n− 1E n X i=1 x2_i − nx2 ! = 1 n− 1 " _n X i=1 E(x2 i) − nE(x 2 ) # = 1 n− 1{n[Var (xi) + E 2 (xi)] = n[Var (x) + E 2 (x)]} = 1 n− 1 " n(σ2 + µ2 ) − n σ 2 n + µ 2 !# = 1 n− 1(nσ 2 − σ2 ) = σ2 . 其中 Var (X) = E(X2 ) − E2 (X) 為 X 之變異數 (Variance)。上述證明中所用到的 Var (x) = σ2 n, 只有當各樣本為獨立時才成立。但一般的簡單隨機抽樣是不放回的, 此時任二樣本皆不彼此獨立, 若我們接受樣本變異數 s2 = 1 n− 1 n X i=1 (xi− x) 2 而母體變異數為 S2 = 1 N − 1 N X i=1 (Xi− X) 2 則 x 是 X 之不偏估計量而 s 是 S 之不偏估計量 (Cochran, 1977), 證明如下: 首先 E(x) = _N1 n X x= n!(N − n)! n· N! X (x1+ x2+ · · · + x_n)

(4)

其中P _{表示對所有} N n 種可能的組合求和。由排列組合概念知 X (x1+ x2 + · · · + x_n) = N − 1 n− 1 ! · (X1+ X2+ · · · + X_N) = (N − 1)! (n − 1)!(N − n)!(X1+ X2+ · · · + XN) 故得到 E(x) =n!(N − n)! n· N! · (N − 1)! (n − 1)!(N − n)!· (X1+ X2+ · · · + XN) =X1+ X2+ · · · + XN N = X 另外由於 n X i=1 (xi− x) 2 = n X i=1 (xi− X + X − x) 2 = n X i=1 (xi− X) 2 + 2(X − x) · n X i=1 (xi− X) + n(X − x) 2 = n X i=1 (xi− X) 2 − n(x − X)2 又因為 E " 1 n n X i=1 (xi− X) 2 # = 1 nE " _n X i=1 (xi− X) 2 # = 1 n · n N · N X i=1 (Xi− X) 2 = 1 N N X i=1 (Xi− X) 2 以及 E(x − X)2 = 1 n2E(x1− X+ x2− X + · · · + xn− X) 2 = 1 n2E " _n X i=1 (xi− X) 2 # + 1 n2E   n X i6=j (xi− X)(xj − X)   = 1 n2 · _N₋₁ n−1 _N n N X i=1 (Xi− X) 2 + 1 n2 _N−2 n−2 _N n N X i6=j (Xi − X)(Xj− X)

(5)

= 1 nN N X i=1 (Xi− X) 2 − 1 n2 · n(n − 1) N(N − 1) · N X i=1 (Xi− X) 2 = N − n nN(N − 1) N X i=1 (Xi− X) 2 可知 E " 1 n n X i=1 (xi− x) 2 # = " 1 N − N − n nN(N − 1) # · N X i=1 (Xi− X) 2 = n− 1 n · 1 N − 1 · N X i=1 (Xi− X) 2 因此得到 E(s2 ) = E " 1 n− 1· n X i=1 (xi− x) 2 # =n− 1 n− 1· 1 N − 1 · N X i=1 (Xi − X) 2 = 1 N − 1 · N X i=1 (Xi− X) 2 = S2 所以 1 n−1 Pn i=1(xi− x) 2 在不偏性的考慮下, 當然要比 1 n Pn i=1(xi− x) 2 具有優勢。至於樣本平均數是母體平均數之不偏估計量, 以及樣本變異數是母體變異數之不偏估計量, 此時是否就表示估計值與真正值恰好相等? 這是統計教學上一個容易受到誤解的概念。統計上我們說樣本平均數 (變異數) 是母體平均數 (變異數) 的估計量, 在以往所學的確定性數學中「是」就被理解成「等於」, 但在隨機性數學中「是」卻包含有「機率的含義」, 亦即上面的「是」並非樣本平均數恰好等於母體平均數。它的實際意義應解釋為: 如果我們知道了樣本平均數的時候, 那麼母體平均數有很大機會落在樣本平均數之附近。

3. 標準差是除以 n 或除以 n

_{− 1}

新教材經過了第一年的爭執與討論之後, 有些現行教科書為了說明標準差除以 n − 1 的理由, 在第二年之教材內容中補上了下列的證明: 1 n n X i=1 (xi− µ) 2 = 1 n n X i=1 [(xi− x) + (x − µ)] 2 = 1 n n X i=1 [(xi− x) 2 + 2(xi − x)(x − µ) + (x − µ) 2 ]

(6)

= 1 n n X i=1 (xi − x) 2 + 1 n n X i=1 (x − µ)2 ≥ 1 n n X i=1 (xi − x) 2 . 據此來解釋 1 n Pn i=1(xi− x) 2 當作 σ2 = 1 N N X i=1 (xi− µ) 2 的估計會有低估的現象, 因而統計學家改以 1 n−1 n X i=1 (xi− x) 2 作為 σ2 = 1 N N X i=1 (xi− µ) 2 之估計。試問: 僅憑上面一段證明就可以確定 1 n n X i=1 (xi − x) 2 完全不合適嗎? 換成除以 n − 1 後難道不怕會高估 σ2 嗎? 為何不除以其他數而偏偏要找 n − 1 呢? 面對學生 (尤其是程度好的學生) 這一連串的疑惑, 不知道老師們在教學時要如何解釋? 根據筆者之實際教學經驗, 要表達一群數據資料之間的離散程度, 很自然會想到利用資料離開其中心值有多遠來表示。假設我們要考慮樣本資料 x1, x2, . . . , x_n 與其平均數 x 的差異 xi − x, 由於 x = 1 n n X i=1 xi 恆可得到 n X i=1 (xi − x) = n X i=1 xi − nx = 0, 利用 1 n n X i=1 (xi − x) 會因為正負抵消的緣故, 根本無法呈現資料間的分散程度。若將 xi− x 改成 |xi− x| 而計算 1 n n X i=1 |xi − x|, 就可以得知這群資料間的離散程度, 它代表所有樣本資料到其中心值的平均距離。但因數學上處理絕對值的運算較為麻煩, 促使統計上必須找一種新的差異量數, 使其既能代表資料間之分散情形又能從事簡單的代數運算, 轉而採取了 1 n n X i=1 (xi − x) 2 的作法。其次, 為了兼顧此差異量數與原來資料的單位一致, 我們還將 1 n X (xi − x) 2 開平方根, 最後才定義了樣本標準差為 v u u t 1 n n X i=1 (xi− x)2. 從上面的討論可知, 在高中課程中採取除以 n 的定義, 不論在教與學都比較符合高中學生的思維, 否則學習者很難將新的學習內容與其舊經驗取得關聯, 他們會轉而偏向機械式記憶。美國當代認知心理學家 Ausubel 主張要讓學生之學習成為有意義學習 (meaningful learning), 其先決條件就是學習者能將所學內容與本身已有的先備知識 (preknowledge) 聯結起來, 整個學習活動才容易被引導進入有意義學習活動 (余民寧, 2003)。因此, 大多數學生在高中階段之認知 (cognition) 根本無法瞭解不偏估計的意義, 怎能盼望他們可以掌握 s2 = 1 n−1 n X i=1 (xi− x) 2 中要除以 n−1 之理由呢? 課程的設計與教材之編寫必須從學生認知結構 (cognitive structure) 的角度出發, 才能使學習者取得較佳的學習效果。當然, 筆者也同意要儘量站在高觀點的立場來編寫教材, 但是當此立場與學習者之認知有所衝突時, 便應該以學生的可接受性為主要考量。否

(7)

則, 獲得的知識若沒有完備結構作聯結, 那是一種多半會被遺忘的知識, 一串不連貫的論據在記憶中僅有短促的可憐的壽命 (李士錡, 2001), 也難怪很多人學完統計就「統統忘記」了。如果真的需要再進一步說明, 也僅能輕描淡寫指出統計理論上也有採用 s = v u u t 1 n−1 n X i=1 (xi− x) 2 來定義樣本標準差, 其目的是為了消除它在估計理論上的偏差。在高中階段對於樣本標準差的定義, 我們不可能去分成樣本獨立時 E(s2 ) = σ2 , 樣本不獨立時 E(s2 ) = S2 來討論, 畢竟這是一段學生不可負荷的認知過程。事實上, 在估計理論 s2 = 1 n−1 n X i=1 (xi− x) 2 是 σ2 或 S2 的不偏估計, 但必須注意 s 並非 σ 或 S 之不偏估計, 因此不論統計上使用哪種方法, 對標準差的估計都有其誤差存在。正因為其誤差的不可避免, 雖然有些電腦上之樣本標準差採用除以 n − 1 來設計, 但在國外的中學 (grade 9∼12) 教材大都仍然以 v u u t 1 n n X i=1 (xi− x) 2 進行教學。高中統計教材所涉及的數學知識不多也不難, 這一階段的統計須著重於概念的理解與掌握, 教學之目標應引導學生貼近生活。要成功地實施統計內容的教與學, 教材與老師不僅要重視隨機性數學的預備知識, 還必須讓學生瞭解它與確定性數學之差異, 而不是把統計當成計算標準答案的工具。因為在統計的教學中, 面對一組數據可能會有不一樣的解釋, 同一個問題也有可能產生不同的答案, 所以在教材上根本沒有必要規定統一的公式作為分析數據之絕對標準。

4. 一些想法與建議

看到擺在書房的高中數學教科書, 再仔細比較各版本的內容, 使我想起了數學傳播二十四卷第三期 65頁一段審稿人的話「· · · 試問: 有多少教師瞭解或設法瞭解課程更改的用意? 有多少教師肯以學生的學習立場來檢討自己的教學? 有多少編者肯為那些在學習上居於弱勢的學生用心寫一份妥適的教材? 如今有了新課程與新教材, 但我一點都沒有高興, 心情只是更加的沉悶」 (數學傳播, 2000)。看了這位學者語重心長的言論, 讓身兼教師與編者雙重身份的我, 內心感到無限慚愧而且百感交集。在新課程標準及教材即將誕生的時刻, 任何耳目一新的改革都是令人期待的。面對整個數學教育的改革浪潮, 對學生之數學學習尋求更好的教學方法, 為學生的學習內容設計適當之課程規劃, 應是數學界上下共同的責任和目標。筆者認為每一次的課程改革, 除了要求負責課程標準制定與編寫課程內容的人員有所變革之外, 也在暗示基層教師在教法上必須作些改變, 甚至對於教學內容要多付出一些心力。舉一個高中教師都感到困擾的例子: 當老師在教「極限的應用」這個單元時, 師生都會不耐煩於一再重覆「分割 → 求和 → 取極限」的題目, 教學中往往有學生反應「算式太麻煩了啦! 聯考怎麼可能考?」, 「利用補習班的方法, 直接積分多快啊!」, 以致很多學校老師也直接教積分公

(8)

式或乾脆簡單帶過, 這些都是不負責的教學方法。筆者在教這一部分的時候, 課堂上我先介紹 y = f (x) = x2 在 0 ≤ x ≤ 1 與 x 軸所圍的面積, 並探討分割所得「上和」 Un 與「下和」 Ln 誤差 |Un− Ln| < 1 100 之最小自然數 n 應取多少? 為了不讓學生因冗長的計算感到不耐煩, 緊接著我就舉了下列的問題: 設曲線 y = f (x) 與 y = 0 在 0 ≤ x ≤ 1, 1 ≤ x ≤ 2, 2 ≤ x ≤ 3, 3 ≤ x ≤ 4 所圍的面積分別為 5 2, 3 2, 4 3, 8 3, 求下列各極限值為何? lim n→∞ 1 n n X k=1 f k n ! =? lim n→∞ 2 n n X k=1 f 2k n ! =? lim n→∞ 1 n n X k=1 f 2 + k n ! =? lim n→∞ 3 n n X k=1 f 1 + 3k n ! =? lim n→∞ 4 n n X k=1 f 1 + 3k n ! =? 當講解完前面 3小題的時候, 大部分學生臉上開始露出愉快的表情, 甚至有學生已直觀的看出後面兩小題之答案, 也排除了聯考不可能考或計算太麻煩的疑慮, 使學生在上課中仍然維持良好的學習態度。教學中教師應恰當地利用相對直觀的東西作為抽象概念規定的表徵 (representa-tion), 讓學生能逐步地學會其核心概念的數學化 (mathematising)。荷蘭數學教育學家 Freuden-thal 認為數學化在現實世界裡是瞭解和深化理論的過程, 其目的是要把生活世界之概念引向符號世界 (Freudenthal, 1991)。因此, 教師若能充分了解課程安排的用意, 進而提出更符合學生認知的學習內容和方法, 往往能透過課堂上之教學將教科書的缺點降到最低。總之, 筆者要不厭其煩的再次強調, 教科書的編寫必須深入探討學生原有的認知結構, 如此才能選擇更適合學生特點的知識, 並且也讓教師在課堂上順利的進行教學。在這種兼顧教與學之理念基礎上, 教師不應僅僅是教材的使用者, 更應該也是教材的開發與修正者。畢竟一本完善的教科書不管是由教師的教學適用性, 抑或從學生之學習需求性, 都必須透過實際的課堂教學活動來檢驗。最近在 Notices of the AMS 有一篇文章中作者提到: 「若數學家願意從事善意和有建設性的評論, 而不是傲慢與反諷的批評, 那麼美國數學戰爭的結果才不會繼續造成數學教育界的傷害」 (Ralston, 2004)。不可否認, 數學家所擁有的數學知識, 使得他們對於高中數學什麼概念是重要的, 具備有較寬廣的洞察能力, 但數學家並不完全了解有些想法在課堂上是

(9)

不易實行的。因此, 當高中教師與大學教授有機會一起編寫教材時, 必須避免教授的權威凌架在教師之上的心態, 唯有透過理性的討論才能呈現更符合教學需求的內容。另外, 也希望負責課程標準制訂與審查的專家學者, 應該抱持較具彈性的眼光來審查課程內容。只要合乎數學理論的規範與系統, 應該留給編寫作者們更大的發揮空間, 如此才能期盼寫出更有特色的全新教材, 否則所有版本之內容千篇一律, 感覺有點浪費資源。如果當初編譯館不要硬性規定標準差的定義, 或許目前會出現其他各種更有創意的表達方式。畢竟, 開放版本也正是發展多元教材的最佳時機, 我們豈能錯過這一大好的改革機會。

參考文獻

1. 李士錡 (2001), PME: 數學教育心理, 上海華東師範大學出版社, p22∼p63。 2. 余民寧 (2003), 有意義的學習—概念構圖之研究, 台北商鼎文化出版社, p41∼p58。

3. A. M. Mood, F. A. Graybill and D. C. Boes (1974), Introduction to the Theory of Statistics, McGraw-Hill Book Company, p315∼p321.

4. W. G. Cochran (1977), Sampling Techniques, Third Edition, John Wiley & Sons, Inc, p.18∼p.27.

5. H. Freudenthal, Revisiting Mathematics Education, Kluwer Academic Publishers, Dor-drecht/Boston/London, 1991, p30∼p42.

6. A. Ralston (2004), Research Mathematicians and Mathematics Education: A Critique, Notices of The AMS, April 2004, p403∼p411.