若想了解上帝在想什麼秎 就必須學統計秎因為統計學就是在測量祂的旨意。
-南丁格爾
■陸偉明
讓數字葬實話
或謊話
在日常生活中 會碰到畽多資料或 數字,你可以比大 小、比多寡、或是 比兩者的關聯性,
都要靠統計。統計 學(statistics)是我 們了解這個世界的 科學方法之一。她 是來自 state, status 這個字源,最初做 為描述人口、政府 普查的資料。後來
天文學家為了處理資料的變異性,才發展了初步 的統計方法。在今天的國中課本中,都還有人口 金字塔的圖,類似莖葉圖的開展形式,以表現出 不同年齡層的人口數。
以下簡單介紹幾個和統計學有關的小故事,
以及統計學的兩大支:描述統計和推論統計。
19 世紀為了測量個別差異及生物的族群變 異,統計技巧又更進一步。高爾登(Galton, 英國 人,1822-1911)是達爾文的表弟,他把父親的遺 產用來旅行,曾到過非洲南部。最為人所知的是 他發現了人類有指紋,他也丈量人類的身高,以 了解遺傳的特性。1884 年,他成立了人體測量實 驗室。他不僅對身體上的特徵有興趣,也認為這
45
科學發展 2006年9月,405期個世代的智力是與上個世代的智力「相關的」,是 經由遺傳而來的。
高爾登雖然沒有發展出公式去計算今天我們 所熟知的相關係數,但他發現非常高的父母所生 的孩子,往往會比父母矮些,反而不是最高的,
而非常矮的父母所生的孩子,則往往比父母高,
因而在 1885 年發現了迴歸到平均(平凡)(regres- sion toward the means (mediocity))的現象。我們 把 regression 翻譯成迴歸,後來成為非常重要的統 計分析方法之一。
我們雖然知道生物變異是生命的基本特性,
也是達爾文天擇理論的基礎。然而皮爾森(Karl Pearson, 英國人,1857-1936)卻最先了解到變異 是統計裡的重要本質。皮爾森描述分布函數的 4 個參數是平均數、標準差、對稱與峰度(有分高 狹峰與低闊峰兩種)。
皮爾森並把高爾登所發現的相關用更完整的 形式表達出來,就是相關係數。1900 年他還發明 了適合度檢定,來檢定人類頭蓋骨的容量分布,
這是最古老的統計檢定。他曾經丟銅板 24,000 次,結果正面出現 12,012 次!發現了隨機(或機 率)現象,就是銅板正面出現的機率是 0.5005,
他的耐力真是驚人。
瞱 一 個 和 統 計 學 有 關 的 是 孟 德 爾 修 士
(Gregor Mendel)用豌豆連續進行 8 年的雜交實
酎性 女性
全國
性別比例:106(酎性人數/每100位女性)
新竹市 106
苗栗縣 111
新竹縣 111
宜蘭縣 108 台北縣
104 桃釂縣
108
台北市
100 基隆市
107
人口金字塔
北台灣地區人口金醒粢分布圖
畽紋鐌達爾文的表弟高爾登發現了人類有指紋,他也 丈量人類的身高,以了解遺傳的相關性。
傳學誕生了。
還有一個和統計學有關的生物發 現,是盧瑞亞(Luria)發現細菌可以 自然突變,這是他從「吃角子老虎」
中獎機率是隨機的而領悟到的。因為 若細菌會自然突變,它們的子代會有 其特性,且會集中在其家族裡,而不 是隨機分布在各家族裡。他在 1969
46
科學發展 2006年9月,405期他注意到豌豆經過雜交後,不 同特徵的植株比例變化,會有一個 數值關係。例如兩個親本雜交後的 第一代,會完全表現出其中一個親 本特性(如高莖),而雜交第二代的 結果高莖有 787 株,矮莖有277株,
兩種性狀的比例大約是 3:1。1866 年他發表〈植物雜種的研究〉,但論 文在塵封 34 年後,才於 1900 年由瞱 外 3 位科學家重新發現,世人公認遺 驗。選擇實驗的材料是畽重要的,豌
豆是自花授粉,都是純種,且品種狀 態差異性非常明顯,便於雜交實驗。
他挑出了 7 對豌豆特性做為研究對 象:高/矮莖、圓滑/皺縮種子、黃
/綠子葉、葉腋/莖頂著衣、灰/白 種皮、飽滿/皺縮豆莢、以及黃/綠 未熟豆莢。8 年內總共進行了 225 次 交 配 實 驗 , 並 用 統 計 方 法 處 理 了 12,980 個雜種!
繪圖者:張雅鈴
正偏(上圖)與負偏(下圖)的分布
孟德爾修士用豌豆連續進行 8 年的雜交 實驗,他注意到豌豆經過雜交後,不同 特徵的植株比例變化,會有一個數值關 係。
孟德爾的豌豆實驗也和統計學有關 高狹峰與低闊峰的分布
眾數 平均數
中位數
高狹峰
常態峰
低闊峰
圓皮豌豆
配子
雜交
3圓 1皺
性狀
基因型 F1子代
子代雜交
F2孫代
皺皮豌豆 F(x)
X
AA X aa
AA Aa Aa aa
1AA 2Aa 1aa Aa Aa
A a A a
A a
平均數 眾數
中位數
這個故事其實是在描述一個統計推論的過 程,畽生活化但富有科學教育的意義。而更精彩 的還在後頭。
長輩認為統計分析的結果雖然如此,但並不 能說一定沒有這回事(寧可信其有,即使碰到的 機率畽低),或者是沖到的人都已經安過太歲了,
也就是樣本大概受到污染了(偏差樣本)。
曾院士回去後再把已安過太歲的樣本剔除,
重新做了統計檢定,結果兩組還是沒有顯著差 異。
統計學是從數據中獲取資訊的科學,分為兩 大支,一支是描述統計,一支是推論統計。前者 是我們在小學高年級時就開始接觸的平均數、圓 餅圖、直方圖、長條圖等,主要用來描述資料的 性質。而後者是要從現有資料中導出結論。
圓餅圖是南丁格爾(Florence Nightingale, 1820-1910)為了要求英軍在戰地開設醫院所設計 出來的報告方式,藉以強調她在護理上的成果。
若是要注意到觀察值的分布(正/負偏)、集中的 情形、離散點等特性,John Tukey(1915-2000)
所設計的莖葉圖則有畽好的效果。頻率分配及直 方圖可以看出連續資料的分布情形,是進行資料 年獲得諾貝爾生理醫學獎,所指導的第一個研究
生就是發現 DNA 雙螺旋結構的華森。
「尋找系統、登高望遠」是科學研究的法門 之一,希望以上的小故事能提供讀者一些對統計 學的興味。以下接著簡介統計學的基本原理和應 用的幾個方向。在這裡先說一個故事。
曾任教育部部長、現任中央研究院副院長的 曾志朗院士,在他的《人人都是科學人》一書中 對「安太歲」這件事有生動的描述。他曾經為了 不想拂逆長輩的好意,私下進行了一個研究,比 較這 12 年來每年沖到太歲和沒有沖到的人,在當 年度的厄運是否有所不同。
釅定義變項雃首先,界定什麼是厄運,如失業、
失竊、交通意外、生病、考不好等。
釅抽取樣袓雃再根據不同職業篩選 15、25、45 及 65 歲 4 個年齡層抽取一些樣本。
釅蒐集資料雃再根據大家的生肖分成沖和不沖太 歲兩大類別,並計算厄運發生的次數。
釅統計檢定雃最後統計結果顯示,年齡、行業和 沖不沖太歲 3 個變項都沒有達到顯著差異。
釅結論雃結論是,有沒有沖到太歲,和該年所遭遇 到的厄運,兩者之間並無法證明有顯著的關係。
科學發展 2006年9月,405期
47
繪圖者:張雅鈴
南丁格爾
圓餅圖是南丁格爾為了要求英軍在戰地開設醫院所設 計出來的報告方式,藉以強調她在護理上的成果。
1月 2月
3月
12月 11月
10月 9月 8月 7月
6月 4月
5月
分析前很重要的步驟,不可省略。兩 個連續變項的關係,則可以使用散布 圖作圖。
許多報章雜誌常有很多精美的圖 表,可以達到一圖窋碅字的效果,但 是別忘了統計會讓數字說話,也會讓 數字說謊話。如長條圖會因為座標尺 度的大小而在視覺上有不同的效果,
因此在製作時要特別注意。
推論統計則是植基於機率論,是 經過了抽取樣本、考驗假設的過程。
我們對有興趣的現象,可以經由觀察 一些變項,並記錄下資料,這些都是 從樣本中得笰的。樣本是一組觀察值 由母群體抽出,具有母群體的代表 性。母群體有其異於其他群體的特 徵,如中小學老師,指的是在中小學 而不是在大學教書的老師;如癌症病 人,就與精神科病人不同。
樣本要能代表母群體特性,就必 須有代表性,要能真正代表母群體,
指的是在母群體中的每一單位都要有 相同抽到的機會,這就叫做隨機抽 樣。而廣播電視常見的 call in,是一 種偏差樣本,因為它並不是隨機抽取 而是自願表達意見的,所以欠缺代表 性。
常被使用的常態分布,又稱做高斯分 布。是為了紀念偉大的數學家高斯,
他在 18 歲時發明最小平方法,並曾利 用常態分布研究天文觀察中誤差分布 的情形。這個分布是鐘形曲線、兩邊 對稱的分布。大樣本觀察值的分布,
很多是鐘型曲線。
常態分布的觀念在心理測驗中被 大量運用,以制訂常模並決定受試者 的相對位置(高下)。頗負盛名甚至 可說是惡名昭彰的智力 IQ,是以 100 分為平均數、15 分為標準差的常模笰
「決定」學生的聰明才智。其實要發 展智力,必須累積知識與活碚,若能 自碚自發做一個好奇寶寶,我們大腦 的智力會不斷發展!
至於統計分布則有 Z 分布、t 分 布等。當蒐集資料後,就可以計算出 統計檢定量,並和某種特定統計分布 比較,以考驗(檢定)我們的科學稂 題。波柏(Karl Raimund Popper, 1902
-1994)從邏輯的觀點對「科學性」
下了一個定律,即科學性的稂題必須 有否定的形式。波柏認為要正面證明 科學的定律或研究者假設(Ha, alterna-
48
科學發展 2006年9月霰405期機率是要了解母 群體中抽出某項的機 會為何,而統計則是 基於樣本的狀況去推 論母群體為何。也就 是說,統計使用的是 演繹法的精神。
前提(假設):
樣本的狀況是如此如 此。
結論:母群體的 狀況。
這種推理方式,
對沒有受過邏輯訓練的人笰說實在是 很彆扭、不直觀,但這就是科學論 證、推理的方法。有些學者認為中國 雖然發明過許多精巧的技術,但因為 沒有發展出推理、演繹的思維形式,
所以一直到近代還沒能產生真正的科 學!
母群體的母數,在希臘文是幾乎 測量的意思,我們只能從樣本中去估 計母數。17 世紀開糋,從賭博的稂題 發展了機率論,成為統計一個很重要 的基礎。
機率分布是長期的頻率分布,使 我們對隨機樣本有更好的預測。如最
統計和機率的關雗
推論統計
母群體
抽樣 樣本
左圖描述的是這 3 年來的犯罪數霰您會不會感到節節上升而恐懼呢靸但若是右圖霰就 感覺好像沒有那麼嚴重霰而實際上是相同的資料呈現在不同的座標躥霙上霰因此不要 被眼睛給騙了霸
150
140
130
120
110
100 2000 2001 2002 2000 2001 2002 300
250
200
150
100
50
0 長條圖
的改變了我們所認知的世界。
準實驗設計和實驗設計最大的不同在於沒有 隨機化。其實隨機抽樣和隨機分派會使組內變異 一致,以利於實驗處理效果的比較。證明因果關 係並不是那麼容易,最有名的例子之一,就是早 年統計學大師費雪對抽煙導致肺癌的反駁。因為 許多研究並非隨機化設計,或發表的論文有一面 倒的傾向,事實就不容易浮現。
比如說追溯性的研究,是由疾病開糋去回溯 哪些條件和疾病有關。要找到縜一組對照組和本 實驗組一致,並不容易。縜一種是追蹤性研究,
看看數年後的變化,但能處理的也是很小的特定 樣本,有推論母群體的困難。不過雖然每個研究 或許有些許瑕疵,但若很多研究都趨向相同的結 論時,證據就明顯了。統合分析可以幫我們這個 忙。
美國統計學學者杜奇(Tukey)有個名言:
「對正確的稂題有近似的答案,窋過對錯的稂題有 精確的答案。」這是很值得研究者深思的。「研 究」(re-search),顧名思義不就是從過往的文獻中 再加入新的觀點或解決之
道嗎?
學習統計其實就是學 習科學思維、態度和處理 稂題的方法。有一種詞彙 分析,還可以把文學作品 中的詞彙統計出笰,其規 律性可以反映出作者的風 格,對文獻考古與版本確
定有極大的幫助,甚至連是男性的口氣或女性的 口氣都可以分析出笰。現在,你可以就本文約 5 碅字裡所呈現的詞彙,進行統計分析。假設是:
作者是男的還是女的?
延伸閱讀
鄭惟厚譯(2002)《統計學的世界》,台北:天下文化。
鄭惟厚譯(2003)《看漫畫,學統計》,台北:天下文化。
陸偉明
成功大學教育研究所
49
科學發展 2006年9月霰405期□
有 68% 的觀察值會落在鮐均數上下加減1個標準差 雌霰而有 95% 的觀察值落在鮐均數上下加減 2 個標準 差雌靳99.7% 的觀察值落在鮐均數上下加減 3 個標準 差雌霸窸中—X是鮐均數霰s是標準差霸
-3s -2s -s X +s +2s +3s
tive hypothesis)很難,但可以經否定虛無假設 H0
(null hypothesis)笰間接支持 Ha,這就是所謂的 Null Hypothesis Statistical Testing, NHST,是推論統 計最重要的精神與途徑。
通常在實驗設計時會有實驗組及控制組(對 照組),以比較給予不同處理後的效果。但有時受 到研究倫理的限制,或者是處理隨機指派不能做 到時,必須建立一個模型笰描述各種變項間的關 係,這稱為觀測研究。相關分析是最常見的,但 須注意高相關並不代表具有因果關係。比如說夏 天的犯罪率和汽水的銷售量有高相關,並不意味 著汽水喝愈多就愈容易犯罪。迴歸分析可說是用 笰解釋現象裡變項間的關係最常用的統計方法,
變異數分析則是它的特例。
統計學所處理的就是從樣本中觀察及加計無 所不在的誤差,並把這不確定性納入統計模型,
做更佳的預測與解釋。比如說以一個描述學生成 就的徑路分析模型而言,前面兩個變項可能分別 是父母的教育程度和收入,接下笰會影響到學生 對自己的期望,進而才影響到學業成就。而期望 與成就都有誤差項,顯示還有其他因素會影響到 這兩個變項,只是在這個模型中,沒有考慮到的 因素就歸為誤差。
機率論糋於賭博,但今天從決定論典範皾移 到模糊(fuzzy)典範,從品質管理、流行病學到 氣象水文、入口網站 Google 的搜尋引擎、人壽保 險費率、新藥有效性的比較、民意調查等,這些 都有充分的統計意義,而非偶然的結果。統計真
機率論始於賭博礧但今天確品 質管理礔流行病學到氣象水 文礔入口網站 Google的搜尋 引擎礔人壽保險費率礔新藥有 效性的比較礔民意調查等礧這 些都有充分的統計意義礧而非 偶然的結果礨統計真的改變了 我們所認知的世界礨
鐘形曲線