統計考驗的發展歷史與傳統

第二章文獻回顧與探討

第一節統計考驗的發展歷史與傳統

本章一開始針對統計考驗的發展史及傳統，作文獻上的探討；以支持本研究所提出的量化研究可能缺失。由於研究者並無統計考驗學門之專業背景因此第一節中的主要內容大部分參考張漢宜 2003 年之博士論文。第二節開始則針對量化研究的特性與研究法中「質量之爭」進行文獻上的探討，用以歸納出一些量化研究適用的範圍與應注意的事項。在教育研究方式的質、量典範分析中，更述及本研究所使用之「內容分析法」其質量兼具的特性介紹。文獻探討的第三節，研究者欲呈現國內外與本研究相關之研究，並對其內容做整理與說明。由於本所蔡秉宸學長 2004 年的碩士論文已針對科學教育論文之趨勢作了一番研究，因此第三節中的探討內容主要以其論文內容為參考資料。

第一節統計考驗的發展歷史與傳統

許多教育相關領域的研究，常使用假設考驗與推論統計來分析所蒐集到的資料。研究者通常會先建立一個虛無假說，然後根據預訂的顯著水準來決定要拒絕或接受這個虛無假說。假設考驗基本上是推論統計的一部份，它根據樣本的訊息來對母群的特性做出結論(林清山，1992)。為了以最佳的方式(如不偏估計值或最小變異量)估計母數，並且發展出統計值來考驗對母群所做的假設，就必須要有樣本統計值 (Murray &

Dossier,1987)。因此，統計學者必須要掌握這些統計值的機率行為，也就是它們的抽樣分配；在了解統計值的抽樣分配後；例如虛無假說為真時的抽樣分配後，才能進行臨界值的計算並考驗統計假設及建構信心區間。

假設考驗、推論統計與二分的顯著性考驗都是源自於統計學家Fisher 的傳統(Akin,McDowell & Orndoff,1992)。Fisher無疑地是二十世紀最偉大的統計學家，而且他可以被稱為「現代統計學之父」(Cohen,1990)。但

是，除了Fisher的理論之外，統計學仍有其它的傳統。從二十世紀之初開始，對於如何從資料數據(data)中獲得結論出現了數個明顯區別的觀點 (Gigerenzer,G., Swijtink,Z., Porter,T., Daston,L. J.,Beatty,J., &

Kruger,L. ,1989)。R. A. Fisher，Jerry Neyman 與 Egon Pearson，以及Bayes(貝氏)學派的統計學家各自代表了不同的取向，他們都致力於提昇他們之前的理論觀點，這三種取向也都相當地系統化，每個取向都能解釋很廣泛的實務。

Fisher學派與Neyman-Pearson學派同屬於「次數」(frequency)學派；

而Bayes學派則通常被稱之為「主觀」(subjective)學派。這兩個學派的應用領域也脛渭分明。次數學派的名稱與它們對機率的觀點有關。過去300 年來所使用的機率以及目前統計考驗所使用的機率都是相對次數 (relative frequency)的機率(Huberty,1993)。事實上，如果要瞭解Fisher 在統計推論上的研究典範，就須要從他反對使用Bayes法則的角度來體會 (Gigerenzer et al.,1989)。對Bayes統計學而言，機率並非是相對次數而是信念程度(degree of belief)(Cohen,1990)。次數學派的方法與概念貫穿了整個實驗科學，主觀學派則否。雖然有些學者嘗試將統計考驗納入 Bayes理論的脈絡之中(例如， Overall,1969)，然而，Bayes學派主要是在經濟學的領域中開拓出它的出路，它也已經復興了它在十八世紀的傳統用途，例如，法律裁決與人類理性。

以下將對統計考驗的發展過程做一簡要回顧。在這個回顧中，將敘述:

一、Fisher之前的統計考驗發展。

二、Bayes定理的基本概念與批評。

三、Fisher如何一統他之前的各種「顯著性考驗」的概念，並為現代的統計考驗墊定基礎。

四、Neyman-Pearson如何將統計考驗力引進他們的「假設考驗」中。

五、Fisher與Neyman-Pearson這兩大學派如何融合在一起。

六、虛無假說考驗的幻夢。

七、第一節文獻探討總結

一、Fisher的先驅者: 早期的統計考驗

在Fisher之前即有一些統計考驗的先驅者。最早的例子可能可以追溯到約300年前的John Arbunthnot (Huberty,1993; Gigerenzer et al.,1989;

Hacking,1965)。他曾經做了很原始的考驗，因為他想要知道男性的年出生率略高於女性的年出生率，究竟是要歸咎於機率造成的或是上帝的意旨。伯努力（Daniel Bernoulli）與拉普拉斯（Laplace）對行星的轉向與軌道平面的關切是另一個例子。然而，一直要到二十世紀初期，機率考驗才成為很多學科中的例行性分析程序，在這之前並沒有學者持續地發展與改進顯著性考驗的方法論。在這類考驗中，唯一具有標準化形式的是 Laplace的「原因的機率」，但是由於它使用了Bayes的法則因而受到次數學家（frequentists）的質疑。

張漢宜（2003）的研究指出：雖然在經濟與社會統計學家Wilhelm Lexis 與Francis Edgeworth的著作中可以再一次看到顯著考驗出現的證據，然而，以發展與運用顯著性考驗為目的的完整研究計畫是始於Karl Pearson 與生物計量學派。其時間可以追溯至1900年，在那個時候，Pearson出版了他的「卡方適合度考驗」（chi-square test of "goodness of fit"），

卡方適合度考驗可以用來考驗一組資料數據(data)與一條理論性曲線之間的適合程度。他發展這種考驗的一個目的是要證明常態曲線的不足。

在1908年，Gosset根據他在Pearson實驗室所接受的訓練以及工作經驗，出版了單一樣本與相關係數抽樣分配的劃時代著作。但是，為了使統計能夠適用於釀酒師的工作，他做了一些調整以符合小樣本考驗的需要。

由於他在這些著作中的努力，尤其是其中的第一篇研究，使得t考驗能運用於農業資料。在Gosset之前，當研究人員要使用統計考驗時，他們必須先假定母群變異數是已知的；或者，他們所使用的樣本大小必須是非常的大，大到足以使研究者能夠將母群變異數的估計值視為是真實的母群變異

數。張漢宜（2003）研究指出Student t分配是第一個精確的分配，第一個可以不須要依賴可疑趨近（approximation）的分配。

Gosset曾任職於都柏林（Duplin）的Guinness釀酒廠，他通常以 Student的筆名發表著作。Fisher在發展變異數分析時，就曾因為站在他的肩膀上而獲得更好的視野。Gosset後來轉而與E. S. Beaven一起從事農業實驗。從很多方面而言，他的著作調和了Karl Pearson的大樣本統計學與R. A. Fisher的實驗方法與小樣本。他也與兩人熟識，而且一直和他們

Arbuthnot Michelle

Laplace K. Pearson

Gosset

出生的性別比率星星的分佈月亮盈虧與氣壓變化

適合度單一平均數資料來源: Huberty，1993

二、Bayes: 主觀機率的先行者

在討論Fisher的顯著性考驗典範之前，須要對Bayes學派的基本觀點有一些瞭解。這是因為如果我們要瞭解Fisher的統計推論理論，就須要先知道他為何強烈反對使用貝氏法則來進行統計推論 (Gigerenzer et al.,1989)。

Thomas Bayes神父對他自己的定理的熱情，似乎不及那些喜歡歸納式思考的心理學家。心理學家們將「貝氏定理」（Bayes’theorem）與理性思考畫上等號。雖然Bayes可能花很久的時間在思考這條定理，但是，他

根本就沒將這條定理發表出來。貝氏定理在當代的知名度遠甚於它出現的年代(Gigerenzer & Murrey,1987)。它可以表示如下:

p(H|D)=p(H)p(D|H)/p(D)

在其中，p(H|D)代表事後機率(posterior probability)，它是給定數據資料D的條件下，假設H(為真，有效)的機率。p(H)可以稱之為先驗機率(prior probability)，是指資料蒐集之前假設H的機率，這個機率可以說是貝氏定理中的核心概念，它涉及到主觀信念程度，因此，這個機率也叫做「主觀機率」。p(D|H)是給定假設H的條件下，數據資料出現的概率 (likelihood)。p(D)是數據資料出現的機率。p(D|H)/p(D)比率是指數據資料的影響，所以，p(D|H)與p(D)的差異愈多，數據資料的影響愈大。

因此，基本上，貝氏定理是在陳述一條法則(rule)，這條規則可以根據新蒐集到的資料，將事前機率修正成事後機率。所以，在詮釋貝氏機率時，所根據的是主觀的信念。就是這個主觀成份招來了次數機率理論 (frequency theory of probability)擁護者的攻擊。很明確地，相對次數機率學家批評的焦點在於貝氏機率學家決定先驗機率的方式。因為在大部份的應用中，並沒有單一方式可以根據過去經驗來決定先驗機率。因此，貝氏機率學家運用了「無差異原則」(principle of indifference)，

亦即，他們將所有假設的先驗機率都設定成一樣。這表示如果我們有兩個假設，那麼貝氏定理中的p(H)就等於.50。無差異原則是主觀的，因為這個機率陳述與我們的知識或無知有關，但是和真實世界無關。另一方面，

次數機率學家則相信，對機率合理的詮釋須要根據實徵證據，亦即，須要根據觀察到的事件相對次數機率。因此，如果機率可以由主觀來決定，貝氏定理就很令人懷疑了。

相對次數機率學家放棄先驗機率的概念，這造成了重要的理論性影響。從此以後他們無法再談論事後機率，事後機率又稱為「反機率」

(inverse probability)，也就是給定某一組資料的條件下，假設(為真，

有效)的機率，因為，相對次數機率學家已經沒有計算事後機率時所須要的先驗機率。取而代之的是，次數機率學家只能處理給定某一特殊假設的條件下，數據資料現的機率。這個機率又叫做「概率」(likelihood)，也稱為「直接機率」(direct probability)。以形式化的術語來講，貝氏機率學者的焦點集中在反機率p(H|D)上；次數機率學者的焦點集中於直接機率p(D|H)上，這是因為他們認為，在現實的世界裡，一個人很少能從資料中得到假設的先驗機率（張漢宜，2003）。

三、Sir Ronald Aylmer Fisher: 統計考驗典範的轉移者

受到早期次數學派學者批評的影響，Fisher拒絕先驗機率的觀念，並拒絕讓自己與主觀機率牽連在一起(Gigerenzer & Murray,1987)。然而弔詭的是，雖然終其一生他對反機率持反對立場，然而，他自己也承認反機率的觀念悄悄地進入他著作中。張漢宜（2003）認為，就是因為他書中的反機率觀念，使得他的理論吸引了心理學家，顯著性考驗即使用到反機率的觀念。

就顯著性考驗而言，它是用來執行 Fisher所謂的「歸納式推論」 ( inductive inference)(Gigerenzer & Murray,1987)。張漢宜（2003）

的研究指出，雖然顯著考驗並非始於Fisher，但Fisher倒是統一了顯著性

在文檔中師範院校量化取向科學教育碩士論文之研究 (頁 23-40)

第二章 文獻回顧與探討

第一節 統計考驗的發展歷史與傳統

第二章文獻回顧與探討

第一節統計考驗的發展歷史與傳統