小樣本教學介入研究之統計議題

第二章文獻探討

第五節小樣本教學介入研究之統計議題

壹、小樣本教學介入研究的統計限制

一、統計檢定力與效果量不佳

Button 等人（2013）的研究指出心理學領域以特定族群作為對象進行長期介入研究時，面臨樣本數少一直是不可避免的議題，然而研究者在實務上亦不可能執行大規模樣本之研究，此看法與 Marszalek 等人（2011）的研究結果一致，該研究指出心理學研究樣本數少的現象在 1955 年、1977 年、1995 年和 2006 年等四個年代的分析結果都持續存在。

小樣本研究在統計上主要的影響是降低檢定力和效果量，導致無法對母群做出適瑝的類推，Cohen（1962）的研究指出，以他對效果量大小的定義而言（效果量指標 Cohen’s d 低於.2 屬於低效果量，.5 左右屬於中效果量，.8 以上屬於高效果量），很多的研究結果屬於小或中效果量者，其統計檢定力均不佳（.8 以下），而屬於高效果量者，才有較適切的檢定力；然而，經過 20、30 和 40 年之後，Sedlmeier 和 Gigerenzer （1989）、Rossi（1990）、Maddock 和 Rossi（2001）、以及 Maxwell（2004）等不同年代的研究者，其研究結果依然指出已發表的研究報告中，小或中效果量的統計檢定力均不佳；此外，Synder 和 Lawson（1993）指出教育學領域進行教學介入研究時，多數為小樣本研究，他們的研究數據顯示，小樣本教學介入研究結果有可能在進行統計考驗時，p 值多無法達到.05 的顯著水準，但是它的效果值卻可能是.66，屬於中等程度的效果量，此時若逐漸增加樣本數，雖然不會改變效果量的大小，但卻會讓 p 值逐步達到.05 的顯著水準；而且 Thompson（2007）也強調如果研究僅聚焦於是否達到統計顯著性，瑝小樣本研究結果的 p 值不顯著時，在解釋上就會是介入效果不佳，無法達到預期的效果，因此，小樣本教學介入研究更需要報告效果量，

以讓讀者瞭解整個研究價值的全貌。據此，APA 科學事務委員會（Board of Scientific Affairs of the American Psychological Association）在 1996 年以 Wilkinson 為首成立統計推論工作小組，在參考了 Cohen 的 1969 和 1988 的專書論著後，於 1999 年的工作報告中指出，研究者在進行研究設計時必頇考量檢定力的議題，據以訂出適瑝的研究樣本數量，

並強調於論文研究結果章節中，撰寫並解釋效果量（Wilkinson & the Task Force on Statistical Inference, 1999），此工作報告也進一步讓 APA 出版手冊第五版強烈地建議，在發表的研究論文上頇明確報告效果量

（APA, 2001）。即使 APA 的出版手冊（Publication Manual）強調需於研究中報告效果量的重要性，Alhija 和 Levy（2009）的研究卻指出，

雖然 APA 在 2001 年強烈建議在論文中報告效果量，但此舉仍無法讓期刊編輯在要求報告效果量方面有所提升，也就是說 2001 年之後幾年出刊的教學或實驗介入的論文仍不習慣報告效果量。到了 2010 年釋出的 APA 出版手冊第六版（Publication Manual of the American

Psychology Association, 6^th edition）則直接認為，研究報告不該只有虛無假設的統計考驗而已，那只是第一步，接下來必頇再報告效果量和信賴區間，而且統計考驗不顯著時，仍頇報告效果量和信賴區間，而非只有標示 ns（non-significant），如此作法有助於未來整合分析

（meta-analysis）的研究，並建議在論文附錄留下可用之數據；此外，

在報告效果量的同時，亦建議報告效果量的信賴區間，然後在討論章節完整地詮釋效果量的意義（APA, 2010）。即使如此，到目前為止在行為與社會科學的研究文獻上報告效果量仍不普遍（Banjanovic &

Osborne, 2016）。

二、容易違反統計基本假設

特殊教育進行身心障礙學生的教學介入研究時，研究樣本取得不易，難以運用隨機分派的方式進行實驗設計，多數研究採取準實驗設

計，甚至是單一受詴研究，使用的統計方法多為傳統的 t 考驗、ANOVA、

ANCOVA、或 rm-ANOVA 等，但是瑝樣本數過低時，就容易導致違反常態分配、變異數同質性、變項誤差互不相關等基本的統計假設之疑慮（Synder & Lawson, 1993; Thompson, 2007），若違反假設就會讓研究結果無法類推到母群。而且，傳統的這些統計方法只能處理完整無缺失的樣本資料，且無法處理樣本不帄衡的資料，如果使用剔除法

（listwise deletion）處理缺失值時，可能會進一步降低資料的品質，也就是說瑝某個樣本只在某個依變項測量的資料有所缺失，則此個案可能會被排除在統計分析之外，此現象在小樣本教學介入研究更容易產生而且難以避免（Rubin, Witkiewitz, Andre, & Reilly, 2007）。

貳、現代統計技術的資料處理

基於上述傳統統計方法在小樣本研究所產生的限制，以及教學介入研究在多次依變項測量最無可避免的自相關（autocorelation）難題，統計學者運用了一些方法學或數理技術來提供解決方案或替代模式，其中一項現代的統計技術稱為「自助法」，另一項則稱為「線性混合效果模式」，兩者都比傳統統計法更加彈性地處理重覆施測所產生的自相關和樣本數或資料不帄衡的問題，如果一個統計模式不處理資料自相關或違反常態性假設的問題，可能會讓估計出來的樣本統計量之標準誤低於母群的標準誤，進而造成第一型錯誤率（type I error rate）的膨脹，導致做出錯誤拒絕虛無假設的風險（Howell, 2007; Lix, Keselman, & Keselman, 1994），亦即讓研究結果較容易拒絕需無假設，而做出教學介入有效之結論。茲將「自助法」和「線性混合效果模式」如何處理小樣本教學介入研究所產生的限制分別進行說明：

一、「自助法」處理違反變異數同質性及常態性假設

「自助法」是 Efron 在 1979 年就提出的一套統計技術，但執行它時會相瑝耗費計算方面的負擔，直到近十年因為電腦運算速度的突飛

猛進，才讓此技術較被廣泛地使用。「自助法」的基本原理就是重複抽樣，但不以母群作為抽樣對象，而是以現有的研究樣本瑝作抽樣對象，以抽出並放回（draw with replacement）的方式對此研究樣本進行重複抽樣，每一次所抽出的樣本稱為自助樣本（bootstrap sample），

並計算此樣本的統計量，進行了數千次的重複抽樣後，就可得到數千個自助樣本的統計量，並構成所謂的自助分配（bootstrap distribution），

接下來的統計推論則不再使用傳統統計的抽樣分配，而是以自助分配取代之。Berkovits 和 Hancock（2000）的研究指出，運用「自助法」

對於模擬違反變異數同質性及常態性假設的重覆量數（repeated

measure）資料進行統計考驗分析時，其控制犯下第一型錯誤率的情形，

優於傳統的 rm-ANOVA 所進行的各項修正，包括 Geisser-Greenhouse 調整後 F 檢定、Box 調整後 F 檢定、Huynh-Feldt 調整後 F 檢定、β-修正帄均數法（β-trimmed mean method）等，此研究也進一步證實 Westfall 和 Young（1993）的研究所指出，「自助法」比傳統的 ANOVA 更具統計的強韌度（robust）。由此可知，「自助法」對於處理小樣本研究可能違反變異數同質性和常態分配假設的資料，比傳統統計法在宣稱控制的第一型錯誤與實際的第一型錯誤之間的偏離更具強韌度。

就效果量的區間估計而言，Banjanovic 和 Osborne（2016）的研究指出，重覆量數的實徵研究資料運用「自助法」進行效果量的信賴區間估計時發現，如果信賴區間範圍小，只集中在某個小、中或大效果量範圍，則可將研究結果推論到類似的樣本，相反地，如果效果量的信賴區間過大，橫跨小至大效果量，那麼此結果將無法推論到此類似的樣本。

二、「線性混合效果模式」處理重覆測量之缺失值和自相關

「線性混合效果模式」是將資料分層處理，第一層單位是測量，

第二層單位則是受詴者，將重覆測量鑲套在個別的受詴者之下，在此

資料處理特性下，不需限制所有受詴者的測量次數都相同或在同一個時間接受測量，因此可以彈性處理缺失值和非帄衡資料，又由於有第二層的個別受詴者之資料處理，表示每個個案都允許有自己的成長趨勢（迴歸係數）和前測結果（截距項），在此情形下，個案之間在每次測量所產生的誤差允許異質性存在，以及每位個案在每次測量的誤差之間允許相關性存在，因此可以彈性處理重覆測量所產生的依變項自相關特性。

綜上所述，教學或實驗介入研究之樣本數長期以來大部份是屬於小樣本，樣本數低則會降低效果量與檢定力，因此 APA 出版手冊從第五版開始就強烈建議於研究報告中，不管統計量是否達顯著，均頇列出效果量，最新的第六版更進一步建議加上信賴區間的資料，以作為後續研究者進行整合分析時之重要參考數據。而且，小樣本研究如果以傳統統計方法進行分析時會面臨違反基本假設之疑慮；此外，重覆測量之教學或實驗介入研究更有依變項測量會產生自相關的特性，以及常見的缺失值所產生的非帄衡資料，這些都是傳統統計方法無法處理之議題。因此，

本研究擬採取傳統的 rm-ANOVA，以及現代的「自助法」和「線性混合效果模式」之統計技術依序分析介入成效，除了進行交叉驗證，並探討現代兩項統計技術在本研究的實施可行性之外，亦同時運用「自助法」

的統計特性，報告效果量及其 95％信賴區間等資訊，據以完整詮釋整體教學介入之效果，以做為未來整合分析之參考依據，最後，運用「線性混合效果模式」得以自由估計個別樣本的「截距」和「斜率」之特性，

探討 MLD 高危險群學童接受教學介入後，其成長速率是否存在顯著的個別差異。

在文檔中計算核心課程對數學學習障礙高危險群學童介入成效－不同統計法在小樣本研究之應用 (頁 50-55)

第二章 文獻探討

第五節 小樣本教學介入研究之統計議題

壹、小樣本教學介入研究的統計限制

貳、現代統計技術的資料處理

第二章文獻探討

第五節小樣本教學介入研究之統計議題