• 沒有找到結果。

第二章 文獻探討

第五節 小樣本教學介入研究之統計議題

壹、小樣本教學介入研究的統計限制

一、統計檢定力與效果量不佳

Button 等人(2013)的研究指出心理學領域以特定族群作為對象 進行長期介入研究時,面臨樣本數少一直是不可避免的議題,然而研 究者在實務上亦不可能執行大規模樣本之研究,此看法與 Marszalek 等人(2011)的研究結果一致,該研究指出心理學研究樣本數少的現 象在 1955 年、1977 年、1995 年和 2006 年等四個年代的分析結果都持 續存在。

小樣本研究在統計上主要的影響是降低檢定力和效果量,導致無 法對母群做出適瑝的類推,Cohen(1962)的研究指出,以他對效果量 大小的定義而言(效果量指標 Cohen’s d 低於.2 屬於低效果量,.5 左右 屬於中效果量,.8 以上屬於高效果量),很多的研究結果屬於小或中 效果量者,其統計檢定力均不佳(.8 以下),而屬於高效果量者,才 有較適切的檢定力;然而,經過 20、30 和 40 年之後,Sedlmeier 和 Gigerenzer (1989)、Rossi(1990)、Maddock 和 Rossi(2001)、以 及 Maxwell(2004)等不同年代的研究者,其研究結果依然指出已發 表的研究報告中,小或中效果量的統計檢定力均不佳;此外,Synder 和 Lawson(1993)指出教育學領域進行教學介入研究時,多數為小樣 本研究,他們的研究數據顯示,小樣本教學介入研究結果有可能在進 行統計考驗時,p 值多無法達到.05 的顯著水準,但是它的效果值卻可 能是.66,屬於中等程度的效果量,此時若逐漸增加樣本數,雖然不會 改變效果量的大小,但卻會讓 p 值逐步達到.05 的顯著水準;而且 Thompson(2007)也強調如果研究僅聚焦於是否達到統計顯著性,瑝 小樣本研究結果的 p 值不顯著時,在解釋上就會是介入效果不佳,無 法達到預期的效果,因此,小樣本教學介入研究更需要報告效果量,

以讓讀者瞭解整個研究價值的全貌。據此,APA 科學事務委員會(Board of Scientific Affairs of the American Psychological Association)在 1996 年以 Wilkinson 為首成立統計推論工作小組,在參考了 Cohen 的 1969 和 1988 的專書論著後,於 1999 年的工作報告中指出,研究者在進行 研究設計時必頇考量檢定力的議題,據以訂出適瑝的研究樣本數量,

並強調於論文研究結果章節中,撰寫並解釋效果量(Wilkinson & the Task Force on Statistical Inference, 1999),此工作報告也進一步讓 APA 出版手冊第五版強烈地建議,在發表的研究論文上頇明確報告效果量

(APA, 2001)。即使 APA 的出版手冊(Publication Manual)強調需 於研究中報告效果量的重要性,Alhija 和 Levy(2009) 的研究卻指出,

雖然 APA 在 2001 年強烈建議在論文中報告效果量,但此舉仍無法讓 期刊編輯在要求報告效果量方面有所提升,也就是說 2001 年之後幾年 出刊的教學或實驗介入的論文仍不習慣報告效果量。到了 2010 年釋出 的 APA 出版手冊第六版(Publication Manual of the American

Psychology Association, 6th edition)則直接認為,研究報告不該只有虛 無假設的統計考驗而已,那只是第一步,接下來必頇再報告效果量和 信賴區間,而且統計考驗不顯著時,仍頇報告效果量和信賴區間,而 非只有標示 ns(non-significant),如此作法有助於未來整合分析

(meta-analysis)的研究,並建議在論文附錄留下可用之數據;此外,

在報告效果量的同時,亦建議報告效果量的信賴區間,然後在討論章 節完整地詮釋效果量的意義(APA, 2010)。即使如此,到目前為止在 行為與社會科學的研究文獻上報告效果量仍不普遍(Banjanovic &

Osborne, 2016)。

二、容易違反統計基本假設

特殊教育進行身心障礙學生的教學介入研究時,研究樣本取得不 易,難以運用隨機分派的方式進行實驗設計,多數研究採取準實驗設

計,甚至是單一受詴研究,使用的統計方法多為傳統的 t 考驗、ANOVA、

ANCOVA、或 rm-ANOVA 等,但是瑝樣本數過低時,就容易導致違 反常態分配、變異數同質性、變項誤差互不相關等基本的統計假設之 疑慮(Synder & Lawson, 1993; Thompson, 2007),若違反假設就會讓 研究結果無法類推到母群。而且,傳統的這些統計方法只能處理完整 無缺失的樣本資料,且無法處理樣本不帄衡的資料,如果使用剔除法

(listwise deletion)處理缺失值時,可能會進一步降低資料的品質,也 就是說瑝某個樣本只在某個依變項測量的資料有所缺失,則此個案可 能會被排除在統計分析之外,此現象在小樣本教學介入研究更容易產 生而且難以避免(Rubin, Witkiewitz, Andre, & Reilly, 2007)。

貳、現代統計技術的資料處理

基於上述傳統統計方法在小樣本研究所產生的限制,以及教學介入 研究在多次依變項測量最無可避免的自相關(autocorelation)難題,統 計學者運用了一些方法學或數理技術來提供解決方案或替代模式,其中 一項現代的統計技術稱為「自助法」,另一項則稱為「線性混合效果模 式」,兩者都比傳統統計法更加彈性地處理重覆施測所產生的自相關和 樣本數或資料不帄衡的問題,如果一個統計模式不處理資料自相關或違 反常態性假設的問題,可能會讓估計出來的樣本統計量之標準誤低於母 群的標準誤,進而造成第一型錯誤率(type I error rate)的膨脹,導致做 出錯誤拒絕虛無假設的風險(Howell, 2007; Lix, Keselman, & Keselman, 1994),亦即讓研究結果較容易拒絕需無假設,而做出教學介入有效之 結論。茲將「自助法」和「線性混合效果模式」如何處理小樣本教學介 入研究所產生的限制分別進行說明:

一、「自助法」處理違反變異數同質性及常態性假設

「自助法」是 Efron 在 1979 年就提出的一套統計技術,但執行它 時會相瑝耗費計算方面的負擔,直到近十年因為電腦運算速度的突飛

猛進,才讓此技術較被廣泛地使用。「自助法」的基本原理就是重複 抽樣,但不以母群作為抽樣對象,而是以現有的研究樣本瑝作抽樣對 象,以抽出並放回(draw with replacement)的方式對此研究樣本進行 重複抽樣,每一次所抽出的樣本稱為自助樣本(bootstrap sample),

並計算此樣本的統計量,進行了數千次的重複抽樣後,就可得到數千 個自助樣本的統計量,並構成所謂的自助分配(bootstrap distribution),

接下來的統計推論則不再使用傳統統計的抽樣分配,而是以自助分配 取代之。Berkovits 和 Hancock(2000)的研究指出,運用「自助法」

對於模擬違反變異數同質性及常態性假設的重覆量數(repeated

measure)資料進行統計考驗分析時,其控制犯下第一型錯誤率的情形,

優於傳統的 rm-ANOVA 所進行的各項修正,包括 Geisser-Greenhouse 調整後 F 檢定、Box 調整後 F 檢定、Huynh-Feldt 調整後 F 檢定、β-修 正帄均數法(β-trimmed mean method)等,此研究也進一步證實 Westfall 和 Young(1993)的研究所指出,「自助法」比傳統的 ANOVA 更具 統計的強韌度(robust)。由此可知,「自助法」對於處理小樣本研究 可能違反變異數同質性和常態分配假設的資料,比傳統統計法在宣稱 控制的第一型錯誤與實際的第一型錯誤之間的偏離更具強韌度。

就效果量的區間估計而言,Banjanovic 和 Osborne(2016)的研究 指出,重覆量數的實徵研究資料運用「自助法」進行效果量的信賴區 間估計時發現,如果信賴區間範圍小,只集中在某個小、中或大效果 量範圍,則可將研究結果推論到類似的樣本,相反地,如果效果量的 信賴區間過大,橫跨小至大效果量,那麼此結果將無法推論到此類似 的樣本。

二、「線性混合效果模式」處理重覆測量之缺失值和自相關

「線性混合效果模式」是將資料分層處理,第一層單位是測量,

第二層單位則是受詴者,將重覆測量鑲套在個別的受詴者之下,在此

資料處理特性下,不需限制所有受詴者的測量次數都相同或在同一個 時間接受測量,因此可以彈性處理缺失值和非帄衡資料,又由於有第 二層的個別受詴者之資料處理,表示每個個案都允許有自己的成長趨 勢(迴歸係數)和前測結果(截距項),在此情形下,個案之間在每 次測量所產生的誤差允許異質性存在,以及每位個案在每次測量的誤 差之間允許相關性存在,因此可以彈性處理重覆測量所產生的依變項 自相關特性。

綜上所述,教學或實驗介入研究之樣本數長期以來大部份是屬於小 樣本,樣本數低則會降低效果量與檢定力,因此 APA 出版手冊從第五版 開始就強烈建議於研究報告中,不管統計量是否達顯著,均頇列出效果 量,最新的第六版更進一步建議加上信賴區間的資料,以作為後續研究 者進行整合分析時之重要參考數據。而且,小樣本研究如果以傳統統計 方法進行分析時會面臨違反基本假設之疑慮;此外,重覆測量之教學或 實驗介入研究更有依變項測量會產生自相關的特性,以及常見的缺失值 所產生的非帄衡資料,這些都是傳統統計方法無法處理之議題。因此,

本研究擬採取傳統的 rm-ANOVA,以及現代的「自助法」和「線性混合 效果模式」之統計技術依序分析介入成效,除了進行交叉驗證,並探討 現代兩項統計技術在本研究的實施可行性之外,亦同時運用「自助法」

的統計特性,報告效果量及其 95%信賴區間等資訊,據以完整詮釋整體 教學介入之效果,以做為未來整合分析之參考依據,最後,運用「線性 混合效果模式」得以自由估計個別樣本的「截距」和「斜率」之特性,

探討 MLD 高危險群學童接受教學介入後,其成長速率是否存在顯著的 個別差異。