• 沒有找到結果。

第四章 研究結果與討論

第四節 可能缺失之分析

研究者參考指導教授許良榮博士近年來之科學教育類論文審查意見後,

自行設計「量化研究可能缺失檢核表」。其中將論文中可能發生的缺失分為「一 致性」、「精確性」、「客觀性」、「完備性」、「公開性」五類,若相似缺失出現 於樣本論文中達三篇以上,則再增列項次進行統計,三篇以下的缺失則列於 各類「其它可能缺失」加以統計。針對135篇樣本論文為時半年之久進行逐篇 之內容分析,在剔除一篇無效論文樣本後,134篇介於2001年至2003年的量化 科學教育碩士論文其可能缺失的檢核統計結果於本節分類說明並加以討論。

一、一致性缺失

列項進行統計的「一致性」可能缺失其編號與項目如下:

A01.統計考驗之第一類型錯誤概率(α值)設定不一致。

A02.P 值寫法不統一;例如 P<.05 又 P<0.05。

A03.所得數據的有效位數沒有一致。

A04.施測樣本數與總和樣本數(自由度總和)不一致。

A05.其它一致性缺失。

統計檢核結果發現在134篇有效樣本論文中,編號「A01」之缺失共出現 33篇,佔樣本論文總數的24.6%,居此類缺失中的第一位。編號「A02」之缺 失共出現11篇,佔樣本論文總數的8.2%。編號「A03」之缺失共出現28篇,

佔樣本論文總數的20.9%,居此類缺失中的第二位。編號「A04」之缺失共出 現13篇,佔樣本論文總數的9.7%,居此類缺失中的第三位。編號「A05」之 其它一致性缺失共出現3篇佔,樣本論文總數的2.2%。總計本類「一致性缺 失」共出現88次佔論文樣本檢核總數670次(134×5)的13.1%。詳如下表4-4-1 與圖4-4-1。

表4-4-1 一致性缺失檢核結果統計表

項次編號 出現次數 所佔比例(%) 排序

A01 33 24.6 1

A02 11 8.2 4

A03 28 20.9 2

A04 13 9.7 3

A05 3 2.2 5

總計 88 13.1

24.6%

8.2%

20.9%

9.7%

2.2%

0%

5%

10%

15%

20%

25%

30%

A01 A02 A03 A04 A05

一致性缺失編號 百分比

圖4-4-1 一致性缺失統計結果之百分比長條圖

在本類一致性缺失的統計結果中,最常見的是統計考驗之第一類型錯誤 概率(α值)設定不一致(項次編號A01),達總有效樣本數的24.6%。筆者 發現樣本論文對於第一類型錯誤概率(α值)的顯著水準設定,雖然通常以 SPSS 軟 體 所 預 設 .05 為 顯 著 水 準 。 但 是 在 呈 現 統 計 考 驗 結 果 時 , 若 達

到.01、.005或更小的顯著水準時,犯此項缺失的論文作者對結果的敘述就會 呈現上述更小的顯著水準,而造成量化研究論文α值設定不一致的情形發 生。我國的教育統計學者林清山(1992),在其著作「心理與教育統計學」中

(p.236),曾說明在進行假設考驗時第一類型錯誤之概率(α值),若設定不 一致是不切實際且不夠嚴謹的。理由是:第一、顯著水準一旦在實驗觀察前 決定好,就不宜再變更;因為,如果在實驗觀察後變更它,何必在實驗觀察 前就決定它呢?第二、在利用一定樣本大小的一次實驗觀察之後,已不可能 再增加樣本(N)的大小。如果要再做第二次重複的實驗觀察,而用較多的樣 本人數,則結果不一定與前次一樣,結果也不一定更加如意,則到底那一次 的結果比較接近真實?要採用哪一次所得的結果呢?

居第二位的「所得數據的有效位數沒有一致」(項次編號A03),也許有人 認為當統計結果是整數時,小數點被省略並不影響數據大小因此並不是什麼 大問題。不過筆者認為畢竟學術論文有其嚴謹性上的要求,一篇研究論文在 寫作時是否嚴謹,便可以從此處看出端倪。至於位居第三位項次編號A04的「施 測樣本數與總和樣本數(自由度總和)不一致」,筆者認為在研究資料進行統 計時,因為科學教育研究有其針對人而非針對物;也就有社會科學研究上的 難度與複雜性,因此一些遺漏值的發生在所難免。只是身為一位學術研究者 應當對遺漏值的發生原因或實際進行統計的樣本數說明清楚,如果在論文內 容中,若發生統計結果上的自由度總和與施測樣本數不一致,而又不說明原 因,那麼其研究過程是否夠周延和嚴謹,以及研究者是否誠實的呈現真實研 究情境和結果等,就不禁令人懷疑而有可議之處了。

二、精確性缺失

列項進行統計的「精確性」可能缺失其編號與項目如下:

B01.變量種類區分錯誤。

B02.分量表的第一類型錯誤(α值)產生累積。

B03.使用「顯著差異」之描述,但未進行統計考驗。

B04.對考驗結果之解釋非為二分法。

B05.相關係數之 r 值,未考慮樣本數(N)的多寡,而比較其大小。

B06.信度考驗方法不當。

B07.使用不適切的考驗方法。

B08.對於信、效度的區別不當。

B09.使用卡方檢定理論次數太小時,沒有進行相關校正。

B10.信度考驗方法敘述錯誤。

B11.虛無假說敘述錯誤,用統計考驗須拒絕而非證實虛無假說。

B12.只有兩組的變異數分析,卻進行事後比較。

B13.其它精確性缺失。

依134篇有效論文的各檢核表進行統計後發現,編號「B01」之缺失僅出 現1篇,佔有效樣本總數的0.7%。編號「B02」之缺失共出現達54篇,佔有效 樣本總數的40.3%;為此類缺失之首位。編號「B03」之缺失共出現38篇,佔 有效樣本總數的28.4%;居此類缺失第二位。編號「B04」之缺失共出現10 篇,佔有效樣本總數的7.5%。編號「B05」之缺失共出現2篇,佔有效樣本總 數的1.5%。編號「B06」之缺失共出現12篇,佔有效樣本總數的9.0%。編號

「B07」之缺失也共出現12篇,同樣佔有效樣本總數的9.0%。編號「B08」之 缺失共出現2篇,佔有效樣本總數的1.5%。編號「B09」之缺失也是共出現2 篇,佔有效樣本總數的1.5%。編號「B10」之缺失共出現38篇,佔有效樣本 總數的28.4%;與編號「B03」之缺失同居第二位。編號「B11」之缺失共出 現16篇,佔樣本總數的11.9%。新增列的編號「B12」之缺失共出現4篇,佔 樣本總數的3.0%。編號「B13」的其它精確性缺失共出現9篇,佔有效樣本總 數的6.7%。總計本類「精確性缺失」共出現200次佔論文樣本檢核總數1742

次(134×13)的11.5%。詳如下表4-4-2與圖4-4-2。

表4-4-2 精確性缺失檢核結果統計表

項次編號 出現次數 所佔比例(%) 排序

B01 1 0.7 13

B02 54 40.3 1

B03 38 28.4 2

B04 10 7.5 7

B05 2 1.5 10

B06 12 9.0 5

B07 12 9.0 5

B08 2 1.5 10

B09 2 1.5 10

B10 38 28.4 2

B11 16 11.9 4

B12 4 3.0 9

B13 9 6.7 8

總計 200 11.5

0.7%

B01 B02 B03 B04 B05 B06 B07 B08 B09 B10 B11 B12 B13 精確性缺失編號 考驗時,根據 Keppel(1991)指出分量表累積可能犯 TypeⅠerror 之機率將 增加為:

因此為了使 TypeⅠerror 低於.05,假若進行八個層面的顯著性考驗,應 將八個層面之顯著性分析的臨界值提高為:

αEW=1-(1-α)8 <.05 即(1-α)8 >.95 α<.006

亦即α值小於.006 時才拒絕虛無假說(p<.05),換句話說 t 值或 F 值 的顯著性必須 p 值小於.006 才能拒絕虛無假說。但是在本研究的 134 篇有效 樣本論文中,竟有高達 54 篇量化科學教育碩士學位論文,出現此項缺失之比 例高達 40.3%。為維持國內科學教育研究的水準,國內的科學教育研究者與 各師範院校的科學教育相關研究單位,實應注意此項缺失;避免研究結果失 真,而喪失學術研究論文應有的精確性。

精確性可能缺失統計,為居第二位的是編號「B03」:使用「顯著差異」

之描述,卻未進行統計考驗。此項缺失經常出現於論文對於描述性統計的結 果敘述中。例如:由統計結果可看出 A 項結果「明顯」高於 B 項。量化研究 者應知,在統計上若要作出某測量數據顯著高於另一測量數據,必須要進行 統計考驗;才能精確的依考驗結果下此宣稱。以男女生自然成就測驗為例:

若沒有交待單單只是以平均分數作比較,而宣稱男生的自然能力明顯高於女 生。依統計學的基本原則思考,要是表現男女生分數離散情形的「變異量數」

(標準差)不同,縱然平均分數上男生高於女生,統計考驗結果也有可能出 現沒有顯著差異的結果。因此,若要使用「顯著差異」的敘述,應該進行必 要的統計考驗,依照數據結果才能精確的下此宣稱。

與編號「B03」缺失同居第二位的是編號「B10」項缺失:信度考驗方法 敘述錯誤。在 38 篇有此項缺失的論文中,有 37 篇所出現的情形是將成就測 驗的信度考驗係數「庫李信度」,誤述為態度量表所使用的 Cronbach α 信度 係數。雖然在 SPSS 軟體中,信度分析只有 Alpha 值的模式選項;但是在其

信度分析-統計量的輔助說明中,明白指出軟體所指的 Alpha 值對二分資料 而言,已轉換為 Kuder-Richardson 20 (KR20) 係數。研究者應該敘述成就 測驗的信度係數為庫李係數才比較適切。相信這也應是一篇精確嚴謹的研究 論文所應注意的。

三、客觀性缺失

列項進行統計的「客觀性」可能缺失其編號與項目如下:

C01.使用主觀敘述。

C02.對態度量表所得結果,使用優劣、好壞之主觀評判。

C03.對統計結果之相關,解釋為有因果關係。

C04.使用「證實」字眼用以描述「拒絕虛無假說」。

C05.將統計考驗結果「沒有顯著差異」解釋為「一致」。

C06.不認同統計考驗的結果,主觀敘述研究成果。

C07.其它客觀性缺失。

統計檢核表後發現在 134 篇有效樣本論文中,編號「C01」之缺失共出現 54 篇,佔樣本論文總數的 40.3%,居此類缺失中的第一位。編號「C02」之 缺失共出現 15 篇,佔樣本論文總數的 11.2%,居此類缺失中的第三位。編 號「C03」之缺失共出現 4 篇,佔樣本論文總數的 3.0%。編號「C04」之缺 失也是出現 4 篇,佔樣本論文總數的 3.0%。編號「C05」之缺失共出現 25 篇,佔樣本論文總數的 18.4%,居此類缺失中的第二位。編號「C06」之缺 失共出現 8 篇,佔樣本論文總數的 6.0%。編號「C07」之其它客觀性缺失則 未出現。總計本類「客觀缺失」共出現 110 次佔論文樣本檢核總數 938 次(134

×7)的 11.7%。詳如下表 4-4-3 與圖 4-4-3。

表 4-4-3 客觀性缺失檢核結果統計表

C01 C02 C03 C04 C05 C06 C07

客觀性缺失編號 百分比

圖 4-4-3 客觀性缺失統計結果之百分比長條圖

在此類客觀性缺失中,最常見的便是論文內容中沒有說明統計數據就貿 然使用主觀敘述,例如「大多數」、「絕大多數」等等;佔樣本論文總數高達 40.3%。以上述的例子來說「多數」、「大多數」或「絕大多數」此類程度用 詞,其程度上的分界標準到底為何,相信是人人說法不一而模糊不清的。因 此,若非得要使用不可,也應該在文句敘述中將統計數據交待出來,好讓讀 者能有比較的依據以方便判定「多數」、「大多數」或「絕大多數」在這此篇

在此類客觀性缺失中,最常見的便是論文內容中沒有說明統計數據就貿 然使用主觀敘述,例如「大多數」、「絕大多數」等等;佔樣本論文總數高達 40.3%。以上述的例子來說「多數」、「大多數」或「絕大多數」此類程度用 詞,其程度上的分界標準到底為何,相信是人人說法不一而模糊不清的。因 此,若非得要使用不可,也應該在文句敘述中將統計數據交待出來,好讓讀 者能有比較的依據以方便判定「多數」、「大多數」或「絕大多數」在這此篇