遺失樣態對於 DIF 偵測效果的影響

第四章研究結果與討論

第一節遺失樣態對於 DIF 偵測效果的影響

本節的遺失樣態是包含遺失機制與遺失比率兩個變項，以回應本研究的第一個研究問題：「不同的遺失樣態（遺失機制、遺失比率）是否會影響 DIF 偵測效果？」。本節將針對遺失樣態來呈現研究結果，並討論之。其中，遺失機制包括完全隨機遺失（MCAR）與三種類型的隨機遺失（MAR）。以下分別介紹各個遺失機制的定義：MCAR 是自所有的作答反應隨機抽取遺失值；MAR I 是針對焦點組作答反應隨機抽取遺失值；MAR II 是針對低能力者（PR<50）作答反應隨機抽取遺失值；MAR III 則是針對高難度試題（PR>50 ）作答反應隨機抽取遺失值。此外，

遺失比率分為無遺失、10%遺失與 30%遺失三種。以下將依 α 值與 power 值分別呈現各組情境的 DIF 偵測結果，並在第三小節以二因子變異數分析來呈現遺失機制與遺失比率兩個變項對於DIF 偵測結果的解釋力。

一. α 值

（一）各組人數為 500 人

表4-1-1 顯示各組人數為 500 人時，於不同遺失樣態下，以 MH 法與 Lord 法偵測DIF 試題的 α 值。首先，從無遺失情境可發現，隨著 DIF 試題比率增高且 DIF 程度增強，α 值也有漸增。

在MAR I 的情境下，若使用 MH 法來偵測 DIF 試題，α 值會變得異常高。隨著 DIF 試題比率增加與 DIF 程度增強，α 值會持續升高。此外，當遺失比率增加到 30%時，其 α 值甚至會高達 1。MAR I 是隨機抽取焦點組的作答反應來產生遺失情境，加上 MH 法是以測驗總分作為配對變項，若遺失比率為 10%時，相較於參照組，焦點組便只有 90%的試題可以來計算能力，因此是在不同題數基準下進行能力配對。相對地，Lord 法具有能力估計的不變性，即使總作答題數變少，仍可進行正確的能力估計，故維持可接受的偵測效果。

若觀察其他的遺失情境，可以發現α 值會隨著 DIF 試題比率與 DIF 程度而增

高，特別是以Lord 法進行 DIF 偵測時，無 DIF 試題被誤判得更為明顯。但在無遺

基準差異更大，能力的配對與計算都更不準確，型一錯誤率也變得更高。各個條

值低於一般；而遺失比率為 30%時，因為幾乎所有題目都被判斷為 DIF 試題，因

較低。由於是針對所有作答反應隨機抽取遺失值，其遺失資料量是MAR 類遺失資

不同遺失機制下的 α 值有顯著差異。且遺失機制與遺失比率之間有交互作用

（𝐹 = 9.03，𝑝 < .001），表示必須進一步探究兩個變項之間的影響性。

由圖4-1-1 可看出，當遺失機制為 MAR I 時，除了 α 值高得異常外，其 α 值會隨著遺失比率而增高。在MCAR、MAR II 與 MAR III 等遺失機制卻是相反的，

隨著遺失比率增高，誤判率會些微降低。此圖也顯示遺失比率高低對於 α 值的影響性，MAR I 的差異最為明顯，其次是 MAR II，對於 MCAR 與 MAR III 的影響則較小。相較於MAR I 與遺失比率的關係，在這三種遺失情境下，α 值受到遺失比率的影響較輕微且平緩。

由於MH 法是以測驗總分作為配對變項，且 α 值較易受到樣本數多寡的影響，

因此在一般遺失情境下，當遺失比率增高時，使用 MH 法來偵測 DIF 試題的誤判率會降低。然而，在MAR I 的遺失情境下，因為該遺失機制是針對焦點組的作答反應隨機抽取遺失值，加上使用的DIF 方法是非 IRT 取向的 MH 法，兩組是在不同的題數基準上進行能力配對與估計。且隨著遺失比率增加，能力的配對與估算會更不準確，才導致較高的誤判情形。

除了MAR I 的 α 值與遺失比率的關係較為獨特外，其餘的 MCAR、MAR II 與MAR III 等遺失機制，三者的方向性一致且 α 值大小並無差異。由此可見，自所有作答反應、低能力者或高難度試題隨機抽取遺失值，對於 α 值的影響並不明顯。

圖4-1-1 在MH法時，不同遺失比率與遺失機制的α值

表4-1-6 是針對遺失機制與遺失比率進行二因子變異數分析的結果，依變項為

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

0% 10% 30%

α值

MCAR MAR I MAR II MAR III 無遺失

DIF 試題的 α 值，是以 Lord 法進行分析。結果顯示兩個自變項的主要效果與交互作用皆沒有達到顯著水準，表示遺失樣態本身對於 DIF 試題的誤判率是沒有解釋力。由於Lord 法是 IRT 取向的 DIF 偵測方法，此法具有能力估計的不變性，因此不像MH 法那樣容易受到遺失機制或遺失比率的影響。從圖 4-1-2 可看出，若使用 Lord 法作為 DIF 偵測方法時，對於無 DIF 試題的誤判機率而言，四種遺失機制之間的差異不大。各個遺失機制受遺失比率影響的方向性一致，並無交互作用存在。

表4-1-6 在 Lord 法時，以 α 值為依變項的二因子變異數分析摘要表

變異來源 SS df MS F

遺失機制 (A) .00 3 .00 .03 遺失比率 (B) .00 1 .00 .19

A×B .00 3 .00 .00

誤差 .31 81 .00

圖4-1-2 在Lord法時，不同遺失比率與遺失機制的α值

表4-1-7 在 MH 法時，以 power 值為依變項的二因子變異數分析摘要表

變異來源 SS df MS F

遺失機制 (A) .23 3 .08 2.14 遺失比率 (B) .01 1 .01 .22 A×B 2.03 3 .68 19.33^***

誤差 2.21 63 .04

***p < .001

表4-1-7 是針對遺失機制與遺失比率進行二因子變異數分析的結果，依變項為正確偵測DIF 試題的比率，是以 MH 法作為 DIF 偵測方法。結果顯示遺失機制與遺失比率的主要效果都沒有達到顯著水準，而兩個變項之間有交互作用存在

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

0% 10% 30%

α值

MCAR MAR I MAR II MAR III 無遺失

（𝐹 = 19.328，𝑝 < .001），此時，更需要進一步討論遺失機制與遺失比率的關係，

以及二者對於power 值的影響作用。

圖 4-1-3 顯示各個遺失機制下，當遺失比率較高時，power 值會降低，唯獨 MAR I 的遺失情境是相反的結果。同上一節所述，於 MAR I 使用 MH 法來偵測 DIF 試題，且遺失比率為 10%時，其 power 值會低於一般；而遺失比率為 30%時，

power 值卻高於一般。

整體而言，MAR II 情境的 power 值最佳，其次則是 MAR III 的遺失情境，顯示自低能力者或高難度試題隨機抽取遺失值，對於 DIF 偵測效果的影響是有差異的。再次者為 MCAR，此遺失情境是針對所有作答反應隨機抽取遺失值，其遺失資料量本來便是MAR II 與 MAR III 的兩倍，因此在同樣的遺失比率下，其遺失的資料量較多，因此power 值較低。

另一方面，此圖顯示無論遺失比率高低，在MAR II 的遺失情境下，其 power 值最高。其次為MAR III 的遺失情境，再次者為 MCAR。MCAR 此遺失情境是針對所有作答反應隨機抽取遺失值，其遺失資料量是MAR II 與 MAR III 的兩倍，因此在同樣的遺失比率下，其遺失的料量較多，因此power 值較低。

圖 4-1-3 在 MH 法時，不同遺失比率與遺失機制的 power 值

表4-1-8 是針對遺失機制與遺失比率進行二因子變異數分析的結果，依變項為正確判斷DIF 試題的比率，是以 Lord 法來分析。結果顯示兩個自變項的主要效果與交互作用皆沒有達到顯著水準，表示遺失樣態對於正確判斷 DIF 試題的比率無解釋力。由於Lord 法具有能力估計的不變性，因此不如 MH 法那般受到遺失機制

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

0% 10% 30%

power值

MCAR MAR I MAR II MAR III 無遺失

或遺失比率的影響。從圖 4-1-4 可看出，若使用 Lord 法作為 DIF 偵測方法時，對於 DIF 試題的正確偵測率而言，四種遺失機制之間的差異不大。隨著遺失比率的增加，各種遺失機制的power 值僅略微降低。

表4-1-8 在 Lord 法時，以 power 值為依變項的二因子變異數分析摘要表

圖4-1-4 在 Lord 法時，不同遺失比率與遺失機制的 power 值

在文檔中不同資料遺失樣態對於差異試題功能偵測效果之影響 (頁 35-43)

第四章 研究結果與討論

第一節 遺失樣態對於 DIF 偵測效果的影響

第四章研究結果與討論

第一節遺失樣態對於 DIF 偵測效果的影響