• 沒有找到結果。

遺失樣態對於 DIF 偵測效果的影響

第四章 研究結果與討論

第一節 遺失樣態對於 DIF 偵測效果的影響

本節的遺失樣態是包含遺失機制與遺失比率兩個變項,以回應本研究的第一 個研究問題:「不同的遺失樣態(遺失機制、遺失比率)是否會影響 DIF 偵測效 果?」。本節將針對遺失樣態來呈現研究結果,並討論之。其中,遺失機制包括完 全隨機遺失(MCAR)與三種類型的隨機遺失(MAR)。以下分別介紹各個遺失機 制的定義:MCAR 是自所有的作答反應隨機抽取遺失值;MAR I 是針對焦點組作 答反應隨機抽取遺失值;MAR II 是針對低能力者(PR<50)作答反應隨機抽取遺 失值;MAR III 則是針對高難度試題(PR>50 )作答反應隨機抽取遺失值。此外,

遺失比率分為無遺失、10%遺失與 30%遺失三種。以下將依 α 值與 power 值分別 呈現各組情境的 DIF 偵測結果,並在第三小節以二因子變異數分析來呈現遺失機 制與遺失比率兩個變項對於DIF 偵測結果的解釋力。

. α 值

(一) 各組人數為 500 人

表4-1-1 顯示各組人數為 500 人時,於不同遺失樣態下,以 MH 法與 Lord 法 偵測DIF 試題的 α 值。首先,從無遺失情境可發現,隨著 DIF 試題比率增高且 DIF 程度增強,α 值也有漸增。

在MAR I 的情境下,若使用 MH 法來偵測 DIF 試題,α 值會變得異常高。隨 著 DIF 試題比率增加與 DIF 程度增強,α 值會持續升高。此外,當遺失比率增加 到 30%時,其 α 值甚至會高達 1。MAR I 是隨機抽取焦點組的作答反應來產生遺 失情境,加上 MH 法是以測驗總分作為配對變項,若遺失比率為 10%時,相較於 參照組,焦點組便只有 90%的試題可以來計算能力,因此是在不同題數基準下進 行能力配對。相對地,Lord 法具有能力估計的不變性,即使總作答題數變少,仍 可進行正確的能力估計,故維持可接受的偵測效果。

若觀察其他的遺失情境,可以發現α 值會隨著 DIF 試題比率與 DIF 程度而增

高,特別是以Lord 法進行 DIF 偵測時,無 DIF 試題被誤判得更為明顯。但在無遺

基準差異更大,能力的配對與計算都更不準確,型一錯誤率也變得更高。各個條

值低於一般;而遺失比率為 30%時,因為幾乎所有題目都被判斷為 DIF 試題,因

較低。由於是針對所有作答反應隨機抽取遺失值,其遺失資料量是MAR 類遺失資

不同遺失機制下的 α 值有顯著差異。且遺失機制與遺失比率之間有交互作用

(𝐹 = 9.03,𝑝 < .001),表示必須進一步探究兩個變項之間的影響性。

由圖4-1-1 可看出,當遺失機制為 MAR I 時,除了 α 值高得異常外,其 α 值 會隨著遺失比率而增高。在MCAR、MAR II 與 MAR III 等遺失機制卻是相反的,

隨著遺失比率增高,誤判率會些微降低。此圖也顯示遺失比率高低對於 α 值的影 響性,MAR I 的差異最為明顯,其次是 MAR II,對於 MCAR 與 MAR III 的影響 則較小。相較於MAR I 與遺失比率的關係,在這三種遺失情境下,α 值受到遺失 比率的影響較輕微且平緩。

由於MH 法是以測驗總分作為配對變項,且 α 值較易受到樣本數多寡的影響,

因此在一般遺失情境下,當遺失比率增高時,使用 MH 法來偵測 DIF 試題的誤判 率會降低。然而,在MAR I 的遺失情境下,因為該遺失機制是針對焦點組的作答 反應隨機抽取遺失值,加上使用的DIF 方法是非 IRT 取向的 MH 法,兩組是在不 同的題數基準上進行能力配對與估計。且隨著遺失比率增加,能力的配對與估算 會更不準確,才導致較高的誤判情形。

除了MAR I 的 α 值與遺失比率的關係較為獨特外,其餘的 MCAR、MAR II 與MAR III 等遺失機制,三者的方向性一致且 α 值大小並無差異。由此可見,自 所有作答反應、低能力者或高難度試題隨機抽取遺失值,對於 α 值的影響並不明 顯。

圖4-1-1 在MH法時,不同遺失比率與遺失機制的α值

表4-1-6 是針對遺失機制與遺失比率進行二因子變異數分析的結果,依變項為

0   0.1   0.2   0.3   0.4   0.5   0.6   0.7   0.8   0.9   1  

0%   10%   30%  

α

MCAR   MAR  I   MAR  II   MAR  III   無遺失

DIF 試題的 α 值,是以 Lord 法進行分析。結果顯示兩個自變項的主要效果與交互 作用皆沒有達到顯著水準,表示遺失樣態本身對於 DIF 試題的誤判率是沒有解釋 力。由於Lord 法是 IRT 取向的 DIF 偵測方法,此法具有能力估計的不變性,因此 不像MH 法那樣容易受到遺失機制或遺失比率的影響。從圖 4-1-2 可看出,若使用 Lord 法作為 DIF 偵測方法時,對於無 DIF 試題的誤判機率而言,四種遺失機制之 間的差異不大。各個遺失機制受遺失比率影響的方向性一致,並無交互作用存在。

表4-1-6 在 Lord 法時,以 α 值為依變項的二因子變異數分析摘要表

變異來源 SS df MS F

遺失機制 (A) .00 3 .00 .03 遺失比率 (B) .00 1 .00 .19

A×B .00 3 .00 .00

誤差 .31 81 .00

圖4-1-2 在Lord法時,不同遺失比率與遺失機制的α值

表4-1-7 在 MH 法時,以 power 值為依變項的二因子變異數分析摘要表

變異來源 SS df MS F

遺失機制 (A) .23 3 .08 2.14 遺失比率 (B) .01 1 .01 .22 A×B 2.03 3 .68 19.33***

誤差 2.21 63 .04

***p < .001

表4-1-7 是針對遺失機制與遺失比率進行二因子變異數分析的結果,依變項為 正確偵測DIF 試題的比率,是以 MH 法作為 DIF 偵測方法。結果顯示遺失機制與 遺失比率的主要效果都沒有達到顯著水準,而兩個變項之間有交互作用存在

0   0.1   0.2   0.3   0.4   0.5   0.6   0.7   0.8   0.9   1  

0%   10%   30%  

α

MCAR   MAR  I   MAR  II   MAR  III   無遺失

(𝐹 = 19.328,𝑝 < .001),此時,更需要進一步討論遺失機制與遺失比率的關係,

以及二者對於power 值的影響作用。

圖 4-1-3 顯示各個遺失機制下,當遺失比率較高時,power 值會降低,唯獨 MAR I 的遺失情境是相反的結果。同上一節所述,於 MAR I 使用 MH 法來偵測 DIF 試題,且遺失比率為 10%時,其 power 值會低於一般;而遺失比率為 30%時,

power 值卻高於一般。

整體而言,MAR II 情境的 power 值最佳,其次則是 MAR III 的遺失情境,顯 示自低能力者或高難度試題隨機抽取遺失值,對於 DIF 偵測效果的影響是有差異 的。再次者為 MCAR,此遺失情境是針對所有作答反應隨機抽取遺失值,其遺失 資料量本來便是MAR II 與 MAR III 的兩倍,因此在同樣的遺失比率下,其遺失的 資料量較多,因此power 值較低。

另一方面,此圖顯示無論遺失比率高低,在MAR II 的遺失情境下,其 power 值最高。其次為MAR III 的遺失情境,再次者為 MCAR。MCAR 此遺失情境是針 對所有作答反應隨機抽取遺失值,其遺失資料量是MAR II 與 MAR III 的兩倍,因 此在同樣的遺失比率下,其遺失的料量較多,因此power 值較低。

圖 4-1-3 在 MH 法時,不同遺失比率與遺失機制的 power 值

表4-1-8 是針對遺失機制與遺失比率進行二因子變異數分析的結果,依變項為 正確判斷DIF 試題的比率,是以 Lord 法來分析。結果顯示兩個自變項的主要效果 與交互作用皆沒有達到顯著水準,表示遺失樣態對於正確判斷 DIF 試題的比率無 解釋力。由於Lord 法具有能力估計的不變性,因此不如 MH 法那般受到遺失機制

0   0.1   0.2   0.3   0.4   0.5   0.6   0.7   0.8   0.9   1  

0%   10%   30%  

power

MCAR   MAR  I   MAR  II   MAR  III   無遺失

或遺失比率的影響。從圖 4-1-4 可看出,若使用 Lord 法作為 DIF 偵測方法時,對 於 DIF 試題的正確偵測率而言,四種遺失機制之間的差異不大。隨著遺失比率的 增加,各種遺失機制的power 值僅略微降低。

表4-1-8 在 Lord 法時,以 power 值為依變項的二因子變異數分析摘要表

圖4-1-4 在 Lord 法時,不同遺失比率與遺失機制的 power 值