差異試題功能

第二章文獻探討

第二節差異試題功能

第二章文獻探討

第一節測量恆等性

Drasgow (1984 )提出當一份測驗工具的觀測變項與其所要測量潛在變項之間的關係在相比較的各樣本群體間相等的時候，則此測驗工具便具有測量恆等性。

也就是說當來自不同群體但具有相同潛在變項能力程度的受試者，其在觀測分數上的表現也應該要一致。舉例來說：當研究者施測一份數學測驗，其中有二位數學能力相同但背景（如性別、種族、社經地位等）不同的受試者，他們在這份測驗題目上的得分表現應該要一致。如果表現不一致，表示該題目會受到不同背景變數的影響，而不是單純的只受到數學能力影響。這時該題目便不具有測量恆等性。

當研究者的研究結果發現在不同的樣本群體有顯著差異，其推論會因為測驗工具是否具有測量恆等性而受到影響。也就是說，當所採用測驗工具具有測量恆等性時，在進行不同樣本群體比較時，便能在同一測量尺度上進行比較，所得到的結果也較正確。檢測測量工具是否具有測量恆等性的方法很多。其中如試題反應理論、結構方程模式等方法均可用來檢測。因此，各國的心理學家非常強調測量恆等性的重要，並以此做為群體間有意義比較的必要條件（Drasgow, 1984; Raju, Laffitte, & Byrne, 2002; Reise, Widaman, & Pugh, 1993; Vandenberg, 2002;

Vandenberg & Lance, 2000）。

第二節差異試題功能

差異試題功能是指當兩群體的能力值建立在同一個共同量尺上，能力相同但隸屬於不同群體，在作答同一道試題答對的機率有所差異時，則可稱該道試題具有 DIF（Camilli & Shepard, 1994; Drasgow & Kang, 1984; Holland & Wainer 1993;

Lord, 1980）。

試題反應理論(IRT)提供一個研究 DIF 的架構，因為試題反應函數可以說明答對某個試題的機率，是與受試者的潛在能力和試題的潛在特徵有某種關聯存在。

因此，DIF 的定義可以被寫成下列的操作型定義：「某個試題特徵函數如果對不同的族群而言都不相同的話，則該試題便顯現出 DIF；反之，如果跨越不同族群的試題特徵函數都相同的話，則該試題便不具有 DIF」(Embretson & Reise, 2000)，

若因能力不同所造成的表現差異，未必是真正的 DIF 現象，只能稱作平均能力的差異。

在 IRT 的理論當中，假設各試題皆具有樣本獨立（sample independent）的特性，亦即試題的參數並不受到受試者能力值分布的影響，即便不同群體的受試者作答時所估計得到參數不同，主要乃是抽樣誤差造成。然而，在排除掉平均能力的差異之後，若是同一道試題對於分屬於不同群體的受試者，所估計出來的參數卻明顯不同時，此便可稱試題具有 DIF 現象。

若在一份測驗中含有大量的 DIF 試題，則此測驗將會測到群體中額外的構念，而非測驗所要測到的真正構念。也就是這份測驗對兩群體而言並不具備單向性（unidimensionality），也沒有測到兩群體所要測量的向度 (Holland & Wainer, 1993)。既然這份測驗測量到兩群體不同的能力，在測驗分數解釋上對兩群體而言也具備了不同的意義，因此測驗的信度和效度也同時受到質疑。為了確保測驗的信度和效度，美國心理協會（American Psychological Association, APA）和國際測驗機構（International Test Commission, ITC）同時強調 DIF 檢核的重要性(Cole &

Zieky, 2001)。

差異試題功能依據其特性可分為「一致性差異試題功能」（uniform DIF）和

「非一致性差異試題功能」（nonuniform DIF）兩種類型（Mellenberg, 1982）。在 DIF 的檢核，主要在檢測試題對於不同群體的受試者是否公平，若以兩個群體為

例，我們可將受試群體分為參照群體（reference group）和焦點群體（focal group）。通常，參照群體為主要團體，焦點群體為次要團體。

對於所有能力值的受試者，某一待檢核試題（studied item）在參照群體和焦點群體答對試題機率的差值，呈現一致的變化趨勢，則可稱此試題具有「一致性差異試題功能」，如圖 1，參照群體和焦點群體的試題特徵曲線大致呈現平行，且該試題對於不同能力量尺的受試者皆有利於參照群體。

圖 1 一致性差異試題功能

假若兩群體的試題特徵曲線有差異，且在不同能力區間，兩個群體的答對試題機率的差值，不是呈現一致性的變化趨勢，意即兩群體的答對機率差異會隨能力值的改變而不同，則可稱此試題具有「非一致性差異試題功能」。如圖 2，在高能力量尺部分，該試題有利於參照組；在低能力量尺部分，該試題反而有利於焦點組。

圖 2 非一致性差異試題功能

在文檔中平均數及共變數結構法在多分題上的DIF檢核效果 (頁 13-16)

第二章 文獻探討

第二節 差異試題功能

第二章 文獻探討

第一節 測量恆等性

第二節 差異試題功能

第二章文獻探討

第二節差異試題功能

第二章文獻探討

第一節測量恆等性

第二節差異試題功能