• 沒有找到結果。

第二章 文獻探討

第二節 差異試題功能

第二章 文獻探討

第一節 測量恆等性

Drasgow (1984 )提出當一份測驗工具的觀測變項與其所要測量潛在變項之間 的關係在相比較的各樣本群體間相等的時候,則此測驗工具便具有測量恆等性。

也就是說當來自不同群體但具有相同潛在變項能力程度的受試者,其在觀測分數 上的表現也應該要一致。舉例來說:當研究者施測一份數學測驗,其中有二位數 學能力相同但背景(如性別、種族、社經地位等)不同的受試者,他們在這份測 驗題目上的得分表現應該要一致。如果表現不一致,表示該題目會受到不同背景 變數的影響,而不是單純的只受到數學能力影響。這時該題目便不具有測量恆等 性。

當研究者的研究結果發現在不同的樣本群體有顯著差異,其推論會因為測驗 工具是否具有測量恆等性而受到影響。也就是說,當所採用測驗工具具有測量恆 等性時,在進行不同樣本群體比較時,便能在同一測量尺度上進行比較,所得到 的結果也較正確。檢測測量工具是否具有測量恆等性的方法很多。其中如試題反 應理論、結構方程模式等方法均可用來檢測。因此,各國的心理學家非常強調測 量恆等性的重要,並以此做為群體間有意義比較的必要條件(Drasgow, 1984; Raju, Laffitte, & Byrne, 2002; Reise, Widaman, & Pugh, 1993; Vandenberg, 2002;

Vandenberg & Lance, 2000)。

第二節 差異試題功能

差異試題功能是指當兩群體的能力值建立在同一個共同量尺上,能力相同但 隸屬於不同群體,在作答同一道試題答對的機率有所差異時,則可稱該道試題具 有 DIF(Camilli & Shepard, 1994; Drasgow & Kang, 1984; Holland & Wainer 1993;

8

Lord, 1980)。

試題反應理論(IRT)提供一個研究 DIF 的架構,因為試題反應函數可以說明答 對某個試題的機率,是與受試者的潛在能力和試題的潛在特徵有某種關聯存在。

因此,DIF 的定義可以被寫成下列的操作型定義:「某個試題特徵函數如果對不同 的族群而言都不相同的話,則該試題便顯現出 DIF;反之,如果跨越不同族群的 試題特徵函數都相同的話,則該試題便不具有 DIF」(Embretson & Reise, 2000),

若因能力不同所造成的表現差異,未必是真正的 DIF 現象,只能稱作平均能力的 差異。

在 IRT 的理論當中,假設各試題皆具有樣本獨立(sample independent)的特 性,亦即試題的參數並不受到受試者能力值分布的影響,即便不同群體的受試者 作答時所估計得到參數不同,主要乃是抽樣誤差造成。然而,在排除掉平均能力 的差異之後,若是同一道試題對於分屬於不同群體的受試者,所估計出來的參數 卻明顯不同時,此便可稱試題具有 DIF 現象。

若在一份測驗中含有大量的 DIF 試題,則此測驗將會測到群體中額外的構 念,而非測驗所要測到的真正構念。也就是這份測驗對兩群體而言並不具備單向 性(unidimensionality),也沒有測到兩群體所要測量的向度 (Holland & Wainer, 1993)。既然這份測驗測量到兩群體不同的能力,在測驗分數解釋上對兩群體而言 也具備了不同的意義,因此測驗的信度和效度也同時受到質疑。為了確保測驗的 信度和效度,美國心理協會(American Psychological Association, APA)和國際測 驗機構(International Test Commission, ITC)同時強調 DIF 檢核的重要性(Cole &

Zieky, 2001)。

差異試題功能依據其特性可分為「一致性差異試題功能」(uniform DIF)和

「非一致性差異試題功能」(nonuniform DIF)兩種類型(Mellenberg, 1982)。在 DIF 的檢核,主要在檢測試題對於不同群體的受試者是否公平,若以兩個群體為

9

例,我們可將受試群體分為參照群體(reference group)和焦點群體(focal group)。 通常,參照群體為主要團體,焦點群體為次要團體。

對於所有能力值的受試者,某一待檢核試題(studied item)在參照群體和焦 點群體答對試題機率的差值,呈現一致的變化趨勢,則可稱此試題具有「一致性 差異試題功能」,如圖 1,參照群體和焦點群體的試題特徵曲線大致呈現平行,且 該試題對於不同能力量尺的受試者皆有利於參照群體。

圖 1 一致性差異試題功能

假若兩群體的試題特徵曲線有差異,且在不同能力區間,兩個群體的答對試 題機率的差值,不是呈現一致性的變化趨勢,意即兩群體的答對機率差異會隨能 力值的改變而不同,則可稱此試題具有「非一致性差異試題功能」。如圖 2,在高 能力量尺部分,該試題有利於參照組;在低能力量尺部分,該試題反而有利於焦 點組。

10

圖 2 非一致性差異試題功能

相關文件