試題反應理論

第二章文獻探討

第二節試題反應理論

測驗理論 (test theory) 是一種解釋測驗資料間實證關係 (empirical relationships) 之有系統的理論。測驗理論學者通常將之劃分成二大學派：一為古典測驗理論 (classical test theory, 簡稱 CTT) —主要是以真實分數模式 (true score model) 為骨幹；另一為當代測驗理論 (modern test theory) —主要是以試題反應理論 (item response theory, 簡稱 IRT) 為架構 (余民寧，1991)。

古典測驗理論依據弱勢假設 (weak assumption) 而來，採用的計算公式淺顯易懂，適用於大部分的教育與心理測驗資料，以及社會科學資料的分析。然而，古典測驗理論具有諸項先天上的缺失 (王寶墉，1995；Guion & Ironson, 1983;

Hambleton & Swaminathan, 1985)，如：抽樣變動大、能力難比較、複本 (parallel forms) 難實施、缺乏預測力、等測量標準誤 (standard error of measurement)、忽略受試者的試題反應組型 (item response pattern) 等。為了克服古典測驗理論的缺失，因此才有試題反應理論的誕生。

試題反應理論係依據強勢假設 (strong assumption) 而來，是一立論與假設均屬合理且嚴謹的學說。有關試題反應理論的重點，茲說明如下：

壹、基本概念

試題反應理論建立在兩個基本概念上 (余民寧，1992a)：

一、考生 (examinee) 在某一測驗試題上的表現情形，可由一組因素來加以預測或解釋，這組因素叫作潛在特質 (latent trait) 或能力 (ability)。

二、考生的表現情形與這組潛在特質間的關係，可透過一條連續性遞增的函數來加以詮釋，這個函數叫作試題特徵曲線 (item characteristic curve, 簡稱 ICC)。試題特徵曲線即是某種潛在特質的程度與其在某一試題上正確反應的機率，兩者之間的關係。這種潛在特質的程度越高，即代表考生在某一試題上的正確反應機率也越大。

貳、基本假設

試題反應理論具有下列幾項基本假設，只有在這些假設都成立的前提下，試題反應模式才能用來分析所有的測驗資料 (余民寧，1992a；Embretson & Reise, 2000; Hambleton & Swaminathan, 1985)：

一、單向度 (unidimensionality)

所謂單向度的假設是指測驗中的各個試題都測量到同一種共同的能力或潛在特質，然而實際的測驗情境裡，考生在測驗上的表現情形也會被其他因素如：

成就動機、答題技巧、人格特質等影響。因此，試題反應理論中對測驗必須具有單向度因素的基本看法，認為只要該測驗具有能夠影響測驗結果的一個「主要成分或因素」 (dominant component or factor)，即符合單向度假設的基本要求。

二、局部獨立性 (local independence)

當影響測驗表現的能力被固定不變時，考生在任何一道試題上的反應，以統計學而言是獨立的；換言之，在考慮考生的能力因素後，考生在不同試題上的反應間沒有任何關係存在。

三、非速度測驗 (non-speeded test)

測驗的實施不是在速度限制的情況下完成的；換言之，考生的答題表現，是由於自身能力所決定，而不是由於時間因素所造成。

四、知道—正確假設 (know-correct assumption)

若考生知道某一試題的正確答案，他必然會答對該試題；換言之，考生不會發生知道某一試題的答案，卻故意答錯或不作答的情況。

參、基本的試題反應模式

試題特徵曲線是用來描述測驗所欲測量的潛在特質，與其在試題上正確反應

存在，亦即每一種試題反應模式都是用來描述特質與正確反應機率間的關係。常用的試題反應模式有三種，每一種模式都依其所採用的試題參數之數目多寡來命名，都僅適用於二元化 (即正確反應者登錄為 1，錯誤反應者登錄為 0 的資料) 的反應模式 (余民寧，1992b)。

三種常用的試題反應模式如下：

一、單參數對數模式 (one-parameter logistic model, 簡稱 1-PL)

( )

₍ ₎

i e

P ₋ ₋

= + _θ θ 1

1 ⁱ⁼¹^,²^,³^,_L^,ⁿ (公式 2-2-1)

在公式2-2-1 中，P_i

( )

θ 表示能力值為θ的考生答對試題i的機率；bi表示試題i 的難度參數；^e表示以2.718 為底的指數；ⁿ表示測驗的試題總數。

在單參數對數模式中，只有一個試題參數，即難度參數bi。當考生的能力值大於試題ⁱ的難度參數時 (即θ ⁻bi ^>⁰)，答對機率P_i

( )

θ 大於.5；當考生的能力值與試題i的難度參數相等時 (即θ⁻bi ⁼⁰)，答對機率P_i

( )

θ 等於.5；當考生的能力值小於試題ⁱ的難度參數時 (即θ ⁻bi ^<⁰)，答對機率P_i

( )

θ 小於.5。換言之，想要答對越困難的試題時，考生所須具備的能力值也要越高。

理論上，b值的大小介於±∞之間，但實際應用上，通常只取±2之間的範圍。

b值越大表示試題越困難；b值越小表示試題越簡單。

二、雙參數對數模式 (two-parameter logistic model, 簡稱 2-PL)

( )

₍ ₎

i b

i a

P e₋ ₋

= + _θ θ 1

1 ⁱ ⁼¹^,²^,³^,_L^,ⁿ (公式 2-2-2)

在公式2-2-2 中，各符號的定義與公式 2-2-1 相同，唯多了一個參數：試題鑑別度 (item discrimination) ai，ai表示試題ⁱ的鑑別度參數。

在雙參數對數模式中，有二個試題參數，即鑑別度參數ai和難度參數bi。理論上，^a值的大小介於±∞之間，但實際應用上，通常只取0 到+2之間的範圍。^a值越大表示試題越能區辨出考生能力值的高低；反之則否。

三、三參數對數模式 (three-parameter logistic model, 簡稱 3-PL)

( ) ( )

₍ ₎

i b

i a i

i c c e

P ₋ ₋

− + +

= _θ

θ 1

1 1 ⁱ =¹^,²^,³^,L^,ⁿ (公式 2-2-3)

在公式2-2-3 中，各符號的定義與公式 2-2-2 相同，唯多了一個參數：猜測度ci， ci表示試題i的猜測度參數。此參數代表能力值很低的考生答對某試題的機率。在理想的情況下，試題的猜測度^c值應該為0，但往往因為測驗的題型所致，無法完全杜絕考生產生猜測的行為，因此，三參數對數模式較雙參數對數模式多了一個參數ci，即把低能力值考生的表現好壞因素也考慮到模式裡。

應用試題反應理論的方法來分析測驗資料的首要步驟，是估計我們所選用的試題反應模式之參數。有了滿意的模式參數估計方法，整個試題反應理論的應用，

才不致有濫用與誤用的情況產生 (余民寧，1992c)。隨著近年來人類在電腦科技發展上的突飛猛進，各種適用於試題反應理論的電腦軟體程式相繼誕生，其中最常用的程式是BILOG 和 LOGIST 等 (余民寧，1991)。因此，本研究即應用試題反應理論軟體 BILOG-MG，根據受試者的原始作答反應資料，進行模式適合度 (model-data fit) 檢定，期能找出最適合用以說明本測驗的試題反應模式。

在文檔中國小二年級學童數與量分年細目概念結構圖之模糊取向分析 (頁 26-30)

第二章 文獻探討

第二節 試題反應理論