試題反應理論

第二章文獻探討

第五節試題反應理論

對於測驗結果的解釋，隨著測驗理論的發展演進，採用不同的觀點來加以闡述。而測驗理論是一種解釋測驗資料間實證關係(empirical relationships)有系統的理論學說，學者通常把它分為二大學派，一為古典測驗理論(classical test theory)

主要是以真實分數模式(true score model)為主，另一為現代測驗理論(modern test theory)主要是以試題反應理論為架構。

古典測驗理論以線性模式

X = T + E

(觀察分數=真實分數＋誤差)和樣本依賴 (sample dependent)的指標(難度、鑑別度、信度)來描述測驗試題之特性及推論受試者的真實分數，而試題反應理論則是以樣本獨立(sample independent)之指標(鑑別度、難度、猜測值)與受試者潛在特質下共同影響之每一試題答對之機率P(θ)，並結合整個測驗中各題答對的機率訊息，而推論受試者的潛在特質。而由於試題反應理論考慮了受試者的反應組型、具有樣本不偏性及項目不偏性之特點，且較古典測驗理論能提供穩定的項目參數及較為精確的誤差估計等訊息，故試題反應理論深受測驗學者的青睞，已有逐漸凌駕古典驗測理論之上，甚至進而取代之勢 (王寶墉 1995；余民寧，1991；Hambleton & Swaminathan, 1985)。

壹、試題反應理論的基本概念與假設

一、基本概念

試題反應理論建立於兩個基本概念上，一是受試者在某一測驗試題上的表現，可由潛在特質(latent traits)來加以預測或解釋；二是受試者的表現情形與這組潛在特質間的關係，可以透過一條連續性遞增的函數加以描述，此函數稱為試題特徵曲線(item characteristic curve, ICC)，亦即將能力不同的受試者在某一測驗試題上正確反應的機率連接起來所構成的曲線便是該題的試題特徵曲線，而把各試題的試題特徵曲線加總起來，便構成了測驗特徵曲線(余民寧，1992)。

二、基本假設

傳統的試題反應理論模式有下列幾項基本假設 (王寶墉，1995；余民寧，

1992；Hambleton & Swaminathan, 1985)。

(一)單向度(unidimensionality)

單向度指測驗中的試題皆在測量同一種共同的能力或是潛在特質；亦即測驗

想測出的單一能力或潛在特質必須包含在測驗試題裡。在測驗的實際情境中，只要該測驗具有能夠影響測驗結果的一個「主要成份或因素」(dominant component or factor)，便算符合單向度假設的基本要求，而這個主要因素所指的，即是該測驗所測量到的單一能力或潛在特質。但隨著試題反應理論模式的蓬勃發展，亦有研究者認為在許多的測驗情境裡，會有多個潛在特質牽涉其中，因此亦有多向度模式的提出(王文中，2004)。

(二)局部獨立性(local independence)

局部獨立性包含兩種涵義，一是受試者在任何一對試題上的反應，在統計學上是而言是獨立的，也就是在考慮能力因素後，受試者在不同試題上的反應間沒有任何關係存在，即在試題反應模式裡的能力因素，才是唯一影響受試者在測驗試題上正確反應的機率。另外一個涵意則為受試者彼此之間的能力亦為獨立的。

但在很多的測驗裡會使用題組，而題組內試題間存在關聯性而非獨立，因此會使傳統試題反應理論錯估參數及高估測驗信度，為了克服這項困難，近年來亦有學者提出題組模式，在傳統的單向度試題反應理論模式中，加入一個向度(隨機效果) 用以表明試題間的相互依賴(local dependence) (王文中，2004)。

(三)非速度測驗(nonspeedness)

試題反應理論假設受試者有足夠的時間作答，測驗的施行不是在速度的限制之下完成的，亦即受試者測驗得分表現完全由能力決定，並不受「速度」此一因素的影響。

(四)「知道－正確」假設(know-correct assumption)

如果受試者知道某一試題的正確答案，則必然答對該試題；也就是說，如果受試者答錯某一試題，必然不知道該試題的答案，而把正確答案填於其他格子上，導致回答錯誤的例子，不在此假設所考慮的範圍內，因為人為的疏忽不是任何測驗理論所能顧及到的。

貳、試題反應理論模式

有關試題反應理論的模式相當多，適用的情況各有不同，一般可以區分為三種，分別為二元計分模式、多元計分模式和連續計分模式，其區分的特徵有二：

一為試題反應的計分模式，二是試題特徵曲線的數學模式(Hambleton &

Swaminathan, 1985)，茲依據資料的類型與模式摘要如下表 2-7：

表2-7 常見的幾種試題反應理論模式摘要表

資料性質理論模式

潛在線性模式(latent linear model) 完全量尺模式(perfect scale model) 潛在距離模式(latent distance model)

單、雙、三參數常態肩形模式(one-,two-,three-parameter normal ogive model) 單、雙、三參數邏吉斯模式(one-,two-,three-parameter logistic model) 二元計分資料

四參數邏吉斯模式(four-parameter logistic model) 名義反應模式(nominal response model)

等級反應模式(graded response model) 多元計分模式

部分計分模式(partial credit model)

連續計分模式連續反應模式(continuous response model) 資料來源：Hambleton & Swaminathan, 1985

試題反應理論已有相當多的文獻，限於篇幅，以下僅簡述二元化計分資料中的三種常用的基本模式：單參數邏吉斯模式(one-parameter logistic model)、雙參數邏吉斯模式(two-parameter logistic model)、三參數邏吉斯模式(three-parameter logistic nodel)，其模式的數學函數與意義分述如下。

一、單參數邏吉斯模式(one-parameter logistic model)

此模式又稱為Rasch 模式，由丹麥數學家 Rasch (1960) 所提出，此模式只有一個「試題難度參數」

b

_i，其數學模式為：

)

1

(

) 1

(

e

P

₋ ₋

= +

_θ θ

其中

P

( )

θ 表示能力值為

θ

的受試者在第

i

題上答對的機率，

e

為自然對數的底

數，其值為近似 2.71828 的無窮小數。根據單參數邏吉斯模式的數學模式可知，

試題難度參數

b

_i的位置正好為正確答率機率

P

( )

θ 為.5 時的能力值

θ

上，也就是當受試者能力值和試題難度相等時(即θ

− b

= 0

)，受試者答對該試題的機率為.5；當受試者能力值小於試題難度時(即θ

− b

< 0

)，則其答對該試題的機率小於.5；反之，當受試者能力值大於試題難度時(即θ

− b

> 0

)，則其答對該試題的答對機率大於.5。

圖2-15 四條典型的單參數邏吉斯模式之試題特徵曲線 (資料來源：Hambleton, Swaminathan & Rogers, 1991)

以圖2-15 為例，四條試題特徵曲線的試題難度參數分別為b₁ =1.0，b₂ =2.0， -1.0

3 =

b ，b₄ =0，其值的大小，決定了四條曲線在能力量尺上的相對位置，愈困難的試題，其試題特徵曲線愈是座落在能力值量尺的右方。

二、雙參數邏吉斯模式(two-parameter logistic model)

此模式為Birnbaum (1968) 修改 Rasch 模式所擴展而成，除了「試題難易度參數」

b

_i外，增加了一個「試題鑑別度參數」(item discrimination parameter)

a

_i，

0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1

-4 -3 -2 -1 0 1 2 3 4

試題3 試題4 試題1 試題2

b

( ) _θ P

θ

其數學模式為： (資料來源：Hambleton et al., 1991)

以上圖2-16 為例，四條試題特徵曲線的試題參數分別為a₁ =1.0，b₁ =1.0，

三、三參數邏吉斯模式(three-parameter logistic nodel)

此模式亦是雙參數邏吉斯模式的擴展，它比雙參數邏吉斯模式增加了一個

「猜測參數」或「機運參數」(pseudo-chance parameter)

c

_i，其數學模式為：

) (資料來源：Hambleton et al., 1991)

圖2-17 中的試題 1、2、4 其猜測參數

c

_i為零，因此能力值很低的受試者其答

根據九年一貫課程綱要

各版本數學領域教材

相關文獻之探究

編製因數與倍數概念測驗

IRT 試題反應理論分析

運用 AISM 軟體進行截矩陣分析並畫出 ISM 圖 SAS/IML 模糊關係矩陣

分析

分析因數與倍數的概念結構特徵定義因數與倍數概念

在文檔中國小六年級學童因數與倍數概念階層之模糊詮釋結構模式分析 (頁 69-76)

第二章 文獻探討

第五節 試題反應理論