試題反應理論模式

第二章文獻探討

第二節試題反應理論模式

試題反應理論(IRT)是現代測驗理論的重心，其特點是以「機率」的概念來解釋受試者能力和試題反應間之關係，亦即依據受試者之實際試題反應結果，經由理論的數學模式轉換運算，即可估計受試者的能力(ability)或潛在特質(latent traits)。此數學模式稱為試題特徵函數(item characteristic function，簡稱ICF)，以

試題特徵曲線是將能力不同的受試者得分點連接起來所構成的曲線，把各試題的試題特徵曲線加總起來，便構成所謂的試卷特徵曲線（test characteristic curve，簡寫為TCC）。試題特徵曲線即是一條試題得分對能力因素所作的迴歸線。

一、單參數模式(one-parameter logistic model) 單參數對數模式試題特徵函數：

設 = + = − −∞< − <∞

latent trait 能力值θ probablity P(θ)

bi=-2 bi=0 bi=2

圖2-1 單參數試題特徵曲線(

b

_i 難度) 二、雙參數模式(two-parameter logistic model)

雙參數對數模式試題特徵函數：

)

latent trait 能力值θ probablity P(θ)

ai=1

三、三參數模式(three-parameter logistic model)

三參數對數模式試題特徵函數：

0.0

latent trait 能力值θ probablity P(θ)

ai=1

四、四參數模式(four-parameter logistic model)

四參數對數模式試題特徵函數：

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

-4 -3 -2 -1 0 1 2 3 4

latent trait 能力值θ probablity P(θ)

ai=1 bi=-2 ci=0.1 di=.9 ai=1.5 bi=0 ci=0.2 di=.97 ai=0.5 bi=2 ci=0.3 di=.95

圖2-4 四參數試題特徵曲線(

a

_i鑑別度、

b

_i 難度、

c

_i猜測度、

d

_i 天井參數) 其中

P

_i(θ 代表能力值為_s) θ 之第_s

s

位受試者答對第

i

題的機率函數。

e

：底為2.718(自然對數 exp)之指數。

θ ：第s

s

位受試者之能力值。

a

i ：第

i

題的鑑別參數。

b

i ：第

i

題的難度參數。

c

i ：第

i

題的猜測參數。

d

i ：第

i

題之天井參數。

進行測驗主要希望藉由受試者作答反應來估計其潛在能力，而受試者潛在能力與其在題目反應之關係可藉由試題反應理論來建立，參數型IRT 的特色有：

(一)、試題的參數估計值不變性(invariance)，是樣本獨立(sample-independent) 的試題參數估計值。

(二)、能力的參數估計值不變，是試題獨立(item-independent)的能力估計值。

(三)、能力估計值的測量誤差大小，隨能力不同而異。(曾建銘，2006) 參數型IRT 主要以分析測驗中每一試題之難易度、鑑別度、猜測度等重要參數，以卡方考驗來檢定模式否適合資料。採用卡方適合度統計顯示最少試題達顯著(代表不適配)之模式。再以這些參數為基礎，配合測驗目的，選取鑑別度高的

試題，刪除鑑別度低的試題，進行組卷、施測，並將測驗結果的原始分數轉換為可代表學生真實能力的量尺分數，以估計學生之能力。

參數模式中，

P

_i(θ 代表受試者能力值為_s) θ時之答對機率。當能力值θ趨近正無限大時，答對機率

P

_i(θ 會趨近於 1，而當能力值_s) θ趨近負無限大時，答對機率

) ( _s

P

i θ 會趨近於 0，表示能力值越高者答對機率越高，反之，能力值越低者，答對機率亦越低。在單參數、雙參數模式中，當能力值θ等於難度

b

_i 時，答對機率則為2

1。

舉例來看，若為單參數模式(Rasch model)，假設難度參數

b

i = .5，則能力值θ 為.5，對照到

P

_i(θ =.5。如圖 2-5 之 1PL 試題特徵曲線。若為雙參數模式，假設_s)

a

_i = 1.5,

b

_i = .5，多了鑑別度參數

a

_i ，試題特徵曲線線形產生斜率不同的改變。如圖 2-5 之 2PL 試題特徵曲線。若為三參數模式，

a

_i= 1.5,

b

_i = .5，

c

_i = .15，再加了猜測度參數

c

_i ，如圖2-5 之 3PL 試題特徵曲線，

b

_i 值並未落在

P

_i(θ =.5，而是落在_s )

) ( _s

P

i θ =(1+

c

_i /2)。

如圖2-5，無論是單參數、雙參數或三參數模式，受試者能力值越高，即θ越趨近正無限大時，答對機率

P

_i(θ 就越趨近於 1；當能力值越低，即_s) θ越趨近負無限大時，答對機率

P

_i(θ 就越趨近於 0，但是很明顯三參數模式(3PL)之答對機率_s )

) ( _s

P

i θ 趨近於參測度

c

_i ，高於另外二條試題特徵曲線。意即能力再低的受試者也會有

c

_i 的答對機率。

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

-4 -3 -2 -1 0 1 2 3 4

latent trait 能力值θ probablity P(θ)

1PL 2PL 3PL

圖2-5 1PL、2PL、3PL 模式之試題特徵曲線比較參數設定：

a

_i = 1.5,

b

_i = .5,

c

_i= .15

參數型IRT 假定某一試題之正確反應機率除了由受試者能力值θ所決定外，

並且受該試題之參數(難易度、鑑別度、猜測度)所決定。主要依據測驗中每一試題的參數(難易度、鑑別度、猜測度)，再以數學模式估計試題特徵曲線，因數學模式是固定的，故限制了試題特徵曲線之真實性，對受試者真實呈現之作答訊息的代表性較低。為改善此一缺失，以提昇估計受試者真實能力的精準度，無參數試題反應理論(無參數 IRT)應運而生。

貳、無參數型IRT模式

無參數迴歸估計法對於迴歸函數事先並不設定其模式，完全依照資料忠實呈現受試者能力特質。無參數IRT重點在於「受試者能力參數」的估計方式，而在試題特徵曲線的估計方面則不限制以何種形式來進行描述(郭伯臣，1995)，即受試者能力參數的估計是由受試者實際作答的反應中獲得，並非由固定的數學模式來估計。因此，無參數IRT模式所呈現之試題特徵曲線形狀亦較多樣化，也較能精準估計受試者真實能力。鄭富森(1994)提出無參數IRT內容如下：

一、模式假設：

無參數IRT模式假定所有受試者的試題反應受下列三特性的影響：

(一)、受試者特性：影響答題反應的主要因素來自受試者內在能力特質及外在測量誤差兩方面。

(二)、試題特性：試題做量化分析的目的在描述受試者潛在特質與試題特徵的關係。探討不同能力受試者在試題得分期望值。故假設能用一條直線來表達受試者能力與其試題表現間的數量關係。

(三)、評分特性：評分的量化數值受評分者主觀依受試反應給予量化分數影響，故與受試者潛在特質間存在著誤差分數。

二、能力值估計：

無參數IRT的估計方式，主要以直接得到的觀察分數

x

_is來估計受試者能力值θ ，再以_s θ 估計其得分期望值_s

f

_is。

三、無參數IRT模式優點：

(一)、不受試題參數之限制。

(二)、能真實地描述出試題特徵之曲線。

(三)、所得之試題特徵曲線為嚴格遞增(遞減)，能忠實地呈現資料所代表之訊息。

(四)、即使在小樣本情況下，依舊能合理推算出能力估計值與試題特徵函數。

(五)、不需進行局部獨立之假設。

(六)、不受計分方式限制。

在文檔中核平滑化無參數IRT模式常態轉換遞迴估計之蒙地卡羅模擬研究 (頁 19-27)

第二章 文獻探討

第二節 試題反應理論模式

latent trait 能力值θ probablity P(θ)

bi=-2 bi=0 bi=2

b

latent trait 能力值θ probablity P(θ)

ai=1

latent trait 能力值θ probablity P(θ)

ai=1

ai=1 bi=-2 ci=0.1 di=.9 ai=1.5 bi=0 ci=0.2 di=.97 ai=0.5 bi=2 ci=0.3 di=.95

a

b

c

d

P

s

i

e

s

a

i

b

i

c

i

d

i

P

P

P

b

b

P

a

b

a

a

b

c

c

b

P

P

c

P

P

P

c

c

latent trait 能力值θ probablity P(θ)

1PL 2PL 3PL

a

b

c

貳、無參數型IRT模式

x

f

第二章文獻探討

第二節試題反應理論模式