• 沒有找到結果。

第二章 文獻探討

第二節 試題反應理論模式

試題反應理論(IRT)是現代測驗理論的重心,其特點是以「機率」的概念來解 釋受試者能力和試題反應間之關係,亦即依據受試者之實際試題反應結果,經由 理論的數學模式轉換運算,即可估計受試者的能力(ability)或潛在特質(latent traits)。此數學模式稱為試題特徵函數(item characteristic function,簡稱ICF),以

試題特徵曲線是將能力不同的受試者得分點連接起來所構成的曲線,把各試 題的試題特徵曲線加總起來,便構成所謂的試卷特徵曲線(test characteristic curve,簡寫為TCC)。試題特徵曲線即是一條試題得分對能力因素所作的迴歸線。

一、單參數模式(one-parameter logistic model) 單參數對數模式試題特徵函數:

設 = + = − −∞< − <∞

latent trait 能力值θ probablity P(θ)

bi=-2 bi=0 bi=2

圖2-1 單參數試題特徵曲線(

b

i 難度) 二、雙參數模式(two-parameter logistic model)

雙參數對數模式試題特徵函數:

)

latent trait 能力值θ probablity P(θ)

ai=1

三、三參數模式(three-parameter logistic model)

三參數對數模式試題特徵函數:

0.0

latent trait 能力值θ probablity P(θ)

ai=1

四、四參數模式(four-parameter logistic model)

四參數對數模式試題特徵函數:

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

-4 -3 -2 -1 0 1 2 3 4

latent trait 能力值θ probablity P(θ)

ai=1 bi=-2 ci=0.1 di=.9 ai=1.5 bi=0 ci=0.2 di=.97 ai=0.5 bi=2 ci=0.3 di=.95

圖2-4 四參數試題特徵曲線(

a

i鑑別度、

b

i 難度、

c

i猜測度、

d

i 天井參數) 其中

P

i(θ 代表能力值為s) θ 之第s

s

位受試者答對第

i

題的機率函數。

e

:底為2.718(自然對數 exp)之指數。

θ :第s

s

位受試者之能力值。

a

i :第

i

題的鑑別參數。

b

i :第

i

題的難度參數。

c

i :第

i

題的猜測參數。

d

i :第

i

題之天井參數。

進行測驗主要希望藉由受試者作答反應來估計其潛在能力,而受試者潛在能 力與其在題目反應之關係可藉由試題反應理論來建立,參數型IRT 的特色有:

(一)、試題的參數估計值不變性(invariance),是樣本獨立(sample-independent) 的試題參數估計值。

(二)、能力的參數估計值不變,是試題獨立(item-independent)的能力估計值。

(三)、能力估計值的測量誤差大小,隨能力不同而異。(曾建銘,2006) 參數型IRT 主要以分析測驗中每一試題之難易度、鑑別度、猜測度等重要參 數,以卡方考驗來檢定模式否適合資料。採用卡方適合度統計顯示最少試題達顯 著(代表不適配)之模式。再以這些參數為基礎,配合測驗目的,選取鑑別度高的

試題,刪除鑑別度低的試題,進行組卷、施測,並將測驗結果的原始分數轉換為 可代表學生真實能力的量尺分數,以估計學生之能力。

參數模式中,

P

i(θ 代表受試者能力值為s) θ時之答對機率。當能力值θ趨近正 無限大時,答對機率

P

i(θ 會趨近於 1,而當能力值s) θ趨近負無限大時,答對機率

) ( s

P

i θ 會趨近於 0,表示能力值越高者答對機率越高,反之,能力值越低者,答 對機率亦越低。在單參數、雙參數模式中,當能力值θ等於難度

b

i 時,答對機率 則為2

1。

舉例來看,若為單參數模式(Rasch model),假設難度參數

b

i = .5,則能力值θ 為.5,對照到

P

i(θ =.5。如圖 2-5 之 1PL 試題特徵曲線。若為雙參數模式,假設s)

a

i = 1.5,

b

i = .5,多了鑑別度參數

a

i ,試題特徵曲線線形產生斜率不同的改變。如圖 2-5 之 2PL 試題特徵曲線。若為三參數模式,

a

i= 1.5,

b

i = .5,

c

i = .15,再加了猜 測度參數

c

i ,如圖2-5 之 3PL 試題特徵曲線,

b

i 值並未落在

P

i(θ =.5,而是落在s )

) ( s

P

i θ =(1+

c

i /2)。

如圖2-5,無論是單參數、雙參數或三參數模式,受試者能力值越高,即θ越 趨近正無限大時,答對機率

P

i(θ 就越趨近於 1;當能力值越低,即s) θ越趨近負無 限大時,答對機率

P

i(θ 就越趨近於 0,但是很明顯三參數模式(3PL)之答對機率s )

) ( s

P

i θ 趨近於參測度

c

i ,高於另外二條試題特徵曲線。意即能力再低的受試者也 會有

c

i 的答對機率。

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

-4 -3 -2 -1 0 1 2 3 4

latent trait 能力值θ probablity P(θ)

1PL 2PL 3PL

圖2-5 1PL、2PL、3PL 模式之試題特徵曲線比較 參數設定:

a

i = 1.5,

b

i = .5,

c

i= .15

參數型IRT 假定某一試題之正確反應機率除了由受試者能力值θ所決定外,

並且受該試題之參數(難易度、鑑別度、猜測度)所決定。主要依據測驗中每一試 題的參數(難易度、鑑別度、猜測度),再以數學模式估計試題特徵曲線,因數學 模式是固定的,故限制了試題特徵曲線之真實性,對受試者真實呈現之作答訊息 的代表性較低。為改善此一缺失,以提昇估計受試者真實能力的精準度,無參數 試題反應理論(無參數 IRT)應運而生。

貳、無參數型IRT模式

無參數迴歸估計法對於迴歸函數事先並不設定其模式,完全依照資料忠實呈 現受試者能力特質。無參數IRT重點在於「受試者能力參數」的估計方式,而在 試題特徵曲線的估計方面則不限制以何種形式來進行描述(郭伯臣,1995),即受 試者能力參數的估計是由受試者實際作答的反應中獲得,並非由固定的數學模式 來估計。因此,無參數IRT模式所呈現之試題特徵曲線形狀亦較多樣化,也較能 精準估計受試者真實能力。鄭富森(1994)提出無參數IRT內容如下:

一、 模式假設:

無參數IRT模式假定所有受試者的試題反應受下列三特性的影響:

(一)、 受試者特性:影響答題反應的主要因素來自受試者內在能力特質 及外在測量誤差兩方面。

(二)、 試題特性:試題做量化分析的目的在描述受試者潛在特質與試題 特徵的關係。探討不同能力受試者在試題得分期望值。故假設能 用一條直線來表達受試者能力與其試題表現間的數量關係。

(三)、 評分特性:評分的量化數值受評分者主觀依受試反應給予量化分 數影響,故與受試者潛在特質間存在著誤差分數。

二、 能力值估計:

無參數IRT的估計方式,主要以直接得到的觀察分數

x

is來估計受試者 能力值θ ,再以s θ 估計其得分期望值s

f

is

三、 無參數IRT模式優點:

(一)、 不受試題參數之限制。

(二)、 能真實地描述出試題特徵之曲線。

(三)、 所得之試題特徵曲線為嚴格遞增(遞減),能忠實地呈現資料所代 表之訊息。

(四)、 即使在小樣本情況下,依舊能合理推算出能力估計值與試題特徵 函數。

(五)、 不需進行局部獨立之假設。

(六)、 不受計分方式限制。

相關文件