• 沒有找到結果。

試題反應理論模型(Item Response Theory Models)

第二章 文獻回顧

2.4 試題反應理論模型(Item Response Theory Models)

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

13

2.3 試題反應函數(Item Response Function, IRF)

就二元反應的試題而言,設定隨機變數 𝑋𝑖 為第 𝑖 試題回答的反應值,若 答對或回答正向答案,則𝑋𝑖 = 1;反之,若答錯或回答負向答案,則𝑋𝑖 = 0。試 題反應函數可以定義為 𝑃(𝑋𝑖 = 1|𝜃) = 𝑃𝑖(𝜃),當人的能力或潛在特質越高,試 題反應函數的對應值也會上升,也就是答對或回答正向答案的機率也會越高。

2.4 試題反應理論模型(Item Response Theory Models)

試題反應理論是以試題反應函數為出發點,依據受試者的答題結果,經由數 學模式的運算,來推估受試者的能力或是潛在特質。試題反應理論模型大體上分 為兩大類,有母數試題反應理論模型(parametric IRT models)及無母數試題反應 理論模型(nonparametric IRT models)。

2.4.1 有母數試題反應理論模型

I. 單一參數邏輯斯模型(1-parameter logistic model, 1PLM):

單一參數邏輯斯模型也常被叫做 Rasch 模型(Rasch model)。令隨機變數 𝜃 是表示人的能力或潛在特質,𝛿𝑖 是表示試題困難度的位置,則 Rasch 模型的試 題反應函數定義為:𝑃𝑖(𝜃) = 𝑒(𝜃−𝛿𝑖)

1+𝑒(𝜃−𝛿𝑖)。圖2.1 所示為受試者的能力或潛在特質(𝜃) 具有標準常態分佈,試題困難度由左至右(𝛿1, 𝛿2, 𝛿3, 𝛿4, 𝛿5)分別是(-1.5, -0.75, 0, 0.75, 1.5)的情況。

對於第 𝑖 試題,當受試者的能力或潛在特質(𝜃)恰好等於試題困難度(𝛿𝑖)時,

𝑃𝑖(𝛿𝑖 = 𝜃) = 0.5。如圖 2.1 所示,受試者的能力或潛在特質為 0.75,試題困難度 也為0.75 時,𝑃4(𝛿4 = 0.75) = 0.5。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

14

圖2. 1 1PLM 試題反應函數

II. 二參數邏輯斯模型(2-parameter logistic model, 2PLM):

二參數邏輯斯模型,除了 1PLM 擁有的兩個參數 𝜃 和 𝛿𝑖 外,再加入一個 參數 𝛼𝑖 來表示試題反應函數在 𝜃 = 𝛿𝑖 的斜率,可以用來反應試題的鑑別能力,

2PLM 的 IRF 定義為 𝑃𝑖(𝜃) = 𝑒[𝛼𝑖(𝜃−𝛿𝑖)]

1+𝑒[𝛼𝑖(𝜃−𝛿𝑖)]。圖2.2 所示為受試者的能力或潛在特質 (𝜃)具有標準常態分佈,試題困難度由左至右(𝛿1, 𝛿2, 𝛿3, 𝛿4, 𝛿5)分別是(-1.5, -0.75, 0, 0.75, 1.5),而鑑別參數由左至右(𝛼1, 𝛼2, 𝛼3, 𝛼4, 𝛼5)分別是(1, 0.7, 2, 3, 1.5)的 情況。由圖形來看,鑑別參數值越高,鑑別能力也越高,因為鑑別參數的不同,

表示試題反應函數斜率會不同而有相交的情形發生。

圖2. 2 2PLM 試題反應函數

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

15

2.4.2 無母數試題反應理論模型

無母數試題反應理論模型中,試題反應函數的基本要求為 𝑃𝑖(𝜃𝑎) ≤ 𝑃𝑖(𝜃𝑏), 𝜃𝑎 < 𝜃𝑏

亦即當人的能力或潛在特質越高,試題反應函數的值也會上升,也就是答對或回 答正向答案的機率越高。由於除此之外試題反應函數的形式並沒有特別的限定,

因此實務上,使用無母數試題反應理論模型來進行問題的探討較有彈性。

I. Mokken 量表模型基本假設 a) 單維度(unidimensionality)

在一份問卷裡,我們希望所有試題都是針對一項能力或潛在特質來設計,也 就是我們主要想了解的能力或潛在特質,因此稱為單維度假設。會如此設定的主 要原因是實務上研究者希望每次測驗的測量都只檢測一個能力或潛在特質,這樣 可以避免受到其他因素的干擾。

b) 局部獨立性(local independence)

第二個假設為局部獨立性,意義上是說每位受試者對某一試題的回答不會影 響到其他試題的回答。也就是說受試者對試題間的回答是獨立的,唯一會影響受 試者回答的因素,那便是受試者的能力或潛在特質。

令X = (𝑋1, ⋯ , 𝑋𝑘),x = (𝑥1, ⋯ , 𝑥𝑘),其中 𝑥𝑖 為受試者在第 𝑖 個試題的實 際回答值。在局部獨立性的前提下,受試者的反應為x = (𝑥1, ⋯ , 𝑥𝑘)的發生機率 為P(X = x|𝜃) = ∏𝑘𝑖=1P(𝑋𝑖 = 𝑥𝑖|𝜃)。

c) 單調性(monotonicity of item response functions)

單調性指的是正向的反應條件機率值 P(𝑋𝑖 = 1|𝜃) 為 𝜃 的單調非遞減函 數,因此就任意試題 𝑖 而言,隨著人的能力或潛在特質(𝜃)上升,正向的反應條 件機率值 P(𝑋𝑖 = 1|𝜃) 也會增加。以數學式子來表示,即為

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

16

P(𝑋𝑖 = 1|𝜃𝑎) ≤ P(𝑋𝑖 = 1|𝜃𝑏), 𝜃𝑎 < 𝜃𝑏 這事實上也就是無母數試題反應理論模型的基本要求。

d) 非相交性(nonintersecting item response functions)

所謂非相交性,指的是試題反應函數彼此間不相交,也就是說無論人的能力 或潛在特質為何,對於所有試題難易程度的認知完全相同,因此全部試題正向反 應條件機率值的大小排序是相同的

P(𝑋1 = 1|𝜃) ≤ P(𝑋2 = 1|𝜃) ≤ ⋯ ≤ P(𝑋𝑘 = 1|𝜃), 對於所有的 𝜃 𝑃1(𝜃) ≤ 𝑃2(𝜃) ≤ ⋯ ≤ 𝑃𝑘(𝜃), 對於所有的 𝜃

實際上,1PLM 是有母數試題反應理論模型中唯一具有非相交性的模型。

在此四個假設前提之下,Mokken(1971)提出兩個無母數試題反應理論模 型:

II. 單調同質性模型(The Monotone Homogeneity Model, MHM)

單調同質性模型是由前述的前三個假設所建構而成,分別是單維度、局部獨 立性和單調性。若現在有 𝑘 個二元反應的試題,令正向回答為 1,負向回答為 0,則受試者全部試題的回答總分(亦即正向回答的總題數)我們可以用以下式子 來表示

𝑋+ = ∑ 𝑋𝑖

𝑘

𝑖=1

, 0 ≤ 𝑋+ ≤ 𝑘

在單調同質性模型之下,Grayson (1988)和 Huynh (1994)說明並證明出受試 者的回答總分(𝑋+)與受試者的潛在特質(𝜃)具有 MLR(monotone likelihood ratio) 的性質。所謂的MLR 表示當0 ≤ 𝑠 < 𝑡 ≤ 𝑘,g(𝑠, 𝑡; 𝜃) =𝑃(𝑋𝑃(𝑋+=𝑡|𝜃)

+=𝑠|𝜃) 是 𝜃 的非遞減 函數,受試者的回答總分(𝑋+)與受試者的潛在特質(𝜃)具有正向關係,而只要符 合MLR 性質也就會符合兩個隨機排序(stochastic ordering 或 SO)特性(Lehmann,

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

17

1959, p.74),反之則不然。

SOL(stochastic ordering of the latent trait 𝜃 by 𝑋+):

P(θ > 𝑐|𝑋+ = 𝑠) ≤ P(θ > 𝑐|𝑋+= 𝑡), 當 0 ≤ 𝑠 < 𝑡 ≤ 𝑘 其實這也就是等同於

E(θ|𝑋+ = 𝑠) ≤ E(θ|𝑋+ = 𝑡), 當 0 ≤ 𝑠 < 𝑡 ≤ 𝑘

這意味著受試者回答的分數總分數(𝑋+)越高時,受試者的能力或潛在特質的預期 值也會越高。因此在單調同質性模型之下,縱然受試者的能力或潛在特質程度無 法確切得知,但我們還是可以藉由試題回答的總分高低來排序受試者的能力或潛 在特質程度。

若是將 𝑋+ 和 𝜃 的角色對調,我們也可以得到對應的關係式。

SOM(stochastic ordering of the latent trait 𝑋+ by 𝜃):

P(𝑋+ ≥ 𝑥+|θ = 𝜃𝑎) ≤ P(𝑋+≥ 𝑥+|θ = 𝜃𝑏), 當 𝜃𝑎 < 𝜃𝑏 等同於

E(𝑋+|θ = 𝜃𝑎) ≤ E(𝑋+|θ = 𝜃𝑏), 當 𝜃𝑎 < 𝜃𝑏

上面兩個式子表示受試者的能力或潛在特質程度越高時,受試者的預期回答總分 (𝑋+)也越高。

III. 雙重單調性模型(The Double Monotonicity Model, DMM)

雙重單調性模型是由前述的那四個假設所建構而成,分別是單維度、局部獨 立性、單調性和非相交性。雙重單調性模型和單調同質性模型相比,多了「非相 交性」這個限制,因此若是為雙重單調性模型則一定也會是單調同質性模型,反 之則不然。

雙重單調性模型除了可以探討受試者的能力或潛在特質程度高低外,也可以 排序試題的難易度(Mokken, 1971)。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

18

第三章 研究方法與設計