試題反應理論模型(Item Response Theory Models)

第二章文獻回顧

2.4 試題反應理論模型(Item Response Theory Models)

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

2.3 試題反應函數(Item Response Function, IRF)

就二元反應的試題而言，設定隨機變數 𝑋_𝑖 為第 𝑖 試題回答的反應值，若答對或回答正向答案，則𝑋_𝑖 = 1；反之，若答錯或回答負向答案，則𝑋_𝑖 = 0。試題反應函數可以定義為 𝑃(𝑋_𝑖 = 1|𝜃) = 𝑃_𝑖(𝜃)，當人的能力或潛在特質越高，試題反應函數的對應值也會上升，也就是答對或回答正向答案的機率也會越高。

2.4 試題反應理論模型(Item Response Theory Models)

試題反應理論是以試題反應函數為出發點，依據受試者的答題結果，經由數學模式的運算，來推估受試者的能力或是潛在特質。試題反應理論模型大體上分為兩大類，有母數試題反應理論模型(parametric IRT models)及無母數試題反應理論模型(nonparametric IRT models)。

2.4.1 有母數試題反應理論模型

I. 單一參數邏輯斯模型(1-parameter logistic model, 1PLM)：

單一參數邏輯斯模型也常被叫做 Rasch 模型(Rasch model)。令隨機變數 𝜃 是表示人的能力或潛在特質，𝛿_𝑖 是表示試題困難度的位置，則 Rasch 模型的試題反應函數定義為：𝑃_𝑖(𝜃) = ^𝑒^{(𝜃−𝛿𝑖)}

1+𝑒(𝜃−𝛿𝑖)。圖2.1 所示為受試者的能力或潛在特質(𝜃) 具有標準常態分佈，試題困難度由左至右(𝛿₁, 𝛿₂, 𝛿₃, 𝛿₄, 𝛿₅)分別是(-1.5, -0.75, 0, 0.75, 1.5)的情況。

對於第 𝑖 試題，當受試者的能力或潛在特質(𝜃)恰好等於試題困難度(𝛿_𝑖)時，

𝑃_𝑖(𝛿_𝑖 = 𝜃) = 0.5。如圖 2.1 所示，受試者的能力或潛在特質為 0.75，試題困難度也為0.75 時，𝑃₄(𝛿₄ = 0.75) = 0.5。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖2. 1 1PLM 試題反應函數

II. 二參數邏輯斯模型(2-parameter logistic model, 2PLM)：

二參數邏輯斯模型，除了 1PLM 擁有的兩個參數 𝜃 和 𝛿_𝑖 外，再加入一個參數 𝛼_𝑖 來表示試題反應函數在 𝜃 = 𝛿_𝑖 的斜率，可以用來反應試題的鑑別能力，

2PLM 的 IRF 定義為 𝑃_𝑖(𝜃) = ^𝑒^{[𝛼𝑖(𝜃−𝛿𝑖)]}

1+𝑒^{[𝛼𝑖(𝜃−𝛿𝑖)]}。圖2.2 所示為受試者的能力或潛在特質 (𝜃)具有標準常態分佈，試題困難度由左至右(𝛿₁, 𝛿₂, 𝛿₃, 𝛿₄, 𝛿₅)分別是(-1.5, -0.75, 0, 0.75, 1.5)，而鑑別參數由左至右(𝛼₁, 𝛼₂, 𝛼₃, 𝛼₄, 𝛼₅)分別是(1, 0.7, 2, 3, 1.5)的情況。由圖形來看，鑑別參數值越高，鑑別能力也越高，因為鑑別參數的不同，

表示試題反應函數斜率會不同而有相交的情形發生。

圖2. 2 2PLM 試題反應函數

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

2.4.2 無母數試題反應理論模型

無母數試題反應理論模型中，試題反應函數的基本要求為 𝑃_𝑖(𝜃_𝑎) ≤ 𝑃_𝑖(𝜃_𝑏), 𝜃_𝑎 < 𝜃_𝑏

亦即當人的能力或潛在特質越高，試題反應函數的值也會上升，也就是答對或回答正向答案的機率越高。由於除此之外試題反應函數的形式並沒有特別的限定，

因此實務上，使用無母數試題反應理論模型來進行問題的探討較有彈性。

I. Mokken 量表模型基本假設 a) 單維度(unidimensionality)

在一份問卷裡，我們希望所有試題都是針對一項能力或潛在特質來設計，也就是我們主要想了解的能力或潛在特質，因此稱為單維度假設。會如此設定的主要原因是實務上研究者希望每次測驗的測量都只檢測一個能力或潛在特質，這樣可以避免受到其他因素的干擾。

b) 局部獨立性(local independence)

第二個假設為局部獨立性，意義上是說每位受試者對某一試題的回答不會影響到其他試題的回答。也就是說受試者對試題間的回答是獨立的，唯一會影響受試者回答的因素，那便是受試者的能力或潛在特質。

令X = (𝑋₁, ⋯ , 𝑋_𝑘)，x = (𝑥₁, ⋯ , 𝑥_𝑘)，其中 𝑥_𝑖 為受試者在第 𝑖 個試題的實際回答值。在局部獨立性的前提下，受試者的反應為x = (𝑥₁, ⋯ , 𝑥_𝑘)的發生機率為P(X = x|𝜃) = ∏^𝑘_𝑖=1P(𝑋_𝑖 = 𝑥_𝑖|𝜃)。

c) 單調性(monotonicity of item response functions)

單調性指的是正向的反應條件機率值 P(𝑋_𝑖 = 1|𝜃) 為 𝜃 的單調非遞減函數，因此就任意試題 𝑖 而言，隨著人的能力或潛在特質(𝜃)上升，正向的反應條件機率值 P(𝑋_𝑖 = 1|𝜃) 也會增加。以數學式子來表示，即為

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

P(𝑋_𝑖 = 1|𝜃_𝑎) ≤ P(𝑋_𝑖 = 1|𝜃_𝑏), 𝜃_𝑎 < 𝜃_𝑏 這事實上也就是無母數試題反應理論模型的基本要求。

d) 非相交性(nonintersecting item response functions)

所謂非相交性，指的是試題反應函數彼此間不相交，也就是說無論人的能力或潛在特質為何，對於所有試題難易程度的認知完全相同，因此全部試題正向反應條件機率值的大小排序是相同的

P(𝑋₁ = 1|𝜃) ≤ P(𝑋₂ = 1|𝜃) ≤ ⋯ ≤ P(𝑋_𝑘 = 1|𝜃), 對於所有的 𝜃 𝑃₁(𝜃) ≤ 𝑃₂(𝜃) ≤ ⋯ ≤ 𝑃_𝑘(𝜃), 對於所有的 𝜃

實際上，1PLM 是有母數試題反應理論模型中唯一具有非相交性的模型。

在此四個假設前提之下，Mokken(1971)提出兩個無母數試題反應理論模型：

II. 單調同質性模型(The Monotone Homogeneity Model, MHM)

單調同質性模型是由前述的前三個假設所建構而成，分別是單維度、局部獨立性和單調性。若現在有 𝑘 個二元反應的試題，令正向回答為 1，負向回答為 0，則受試者全部試題的回答總分(亦即正向回答的總題數)我們可以用以下式子來表示

𝑋₊ = ∑ 𝑋_𝑖

𝑘

𝑖=1

, 0 ≤ 𝑋₊ ≤ 𝑘

在單調同質性模型之下，Grayson (1988)和 Huynh (1994)說明並證明出受試者的回答總分(𝑋₊)與受試者的潛在特質(𝜃)具有 MLR(monotone likelihood ratio) 的性質。所謂的MLR 表示當0 ≤ 𝑠 < 𝑡 ≤ 𝑘，g(𝑠, 𝑡; 𝜃) =^𝑃(𝑋_𝑃(𝑋⁺^=𝑡|𝜃)

+=𝑠|𝜃) 是 𝜃 的非遞減函數，受試者的回答總分(𝑋₊)與受試者的潛在特質(𝜃)具有正向關係，而只要符合MLR 性質也就會符合兩個隨機排序(stochastic ordering 或 SO)特性(Lehmann,

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

1959, p.74)，反之則不然。

SOL(stochastic ordering of the latent trait 𝜃 by 𝑋₊)：

P(θ > 𝑐|𝑋₊ = 𝑠) ≤ P(θ > 𝑐|𝑋₊= 𝑡), 當 0 ≤ 𝑠 < 𝑡 ≤ 𝑘 其實這也就是等同於

E(θ|𝑋₊ = 𝑠) ≤ E(θ|𝑋₊ = 𝑡), 當 0 ≤ 𝑠 < 𝑡 ≤ 𝑘

這意味著受試者回答的分數總分數(𝑋₊)越高時，受試者的能力或潛在特質的預期值也會越高。因此在單調同質性模型之下，縱然受試者的能力或潛在特質程度無法確切得知，但我們還是可以藉由試題回答的總分高低來排序受試者的能力或潛在特質程度。

若是將 𝑋₊ 和 𝜃 的角色對調，我們也可以得到對應的關係式。

SOM(stochastic ordering of the latent trait 𝑋₊ by 𝜃)：

P(𝑋₊ ≥ 𝑥₊|θ = 𝜃_𝑎) ≤ P(𝑋₊≥ 𝑥₊|θ = 𝜃_𝑏), 當 𝜃_𝑎 < 𝜃_𝑏 等同於

E(𝑋₊|θ = 𝜃_𝑎) ≤ E(𝑋₊|θ = 𝜃_𝑏), 當 𝜃_𝑎 < 𝜃_𝑏

上面兩個式子表示受試者的能力或潛在特質程度越高時，受試者的預期回答總分 (𝑋₊)也越高。

III. 雙重單調性模型(The Double Monotonicity Model, DMM)

雙重單調性模型是由前述的那四個假設所建構而成，分別是單維度、局部獨立性、單調性和非相交性。雙重單調性模型和單調同質性模型相比，多了「非相交性」這個限制，因此若是為雙重單調性模型則一定也會是單調同質性模型，反之則不然。

雙重單調性模型除了可以探討受試者的能力或潛在特質程度高低外，也可以排序試題的難易度(Mokken, 1971)。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

第三章研究方法與設計

在文檔中 Mokken尺度量表下潛在特質排序之正確率探討 - 政大學術集成 (頁 14-19)

試題反應理論模型(Item Response Theory Models)

第二章 文獻回顧

2.4 試題反應理論模型(Item Response Theory Models)

國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

2.3 試題反應函數(Item Response Function, IRF)

2.4 試題反應理論模型(Item Response Theory Models)

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

第三章 研究方法與設計

第二章文獻回顧

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學

第三章研究方法與設計