試題反應理論

第二章文獻探討

第一節試題反應理論

第二章文獻探討

為比較 HIRT、UIRT 與 MIRT 模式的參數估計效果，須先針對 HIRT、UIRT 與 MIRT 模式深入探究；本研究擴充 de la Torre 與 Hong (2010) 所提出的參數估計方法於多因子 HIRT 模式下的參數估計 (Hsieh, T. Y., Kuo, B. C., & Shih, S. C., 2009) ，於此，須先了解蒙地卡羅馬可夫鏈(Markov Chain Monte Carlo, MCMC) 等相關文獻，並針對 MH-within-Gibbs sampling 進行深入探討；本研究有針對 HIRT 模式提出無參數型估計方法，因此，須先針對 UIRT 無參數型估計方法進行探討(目前尚無 MIRT 模式的無參數估計方法)；最後，針對 HIRT 模式等化同時估計方法的提出，則須針對等化估計方法進行探究。簡言之，以下將探討四大類文獻：一、試題反應理論；二、蒙地卡羅馬可夫鏈；三、UIRT 無參數型估計方法；四、等化估計方法。

第一節試題反應理論

本論文所比較之試題反應理論(item response theory, IRT)模式，包括單一層次模式與階層式模式，因此在此節中將論述何謂單一層次模式與階層式模式：

一、單一層次模式

單一層次試題反應理論模式定義量尺分數為單一層次，模式中僅包含量尺分數與試題兩類的參數，單一層次試題反應理論模式依據其量尺分數變數的多寡，可分為單向度試題反應理論(unidimensional item response theory, UIRT)模式與多向度試題反應理論(multidimensional item response theory, MIRT)模式。一般常見的 UIRT 模式，包括單參數對數模式 (one-parameter logistic model) (Rasch, 1960) 、雙參數對數模式(two-parameter logistic model) (Birnbaum, 1968) 、三參數對數模式(three-parameter logistic model) (Birnbaum, 1968) 。

多向度測驗依據測驗架構又可以分為題間多向度測驗 (between-item multidimensional test)與題內多向度測驗(within-item multidimensional test)兩種 (Adams, Wilson & Wang, 1997) ；前者如圖 2-1 的(a)；後者如圖 2-1 的(b)。

圖 2-1 題間與題內多向度測驗

一般常見的 MIRT 模式，包括多向度二參數模式(multidimensional two parameters model, M2PL) (Mckinley & Reckase, 1983) 、多向度三參數模式 (multidimensional three parameters model, M3PL) (M-3PL; Reckase, 1997) 與多向度隨機係數多項洛基模式(multidimensional random coefficients multinomial logit model, MRCMLM) (Adams, Wilson, & Wang, 1997) 。

由於，本研究所探究之 HIRT 模式中所用的 MIRT 模式即為 MRCMLM，於此，將 MRCMLM 定義如方程式(2.1)，該模式主要是延伸至 Rasch 模式而成的多向度模式而來 (Hoskens & De Boeck，1997；Wang, Wilson, & Cheng，2000；Wilson

& Adams，1995) ：

參數估計方法主要有：最大邊際概似最大估計法 (maximum marginal likelihood estimation, MMLE)、聯合最大概似估計法(joint maximum likelihood estimation, JMLE) 與條件邊際概似估計法 (conditional marginal likelihood estimation, CMLE)等方法 (Baker, 2004) 及 MCMC。目前已有相當多的文獻 (Albert, 1992; Baker, 1998; Kim & Cohen, 1999; Patz & Junker, 1997; 1999) 指出 MCMC 應用於單一層次模式中進行參數估計，可獲得正確的估計結果。

二、HIRT 模式

本研究將能同時估計高層次與領域量尺分數的模式定為 HIRT 模式，包括階層式潛在特質分析模式(hierarchical latent analysis model) (De la Torre & Douglas, 2004) 與二參數常態肩形階層分析模型(2-PL normal ogive analysis mode) (Sheng, 2005) ，然階層式潛在特質分析模式假設總體量尺分數需為離散量，此與一般 IRT 模式在於建立連續量尺分數之目的相違背；二參數常態肩形階層分析模型則假設所用的 IRT 模式需為二參數常態肩形模式，此外，總體量尺與領域量尺間亦無遵守等量尺的假設 (de la Torre & Song, 2009) 。於此，de la Torre 與 Song (2009) 提出 HO-IRT 模式，並論證 HO-IRT 模式是目前較具一般化的 HIRT 模式，且 de la Torre 與 Hong (2010) 提出基於 MH-wthin-Gibbs sampling 的參數估計方法，由於本研究的 HIRT 模式是以 HO-IRT 模式為基礎，因此加以詳述：

圖 2-2 單因子 HIRT 模式(修改自 de la Torre 與 Song (2009) )

) ( I

βj )

λ( λ⁽^II⁾ λ^{( D}⁾ θⁱ

) ( I

θ i θ _i^{( II}⁾ θ _i^{( D}⁾

) ( I

Xij X_ij^{( II}⁾ X_ij^{( D}⁾

) ( II

βj β^{( D}_j ⁾ 觀察變項以圓圈表示；

其他變項表示待為估計。

de la Torre 與 Song (2009) 和 de la Torre 與 Hong (2010) 所提之 HO-IRT 模式，如 圖 2-2 所示。其中，第一層表示第 i 位受試者在領域量尺d中的第 j 題試題之反 應情形X_ij^(d⁾，第二層表示受試者的反應透過 IRT 模式中的試題參數β^(d_j ⁾連結到領域量尺分數θ ，第三層表示受試者的領域量尺分數透過迴歸參數_i^{( D}⁾ λ 連結到相^(d⁾ 對應之總體量尺分數θ 。領域量尺分數_i θ ，_i^(d⁾ θ 表示第_i^(d⁾ i位受試者在領域量尺d 的表現，其中，d =1,2,3,,D；θ 為第_i i位受試者在總體量尺分數，並假設領域量尺分數為高層次能力量尺分數的一線性函數 (de la Torre & Song, 2009) 。

id i d d

i λ θ ε

θ⁽ ⁾ = ⁽ ⁾ + (2.2) 其中，λ 為迴歸參數，^(d⁾ ε 為誤差項，_id ε 假設服從平均數為 0 且變異數為_id 1−λ⁽^d⁾² 的常態分布，其中|λ⁽^d⁾ |≤1。根據這些假設可得知θ 的分配與_i^(d⁾ θ 相同屬於標準_i 常態分布N(0,1)。此外，假設在已知總體量尺分數下，領域量尺間會互相獨立；

其中λ 更可表示總體量尺分數與領域量尺分數間的相關，而領域量尺^(d⁾ d與d'間的相關則為λ⁽^d⁾ ×λ⁽^d^'⁾。雖然λ 可為負數，但在教育測驗的應用上總體量尺及領^(d⁾ 域量尺間的相關皆為正的 (de la Torre & Song, 2009) 。

此外，本研究有實作 MH-within-Gibbs sampling 參數估計方法，所以在此省略 MH-within-Gibbs sampling 於 HO-IRT 模式參數估計推論的相關文獻，其推導過程如本研究之第三章的第一節。簡言之，HIRT 模式的參數估計過程比單一層模式來得複雜，所需估計之參數增加及結構複雜程度的提升，使得傳統估計方法，例如：最大邊際概似最大估計法、聯合最大概似估計法與條件邊際概似估計法…等參數估計法不能直接套用。故 Sheng 與 Wikle (2008) 和、de la Torre 與 Song (2009) 皆採用 MCMC 中之 Gibbs sampling 進行參數估計。更甚者，de la Torre 與 Hong (2010) 實作比 Gibbs sampling 更為直觀的 MH-within-Gibbs sampling 於 HIRT 模式的參數估計，以達到同時估計試題參數的目的。

在文檔中階層式試題反應理論模式及其等化估計方法 (頁 13-16)

第二章 文獻探討

第一節 試題反應理論

第二章 文獻探討

第一節 試題反應理論

第二章文獻探討

第一節試題反應理論

第二章文獻探討

第一節試題反應理論