• 沒有找到結果。

第二章 文獻探討

第一節 試題反應理論

第二章 文獻探討

為比較 HIRT、UIRT 與 MIRT 模式的參數估計效果,須先針對 HIRT、UIRT 與 MIRT 模式深入探究;本研究擴充 de la Torre 與 Hong (2010) 所提出的參數估 計方法於多因子 HIRT 模式下的參數估計 (Hsieh, T. Y., Kuo, B. C., & Shih, S. C., 2009) ,於此,須先了解蒙地卡羅馬可夫鏈(Markov Chain Monte Carlo, MCMC) 等相關文獻,並針對 MH-within-Gibbs sampling 進行深入探討;本研究有針對 HIRT 模式提出無參數型估計方法,因此,須先針對 UIRT 無參數型估計方法進 行探討(目前尚無 MIRT 模式的無參數估計方法);最後,針對 HIRT 模式等化同 時估計方法的提出,則須針對等化估計方法進行探究。簡言之,以下將探討四大 類文獻:一、試題反應理論;二、蒙地卡羅馬可夫鏈;三、UIRT 無參數型估計 方法;四、等化估計方法。

第一節 試題反應理論

本論文所比較之試題反應理論(item response theory, IRT)模式,包括單一層次 模式與階層式模式,因此在此節中將論述何謂單一層次模式與階層式模式:

一、單一層次模式

單一層次試題反應理論模式定義量尺分數為單一層次,模式中僅包含量尺 分數與試題兩類的參數,單一層次試題反應理論模式依據其量尺分數變數的多 寡,可分為單向度試題反應理論(unidimensional item response theory, UIRT)模式與 多向度試題反應理論(multidimensional item response theory, MIRT)模式。一般常見 的 UIRT 模 式 , 包 括 單 參 數 對 數 模 式 (one-parameter logistic model) (Rasch, 1960) 、雙參數對數模式(two-parameter logistic model) (Birnbaum, 1968) 、三參 數對數模式(three-parameter logistic model) (Birnbaum, 1968) 。

多 向 度 測 驗 依 據 測 驗 架 構 又 可 以 分 為 題 間 多 向 度 測 驗 (between-item multidimensional test)與題內多向度測驗(within-item multidimensional test)兩種 (Adams, Wilson & Wang, 1997) ;前者如圖 2-1 的(a);後者如圖 2-1 的(b)。

圖 2-1 題間與題內多向度測驗

一般常見的 MIRT 模式,包括多向度二參數模式(multidimensional two parameters model, M2PL) (Mckinley & Reckase, 1983) 、多向度三參數模式 (multidimensional three parameters model, M3PL) (M-3PL; Reckase, 1997) 與多向 度隨機係數多項洛基模式(multidimensional random coefficients multinomial logit model, MRCMLM) (Adams, Wilson, & Wang, 1997) 。

由於,本研究所探究之 HIRT 模式中所用的 MIRT 模式即為 MRCMLM,於 此,將 MRCMLM 定義如方程式(2.1),該模式主要是延伸至 Rasch 模式而成的多 向度模式而來 (Hoskens & De Boeck,1997;Wang, Wilson, & Cheng,2000;Wilson

& Adams,1995) :

8

參 數 估 計 方 法 主 要 有 : 最 大 邊 際 概 似 最 大 估 計 法 (maximum marginal likelihood estimation, MMLE)、聯合最大概似估計法(joint maximum likelihood estimation, JMLE) 與 條 件 邊 際 概 似 估 計 法 (conditional marginal likelihood estimation, CMLE)等方法 (Baker, 2004) 及 MCMC。目前已有相當多的文獻 (Albert, 1992; Baker, 1998; Kim & Cohen, 1999; Patz & Junker, 1997; 1999) 指出 MCMC 應用於單一層次模式中進行參數估計,可獲得正確的估計結果。

二、HIRT 模式

本研究將能同時估計高層次與領域量尺分數的模式定為 HIRT 模式,包括階 層式潛在特質分析模式(hierarchical latent analysis model) (De la Torre & Douglas, 2004) 與二參數常態肩形階層分析模型(2-PL normal ogive analysis mode) (Sheng, 2005) ,然階層式潛在特質分析模式假設總體量尺分數需為離散量,此與一般 IRT 模式在於建立連續量尺分數之目的相違背;二參數常態肩形階層分析模型則假設 所用的 IRT 模式需為二參數常態肩形模式,此外,總體量尺與領域量尺間亦無遵 守等量尺的假設 (de la Torre & Song, 2009) 。於此,de la Torre 與 Song (2009) 提 出 HO-IRT 模式,並論證 HO-IRT 模式是目前較具一般化的 HIRT 模式,且 de la Torre 與 Hong (2010) 提出基於 MH-wthin-Gibbs sampling 的參數估計方法,由 於本研究的 HIRT 模式是以 HO-IRT 模式為基礎,因此加以詳述:

圖 2-2 單因子 HIRT 模式(修改自 de la Torre 與 Song (2009) )

) ( I

βj )

I

λ( λ(II) λ( D) θi

) ( I

θ i θ i( II) θ i( D)

) ( I

Xij Xij( II) Xij( D)

) ( II

βj β( Dj ) 觀察變項以圓圈表示;

其他變項表示待為估計。

de la Torre 與 Song (2009) 和 de la Torre 與 Hong (2010) 所提之 HO-IRT 模式,如 圖 2-2 所示。其中,第一層表示第 i 位受試者在領域量尺d中的第 j 題試題之反 應情形Xij(d),第二層表示受試者的反應透過 IRT 模式中的試題參數β(dj )連結到領 域量尺分數θ ,第三層表示受試者的領域量尺分數透過迴歸參數i( D) λ 連結到相(d) 對應之總體量尺分數θ 。領域量尺分數i θ ,i(d) θ 表示第i(d) i位受試者在領域量尺d 的表現,其中,d =1,2,3,,D;θ 為第i i位受試者在總體量尺分數,並假設領域 量尺分數為高層次能力量尺分數的一線性函數 (de la Torre & Song, 2009) 。

id i d d

i λ θ ε

θ( ) = ( ) + (2.2) 其中,λ 為迴歸參數,(d) ε 為誤差項,id ε 假設服從平均數為 0 且變異數為id 1−λ(d)2 的常態分布,其中|λ(d) |≤1。根據這些假設可得知θ 的分配與i(d) θ 相同屬於標準i 常態分布N(0,1)。此外,假設在已知總體量尺分數下,領域量尺間會互相獨立;

其中λ 更可表示總體量尺分數與領域量尺分數間的相關,而領域量尺(d) dd'間 的相關則為λ(d) ×λ(d')。雖然λ 可為負數,但在教育測驗的應用上總體量尺及領(d) 域量尺間的相關皆為正的 (de la Torre & Song, 2009) 。

此外,本研究有實作 MH-within-Gibbs sampling 參數估計方法,所以在此省 略 MH-within-Gibbs sampling 於 HO-IRT 模式參數估計推論的相關文獻,其推導 過程如本研究之第三章的第一節。簡言之,HIRT 模式的參數估計過程比單一層 模式來得複雜,所需估計之參數增加及結構複雜程度的提升,使得傳統估計方 法,例如:最大邊際概似最大估計法、聯合最大概似估計法與條件邊際概似估計 法…等參數估計法不能直接套用。故 Sheng 與 Wikle (2008) 和、de la Torre 與 Song (2009) 皆採用 MCMC 中之 Gibbs sampling 進行參數估計。更甚者,de la Torre 與 Hong (2010) 實作比 Gibbs sampling 更為直觀的 MH-within-Gibbs sampling 於 HIRT 模式的參數估計,以達到同時估計試題參數的目的。