• 沒有找到結果。

第二章 文獻探討

第二節 估計方法

在認知診斷模式下試題參數的估計經常使用最大期望值演算法

(expectation-maximization, EM algorithm; Dempster , Laird, & Rubin, 1977)逼近或 MCMC技術(Markov Chain Monte Carlo techniques; Tierney, 1994)。但這二個方法 不僅只能使用於參數估計,也能用來估計模式的適配,利用EM法來估計模式的 適配,包含DINA(de la Torre, 2008)、NIDA(Maris, 1999)及general diagnostic model (GDM) (von Davier, 2005),使用MCMC技術估計模式適配上則有DINA及NIDA(de la Torre & Douglas, 2008),及fusion model (Hartz, 2002)。

上述這些論文概述出了演算法,有些並被撰寫成程式,或能利用現有的軟體 呈現出來,這些軟體包含了Arpeggio (Educational Testing Service, 2004),一個可 估計fusion模式的商業軟體及一個常用的商業軟體M-Plus (Muthén & Muthén, 1998-2006),可基於log linear models上來估計CDMs家族(Henson, Templin, &

Willse, 2009)。

茲分別介紹二種估計方法:

壹、EM 參數估計法

因最大期望值演算法(Expectation-Maximization Algorithm)可以應用到各種領 域,在此僅介紹在 DINA 模式下使用 EM 演算法來估計參數的方法。

首先,定義 DINA 模式中正確答對機率之方程式,

!(0H) = - QR 0H < 

1 − ) QR 0H =  (2-5) 其中, 是Q矩陣轉置後的第j 行。所以,當0$H  < 時&$ = 0;當0H = 

時&H = 1。

定義#的邊際概似區間為下式:

壹、 MCMC 參數估計法

現今IRT模式的發展愈來愈複雜,其估計模式相當受重視,若使用傳統測驗 理論(如古典測驗理論或單參數試題反應理論)進行分析,可能會造成測量結果 客觀性及可比較性不足。一般較複雜的IRT模式之參數估計是MMLE/EM(Bock

&Aitkin, 1981),但當模式愈來愈複雜時,EM演算法將難以直接應用。MCMC 法是在多變量模式中模擬隨機抽樣之方法,不同於EM演算法,因MCMC之計算 過程不會牽涉積分或微分,故可簡單地被應用(Patz & Junker, 1999)。

MCMC是透過多次的重複遞迴抽樣,建構出馬可夫鏈(Markov chain),進 而求得一平穩分配,即是貝氏架構下的後驗(posterior)分配,藉由馬可夫鏈中 的隨機變數可了解變數的特質。MCMC在統計上應用的範圍非常廣泛,建構馬可 夫鏈的方法亦有很多,以下僅針對 MCMC所使用的Gibbs sampler法及

Metropolis-Hastings algorithm 做介紹。

一、Gibbs sampler

假設隨機變數]^,n ≥ 0 為一馬可夫鏈,通常]^ 的可能集合S 稱為]^的狀態 空間(state space),其中每一個隨機變數所發生的機率都只和前一個隨機變數有 關,也就是 ]^` 是從條件機率分配P ( ]^|]^`)中產生,其中P (.|.) 稱為馬可夫 鏈的轉置核(transition kernel)。而所謂平穩的馬可夫鏈就是P(]^|]^`) 中的轉 換機率和狀態有關,但和時間 t 無關。

在IRT模式中,假設需要推論θ b 兩參數,則馬可夫鏈的轉置核為:

ab(cE, dE), ((c, d)e = !b ]^` = (c, d)|]^ = (cE, dE) e (2-10) 隨著n 增加,P(]^|]^`) 會收斂到平穩分配 f(c, d),在貝氏架構中,期望透過 馬可夫鏈來定義後驗分配 !(c, d|]) 為 f(c, d),而平穩分配為:

g ab(ci,j E, dE), ((c, d)ef(cE, dE)h(cE, dE) = f(c, d) (2-11) 其中, f(c, d) 為後驗分配。由此可知,只要找到馬可夫鏈的建構方法,即可

推算出期望求得的後驗分配。Gibbs sampling即是建構馬可夫鏈的方法之ㄧ。

假設f(c, d) = !(c, d|]),且參數 θ b 完全條件獨立,由式子(2-10),

可將轉置核公式定義如下(Geman & Geman, 1984):

ab(cE, dE), (c, d)e = !(c|dE, ])!(d|c, ]) (2-12) 其中,!(c |d, ])!(d|c, ])稱為完全條件分配(full conditional distribution)。

Gibbs sampling的演算步驟如下:

(一)給定所有參數起始值:(cE, dE)

(二)透過完全條件分配反覆抽取M+N組參數估計值,其迭代過程如下:

1. 由!(c |dE, ])中抽取出c,由!(d|c, ])中抽取出d。 2. 由!(c |d, ])中抽取出c,由!(d|c, ])中抽取出d。 3. 由!(c< |d, ])中抽取出c<,由!(d<|c<, ])中抽取出d<

重複以上迭代過程,即可得到M+N組參數估計值。

(三)最後刪去前面的M組(即為burn-in),保留後面的N組(即為sampling)用 來分析。當樣本數N夠大時,參數估計值將會趨近於平穩分配(Tierney, 1994)

二、 Metropolis-Hastings algorithm

Gibbs sampler 是 Metropolis-Hastings algorithm 的一個特例,所有的 MCMC 演算法都是以 Metropolis-Hastings algorithm 為基礎的,且在比較複雜的情形下 Gibbs sampler 取樣時比較困難的,這時就必需使用 Metropolis-Hastings algorithm。

(B. Walsh, 2004)。

Metropolis-Hastings algorithm 演算步驟如下:假設平穩分配 R(k),依其特 性給定一個轉換函數(. |. ),則

(一)給定所有參數起始值:X0 =(X10,L,X0p) t=1,2,3,L

(二)透過轉換分配產生參數估計值, X ~q(|Xt1)

(三)計算

de la Torre (2004)使用 MCMC 法的 Metropolis-Hastings algorithm 來估計 HO-DINA 模式的試題參數及高層能力。估計結果與模擬資料真值的誤差不超過 0.02。25 次的模擬結果也只有微小的不同。故使用 MCMC 法是可以正確估計 HO-DINA 模式的。

de la Torre(2009a)使用同一筆資料分別使用 DINA 模式以 EM 法估計及使用 HO-DINA 模式以 MCMC 法估計,得到的估計結果相當一致。de la Torre(2010) 即以 HO-DINA 模式產生模擬資料,並以 EM 法估計來探討在 DINA 模式下不同

相關文件