第二章 文獻探討
第二節 能力估計方法相關研究
爲說明上的方便,先定義本節所使用之符號:
N :受試者(subject or examinee)人數 n :測驗長度
τ :影響能力參數分布之超參數(hyperparameter)
η:影響試題參數分布之超參數(hyperparameter) )
,
| (U ξ θ
L :已知ξ,θ的條件下,抽樣試題反應的概似函數 )
| (ξ η
g :已知η的條件下,ξ之先驗分布
壹、邊際最大概似法
Birnbaum(1968) 提 出 聯 合 最 大 概 似 法 (joint maximum likelihood estimation, JMLE),其主要特色是能力值參數與試題參數以迭代方式共同估計,
因此會發生Neyman-Scott 問題,即當樣本數越大時,所要估計的能力參數也越 多,估計的精準度無法藉由樣本數的增加而提升,使得參數的估計缺乏一致性 (Baker, 2004)。為避免 Neyman-Scott 問題,Bock & Lieberman (1970) 提出 邊際最大概似法(marginal maximum likelihood estimation, MMLE)來進行參 數估計。
但其方法在計算上相當繁雜,僅適用於非常短的測驗,Bock & Aitkin (1981) 採用EM 演算法改進 MMLE。本文中把 Bock & Aitkin (1981)的參數估計法稱 為MMLE/EM 法。茲詳述 MMLE/EM 之估計方法如下:
MMLE/EM 分成三個步驟進行試題參數及能力參數的估計:
一、E-步驟
1. 設定試題參數及能力參數的起始值,並將所有受試者依能力參數排序後分為 q組,並以其組中點Xk代表該組的能力值。(k =1,2,L,q)
2. 令 ij,計算在各組中點Xk之每種作答反應的概似機 率。
ij u
k i u k i n
i
k P X Q X
X
L( )=
Π
( ) ( )1−3. 根據組中點的權重A(Xk)計算第 j位能力值為Xk的後驗機率(posterior
probability):
2
貳、貝氏估計法
MMLE/EM 解決了 JMLE 估計上的 Neyman-Scott 問題,但對於受試者答 對或答錯該測驗中所有試題的情況時,MMLE/EM 則無法進行能力參數的估計 (Baker, 2004)。
Swaminathan & Gifford (1982) 提 出 以 貝 氏 理 論 為 基 礎 並 結 合 由 Birnbaum 所提出的二階段估計法,以進行 IRT 的參數估計。這種以貝氏理論為 基礎的估計法能有效結合先前的先驗分布(prior distribution)與蒐集所得的概 似 機 率(likelihood) , 並 透 過 貝 氏 定 理 求 得 參 數 的 後 驗 機 率 分 布 (posterior distribution) 以進行試題參數、能力參數等未知參數的推論 (Baker, 2004)。
因此以貝氏理論為架構之二階段估計法除可獲得穩定之試題參數估計值 外,對於全對或是全錯的作答反應組型之能力估計亦可獲得正確的估計結果 (Lindley, 1971)。
貝氏理論為架構之二階段估計法主要分成:試題參數估計部分與能力參數估
正如同JMLE、MMLE/EM,邊際化貝氏估計法亦假設試題間為獨立,是故 採逐題估計。爲估計未知的試題參數,將下式
∫∫
由上述方程式可以發現,與Bock & Aitkin (1981)所提之 MMLE/EM 估計 法中的試題參數估計法的方程式相比較,多了一個先驗分布(prior distribution) 在 其 中 。Baker (2004) 指 出 BILOG-MG 中 假 設 各 試 題 參 數 之 先 驗 分 布
) ] 法(Bayes expected a posteriori estimation procedure, EAP) 進行能力參數的 估計,能力參數估計方程式如下式所示:
Mislevy & Bock (1982) 提出以貝氏理論為基礎之貝氏後驗
∑
可以直接計算,不必經由迭代的過程。Mislevy Stocking (1989) 建議以 EAP 作能力參數估計的方法。
以EAP 進行能力參數估計,
&
參、
,但是在實際應用過程中仍會衍生以下幾個問題(Wolfgang & Marlene , 2004
組距太大會使得圖形失真,所以由組距大小界定最佳的平滑程度有其困難度。
圖的形狀,進一步會影響到面積的估計,所以
MMLE/EM-MIX 法之能力參數估計法及改良後的 E-步驟、M-步驟如下:
1. 已知
基於核平滑化法之估計法
Bock & Aitkin(1981)所提之 MMLE/EM 法在估計試題參數過程中主要 分成E-步驟及 M-步驟,E-步驟主要目的為計算各組人數之期望值以及各組於各 題的答對人數之期望值,M-步驟主要藉由 E-步驟中所獲得的參數來估計試題參 數。BILOG-MG 在應用 MMLE/EM 估計試題參數過程中,即是使用此方法進行 試題參數之估計,然在估計過程中涉及到數值運算的部分:估計能力的機率分 布。目前BILOG-MG 採用直方圖的估計方法(Zimowski, Muraki, Mislevy &
Bock, 1996)。該方法雖然很方便,亦能針對能力參數在非常態的情況下進行正 確的估計
)
一、組距難以決定
組距的大小會對直方圖的形狀有影響,組距變大會使得曲線變得較平滑,然
二、原點難以決定
即使是同一筆資料,在固定組距大小的情況下,原點位置的不同會影響直方 由原點位置的決定有其困難度。
根據上述可知,BILOG-MG 中的 MMLE/EM 估計法是有其問題,因此張雅 媛 (2007) 提 出 基 於 MMLE/EM-MIX 估 計 法 改 良 該 步 驟 , 茲 詳 述
E-步驟
θ ,以核平滑化i 法進行無參數曲線估計,得到能力參數的機率分布如下:
) ( 2 ) ( 1 ) 1
(
1
π θ
θ K
P Nh
N
j
⋅
=
∑
=
) h:帶寬參數(bandwid
)
如同貝式估計法,各符號定義如下:
∑
∑
=
= =
= q
k
k mix k q
k
k mix k k j
j j
X A X L
X A X L X U
E
1 1
) ( ) (
) ( ) ( )
,
|
(θ ξ θ
最後持續E-步驟及 M-步驟直至其概似機率不再變動為止。
MMLE/EM-MIX 估計法與 MMLE/EM 估計法一樣,使用二階段估計法。
第一階段依上述法估計試題參數完畢後,便固定試題參數,再於第二階段應用 EAP 估計法來進行能力參數的估計。期望能改進原先 MMLE/EM 在估計能力參 數分布的缺點,並期望應用於不同能力分布下進行試題參數及能力參數之估計,
都能獲得較高的估計精準度。