• 沒有找到結果。

試題反應理論(item response theory, IRT)是現代測驗理論的主要架構,

為國內外測驗學者廣泛應用,且為測驗學界的主流趨勢。然而,由於受試 者的能力參數和試題參數的真值在現實生活中無法預知,故無法評斷估計 所得的參數是否精確,故只能以電腦模擬試驗的方式模擬參數真值,藉由 真值模擬作答反應,以該作答反應進行參數估計,再計算參數估計值和真 值之間的誤差作為評斷不同估計法優劣的指標。

目前已有數種 IRT 應用軟體問世,比如說:BILOG­MG、ICCNP、 

MULTILOG (Thissen, 1991)、PARSCALE (Muraki & Bock, 1996),每種軟體 適用的模式及參數估計方法皆不太相同。趙素珍(1998)採用真實資料與 模擬資料並用的方式,利用三參數對數模式製造二元計分資料,來測試上 述四種 IRT 軟體的實際應用情形及其參數估計精準度,研究結果指出試題 參數與能力值參數皆以 BILOG­MG  軟體的估計最為精確與穩定。

然 BILOG­MG 在應用邊際最大概似法(marginal maximum likelihood  estimation/ EM, MMLE/EM)估計試題參數過程中(Mislevy & Bock, 1989),

涉及估計能力的機率密度函數部分,BILOG­MG 採用直方圖的估計方法,

但是在實際應用過程中則有組距及原點以決定的問題。因此,若能有較精 準的估計法,相信必能提升整體的估計精確度。

加拿大心理計量學者 Ramsay (1991)成功地結合高低試題鑑別指數與 核平滑無參數估算法,發展出正確選項與誘答選項均可分析之核平滑法無 參數試題特徵曲線估算法(kernel smoothing approaches to nonparametric 

本章分為四節,第一節介紹研究動機,第二節介紹研究目的,第三節 介紹研究問題。

第一節 研究動機 

BILOG­MG 在應用邊際最大概似法(marginal maximum likelihood  estimation/ EM, MMLE/EM)估計試題參數過程中(Mislevy & Bock, 1989),

涉及估計能力的機率密度函數部分,BILOG­MG 採用直方圖的估計方法,

該方法雖然很方便,亦能針對能力參數為非常態的情況下進行正確的估 計,但是在實際應用過程中則有組距難及原點以決定的問題。

故本研究以無參數的核平滑化(kernel smoothing)來估計能力的機率密 度函數,期望克服直方圖估計所遭遇的問題並提升估計精準度。

為探討本研究所提出之基於核平滑化法之邊際最大概似估計法(簡稱  MMLE/EM­MIX)是否可行,本研究將與 BILOG­MG 比較估計結果估計之 精準度

第二節 研究目的

本研究欲了解在不同人數、測驗長度、不同能力分布時,以  MMLE/EM­MIX 及 BILOG­MG 進行參數估計之精準度比較。

茲將本研究目的敘述如下:

一、了解 BILOG­MG 在不同情況下之參數估計的效果。

二、開發新的參數估計法 MMLE/EM­MIX。

三、了解 MMLE/EM­MIX 在不同情況下之參數估計的效果。

四、比較 MMLE/EM­MIX 及 BILOG­MG 於不同情況下參數估計的效果。

第三節 研究問題

本研究欲探討的問題有三,茲分述如下:

一、各變項對 BILOG­MG 進行參數估計效果的影響為何?

二、各變項對 MMLE/EM­MIX 進行參數估計效果的影響為何?

三、比較 MMLE/EM­MIX、BILOG­MG 於不同情況下參數估計效果之優 劣?

相關文件