UIRT 和 MIRT 之多點計分模式 - 文獻探討 - 階層式試題反應理論之多點計分模式探討

第二章文獻探討

第二節 UIRT 和 MIRT 之多點計分模式

壹、UIRT之PCM模式

相較於古典測驗理論(classical test theory, CTT)，試題反應理論(item response theory, IRT)是測驗領域中較新的技術，它已經被應用在教育、心理、醫療等相關領域中。我國的國中基本學力測驗、美國的TOEFL(Test of English as a Foreign Language)和TOEIC(Test of English for International Communication)考試，以及國外著名的大型測驗，如PIRLS、PISA、TIMSS、NAEP等等，皆使用IRT之相關理論作為其學術研究的主要工具之一。

試題反應理論建立在兩個基本概念上：(1)受試者在某一測驗試題上的表現情形，可由一組因素來加以預測或解釋，這組因素叫作潛在特質(latent traits)或能力 (abilities)；(2)受試者的表現情形與其能力間的關係，可透過一條連續性遞增的函數來加以詮釋，此函數稱為試題特徵曲線(item characteristic curve, ICC)（余民寧，

1992）。任何一條試題特徵曲線代表受試者答對某一試題的機率，是由其能力和試題的特性所共同決定（余民寧， 1992 ）。 IRT 模式必頇符合單向度 (unidimensionality)、局部獨立性(local independence)、非速度性(nonspeedness)及

「知道-正確」假設(“know-correct” assumption)四項基本的假設(Weiss & Yoes, 1991)。唯有這些假設成立的前提下，才能使用IRT進行測驗資料分析。

單向度的假設是試題反應理論中各種模式最常用的共同假設：測驗中的各個試題都測量到同一種共同的能力或潛在特質；這種單一能力或潛在特質（因素）

必頇包含在測驗試題裡。因此，試題反應理論中對測驗必頇具有單向度因素的基本看法，認為只要該測驗具有能夠影響測驗結果的一個「主要成份或因素」

(dominant component or factor)，便算符合單向度假設的基本要求，而這個主要因素所指的，即是該測驗所測量到的單一能力或潛在特質。因此適用於含有單一主

常用的單向度試題反應模式，依測驗資料不同而有其適合之模式。多點計分

   

多向度測驗(within-item multidimensional test) (Wang, Wilson, & Adams, 1997)。題間多向度測驗（如圖 2-2）裡的每題試題皆為單向度試題，意即每試題只測量單

圖 2-3 題內多向度測驗模式 MIRT。由 Adams、Wilson 與 Wang(1997)所提出來的 MRCMLM 為 Rasch 模式的衍生模式，如公式(10)所示：

B ：整份測驗的計分矩陣(scoring matrix)

MRCMLM屬於指數家族分布，其中受試者的潛在特質是隨機效果，試題特性是固定效果，經由 logit的轉換，潛在特質和試題特性是線性關係。因此 MRCMLM 為一般化線性混合模式 (generalized linear mixed model, GLMM;

McCullagh & Nelder, 1989; McCulloch & Searle, 2001; Nelder & Wedderburn, 1972;

Rijmen et al., 2003)，功能多、包容性廣，舉凡最原始的Rasch模式﹙Rasch, 1960﹚、 Fischer﹙1973﹚的LLTM﹙logistic latent trait model﹚、Andrich ﹙1978﹚的RSM﹙rating scale model﹚、Masters﹙1982﹚的PCM等，都是它的特例。透過計分矩陣和設計 estimation, JMLE)、邊際最大概似估計法(marginal maximum likelihood estimation, MMLE) 及條件最大概似估計法 (conditional maximum likelihood estimation, CMLE)，由於 MMLE 適用於任何模式、不受測驗長度限制及參數估計較為精確 (Embretson & Reise, 2000)，且 Bock 與 Aitken(1981)提出 EM(E-M algorithm)算則簡化計算過程，因此本研究在 UIRT、MIRT 模式下之參數估計使用 MMLE/EM

通常在單向度的試題反應模式中，學生抽樣的母群通常來自常態分布，平均

且

計算第

t

次迭代



_n的邊際後驗機率，其中，



^(t⁾、



^(t⁾和



^(t⁾是第

t

次迭代



、 (Bayes expected a posteriori procedure, EAP)法可以估計全對或全錯的作答反應，且均方根誤(root mean square of error, RMSE)較小（洪碧霞、吳裕益、吳鐵雄、陳英豪，1992），故本研究在UIRT、MIRT模式之能力估計使用EAP法。

在文檔中階層式試題反應理論之多點計分模式探討 (頁 21-30)

UIRT 和 MIRT 之多點計分模式

第二章 文獻探討

第二節 UIRT 和 MIRT 之多點計分模式

壹、UIRT之PCM模式

   

t









t



第二章文獻探討