• 沒有找到結果。

UIRT 和 MIRT 之多點計分模式

第二章 文獻探討

第二節 UIRT 和 MIRT 之多點計分模式

壹、UIRT之PCM模式

相較於古典測驗理論(classical test theory, CTT),試題反應理論(item response theory, IRT)是測驗領域中較新的技術,它已經被應用在教育、心理、醫療等相關 領域中。我國的國中基本學力測驗、美國的TOEFL(Test of English as a Foreign Language)和TOEIC(Test of English for International Communication)考試,以及國外 著名的大型測驗,如PIRLS、PISA、TIMSS、NAEP等等,皆使用IRT之相關理論 作為其學術研究的主要工具之一。

試題反應理論建立在兩個基本概念上:(1)受試者在某一測驗試題上的表現情 形,可由一組因素來加以預測或解釋,這組因素叫作潛在特質(latent traits)或能力 (abilities);(2)受試者的表現情形與其能力間的關係,可透過一條連續性遞增的函 數來加以詮釋,此函數稱為試題特徵曲線(item characteristic curve, ICC)(余民寧,

1992)。任何一條試題特徵曲線代表受試者答對某一試題的機率,是由其能力和 試 題 的 特 性 所 共 同 決 定 ( 余 民 寧 , 1992 ) 。 IRT 模 式 必 頇 符 合 單 向 度 (unidimensionality)、局部獨立性(local independence)、非速度性(nonspeedness)及

「知道-正確」假設(“know-correct” assumption)四項基本的假設(Weiss & Yoes, 1991)。唯有這些假設成立的前提下,才能使用IRT進行測驗資料分析。

單向度的假設是試題反應理論中各種模式最常用的共同假設:測驗中的各個 試題都測量到同一種共同的能力或潛在特質;這種單一能力或潛在特質(因素)

必頇包含在測驗試題裡。因此,試題反應理論中對測驗必頇具有單向度因素的基 本看法,認為只要該測驗具有能夠影響測驗結果的一個「主要成份或因素」

(dominant component or factor),便算符合單向度假設的基本要求,而這個主要因 素所指的,即是該測驗所測量到的單一能力或潛在特質。因此適用於含有單一主

常用的單向度試題反應模式,依測驗資料不同而有其適合之模式。多點計分

   

多向度測驗(within-item multidimensional test) (Wang, Wilson, & Adams, 1997)。題 間多向度測驗(如圖 2-2)裡的每題試題皆為單向度試題,意即每試題只測量單

圖 2-3 題內多向度測驗模式 MIRT。由 Adams、Wilson 與 Wang(1997)所提出來的 MRCMLM 為 Rasch 模式 的衍生模式,如公式(10)所示:

B :整份測驗的計分矩陣(scoring matrix)

MRCMLM屬於指數家族分布,其中受試者的潛在特質是隨機效果,試題特 性 是 固 定效 果 , 經 由 logit的轉換,潛在特質和試題特性是線性關係。因此 MRCMLM 為 一 般 化 線 性 混 合 模 式 (generalized linear mixed model, GLMM;

McCullagh & Nelder, 1989; McCulloch & Searle, 2001; Nelder & Wedderburn, 1972;

Rijmen et al., 2003),功能多、包容性廣,舉凡最原始的Rasch模式﹙Rasch, 1960﹚、 Fischer﹙1973﹚的LLTM﹙logistic latent trait model﹚、Andrich ﹙1978﹚的RSM﹙rating scale model﹚、Masters﹙1982﹚的PCM等,都是它的特例。透過計分矩陣和設計 estimation, JMLE)、邊際最大概似估計法(marginal maximum likelihood estimation, MMLE) 及 條 件 最 大 概 似 估 計 法 (conditional maximum likelihood estimation, CMLE),由於 MMLE 適用於任何模式、不受測驗長度限制及參數估計較為精確 (Embretson & Reise, 2000),且 Bock 與 Aitken(1981)提出 EM(E-M algorithm)算則 簡化計算過程,因此本研究在 UIRT、MIRT 模式下之參數估計使用 MMLE/EM

通常在單向度的試題反應模式中,學生抽樣的母群通常來自常態分布,平均

計算第

t

次迭代

n的邊際後驗機率,其中,

(t)

(t)

(t)是第

t

次迭代

、 (Bayes expected a posteriori procedure, EAP)法可以估計全對或全錯的作答反應,且 均方根誤(root mean square of error, RMSE)較小(洪碧霞、吳裕益、吳鐵雄、陳英 豪,1992),故本研究在UIRT、MIRT模式之能力估計使用EAP法。