多層次試題反應理論

第二章文獻探討

第二節多層次試題反應理論

一、IRT

IRT 為以數學關係描述一組或一個潛在特質，影響答題反應情形的理論，其數學關係式稱為試題特徵函數，繪成圖形稱作試題特徵曲線 (item characteristic curve)。IRT 的三個基本假設為：

1. 單一向度 (unidimensionality)：測驗中的所有試題都測量到一個共同的潛在特質，測驗結果不受其他因素干擾。

2. 局部獨立性：考慮學生的能力後，學生在不同試題的答題反應無任何相關。

3. 非速度測驗：受試者有足夠的時間完成所有試題，亦即考試成績不理想，是能力不足而非時間不夠。

但實際應用上，常因測驗目的不同，測驗可能為速度測驗、多向度 (multidimension) 測驗，而出現違反這三個基本假設的情況，相關研究已對不同情況提出適合的模型，如 Mckinley and Reckase (1982) 提出多向度的單參數模式，可測量一個以上的潛在特質，但因未考慮各向度權重，有研究加以改進，但改進後，模型受限於各試題難度必須相等，故較少使用。Thissen and Steinberg (1986) 依不同假設與參數估計的方式，將 IRT 歸納為三大類：差異模式 (Difference Model)、除總模式 (Divide-by-Total Model) 與左加模式 (Left-Side- Added Model)，以 IRT 處理二元資料時，使用最廣泛的為對數 (logistic) 模式，

其根據參數不同又分為 Rasch 模式、二參數與三參數對數模式，三者介紹如下：

(一) Rasch 模式

(二) 二參數對數模式 (two-parameter logistic model)

(三) 三參數對數模式 (three-parameter logistic model)

二、多層次試題反應理論 (Multilevel Item Response Theory)

許多研究基於不同觀點，將 IRT 視為多層次模型的一種 (Adams, Wilson, &

Wang, 1997; Hedeker & Gibbons, 1993)，以下介紹幾種觀點：

1. 為使邊際最大概似估計法 (marginal maximum likelihood estimation) 方便估計試題參數，將受試者的能力參數視為隨機變數，避免同時估計試題參數與能力參數時，發生不一致的問題 (Neyman-Scott problem) (Neyman & Scott, 1948)。

這種處理方式將試題參數視為固定影響，將能力參數視為隨機影響，亦是多層次模型的觀點。Singer (1998) 更基於上述，把能力參數分解成固定效果和隨機效果的線性組合，討論這種混合效果模式 (mixed effect model) 和多層次線性模式 (multilevel linear model) 等價的概念。

2. 受試者因來自不同學校或不同種族，而有不同特徵，故依其背景變項將受試者分成不同群，並定義各群受試者的能力值為不同分配。接著以多群體 (multiple-group) 的觀點，呈現多層次試題反應理論，也以此估計試題參數 (Bock & Zimowski, 1997; Mislevy, 1983; Mislevy & Bock, 1989)，可應用在 DIF (differential item functioning) 或參數浮動模型 (item parameter drift model) (Bock, Muraki, & Preiffenberger, 1988; Thissen, Steinberg, & Wainer, 1993)。

3. 將試題參數分解成數個參數的組合，並加入試題特徵變數，探討試題對誤差的解釋程度，有別於一般分解能力參數的觀點。Fischer (1973, 1983) 將 Rasch 模式的試題參數分解成數個參數的線性組合，稱做線性潛在試題模式 (linear latent test model)，即是此觀點的代表。

4. 第 4 種多層次試題反應理論的觀點，為調查評分者的影響。多層面 (many-faceted) 模式是指在 IRT 的模型中，加入代表評分者的變數 (Linacre, 1989)，Patz, Junker, and Jihnson (1999) 也將評分者的影響以多層次模式呈現。

綜合上述，多層次試題反應理論，多半基於參數分解的觀點，以便以一步驟的方式估計，減少參數標準誤。本研究則是運用 Kamata (2001) 提出的理論，將

受試者個人與作答反應視為巢套設計。假設各試題作答反應包含於受試者內，如圖 2-5 所示，以階層線性模式的觀點解釋 Rasch 模式 (Kamata, 2001; van den Noortgate, De Boeck, & Meulders, 2003)，提出 1-P HGLLM。現以圖 2-5 的資料結構，介紹 1-P HGLLM 和 Rasch 模式的關係。 (Bernoulli distribution) ，期望值為

Y

i

(

i

=1,2...,

k

)

連結函數有許多種，在此取二元試題最常用的對數函數為連結函數 (Raudenbush

在文檔中階層線性模式與Rasch模式在題組效果下之參數估計模擬比較 (頁 20-27)

第二章 文獻探討

第二節 多層次試題反應理論

Y

i

i

k

第二章文獻探討

第二節多層次試題反應理論