• 沒有找到結果。

第二章 文獻探討

第二節 多層次試題反應理論

一、IRT

IRT 為以數學關係描述一組或一個潛在特質,影響答題反應情形的理論,其 數學關係式稱為試題特徵函數,繪成圖形稱作試題特徵曲線 (item characteristic curve)。IRT 的三個基本假設為:

1. 單一向度 (unidimensionality):測驗中的所有試題都測量到一個共同的潛在特 質,測驗結果不受其他因素干擾。

2. 局部獨立性:考慮學生的能力後,學生在不同試題的答題反應無任何相關。

3. 非速度測驗:受試者有足夠的時間完成所有試題,亦即考試成績不理想,是能 力不足而非時間不夠。

但 實 際 應 用 上 , 常 因 測 驗 目 的 不 同 , 測 驗 可 能 為 速 度 測 驗 、 多 向 度 (multidimension) 測驗,而出現違反這三個基本假設的情況,相關研究已對不同 情況提出適合的模型,如 Mckinley and Reckase (1982) 提出多向度的單參數模 式,可測量一個以上的潛在特質,但因未考慮各向度權重,有研究加以改進,但 改進後,模型受限於各試題難度必須相等,故較少使用。Thissen and Steinberg (1986) 依 不 同 假 設 與 參 數 估 計 的 方 式 , 將 IRT 歸 納 為 三 大 類 : 差 異 模 式 (Difference Model)、除總模式 (Divide-by-Total Model) 與左加模式 (Left-Side- Added Model),以 IRT 處理二元資料時,使用最廣泛的為對數 (logistic) 模式,

其根據參數不同又分為 Rasch 模式、二參數與三參數對數模式,三者介紹如下:

(一) Rasch 模式

(二) 二參數對數模式 (two-parameter logistic model)

(三) 三參數對數模式 (three-parameter logistic model)

二、多層次試題反應理論 (Multilevel Item Response Theory)

許多研究基於不同觀點,將 IRT 視為多層次模型的一種 (Adams, Wilson, &

Wang, 1997; Hedeker & Gibbons, 1993),以下介紹幾種觀點:

1. 為使邊際最大概似估計法 (marginal maximum likelihood estimation) 方便估計 試題參數,將受試者的能力參數視為隨機變數,避免同時估計試題參數與能力 參數時,發生不一致的問題 (Neyman-Scott problem) (Neyman & Scott, 1948)。

這種處理方式將試題參數視為固定影響,將能力參數視為隨機影響,亦是多層 次模型的觀點。Singer (1998) 更基於上述,把能力參數分解成固定效果和隨機 效果的線性組合,討論這種混合效果模式 (mixed effect model) 和多層次線性 模式 (multilevel linear model) 等價的概念。

2. 受試者因來自不同學校或不同種族,而有不同特徵,故依其背景變項將受試者 分 成 不 同 群 , 並 定 義 各 群 受 試 者 的 能 力 值 為 不 同 分 配 。 接 著 以 多 群 體 (multiple-group) 的觀點,呈現多層次試題反應理論,也以此估計試題參數 (Bock & Zimowski, 1997; Mislevy, 1983; Mislevy & Bock, 1989),可應用在 DIF (differential item functioning) 或參數浮動模型 (item parameter drift model) (Bock, Muraki, & Preiffenberger, 1988; Thissen, Steinberg, & Wainer, 1993)。

3. 將試題參數分解成數個參數的組合,並加入試題特徵變數,探討試題對誤差的 解釋程度,有別於一般分解能力參數的觀點。Fischer (1973, 1983) 將 Rasch 模 式的試題參數分解成數個參數的線性組合,稱做線性潛在試題模式 (linear latent test model),即是此觀點的代表。

4. 第 4 種 多 層 次 試 題 反 應 理 論 的 觀 點 , 為 調 查 評 分 者 的 影 響 。 多 層 面 (many-faceted) 模式是指在 IRT 的模型中,加入代表評分者的變數 (Linacre, 1989),Patz, Junker, and Jihnson (1999) 也將評分者的影響以多層次模式呈現。

綜合上述,多層次試題反應理論,多半基於參數分解的觀點,以便以一步驟 的方式估計,減少參數標準誤。本研究則是運用 Kamata (2001) 提出的理論,將

受試者個人與作答反應視為巢套設計。假設各試題作答反應包含於受試者內,如 圖 2-5 所示,以階層線性模式的觀點解釋 Rasch 模式 (Kamata, 2001; van den Noortgate, De Boeck, & Meulders, 2003),提出 1-P HGLLM。現以圖 2-5 的資料結 構,介紹 1-P HGLLM 和 Rasch 模式的關係。 (Bernoulli distribution) , 期 望 值 為

Y

ij

i

(

i

=1,2...,

k

)

連結函數有許多種,在此取二元試題最常用的對數函數為連結函數 (Raudenbush

相關文件