第二章 文獻探討
第一節 試題反應理論
第二章 文獻探討
本章針對「試題反應理論」、「組卷問題之研究」、「基因演算法」及「粒子群演 算法」等相關文獻進行探討。
第一節 試題反應理論
壹、單向度試題反應理論
學者為了克服古典測驗理論的缺失,發展出試題反應理論。試題反應理論的架 構,主要以依據強勢假定(strong assumption)而來,其理論假設合理與嚴謹,深受學 者青睞取代古典測驗理論。UIRT 介紹如下:
一、基本假定
重要的基本假定(Hambleton & Swaminathan, 1985; Hambleton, Swaminathan, &
Rogers, 1991; 余民寧,1992; 施淑娟,1997; 許擇基、劉長萱,1992)敘述如下所示:
(一) 單向度(unidimentionality)
單向度指在測驗中每個試題只測驗到同一種相同能力。例如:數學測驗 其試題以英文描述,其受試者必須先了解題意才能解題,因此,測驗不只測 數學能力,同時也測驗到英文能力兩個向度能力。
(二) 局部性獨立(local independence)
局部性獨立指當受試者能力固定不變時,受試者對於任何一題做答好 壞,不受其它試題的影響,即試題間彼此獨立。
二、單向度試題反應理論模式
IRT 是利用試題特徵曲線來描述受試者能力值與試題特性答對某一題的機率。
8
以基本假定成立為前提,二元計分主要分成三種模式:單參數對數模式、二參數對 數模式、三參數對數模式,以下分別介紹。
(一)單參數對數模式
單參對數模式(one-parameter logistic model, 1PLM)由 Rasch(1960)提出,又 稱 Rasch model,其模式包含受試者的能力參數與試題的難度參數,如公式(1)所
由學者 Birnbaum(1968)提出二參數對數模式(two-parameter logistic model, 2PLM),比 1PLM 多加入試題鑑別度參數,如公式(2)所示:
三參數對數模式在 2PLM 多加入試題的猜測度參數(guessing parameter),此模式 由 Lord(1974)提出三參數對數模式(three -parameter logistic model, 3PLM),Lord 指出在試題中放入誘答錯誤選項,使猜對的機率低於隨機亂答而對的機率,因此加
9
能力值;bi為第 i 題試題的難度;ai為第 i 題試題的鑑別度;ci為第 i 題試題的猜測 度。
三、單向度 IRT 訊息函數
訊息函數在試題反應理論中扮演重要角色,如組卷(test construction)、試題挑選 (item selection)、測量精確度的評估(assessment of precision of measurement)、測驗相 對效能比較(comparison of relative efficiency of tests)、計分權重的決定(determination of scoring weights)等問題(余民寧,1997)。
以三參數對數模式為例,該模式試題訊息函數(item information function)如公 式(4)所示(Birnbaum, 1968; Lord, 1980),在試題反應理論中,用來描述試題或測 驗,且常被作為選題或組卷的參考依據,當訊息量越大時,估計值的估計誤差越小,
10
目前在組卷相關研究中,都是使用單向度試題反應理論。Ackerman, Gierl, &
Walker(2003)指出許多教育和心理測驗本身就是多向度的,意味著這些測驗測量二個 或更多的向度或構念。在UIRT中,單向度是試題反應理論其中之一的基本假設,單 向度假定是指在測中各試題只測量到同一相同種能力,此單一能力須在測驗試題假 設中。但實際上許多測驗情境,不單純只有測量單一能力,例如心理測驗、綜合能 力測驗。因此有學者提出多向度試題反應理論(Reckase, 1985; van der Linden &
Hambleton, 1996),以嘗試解決測驗實際應用上的問題。
貳、多向度試題反應理論
單向度測驗理論已漸漸不符合多向度的試題,學者朝多向度試題反應理論發 展。隨者電腦與網路的發達,撰寫可適用該模式電腦程式軟體,使各種多向度 IRT 模式研發更快速,應用實務方面將普及化。其模式敘述如下:
一、多向度測驗
多向度測驗模式主要可以分為兩種(Wang, Wilson & Adams, 1997)。第一種是 在測驗裡的試題只測量單一種能力,即單向度試題,但一份測驗中包含許多個單向 度 的 試 題 集 合 , 每 一 個 集 合 的 試 題 測 量 不 同 的 能 力 , 此 種 為 題 間 多 向 度 測 驗
(between-item multidimensional test),這類型的測驗如圖 1 所示。題間多向度的測 驗每題試題測量單一種能力,而整份測驗通常包含了其它相似能力的單向度試題,
分別測量不同的能力,如常見的綜合能力測驗。
11
第二種則是題內多向度測驗(within-item multidimensional test),此測驗模式中 的每題試題可能測量到一種以上的能力,即單一試題內就包含多向度,因此試題反 應同時由多種向度決定。這類型的測驗如圖 2 所示。例如數學測驗應用題,受試者 需使用表徵能力(representation)將問題狀況用數學計算式表示,接著使用計算能力將 答案算出,所以單向度 IRT 模式就不適用此測驗裡。
能力 D
試題 1 試題 2 試題 3
能力 E
試題 4 試題 6 試題 7 能力 F
圖 2 題內多向度測驗模式 能力 A
試題 1 試題 2 試題 3
能力 B
試題 4 試題 5
圖 1 題間多向度測驗模式
12
由 Adams、Wilson and Wang(1997)所提出來的多向度隨機係數多項洛基模式 為 Rasch 模式的衍生模式,如公式(6)所示:
由 Mckinley and Reckase(1983)提出多向度二參數模式(multidimensional two parameters model, M2PL),即為 2PLM 的衍生模式,同時考慮受試者多種能力並將
13
鑑別度向量參數;bi為第 i 題試題的難度參數;θ為受試者的能力向量。
(三)多向度三參數模式
由 Sympson(1978)與 Hattie(1981)所提出的模式相當類似, 都是由 3PLM 的 衍生模式,為多向度三參數模式(multidimensional three parameters model, M3PL;
Hattie, 1981; Sympson, 1978),同時考慮受試者多種能力並將試題的鑑別度定義為向 量,也類似於 M2PL,差別在於是否考慮猜測參數,如公式(8)所示:
(multidimensional item response theory, MIRT)中之多向度隨機係數多項模式進行估 計(OECD, 2005)。因此本研究以MRCMLM 為理論架構,使用演算式演算法進行 組卷,探討不同演算法之結果。
14