測驗理論

第二章文獻探討

第一節測驗理論

現代教育測驗評量中，測驗理論(test theory) 通常劃分為二大類：一為古典測驗理論(Classical Test Theory, CTT)，其理論基礎以真實分數模式(true score model) 為主；另一為當代測驗理論(modern test theory)，由於其架構主要是以試題反應理論(Item Response Theory, IRT)為骨幹，一般以試題反應理論來代表當代測驗理論。

古典測驗理論是以整份測驗(所有試題)的觀點，來解釋受試者測驗分數的意義，所以任何單獨一題試題的得分，在解釋受試者能力上不具有任何意義及價值。

而當代測驗理論是以試題反應理論為骨幹所發展的測驗理論架構，主要是以個別試題的觀點，來解釋受試者測驗分數的意義。

在古典測驗的分數等級解釋上，如以 10 題測驗試題之作答反應組型為例，１是回答正確，０是回答錯誤，則甲（１１１１１０００００）、乙（０００００１１１１１）、丙（１０１０１０１０１０）、丁（０１０１０１０１０１）四位受試者的分數都是五分，但能力不相等，而分數等級有 11 等級（０～１０）。同樣作答反應組型以試題反應理論來解釋受試者的能力（θ）等級時，則有 1024 等級

（２^１０）。如圖 2-1 所示，答對題數在量尺上是非等距的關係，而能力值（θ）

則是等距關係。

圖 2-1 答對題數與能力值的關係圖

資料來源：出自 DeMars(2010:17)

壹、試題反應理論的基本概念

自從 Lord(1980)發表第一本以「試題反應理論」為名的專書後，當代測驗理論正式以試題反應理論為其理論中心架構，故當代測驗學者逐漸以試題反應理論一詞代表當代測驗理論。試題反應理論的特點是以機率的概念來解釋受試者能力和試題參數間之關係，亦即觀察受試者的反應和表現結果，再經數學模式的運算，

以推估受試者的能力(abilities)或潛在特質(latent traits)。此種用來表示試題特性的連續性遞增數學模式稱之為試題特徵函數(item characteristic function，ICF)。試題反應理論因翻譯的關係，又名題目反應理論、項目反應理論、試題作答理論等。

試題反應理論建立在兩個基本概念上：(1)受試者(examinee)在某一測驗試題上的表現情形，可由一組因素來加以預測或解釋，這組因素便稱為潛在特質或能力；

(2)受試者的表現情形與潛在特質間的關係，可透過一條連續性遞增的函數來加以詮釋，這個連續性遞增函數所形成的曲線便稱為試題特徵曲線（item characteristic curve，ICC）。

由於試題反應理論建立在理論假設嚴謹的數理統計學機率模式上，有關此理論之研究報告與專書複雜深奧艱澀難懂，而且學術界的測驗理論學者大多是出身自數學界或至少在數理統計學上訓練有素，他們對理論模式的探討，遠勝於對實際應用的推廣，所以試題反應理論的發展雖然已經超過三十年，但在實際應用上，

並不為一般大眾所接受。因此要了解試題反應理論前先要了解它的基本概念及基

本假設，茲簡要解釋其基本概念如下(余民寧，2009)：

一、試題特徵曲線（Item Characteristic Curve，ICC）

試題特徵曲線所代表之涵義是指受試者的某種潛在特質與他在某一試題上正確反應之機率間的關係，這種潛在特質的程度愈高，代表受試者在某一試題上的正確反應機率便愈大。在試題反應理論中，每一種試題反應模式(1PL、2PL、3PL) 都有其相對應之一條試題特徵曲線，此一特徵曲線通常包含一個或多個參數(a、b、

c)來描述該試題之特性及受試者之潛在特質；因此，當選用之試題反應模式不同，

則其具有之參數數目及其數值便有所不同，當然，其所畫出之試題特徵曲線便不相同。

二、測驗特徵曲線（Test Characteristic Curve，TCC）

把能力值不同的受試者得分點連接起來而構成的曲線，便是能力不同的受試者在某一試題上的試題特徵曲線，把測驗中各試題的試題特徵曲線加總起來，便構成測驗特徵曲線。

三、試題獨立(item-independent)

當某一種試題反應模式適用於某種測驗資料時，一些試題反應理論的基本特性也會跟著產生。經由不同組別的試題估計所得的受試者能力估計值，除了測量誤差外，不會受所使用的不同組別測驗試題之影響，亦即，它是試題獨立的能力估計值。

四、樣本獨立(sample-independent)

經由不同族群之受試者估計所得的試題參數值，除了測量誤差外，不受參與測驗之受試者族群的影響，亦即，它是樣本獨立的試題參數估計值。

五、試題反應理論的「不變性」(invariant)

試題獨立及樣本獨立的兩種特性，在試題反應理論中稱為「不變性」，這些不

變性是把試題之訊息(information)考慮在能力估計的過程中。不管受試者來自何種族群，只要他們具有相同的能力，則他們正確反應某一試題的機率便相同；由於某特定能力之受試者，答對某一試題的機率是由試題參數所決定，因此試題參數對這兩族群之受試者而言也必定相同。

六、估計標準誤(standard errors)

試題反應理論針對每一位能力不同的受試者，在能力值估計時，提供其測量的估計標準誤，這不同於古典測驗理論假設所有受試者都有單一誤差估計值。

貮、試題反應理論的基本假設

任何一條試題特徵曲線所代表的意義是，受試者答對某一試題的機率，是由受試者的能力值(θ)和試題的參數值(a、b、c、)所共同決定。因此，試題反應理論在具有下列幾項基本假設的前提下，才能對測驗資料進行分析(余民寧，2009)。

一、單向度(unidimensionality)：試題反應理論中的各種反應模式都有一個共同假設，那就是測驗中的每道試題都能測量到同一種單一共同之能力或潛在特質，這便是單向度假設。適用於含有單一主要潛在特質的試題反應模式，便稱為單向度模式。適用於含有多種主要潛在特質的試題反應模式，便稱為多向度

(multidimensional)模式。

二、局部獨立性(local independence)：當影響受試者能力值估計的因素被固定不變時，受試者在任何兩題試題上的反應，在統計學上而言，它們是獨立的；換句話說，在考慮受試者的能力因素後，受試者在不同試題上的作答反應是沒有任何關係存在。因此受試者的能力，才是唯一影響受試者在測驗試題上做正確反應之因素。一般來說，當單向度假設獲得成立時，局部獨立性假設也會獲得成立。

三、知道——正確假設(know--correct assumption)：如果受試者知道某一試題的正確答案，他必然會正確回答該試題；如果他回答錯誤某一試題，則假設受試者必然不知道該試題的正確答案。

在文檔中線上適性測驗系統之建置以婦產科學為例 (頁 23-26)

第二章 文獻探討

第一節 測驗理論

壹、試題反應理論的基本概念

貮、試題反應理論的基本假設

第二章文獻探討

第一節測驗理論