第二章 文獻探討
第二節 試題反應理論
心理測驗理論是一種解釋測驗資料間實證關係 (empirical relationships) 之有 系統的理論學說,測驗理論的學者通常將其分為古典測驗理論及現代測驗理論二 大學派 (余民寧,1991) 。古典測驗理論又稱古典真分數理論 (classical true score theory) , 以 線 性 模 式 ( 觀 察 分 數 = 真 分 數 + 誤 差 分 數 , X=T+E) 和 樣 本 依 賴 (sample dependent) 的指數值 (試題難度和鑑別度) 來描述測驗中試題的特性,並 推論受試者的真分數 (余民寧,1997;郭生玉,1995) ,但由於古典測驗理論具 有樣本依賴的特性、每位受試者的測量標準誤皆相同、忽略受試者的試題反應組 型及以總分表示受試者的能力等缺點,加以電腦科技的進步,各種適用現代測驗 理論的軟體程式相繼誕生,古典測驗理論有被現代測驗理論取代的趨勢。
壹、基本概念
試題反應理論 (item response theory, IRT) 為現代測驗理論之主要架構。試題
反應理論是描述受試者與其能力的關係,受試者經由測驗題目表現能力,而能力 也透過測驗題目表達出來 (王寶墉,1995) 。以能力來預測或解釋受試者在某一 測驗上的表現情形,而受試者的表現情形和能力間的關係可透過一條連續性遞增 的函數來詮釋,此函數為試題特徵曲線 (item characteristic curve, ICC) ,此曲線 也可視為不同能力受試者在某一測驗試題上之得分點連接起來所構成的曲線,若 將 各 試 題 的 試 題 特 徵 曲 線 加 總 起 來 , 便 構 成 所 謂 的 試 卷 特 徵 曲 線 (test characteristic curve, TCC) (余民寧,1992;Embretson & Reise, 2000 ) 。
不同於古典測驗理論,試題反應理論有二項不變性 (invariant) 的特徵:首 先,試題獨立 (item-independent) 的能力估計值,不同組的試題估計而得的受試 者能力估計值不受所使用的測驗種類所影響;其次,樣本獨立 (sample-independent) 的試題參數估計值,不同族群的受試者估計而得的試題參數估計值 ,不受參與測 驗受試者族群的影響,此二種特性是將試題訊息包含在能力估計的過程中 ,將受 試者能力訊息包含在試題參數估計的過程中 。此外,不同能力受試者之能力估計 值也各自提供其測量的估計標準誤 (standard errors) (余民寧,1992) 。
貳、基本假設
試題反應理論具有下列幾項基本假設 ,只有在這些假設都成立的前提下 ,試 題反應理論模式方能被用來分析所有的測驗資料 (王寶墉,1995;余民寧,1992;
Embretson & Reise, 2000 ):
一、單向性
測驗中的各個試題都只測量同一特質或能力 ,但在一般測驗中易受動機、焦 慮、答題技巧…等其它因素影響,不易符合此項假設,因此,試題反應理論中對 此假設的基本看法為:只要該測驗具有能夠影響測驗結果的一個 「主要成份或因 素」即符合單向性 (unidimensionality) 的基本要求,也就是允許某程度的違反假 定。
二、局部獨立性
局部獨立性 (local independence) 係指在考慮受試者的能力因素後,受試者在 不同試題的反應沒有任何關係存在,即涵蓋在試題反應模式裡的能力因素是唯一 影響受試者在測驗上作答的反應因素。
三、非速度測驗
非速度測 驗 (nonspeedness) 係指大部份的受試者都有機會回答每一道試 題,測驗才能有效測出受試者的能力 (潛在特質) ,即受試者的表現不理想是由 於能力不足所致。
參、試題反應理論模式
就二元計分的資料而言 ,試題反應理論模式分成 四大類:常態肩形模式 (normal ogive) 、對數模式 (logistic) 、Splines 模式及其他類型模式 (Thissen &
Steinberg, 1986) ,其中以對數模式的應用較為 廣泛。因對數模式建立了不同參 數間的關係,也因此分成單參數對數模式 (one-parameter logistic model) 、雙參 數對數模式 (two-parameter logistic model) 、三參數對數模式 (three-parameter logistic model) 及肆參數對數模式 (four-parameter logistic model) 等模式 (王寶 墉,1995) ,前三種模式較為常見,如表 2-1 所示,表中Pi
表示能力值為的 受試者答對第i題的機率,e為自然對數的底數。表 2-1 三種常用的對數型試題反應模式 別 參 數 (item discrimination parameter) ai。 (pseudo-chance level parameter) 」。 2.ci值 表 示 題 目 完 全 不 會 的 受 試
者,即能力值很小的受試者,其猜 題答對的機率。
資料來源:摘自林原宏 (2004a,p272)
近年來,認知心理學 (cognitive psychology) 發展已逐漸以較客觀、可以量化 和較深奧的數學模式為基礎的研究架構,來探究人類的學習行為及複雜的認知行 為,而這門新的研究領域大多以試題反應理論為基礎。結合認知科學、教學研究、
心理計量學與認知診斷測驗,可根據某種認知科學的理論為基礎 ,設計新型的診
詮釋結構模式 (interpretive structural modeling, ISM) 由 Warfield (1976) 提 出,基於離散數學和圖形理論 ,依據元素間的關係矩陣將元素階層化表示 ,可 系統化表示整體元素間的階層結構關係,並應用在教育領域中課程與學習上 (佐 藤隆博,1995,1996;林原宏,2004b;Warfield, 1982) 。其分析方法的要點如 下 (佐藤隆博,1979;林原宏,2005a;許天維、林原宏,1994) :
假設所欲分析的系統內有K個元素,且已知其中任意兩元素Ai與Aj的二元關