試題反應理論

第二章文獻探討

第三節試題反應理論

本節以古典測驗理論的限制、試題反應理論、及試題選項反應理論三個部份來探討試題反應理論現今發展情形。

壹、古典測驗理論的限制：

古典測驗理論以學生的測驗總分為基礎，以試題難易度、鑑別度兩項

指標來分析受試者的能力高低，由於試題難易度、鑑別度的計算公式淺顯易懂，所以至今仍為測驗理論的重要依據之ㄧ。

古典測驗理論雖然在使用上簡單明瞭，卻出現一些難以解決的問題，

國內學者王寶墉(1995)於現代測驗理論一書中提出，整理如表 2-3-1：

表 2-3-1 古典測驗理論主要缺失

主要缺失問題說明

抽樣變動大隨著受試者能力高者越多時，P 值便會越高。

能力難比較 ^一般來說，成就與性向測驗較適用於中等能力者的受試，

對於能力較高或較低的受試者，估計較不準確，也就是難度與能力的配合形成了古典測驗理論的困難。

 當幾個複本的難度不同時，使用不同複本的受試者能力難以互相比較。

複本難實施古典測驗理論對於信度的界定來自平行複本的假設，但實際上會因為遺忘、焦慮、動機及學習新知識技能而影響到測驗的結果。

缺乏預測力由於抽樣變動大、能力難比較及複本難實施的情況下，所使用的相關指標如信度、難度及鑑別度等便會產生變動，以至於無法預測受試者在一個新測驗可能的表現。

等測量標準誤即假定所有受試者的測量標準誤都相等，一份良好的測驗應能針對受試者能力進行精確的估計，不同得分或能力有其不同機率誤差。

因為上述的問題難以解決，所以才有現代測驗理論的誕生，現代測驗理論以試題反應理論為代表，Tucker(1946)第一位提出「試題特徵曲線 (item reponse curve)」一詞的心理計量學家，而後便以試題特徵曲線作為試題反應理論的中心概念。

貳、試題反應理論：

試題反應理論主要以試題特徵曲線來表示某種潛在特質的程度與其在某一試題上正確反應的機率二者之間的關係(余民寧，2009)，學者王寶墉(1995)也指出試題反應理論模式就是以數學表示受試能力與試題難度、鑑別力及猜測等參數間的關係，如把此關係用圖面(如圖 2-3-1)表示時，就是試題反應曲線(ICC)，此即現代測驗的精華。

圖 2-3-1 單參數模式試題反應曲線

試題反應理論依照有無參數的不同，分成參數模式試題理論及無參數模式試題理論，以下將分別說明之：

一、參數試題反應理論

參數模式試題理論主要將古典測驗中的難度、鑑別度、猜測度作為參數，並將這些參數帶入數學模式中，即可以繪出由這些參數所估計的試題特徵曲線。參數模式試題理論在教育測驗資料分析中，當每個試題作答反應僅有對與錯兩種記分方式時，常用的基本試題反應模式依照所採用的參數個數而加以命名，其中以一參數(1PL)、二參數(2PL)及三參數(3PL)最常被使用，常見的二元計分試題反應模式數學公式如表 2-3-2：

表 2-3-2 二元計分試題反應模式數學公式

(5) 為配合最大近似估計值 MLE(maximum likelihood estimate)，必須符合局部獨立性假設。

(6) 無法與試題選項關聯結構分析及試題層次分析等模式進行整合分析。

(劉湘川，2001)

因此，國內外學者針對以上的缺失與限制，發展所謂無參數試題反應理論(item response theory of non-parameter)，茲將說明如下。

二、無參數試題反應理論：

國內學者劉湘川(2001)指出認知測驗之記分系統，無論是二點記分或多點記分，參數型試題反應理論均已有優美數理結構之分析模式，惟美中不足；必須滿足局部獨立之限制，且僅適用於大樣本之測驗分析，無參數試題反應理論無局部獨立之限制，也可適用於班級教學小樣本之診斷評量，這是無參數式試題反應理論之發展契機。

目前從國內學者簡茂發、劉湘川、許天維、郭伯臣(1994)、劉兆文(1994) 及李文忠(1995)的研究結果發現，該理論至少有以下優點；

(一) 適合目前國小之施測情形 (二) 不受試題參數之限制

(三) 能真實地描述出試題特徵之曲線 (四) 不受記分方式的限制

(五) 所得之曲線為嚴格遞增(遞減)，能忠實地呈現資料所代表的資訊，不會因為給一組錯誤的資料卻得到一條正常的曲線。

(六) 小樣本(140 人)情況下，依然能合理估算出能力估計值與試題特徵曲線。

(七) 無局部獨立的假設

因此，無參數試題反應理論無特定的數學模式來估計受試者的能力，

受試者的參數估計是由受試者實際作答的反應獲得，所以比參數型試題反

應理論更能估計受試者的真實能力。

(一)均一函數(uniform function)：

K(u)=

(二)二次函數(Quadratic funtion)：

K(u)=

權總分排序時之加權函數(劉湘川，2007)，也就是如(1)式：轉換對應到標準常態分配(standard normal distribution)即可得到分位數(quantile)：q_i(i=1,2,3,…,N)，來代替受試者的能力值。

接著再將受試者的原始作答組型依照q_i重新排序，然後針對第 j 個試題的第 m 個選項，藉由二元試題指示向量(binary item-option indicator vector)Y_jm⁽ⁱ⁾的長度 N 和能力向量(ability vector) q_i來估計P_jm。

 ，在此 Ramsay(1991)選擇高斯函數(Gaussian)，

K(u)=exp(-u²/2) ，- u  (4)

作為核函數，並採用 Nadaray&Watson 之 NW 核平滑估計量來定義w_i()，

其中 h 為帶寬參數(bandwith parameter)，當採用 ⁵

-1

N 1.1

h  時，P^jm

 

 可以獲得最佳之估計值(吳慧珉，2002；Ramsay，1991)。

在無參數試題選項理論中，除了可以繪製出正答選項的特徵曲線外，

度及誘答力的程度為何？參考周郡禾(2002)的研究，試題特徵曲線判讀原則有下列三項：

(一) 選項選答率：

1. 正答選項的選答機率應隨能力值增加而遞增。

2. 反之誘答選項的選答機率應隨能力值增加而遞減。

(二) 各選項特徵曲線之斜率：

1. 對於正答選項而言，在某能力範圍內選項特徵曲線的斜率越大，表示對該能力值範圍的受試者越具鑑別度。反之若正答選項曲線斜率為負時，則需檢討該試題選項是否該刪除或修正。

2. 對於誘答選項而言，在某能力值範圍選項特徵曲線的斜率為負，當其絕對值越大時，則表示該選項對於此能力值範圍的受試者越具誘答力，反之，若出現斜率為正的情形，則顯示該誘答選項應刪除或修正。

(三) 選項特徵曲線應有之型態：整理自周郡禾(2002)的研究，如表 2-3-3：

表 2-3-3 選項特徵曲線應有之型態

正答選項

誘答選項

在文檔中 TestGraf98在國小六年級學童柱體與錐體概念之試題編製與分析研究 (頁 42-51)

第二章 文獻探討

第三節 試題反應理論

壹、 古典測驗理論的限制：

貳、 試題反應理論：

 

第二章文獻探討

第三節試題反應理論

壹、古典測驗理論的限制：

貳、試題反應理論：