試題反應理論

第二章文獻探討

第一節試題反應理論

測驗理論是一種解釋資料實證關係理論學說（余民寧，1992a，1992b），分成兩大派:一為古典測驗理論（classical test theory, CTT）主要是以真實分數模式為架構，其數學模式相當簡單，計分容易而廣被採用，卻有非線性與受試者依賴、試題依賴的缺點，影響了測驗的品質；另一為當代測驗理論（modern test theory），主要是以試題反應理論為架構，由於加入許多不同參數型試題反應理論，使得測驗有線性與客觀性，獲得比較好的品質。另外大樣本的測驗資料較容易符合參數模式的假設，所以 IRT 比起 CTT 較適合大樣本的分析，所以本研究施測人數而言，符合 IRT 之參數模式特性，以下將介紹 IRT:

試題反應理論根據強勢假設（strong assumption）而來，認為受試者對試題反應的正確性之期望值可用下式表示：

) , ( )

(X = f I A

ξ （2-1）

其中， X 為試題反應的正確性； I 為試題參數向量； A 為能力參數向量。 X 的期 望值是由試題參數和能力參數之函數所決定的。

然而，使用 IRT 進行測驗資料之分析時，IRT 模式必須符合四項基本假設

（ Weiss & Yoes, 1991 ），才能用來分析所有的測驗資料。亦即單向性

（unidimensionality）；局部獨立（local independence）非速度性（nonspeedness）

及「知道-正確」假設（“know-correct” assumption）。

一、單向性: 是指某一份測驗只針對受試者一種能力或潛在特質(latent traits)進行測量。

二、局部獨立: 受試者在測驗不同試題時，其作答情形彼此互相獨立，除了受試者本身的能力之外，不受其它試題的影響。

三、非速度性:受試者的測驗得分是受本身能力高低所影響，不因測驗時間限制而影響其表現。

四、「知道-正確」:受試者知道試題的正確答案，^就一定會答對該試題，無人為因

素的錯誤填答情形。

常見使用之試題反應理論為單向度反應理論（unidimensional item response theory, UIRT），只能針對單向性的測驗，也就是測驗中所有的試題都測量一種能力或一個潛在特質;然而，有許多測驗情境經常包含多種能力或潛在特質同時運作的多個分測驗，例如心理測驗、綜合能力測驗等，不僅僅只有測量單一能力或單一潛在特質，因此以目前的 UIRT 無法適用於上述的測驗情境。況且 UIRT 個別進行測驗的分析，所得到的測驗的信度都不高，故實際應用上 UIRT 出現兩種缺點，

第一，無法利用向度之間的關連，來增加各向度的測量精準度;第二，無法同時分析多

向度的試題，也就是多種潛在特質的試題，所以單向度模式延伸至多向度模式是

必然的趨勢，因而學者們提出多向度試題反應理論模式（multidimensional item response theory,MIRT）（Adams, Wilson & Wang, 1997; Bock & Aitkin, 1981; Fraser, 1988; McDonald, 1967; Mckinley & Reckase, 1983; Sympson, 1978; Whitely, 1980），以解決測驗實際應用上的問題（Rasch 測量理論與其在教育和心理之應用，2004;測驗專業工作坊，2006）。

因此，本節將分別針對單向度試題反應理論及多向度試題反應理論進行模式之介紹。

壹、單向度試題反應理論

UIRT 模式有三種，以不同的參數作為命名，分別為單參數對數模式

（one-parameter logistic model, 1PL）、二參數對數模式（two-parameter logistic model, 2PL）及三參數對數模式（three-parameter logistic model, 3PL），分述如下。

一、單參數對數模式

單參數對數模式即是 Rasch 模式，每個題目有一個試題參數以表示該題的難 度（Rasch, 1960），假設受試者 j 之能力為θ ，其作答試題 i 通過的機率如下： _j

)

exp

(

1 ) 1 ,

| 1

(

Xij j bi D j bi

P ₋ ₋

= +

= θ

_θ _（2-2）

其中，X 為受試者 j 在試題 i 的作答反應，_ij X_ij=0 或 1，答對記為 1，答錯記為 0；b 為試題 i 之試題難度參數（item difficulty parameter）_i ，−∞<b_i <∞； D 為 一個量尺因素（scaling factor），通常D=1.702。

二、二參數對數模式

在IRT的1PL模式下，再增加一個斜率參數（slope parameter），此參數也可稱為鑑別度參數，即Rasch模式被擴展為二參數對數模式（two-parameterlogistic model, 2PL; Birnbaum, 1968），假設受試者 j 之能力為θ ，其答對試題 i 的機率如j

下：

) (

exp

1 ) 1 , ,

| 1

(

Xij j ai bi D ai j bi

P ₋ ₋

= +

= θ

_θ _（2-3）

其中，X 為受試者 j 在試題 i 的作答反應，_ij X_ij=0 或 1，答對時記為 1，答錯時記為 0 ；a 為試題 i 之試題鑑別度參數（_i item discrimination parameter ），

∞ 學者稱此參數為猜測參數（pseudo-guessing parameter），形成三參數對數模式

（3-paramter logistic model, 3PL; Birnbaum, 1968），假定測驗會發生猜題之現象，

假設受試者 j 之能力為θ ，其答對試題 i 的機率如下（Birnbaum, 1968；Lord, _j

(一) 多向度二參數模式

多向度二參數模式（multidimensional two parameters model, M2PL）為二參數 logistic 模式（2PL）所衍生的模式（Mckinley & Reckase, 1983； Reckase & Mckinley, 1991），以公式（2-6）表示：的多向度鑑別度參數（multidimensional discrimination parameter, MDISC ）_i ：

∑

另一個是第i題的多向度難度參數（multidimensional difficulty parameter, MDIFF ）i ：

參數MDISC 之間的關係，Ackerman（1996）定義試題所要測量的能力方向與各_i 能力向度間的夾角，如下：

力空間（ability space），這個試題反應曲面（Item Response Surface , Bolt & Lall, 2003）會經過設定的不同受試者能力原點−3。

(二) 多向度三參數模式

多向度三參數模式（multidimensional three parameters model, M3PL）為三參數洛基模式（3PL）改良而得，將模式中的能力參數與鑑別度參數改成向量的型式（Hattie, 1981; Sympson, 1978），其模式如公式（2-10）所示：

)]

個受到試題參數 ξ 與受試者的潛在特質變數影響混合模式（mixed co-efficients

集合成一個行向量b_ik =(b_ik₁,b_ik₂,...,b_ikD)^T，而後對試題 i 集合成一個計分子矩陣

Adams, 1997）。一種是題間多向度測驗（between-item multidimensional test），這種測驗裡的每個題目只能測單一種能力，即單向度試題，所以整份測驗會包含許

圖圖圖

圖 2-1 題間多向度測驗模式

另一種是題內多向度測驗（within-item multidimensional test），這種測驗裡的每個題目所測量的能力，可能不只一種，因為題目本身就具有多向度的潛在特質。例如:全民英檢測驗裡的看圖寫作即為題內多向度測驗，以文字描述呈現，受試者必須先瞭解圖意，運用閱讀能力將圖之故事情境加以分析，並把所了解的以個人寫作能力呈現，所以看圖寫作不僅僅測量了語文閱讀能力，而且還有寫作能力。

此類型的測驗如圖2-2所示。

圖圖

圖圖 2-2 題內多向度測驗模式 試題 1 試題 2 試題 3

試題 4 試題 5

試題 6 試題 7 試題 8 向度 1

向度 2

向度 3

試題 1

試題 2

試題 3 向度 1

試題 4 向度 2

在文檔中不同次級量尺估計法之水平及垂直等化效果比較 (頁 16-25)

第二章 文獻探討

第一節 試題反應理論

壹、單向度試題反應理論

exp

1 ) 1 ,

| 1

(

= +

= θ

exp

1 ) 1 , ,

| 1

(

= +

= θ

∑

第二章文獻探討

第一節試題反應理論