• 沒有找到結果。

一、參數型IRT

在文檔中 第一節 認知診斷評量 (頁 49-54)

(一)模式假設

一般參數型IRT模式必須符合下列假設(Weiss & Yoes, 1991),資料的解 釋分析才合理。

假設一:「知道-正確」假設("know-correct" assumption)

假設受試者在答題時,如果知道試題的正確答案,則必會答對該題。

假設二:單維性(unidimentionality)

此假設係指「測驗中每一試題只測量單一潛在特質(latent traits)或能 力」。但就實際而言,一份測驗或試題所測得的受試者的潛在特質應有多種,

例如影響學生解數學文字題可能有數學能力、語文能力、動機等等多種因 素。但要將這些造成影響的潛在特質全部明確地界定出來,在實際上是相當 困難的,而且目前在技術上仍處於尚在發展改良的階段中,因此現今大部分 的試題反應理論皆植基於「一種測驗(試題)只測量一種潛在特質」的假設 下。在此一假設下,一個測驗只測量一主要成分或因素,而此一主要成分即

為測驗所應測量到的受試者能力或潛在特質,至於其它的影響因素都歸入測 量誤差。

假設三:局部獨立(local independence)

此 一 假 設 主 要 是 由 於 大 部 分 的 IRT 模 式 都 採 用 最 大 概 似 估 算 法 (maximum - likelihood estimation, 簡稱MLE)為其參數估計法所致,係指「同 一受試者在同一測驗中不同試題上的反應是彼此獨立的」,亦即受試者在測 驗上某一題的作答情形,不受其他試題的影響。其數學公式如下:

U1,U2,....Un,|

  

PU1|PU2 |

 

,...PUn |

P

假設四:非速度性(nonspeedness)

IRT假設受試者有足夠充裕的時間作答,測驗的施行不是在速度的限制 下完成的,亦即受試者測驗得分表現完全由能力決定,並不受「速度」此一 因素的影響。

以下簡介較為著名的幾種參數型試題反應理論模式,其中 令

x

i表受試者在第

i

題的反應情形

表第s位受試者的能力參數s

(二)雙點記分對數型模式 (logistic model)

在此模式中

x

i只有0或1兩種可能,常見的模式有:

1. 單參數對數型模式(one-parameter logistic model)

此模式中關於試題特性的描述僅涉及「試題難易度」參數

b

i,故稱為單 參數模式,此外,亦有Rasch 模式之稱(Rasch, 1960),此一模式可表示如下:

   

s i

 

s

i

b

x

P     

exp 1

| 1

1

2. 雙參數對數型模式 (two-parameter logistic model)

此種模式比Rasch 模式多了一個「試題鑑別度」參數

a

i,是由美國測驗 學者 A. Birnbaum 修改自 F.M. Lord 的原始雙參數肩型模式(normal ogive model) 而來(Birnbaum, 1968),其模式如下:

  

i

s i

 

s

i

a b

x

P     

exp 1

| 1 1

3. 三參數對數型模式 (three-parameter logistic model)

此種模式比雙參數模式多了一個擬機會參數

c

i(Pseudo-chance level parameter),多使用於選擇題式測驗,會發生猜題現象之時(Birnbaum, 1968;

Lord, 1980),其模式如下:

  

i

s i

 

i i

s

i a b

c c x

P   

 

exp 1

| 1 1

4. 四參數對數型模式 (four-parameter logistic model)

此種模式比三參數模式多了一個天井參數

d

i,表示即使能力值高,正確 的反應機率亦不會到1.00(McDonald, 1967),此模式較不常使用,其模式如下:

x

i s

c

i

d

i

c

i

  a

i

s

b

i

 

P       

exp 1

| 1 1

(三)非雙點記分法模式

1. 名義反應模式(nominal response model)

此種模式可以用來分析多選項的單選試題(Bock, 1972),假設試題

i

有 m 種可能的反應,且

x

i表受試者s在第

i

題的反應情形(xi 1,2,....,m),令

 

P x

i

 | k

 表受試者s在第s

i

題選擇第

k

種反應的機率,則其模式如下:

 

Samejima(1979)以混合機率處理方式,將 Bock 之名義反應模式多引進一 固定之猜測值及猜測項,由於各選項被隨機選答之機會相同,因此固定猜測

Thissen & Steinberg(1984)認為各選項之猜測度參數可不盡相同,於是將 Samejima 擴張名義反應模式一般化,而得多元記分三參數試題選項分析模式 Thissen(1991)稱此擴充模式為 BS 模式(Bock-Samejima model),亦即 BS 模式 為以猜測度參數

c

ij取代上式中之猜測值

其中

  

(2000b)遂修改 Thissen & Steinberg(1984)之 BS 模式,提出「二元記分三 參數試題分析模式之真正多元記分擴充模式」-多元記分三參數試題選項分

= c +(1-i c )i

   

此外,尚有二項試行模式 (binomial trials model)、評定尺度模式( rating scale model ) (Andrich, 1978, 1982)、部分記分模式(partial credit model) (Masters, 1982; Yu, 1991a, 1991b)、連續反應模式(continuous response model) (Samejima, 1973, 1988)以及多維IRT模式(Multidimensional IRT)。有關上述模 式之詳細內容,可參照相關文獻,在此不再贅述。 善這些缺失,乃有無參數試題反應理論(non-parameter item response model) 之產生。

在文檔中 第一節 認知診斷評量 (頁 49-54)

相關文件