壹、試題反應理論探討

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

Hallinan, M. T. (2008). 則以芝加哥地區的 7-9 年級 1,458 名學生的縱貫資料進行研究，結果發現學生若喜歡學校，則偏差行為較少、缺曠課低、學業成就較高。

而影響學生是否喜歡學校的重要因素之是：知覺教師關心他、教師努力時會讚美他、教師公平對學生。

綜合以上貫時性研究，學校教師的角色對於學生偏差行為不獨有短時間的影響，其影響效果具貫時性。研究二採取國中三年均為同一導師的班級學生進行研究，因此導師的班級管理風格影響該班級學生三年，應該也會有貫時性效果。

第五節試題反應理論與 Rasch 模式探討

本研究將以試題反應理論（IRT）中的羅許模式（Rasch model）估算學生偏差行為，以獲得更精細的數值，因此本節將探討有關 IRT 以及羅許模式（Rasch model）的相關文獻。

解釋測驗分數意義的理論可以分成兩大學派：一為「古典測驗理論」（classical test theory，簡稱 CTT），另一為「試題反應理論」（Item Response Theory, 簡稱 IRT）。本研究擬採用較為客觀的實徵分析方法，即以「試題反應理論」中的評定量尺模式（rating scale），將這些題目所產生的最大訊息量所對應到受試者的能力量尺的分數。

題目反應理論又稱潛在特質理論，用來分析考試成績或問卷調查數據的數學模型。這些模型的目標是來確定潛在心理特徵 (latent trait）是否可以通過題目被反應出來，以及題目和受試者間的互動關係 (郭伯臣、吳慧珉、陳俊華 2012)。

IRT 理論研究始於 1950 年代，主要學者是丹麥統計學家 Georg Rasch 和美國心理統計學家 Frederic M. Lord 等。

19 世紀初比奈賽門 (Binet Simon)智力量表問世，測驗理論開始受到學者重視，其中廣為人知的應屬古典測驗理論。古典測驗理論(classical test theory, CTT)

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

最早出現於 Gulliksen 1950 年出版的書，古典測驗理論的模式簡單易懂，是 20 世紀測驗理論的主軸，但隨著測驗需求量的日益增加，形式多樣化，古典測驗理論應用不免受到限制，其中最明顯的限制是不同版本測驗的比較問題: 不同的學生參加不同的測驗，如何比較這些學生的成績? 為克服各式各樣的測驗問題，不同的測驗理論陸續被提出，而 Lord (1980) 出版「試題反應理論於測驗的應用」，

題目反應理論遂成為測驗界的全新典範。IRT 近年來已經被應用在教育、心理、

醫療等相關領域中，如托福、GRE、GMAT 考試，以及國外的一些人格量表與醫學相關量表的編製，在台灣則有實施十餘年的國中基本學力測驗。

試題反應理論主要是以個別試題的觀點，來解釋測驗分數的涵義。它認為學生在某一試題上的表現情形，與其背後的某種潛在特質（即能力）之間具有某種關係存在，該關係可以透過一條連續性遞增的數學函數來加以表示和詮釋，這個數學函數便稱作「試題特徵曲線」（item characteristic curve，簡稱 ICC）（余民寧，

2009）。

把能力不同考生的得分點連接起來所構成的曲線，便是能力不同考生在某一測驗試題上的試題特徵曲線，而把各試題的試題特徵曲線加總起來，就是「測驗特徵曲線」（test characteristic curve，簡稱 TCC）。因此，試題特徵曲線和測驗特徵曲線，都是一條用來解釋學生的試題分數或測驗分數涵義的迴歸線，這條迴歸線基本上是屬於非直線的，但也有可能是直線的，端視我們所決定選用的試題反應模式 (item response model)而定。

在試題反應理論中，每一種試題反應模式都有其相對應的一條試題特徵曲線，此一曲線通常包含一個或多個參數來描述該試題的特性，以及一個或多個參數來描述考生的潛在特質；因此，根據我們選用的試題反應模式所具有的參數個數的不同，所畫出的試題特徵曲線形狀便不相同。但是，它們的涵義都是一致的，

都是在表示學生的能力與其在該試題上做出正確反應兩者之間的可能關係；通常學生的能力程度愈高（或愈強），則其在該試題上做出正確反應（即答對）的機率便愈大，反之，學生的能力程度愈低（或愈弱），則其在該試題上做出正確反

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

應的機率便愈小。

常見的 IRT 模式可以根據其所包含的試題參數數目來分，分為單參數的 Rasch 模式（Rasch Rating Scale Model）、二參數模式、三參數模式。

P（θ）就是試題反應函數，估出的 IRT 能力參數估計值為 θ-scale （-∞

＜θ＜∞）。

b 參數代表該試題的困難度。

a 參數代表該試題的鑑別力、斜率。

c 參數代表該試題的猜測機率。

θ-scale 可經過線性轉換為各種量尺分數，以便理解。因此，研究者可依照資料特性來決定估計幾個參數，使用何種模式。IRT 常針對每道試題繪製試題特徵曲線（Item characteristic curve, ICC），將試題反應函數用平面座標圖表示出來即稱為試題特徵曲線。

b 參數也叫做難度參數，決定一個題目在潛在特質連續體的位置。題目愈難，所需的能力愈高，ICC 越偏右，一般能力的受試者答對機率較低，反之，題目越容易，所需能力越低，ICC 越偏左，一般能力的受試者答對該題的機率也會較高。

a 參數也叫做鑑別力參數，是能力θ變化時，答對機率變化的程度。試題特徵曲線中，a 參數表示曲線陡峭的程度。a 參數愈高，ICC 曲線愈陡，試題愈具有良好的分辨能力；a 參數愈低，ICC 曲線愈平坦，試題愈無法明顯有效的分辨出受試者的能力水準。

c 參數也叫做猜測參數，是試題特徵曲線的左下漸進線，為能力極低時仍有的答對機率。c 參數只出現在三參數或四參數對數模式中，單一參數和二參數模式將其假定為 0 或近於 0。c 值愈小題目愈有效，一般均以 0.3 為選題重點，c 值超過 0.3 的項目不是理想的項目。（曾建銘，2015）

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

圖 3：六條三參數試題特徵曲線（引自余民寧，2009）

圖座標的縱軸是答對機率，P（θ），也就是具某能力θ的受試答對某題的機率。P 機率介於 0.00 至 1.00 之間。橫軸代表能力。能力為一連續體，由左而右表最低的無限小（－∞）至最高的無限大（＋∞）。

圖 4: 「答對機率」與「能力─難度」之間的關係（引自余民寧，2009）

在文檔中教師角色對國中生偏差行為影響的貫時性分析 - 政大學術集成 (頁 61-64)

壹、試題反應理論探討

國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

第五節 試題反應理論與 Rasch 模式探討