電腦化適性測驗

第二章文獻探討

第一節電腦化適性測驗

測驗與評量一直是教學過程中很重要的一環，透過測驗，可以反映出學生的學習狀況，供教師做後續補救教學的依據。早期測驗方式，多以紙筆測驗形式進行，並仰賴人工閱卷，近年來由於電腦科技的發達，許多測驗進行的方式已逐漸由傳統的紙筆測驗轉變成電腦化測驗，用來評估學生的學習成效或學習歷程(曾彥鈞，2007)。近年來，由於適性測驗理論的發展，電腦化測驗有了更重大的突破，可以針對不同程度的受試者給予不同難易度的試題，且做答的題數減少很多即可測驗出學生能力，近年來與網路的結合，更將電腦在測驗上的功效發揮到最大(黃朝恭，2000)。

一般的電腦化適性測驗可以分為以試題反應理論(Item Response Theory, IRT)為主的，以及利用知識或試題結構為主的兩種(郭伯臣，2004)，以下將分別介紹。

壹、以試題反應理論為主的電腦適性測驗

以試題反應理論為主的電腦適性測驗，是應用試題反應理論( Item Rsponse Theory, IRT)所發展出來之一種新的實施測驗方式。要實施適性測驗，也唯有在電腦誕生發明後，才有可能施行。電腦科技的發達，日新月異，它的超大容量可以貯存測驗訊息（如：測驗試題及其特徵指標）、編製、施測、和記錄測驗分數，

因此使得推行適性測驗變得愈來愈可行(Bunderson, Inouye & Olsen, 1989; Wainer, 1990)。

以試題反應理論為主的電腦化適性測驗(computerized adaptive testing, CAT) 裡，呈現給考生的試題順序，是依據考生在前一個試題上的表現好壞來作決定的。在開始進行電腦化適性測驗之時，先由電腦終端機隨機呈現一組測驗試題（也

許是兩題或三題），在考生作出反應之後，電腦便根據這些反應資料，估計出考生的初步能力估計值(initial ability estimate)；然後，電腦會根據這些初步能力估計值，從現有的題庫(item bank)中挑選出最能對能力水準的估計發揮最大貢獻力量的試題，再呈現這些試題給考生作答，根據考生先前的表現好壞，呈現下一個要給考生作答的試題。

換句話說，根據考生先前的表現情形，來決定下一階段將呈現給受試者作答的試題，而且這樣的試題是能對考生能力的估計精確性提供最大訊息量，循此原則，直到滿足一個預先設定的信賴水準或終止標準時，測驗即結束。透過這樣的機制，使得測驗的長度可以縮短，也不會犧牲測量精確性。換言之，對於高能力的受試者無需提供較為容易的試題作答，對於低能力的受試者，也不會有試題難度太高而造成心理上的打擊，因為這些試題是相對於他們的能力水準來選取的。

因此就電腦化適性測驗來說，不僅可以做到精確估計考生能力來進行「因材施測」，更可節省許多施測時間和成本，優點相當明顯。

此種施測方式是採機動的選題方式去配合受測者的表現，換言之，需要從題庫中根據試題的統計特質，即試題參數(item parameters)去選題，且受測者每完成一個反應，能力水準要再被估計，涉及的計算過程頗為複雜，因此需藉助電腦方能實施，所以此種測驗方式又稱為電腦化適性測驗。

基於IRT 理論的電腦適性測驗，將根據受試者的作答情形，依照能力值的不同，給定不同的試題。換言之，一般以試題反應理論為基礎的電腦化適性測驗，

施測結果為一能力值或量尺分數。

由於學生的錯誤類型並不具順序性或線性排列，即並非所有學生皆會先出現錯誤類型1而後才出現錯誤類型2，因此無法單獨將錯誤類型與某一分數進行對應，只能根據受試者的作答情形，依照能力值的不同，給定不同試題。所以IRT 較適合用在成就測驗，如大學學力測驗。使用以估計能力值為目的之適性測驗來進行學習診斷，所提供的訊息相當有限；因此本研究將以國小數學領域為範例，

發展以結構理論為基礎的多點計分題組式適性診斷測驗系統。

貳、以知識或試題結構為主的電腦適性測驗

以知識結構為基礎之適性化診斷測驗系統，首先需建立知識結構，並依據此知識結構作為適性測驗的選題策略，能提供學生一個適性測驗立即的成績回饋，

並於測驗後給予學生個別化、量身訂作的補救教學，讓學生知識的建構能有最好的效果。黃珮璇、王暄博、郭伯臣、劉湘川(2006)的研究證實了以知識結構為主的國小數學科電腦化適性診斷測驗具強韌性(robustness)，即電腦化適性診斷測驗系統之成效在廣泛應用於各單元或其它相關主題時，依然存有良好的表現。

曾彥鈞、劉育隆、郭伯臣、楊智為(2006)實作開發出以知識結構為基礎的適性化診斷測驗系統，目前系統實際上已有94、95年康軒、南一版數學各單元教材上線，並由多位研究生進行實際使用、作為施測平台。許多研究（白曉珊、劉育隆、

郭伯臣、施慶麟，2006；林立敏、白曉珊、郭伯臣、劉育隆，2006；莊惠萍、劉育隆、郭伯臣、曾彥鈞，2006；趙琬津，2006；盧炎成，2006）指出，以知識結構為基礎之適性化診斷測驗系統根據學生知識結構設計適性施測流程，可依不同受試者的作答情形而給予適當的試題，藉此節省大量的試題並可對學生的剖面圖得到精確的估計，確實可以有效節省施測題數，並有適性化的功能，且提供個別學習診斷報告書，讓學生可以立即知道自己的錯誤觀念，也有利教師進行補救教學。

以知識結構為基礎之適性診斷測驗系統的特點如下所示（白曉珊、劉育隆、

郭伯臣、施慶麟，2006；林立敏、白曉珊、郭伯臣、劉育隆，2006；莊惠萍、劉育隆、郭伯臣、曾彥鈞，2006；趙琬津，2006；盧炎成，2006）：

一、「評量」、「診斷」與「補救教學」皆適性化、個別化，達到「因材施測」、

「因材施教」的目的。

二、與施測全部紙筆測驗試題情境比較，當預測精準度設定為0.95時，以知識結構為基礎之適性化診斷測驗系統平均可節省50%以上的施測題目(黃珮璇、王暄博、郭伯臣、劉湘川，2006；楊智為、張雅媛、郭伯臣、許天維，2006）。

三、節省學生大量測驗時間，可把時間用於適性補救教學。

四、可診斷出同分不同錯誤類型之學生，便於因材施教。

五、將知識結構為基礎之適性診斷測驗系統網路化，可達到隨時檢測的目的。

六、可提供多媒體補救教材進行自主學習，以達事半功倍之效。

在文檔中題組式適性診斷測驗系統之建置 (頁 13-16)

第二章 文獻探討

第一節 電腦化適性測驗

第二章文獻探討

第一節電腦化適性測驗