• 沒有找到結果。

本研究根據教育測驗統計理論,以程式模擬電腦適性測驗的題庫擴充建置,

本章就研究動機、研究目的及名詞釋義做概括性的探討。

第一節 研究動機

隨著電腦資訊科技高度發展,電腦運算能力的快速進化,再加上適性測驗理 論的研究發展,電腦化測驗有了重大的突破,電腦化適性測驗(computerized adaptive testing, CAT) 在實務上變得更加可行,因其具有節省測驗長度、增加 能力估計精準度的優點,且可以在測驗中根據每位受試者的能力水平來選取給予 不同難易度的試題來進行施測,國內外大型測驗機構均朝向以電腦化適性測驗來 取代傳統的紙筆測驗與電腦化測驗(computer-based test, CBT)。在知名的大型 測驗GRE(Graduate Record Examinations)、TOFEL(Test of English as a Foreign Language)、GMAT(Graduate Management Admission Test)等均已 實施。

將傳統紙筆測驗的試題經由分析、編碼與結構分類處理後,可以便利運用的 試題彙總組合,即為題庫(Millman & Arter, 1984)。CAT 即以題庫為核心發展 而成,而且其選題是根據試題參數來進行,因此試題品質的優劣(試題參數的精確 性)會直接影到測驗精確度和效率(方秀惠,2002)。

本文中主要分析如何在電腦適性測驗進行中,將未校準的試題(試題參數尚 未估計)加入已校準的題庫(試題參數已精確估計)中,來擴大題庫。因為在題 庫的更新上,若依照題庫建立之初,對新的試題重新舉行大規模的預試,將加重 成本的負擔;若在原題庫的使用過程中,逐次加入新的試題,利用受試者的作答 反應估計新的試題參數,則可望在不增加成本的情況下更新題庫,然而依此方法 所估計的試題參數精準度將是探討的焦點。

因此,在題庫更新時,如何兼顧試題參數估計的精準度及更新的速率,亦是

本研究的動機之一。亦即新增一題未校準之試題必須經由多少受試者施測,才能 得到較精準的試題參數估計值。甚至,在試題參數估計穩定後,是否能藉由適性 測驗試題與新增試題的作答反應,增加能力參數估計的精準度,亦是本研究欲探 討的部分,希望藉此提供給實際應用電腦適性測驗時設定測驗要素的參考。

第二節 研究目的

本研究欲了解如何在電腦適性測驗進行時,加入未校準參數之試題來擴大題 庫的前提下,模擬在測驗中加入新試題的方式,對不同能力分布受試者進行施 測,期望估算出參與受試人數需要多少人數範圍內方使該測驗的新題目試題參數 與對受試者能力值估計更精確。

本研究欲探討的問題有二,茲分述如下:

一、在測驗中增加多少題新試題會使新試題的試題參數估計精準至合理範圍。

二、須多少人參與施測,才會得到新增試題之精準試題參數與更精確的受試者能 力估計值。

第三節 名詞解釋

一、電腦化適性測驗

本研究的電腦化適性診斷測驗係以試題反應理論為基礎,呈現的試題順序,

是依據受試者在前一個試題上的作答反應來決定。在開始進行電腦化適性測驗之 時,先由電腦隨機呈現一組測驗試題,在受試者作出反應之後,電腦便根據這些 反應資料,估計出考生的初步能力估計值(initial ability estimate);然後,電腦 會依據初步能力估計值,從題庫(item bank)中挑選出最能對受試者能力水準的估 計發揮最大貢獻力量的試題,將其呈現給受試作答。

二、題庫(Item bank)

電腦化適性測驗與傳統紙筆測驗的不同在於必須建立一個含有試題反應理 論測驗試題參數的題庫,一個優秀的電腦適性化測驗題庫其試題是經過嚴謹編審 與預試的,經過電腦化且統計過的組合而成。題庫中的能夠提供的試題參數或指 標;如試題鑑別度、試題難度等,越詳細越好。適性測驗之效度與效率,與題庫 大小具有密切關係(李茂能,2000)。

相關文件