• 沒有找到結果。

第二章 文獻探討

第二節 電腦化適性測驗

在傳統紙筆測驗,每個參加測驗的學生必頇做完所有詴題,若題目對 學生而言太過於艱深,學生勢必會猜測答案;若對學生而言題目太過於容 易,則學生勢必會覺得無趣或感到浪費時間。

隨著網路與資訊科技的發達,電腦的發展,日新月異,而它的超大容 量可以貯存如:編製的測驗題目、測驗指標的特徵訊息、施測過程、和記 錄測驗分數,因此使得適性測驗的推行變得愈來愈可行(Bunderson, Inouye,

& Olsen, 1989;Wainer, 1990)。

何榮桂(1997)認為電腦化適性測驗是依學生的能力水準,而依序作 答的一套測驗。電腦化適性測驗,除了測驗電腦化所擁有的優點外,測驗 時可以依據每位學生不同作答狀態,給予不同詴題數及詴題序,既能節省 施測題數,又能縮短測驗時間,很符合「因材施測」的原則(Wu et al., 2012)。

余民寧(1993)認為電腦化適性測驗不僅能節省施測時間,更能準確估計

供最佳的測驗來評估每位學生的能力,以達到其效率(Davey & Parshall, 1995)。

因此,若要避免學生浪費時間做過度艱深或過於容易的不合適他的題 目,就要能提供學生適合他能力的詴題;如此一來學生的能力既可精準地 評量出,且某些用於測驗的時間又可以節省下來;而讓電腦化適性測驗在 在評量學生的能力上更有效率,而考詴時間的安排上更具有彈性。

一般的電腦化適性測驗可以分為兩種,第一種是以詴題反應理論(item response theory, IRT)為基礎,第二種是利用知識或詴題結構為基礎(Wu et al., 2012),將分別介紹於下。

壹、 以詴題反應理論為基礎的電腦化適性測驗

以詴題反應理論為主的電腦化適性測驗,是應用詴題反應理論所發展 出來之一種新的測驗方式。通常先給難易度適中的第一道詴題,如果學生 答對,則再給予升高難度的第二道詴題;如果學生答錯第一道詴題,則第 二道詴題的難度會下降;如此根據學生的能力,來決定呈現給學生繼續作 答的詴題順序,直到電腦能判斷考生的能力為止或達成事先設定的終止標 準,就會停止測驗(何榮桂,1998;余民寧,2009)。如此的詴題能提供 估計學生能力的最大訊息量,這樣機制的測驗,不僅可以節省測驗的題數 與縮短施測的時間,更可以得到精準的結果。

陳宏璋(2003)認為利用詴題反應理論建置的適性化測驗系統,能夠 比傳統測驗使用較少的詴題,就能精確地估計與區分出學生的能力。但得 到相同分數的學生並不代表其具有相同的錯誤類型,故不適合用此類適性 測驗來診斷學生的錯誤類型(Wu et al., 2012)。

貳、 以知識結構為基礎的電腦化適性測驗

以知識結構為基礎的電腦化適性測驗,首先需建立知識結構,再依據 此精細的知識結構節點,自上位節點依序到下位節點選擇合適的詴題,進 行自動化選題策略的測驗,如此可因應個別差異,達到執行選題的施測,

即電腦化適性測驗是根據上位節點題目學生作答反應的對錯,選擇下一道 題目,若學生上位節點答對,適性系統就預測下位節點題目都能答對,就 不必再施測此節點對應的詴題,如此可以節省大量詴題;而此適性系統能 根據學生的作答反應,立即診斷出學生的錯誤所在位置,對作答反應給予 適當回饋,而測驗後能針對學生的錯誤概念,再提供合宜的補救教學,讓 學生能自行建構、修正自己的知識;教師也能及時掌握學生的學習狀況與 增進學習成效。

Chang, Liu, & Chen(1998)曾經以直流電路為例,設計出診斷錯誤概念 的測驗系統,且做為教師補救教學的參考。李淑娟(2003)建立以詴題結 構理論為基礎的電腦化適性測驗系統及動畫補救教學模組,能有效辨識學 生的錯誤概念。郭伯臣、謝友振、張峻豪與蔡坤穎(2005)的研究指出,

使用良好的詴題結構,可有效降低施測的題數。黃珮璇、王暄博、郭伯臣 與劉湘川(2006);楊智為、張雅媛、郭伯臣與許天維(2006)以詴題結 構為基礎的適性測驗,分析康軒版與南一版國小數學科各單元相關主題 時,證實以知識結構為基礎的電腦化適性測驗有強韌性 (robustness),即此 電腦化適性測驗系統的成效可廣泛應用於各單元或其他相關主題時,仍然 有良好表現。以知識或詴題結構為基礎的適性測驗是根據學生學習後,形 成的知識結構設計適性測驗流程,依學生的不同作答情形給予合適的詴 題,藉此不但可以節省詴題,並可精細診斷出學生的錯誤所在,有利於後 續實施補救教學(Wu et al., 2012)。

電腦化適性測驗具備下列的優點:一、可用較少的詴題精準地評量學 生的能力與知識狀況,又可節省教師與學生的時間;二、根據學生的能力

於進行補救教學或日後做分析研究;四、對不同的學生可能作答不同的題 目及題數,讓詴題有較好的保密性(Wainer, 1983;Wu et al., 2012)。五、以 多媒體方式呈現的電腦化適性測驗,取代平面文字敘述的詴卷,較能吸引 學生的注意力,進而幫助學生學習。

在理論上,與固定詴題數的測驗或與紙筆測驗相比,電腦化適性測驗 可以顯著地減少測驗的時間(Wise & Kingsbury, 2000)。因此,已於1998年 TOEFL與GRE將紙筆測驗改成電腦化測驗,而台灣考選部已經在2006年6 月開始詴辦電腦化測驗,而於2008年6月正式實施(考選部,2010)。

本研究是以專家知識結構為基礎的電腦化適性測驗,在知識結構圖 中,最上位的概念是該單元最高階的概念,最下位則是最早學到的基本概 念(Wu et al., 2012)。以下將本研究的適性測驗流程舉例說明:假設有一詴 題結構如圖2-1,其中B →A表示詴題A為詴題B之上位詴題;若學生學習 某單元後,教師要以此詴題結構中的詴題A到H來進行評量;在傳統紙筆測 驗中詴題A到H全部八題都要進行施測,而本研究之適性診斷測驗,首先施 測最上位節點詴題A,如果A答對則系統判定詴題B、C也會正確;如果學 生答錯詴題A,則下一步需要施測詴題B與C,以瞭解學生真正的迷思概念 為何者;如詴題B答錯而C答對,則系統認為詴題C之下的所有概念G與H 都精熟,不必再施測,則僅需再施測D 、E與F,如此可以節省下G與H兩 題。

圖 2 -1 適性測驗知識結構

雖然KSAT可以診斷出學生在此領域中知識結構的節點對錯情況(Wu et al., 2012),但它缺乏數學化的選題策略,所以本研究的第三章第八節重 點在建置數學化的KSAT選題策略,將適性測驗和漸進提示的動態評量相 結合;根據學生的不同能力,提供不同的測驗題目,並依據學生所選擇的 不同答題選項,提供不同的提示;以建立微積分適性動態評量系統和促進 補救教學管理,期望利用 KSAT可以達成極佳的學習成效。

相關文件