• 沒有找到結果。

線上評量的種類與其發展現況

人的一生中,常需要去了解其個人屬性、特質與行為,便需以評量活動來進 行界定,而測驗是最常使用的評量工具,我們常參考測驗的結果,或以此為依據,

來判斷個人行為表現 [24]。

在教學現場,教師會實施教學評量,教學評量通常被教師於教學期間使用來 評估學生的學習狀況與評鑑教學品質,可再區分成四種評量方式,分別為教學前 的安置性評量(placement evaluation),可藉此判斷學生於本單元是否已具備應具 備的先備經驗,來決定教學的起點活動;在教學過程中,為了確定教學目標的可

行性,或是追蹤學生是否在學習過程發生了某些迷思概念,即可進行教學中的形 成性評量(formative evaluation)與診斷性評量(diagnostic evaluation);教學後的 總結性評量(summative evaluation)則用來瞭解教學目標是否確實可行、是否進 行了有效的教學方法,以及實現教學目標的程度。接著根據所得的評量資料,可 以回饋給教師,了解自己教學上的優缺點,包括選擇的教材與教材的組織是否適 宜、是否有調整教學策略或改變教學方法的必要性,以及是否有哪些學生需要進 行補救教學等,使教學的品質持續提昇 [2,16],而此四種評量,幾乎都脫離不了 測驗的使用 [33]。

在教學評量方面,一般標準化的成就測驗,已經無法滿足教師在教學上的需 求,所以教師往往仍需要隨時以自編測驗,來掌握自己的教學情況,並隨時進行 必要的教學調整或補充教學,因此教師依照教學的內容來設計測驗內容,已是教 師專業知能的一部分 [33]。

紙筆測驗是傳統的教學評量方式,但卻難以從其評量結果幫助教師有效地掌 握每個學生的學習狀況,是因為學生在測驗中所得的分數,其實只能表示考生在 該份測驗想要測量之能力上的表現程度,並非由測驗分數之和來表示考生的能力 [30]。

綜合上述,在教學現場,使用紙筆測驗來評量學生對教材瞭解的程度,不僅 教師需在自編測驗上下功夫,測後的分析亦需人力及時間,因此結合電腦科技、

可協助教師分析測驗結果的電腦化測驗便被積極開發。

2.2.2 線上測驗的種類與發展

電腦科技進入測驗的領域已有二、三十年的時間,一開始以單機作業將電腦 應用於測驗活動,是為傳統電腦化測驗(Computer-Based Tests(CBT)),能做到 如編擬題目、建立題庫、挑選試題、編製測驗、施測及評分、統計及印製成績單 和測驗結果的解釋等 [25]。

接著結合試題反應理論(item response theory)以及次序理論(ordering theory)

的電腦化適性測驗(Computerized Adaptive Tests (CAT))出現,可以針對不同程 度的受試者給予不同難易度的試題,且可在減少很多做答題數便可測驗出學生能 力;而若透過知識結構作為選題的依據,最後的測驗結果便可以診斷出受試者的 錯誤概念 [32]。

近年來網路科技的發達,電腦化測驗與網路的結合,將電腦化測驗從單機進 展到線上的領域,是以網路為基礎的電腦化測驗 (Web based tests (WBT)),學 生僅需透過瀏覽器,便可隨時隨地在網路上進行測驗及練習,將電腦化測驗的功 效發揮到最大 [34]。

林明達 [40]將線上測驗依測驗的方式成下列兩類:

1. 傳統測驗:就如同紙筆測驗,應試者在電腦上可看到所有題目,並可自 行選擇作答順序,到確定可以交卷時才送出所有的答案。

2. 適性測驗:電腦一次僅呈現一個題目,應試者必須回答才會出現下一題,

電腦會依照答案來選擇題目,可以藉此測出其能力而不需做完所有的題 目,可以縮短應試的時間,但答錯卻沒有更正的機會。

若與學習環境的搭配,則可分類成下列兩類:

1. 與線上學習環境搭配:此類線上測驗不具備完整的功能和獨立運作的能 力,常見於學習教材的測驗篇內。

2. 獨立的系統:可以獨立於於教學教材之外,具備完整的測驗建構、實施 和管理分析等功能。

無論是何種線上測驗,其發展應著重在完善的管理系統、方便的人機介面、

安全的帳號認證機制、立即的評量回饋、完整的題庫資料及可編輯試題的功能 等,並盡可能發展出不同於選擇題形式的題型,以多樣化題型來達到評量效果 [21]。

底下將再針對三個近年來研究之電腦化測驗做功能之探討。

2.2.3 自動造題題庫系統

對教學者而言,題庫中試題的數量愈多愈好,根據 Prosser [8] 對題庫中題目 數量的建議指出,每一種觀念的試題至少要有十個題目,每一節課程的內容至少 要有五十題 [31],若要每題每題鍵入資料庫,恐耗費大量時間及人力。

研究者侯妤青 [41] 所提出建置題庫題目的方法,可改善傳統逐一鍵入試題 以建立題庫的效率,研究中提出三種智慧型自動造題機制:(一)與數理科測驗 相關的自動造題機制;(二)與數理科應用題測驗相關的自動造題機制;(三)與 非數理科目測驗相關的自動造題機制。

智慧型自動造題機制運用於數理方面,是透過系統產生兩個隨機數字,並結 合加減乘除運算子產生題幹,再透過系統取與正確答案近似之值做誘答項,最後 產生測驗試題,而應用在應用題的造題機制方面,則會透過姓名庫、名詞庫、運 算語意庫、以及運算結果語意庫,隨機的組合成應用問題,舉例說明如下頁圖 2。

研究中指出此方式可應用於與運算有關之測驗及相關應用問題,並能依試題 的模式快速的產生試題,同一觀念可產生不同的試題,可避免因試題重複出現而 造成學生猜題或作弊等情況的發生。

研究最後提出兩個未來建議方向:(一)填充題自動造題機制;(二)發展網 路版的自動造題系統。本研究將朝此方向努力,將自動造題機制能嘉惠更多老師 及學子。

圖 2:與數理科應用題測驗相關的自動造題機制 [41]

2.2.4 漸進提示動態評量系統

九年一貫課程實施後,國小數學領域授課時數減少許多,教師在有限的時間 內要趕上教學進度已是相當困難,對學習有困難的學生進行補救教學更是難上加 難。研究者彭彥翔 [35] 發現,許多作答錯誤的學生,僅需稍加提示後就可解題,

不可與真正不懂的同學歸於同類。

漸進提示動態評量透過「測驗-提示-測驗-提示-測驗」的方式,將提示 由抽象、半具體逐漸演變為具體,可提高國小學生在數學學習上的成效。彭彥翔 發展之適合國小學生之數學科漸進提示法電腦化動態評量系統,可解決一般的漸 進提示動態評量較耗費人力及時間的問題,並發現透過系統反覆進行「出題—作 答—提示—作答」的步驟,可有效提昇學生在「整數四則」單元的學習成效,與 直接電腦動畫教學相比,學生亦有較好的表現及較多的進步。

本研究將延續此概念,將「提供提示」融入在題庫功能之中,學生在進行練 習或測驗時,可透過系統提供提示語協助作答,以增加學生自行練習的可能性。

2.2.5 電腦化適性測驗

電腦化適性測驗與傳統紙筆測驗有很大的不同,其測驗方式是根據學生的能 力及作答的結果,選取最適合該受測者的題目,答對了則選擇較困難的題目,答 錯了便會選擇較簡單的題目。依據其理論基礎可將電腦化適性測驗分為二大類 [32]:一類是以試題反應理論(item response theory(IRT))為基礎[5],另一類則是 以知識或試題結構為基礎[12]。

透過以試題反應理論為基礎的電腦化適性測驗進行施測後,受試者成績為一

「能力值」(ability) 或「量尺分數」(scale score),比較適合用於教育資源分配情 境,例如:基本學力測驗、大學入學測驗等。但其所提供的訊息不適用於錯誤類 型診斷。

以知識或試題結構為基礎的電腦化適性測驗,則得先透過次序理論(ordering theory)來建構學生的知識結構。次序理論中提到,大量受試者進行試題 A 與試 題 B 的作答,若答對試題 A 就會答對試題 B,但答對試題 B 則不一定會答對試 題 A 時,便可設定試題 A 是試題 B 的上位概念,反之,試題 B 則為試題 A 之下 位概念。透過知識或試題為基礎的適性測驗中,學生答對一個題目時,便假設其 下位概念都會了,則可省略不進行測驗,而挑選答對題目的上位概念來繼續施 測,因此每位學生作答的題目不盡相同,以此方式建構之電腦化適性測驗,則可 在節省作答題目的狀況下,有高準度的判斷學生的錯誤概念在哪裡 [42]。

電腦化適性測驗一次僅出一個題目,作答後無更改的機會,且目前的研究均 為選擇題的題型,會有猜測的問題;而本研究欲建立之題庫測驗系統,是基於希 望學生可自行進行精熟練習為目的,因此本研究將採用傳統測驗之電腦化測驗,

並放眼未來能以本系統為基礎建立適性診斷的功能,提供老師在評量分析上更多 的幫助。

2.2.6 線上測驗的優點與缺點

日前,教育部推動每校一電子白板、班班有單槍等計畫,打造國中、小e化 教學環境,透過電腦、媒體科技進行教學已日趨普及,教科書廠商亦提供互動功 能豐富的電子教科書供教師使用,其中不乏有與學習環境搭配的電腦化測驗題 目,可讓老師於課室中讓學生進行電腦化測驗,因此利用電腦從事線上電腦測驗 的活動作為教學的輔助媒介,在現今的教學活動中已逐漸被重視,配合電腦的快 速處理能力及網路無遠弗界的特性,更能擴大教學活動的範圍。各家研究者從應 用的觀點提出線上測驗所具有的優點,兹將優點從教師、受試者這兩個面向,分 別摘述如下: [26,21,24]

從教師的面向來看:

1. 可透過圖片、聲音、影像、動畫等方式將題目呈現於受測者眼前,把試

相關文件