線上評量的種類與其發展現況 - 基植於國小數學分年細目之線上題庫研發

人的一生中，常需要去了解其個人屬性、特質與行為，便需以評量活動來進行界定，而測驗是最常使用的評量工具，我們常參考測驗的結果，或以此為依據，

來判斷個人行為表現 [24]。

在教學現場，教師會實施教學評量，教學評量通常被教師於教學期間使用來評估學生的學習狀況與評鑑教學品質，可再區分成四種評量方式，分別為教學前的安置性評量（placement evaluation），可藉此判斷學生於本單元是否已具備應具備的先備經驗，來決定教學的起點活動；在教學過程中，為了確定教學目標的可

行性，或是追蹤學生是否在學習過程發生了某些迷思概念，即可進行教學中的形成性評量（formative evaluation）與診斷性評量（diagnostic evaluation）；教學後的總結性評量（summative evaluation）則用來瞭解教學目標是否確實可行、是否進行了有效的教學方法，以及實現教學目標的程度。接著根據所得的評量資料，可以回饋給教師，了解自己教學上的優缺點，包括選擇的教材與教材的組織是否適宜、是否有調整教學策略或改變教學方法的必要性，以及是否有哪些學生需要進行補救教學等，使教學的品質持續提昇 [2,16]，而此四種評量，幾乎都脫離不了測驗的使用 [33]。

在教學評量方面，一般標準化的成就測驗，已經無法滿足教師在教學上的需求，所以教師往往仍需要隨時以自編測驗，來掌握自己的教學情況，並隨時進行必要的教學調整或補充教學，因此教師依照教學的內容來設計測驗內容，已是教師專業知能的一部分 [33]。

紙筆測驗是傳統的教學評量方式，但卻難以從其評量結果幫助教師有效地掌握每個學生的學習狀況，是因為學生在測驗中所得的分數，其實只能表示考生在該份測驗想要測量之能力上的表現程度，並非由測驗分數之和來表示考生的能力 [30]。

綜合上述，在教學現場，使用紙筆測驗來評量學生對教材瞭解的程度，不僅教師需在自編測驗上下功夫，測後的分析亦需人力及時間，因此結合電腦科技、

可協助教師分析測驗結果的電腦化測驗便被積極開發。

2.2.2 線上測驗的種類與發展

電腦科技進入測驗的領域已有二、三十年的時間，一開始以單機作業將電腦應用於測驗活動，是為傳統電腦化測驗（Computer-Based Tests（CBT）），能做到如編擬題目、建立題庫、挑選試題、編製測驗、施測及評分、統計及印製成績單和測驗結果的解釋等 [25]。

接著結合試題反應理論（item response theory）以及次序理論（ordering theory）

的電腦化適性測驗（Computerized Adaptive Tests (CAT)）出現，可以針對不同程度的受試者給予不同難易度的試題，且可在減少很多做答題數便可測驗出學生能力；而若透過知識結構作為選題的依據，最後的測驗結果便可以診斷出受試者的錯誤概念 [32]。

近年來網路科技的發達，電腦化測驗與網路的結合，將電腦化測驗從單機進展到線上的領域，是以網路為基礎的電腦化測驗（Web based tests (WBT)），學生僅需透過瀏覽器，便可隨時隨地在網路上進行測驗及練習，將電腦化測驗的功效發揮到最大 [34]。

林明達 [40]將線上測驗依測驗的方式成下列兩類：

1. 傳統測驗：就如同紙筆測驗，應試者在電腦上可看到所有題目，並可自行選擇作答順序，到確定可以交卷時才送出所有的答案。

2. 適性測驗：電腦一次僅呈現一個題目，應試者必須回答才會出現下一題，

電腦會依照答案來選擇題目，可以藉此測出其能力而不需做完所有的題目，可以縮短應試的時間，但答錯卻沒有更正的機會。

若與學習環境的搭配，則可分類成下列兩類：

1. 與線上學習環境搭配：此類線上測驗不具備完整的功能和獨立運作的能力，常見於學習教材的測驗篇內。

2. 獨立的系統：可以獨立於於教學教材之外，具備完整的測驗建構、實施和管理分析等功能。

無論是何種線上測驗，其發展應著重在完善的管理系統、方便的人機介面、

安全的帳號認證機制、立即的評量回饋、完整的題庫資料及可編輯試題的功能等，並盡可能發展出不同於選擇題形式的題型，以多樣化題型來達到評量效果 [21]。

底下將再針對三個近年來研究之電腦化測驗做功能之探討。

2.2.3 自動造題題庫系統

對教學者而言，題庫中試題的數量愈多愈好，根據 Prosser [8] 對題庫中題目數量的建議指出，每一種觀念的試題至少要有十個題目，每一節課程的內容至少要有五十題 [31]，若要每題每題鍵入資料庫，恐耗費大量時間及人力。

研究者侯妤青 [41] 所提出建置題庫題目的方法，可改善傳統逐一鍵入試題以建立題庫的效率，研究中提出三種智慧型自動造題機制：（一）與數理科測驗相關的自動造題機制；（二）與數理科應用題測驗相關的自動造題機制；（三）與非數理科目測驗相關的自動造題機制。

智慧型自動造題機制運用於數理方面，是透過系統產生兩個隨機數字，並結合加減乘除運算子產生題幹，再透過系統取與正確答案近似之值做誘答項，最後產生測驗試題，而應用在應用題的造題機制方面，則會透過姓名庫、名詞庫、運算語意庫、以及運算結果語意庫，隨機的組合成應用問題，舉例說明如下頁圖 2。

研究中指出此方式可應用於與運算有關之測驗及相關應用問題，並能依試題的模式快速的產生試題，同一觀念可產生不同的試題，可避免因試題重複出現而造成學生猜題或作弊等情況的發生。

研究最後提出兩個未來建議方向：（一）填充題自動造題機制；（二）發展網路版的自動造題系統。本研究將朝此方向努力，將自動造題機制能嘉惠更多老師及學子。

圖 2：與數理科應用題測驗相關的自動造題機制 [41]

2.2.4 漸進提示動態評量系統

九年一貫課程實施後，國小數學領域授課時數減少許多，教師在有限的時間內要趕上教學進度已是相當困難，對學習有困難的學生進行補救教學更是難上加難。研究者彭彥翔 [35] 發現，許多作答錯誤的學生，僅需稍加提示後就可解題，

不可與真正不懂的同學歸於同類。

漸進提示動態評量透過「測驗－提示－測驗－提示－測驗」的方式，將提示由抽象、半具體逐漸演變為具體，可提高國小學生在數學學習上的成效。彭彥翔發展之適合國小學生之數學科漸進提示法電腦化動態評量系統，可解決一般的漸進提示動態評量較耗費人力及時間的問題，並發現透過系統反覆進行「出題—作答—提示—作答」的步驟，可有效提昇學生在「整數四則」單元的學習成效，與直接電腦動畫教學相比，學生亦有較好的表現及較多的進步。

本研究將延續此概念，將「提供提示」融入在題庫功能之中，學生在進行練習或測驗時，可透過系統提供提示語協助作答，以增加學生自行練習的可能性。

2.2.5 電腦化適性測驗

電腦化適性測驗與傳統紙筆測驗有很大的不同，其測驗方式是根據學生的能力及作答的結果，選取最適合該受測者的題目，答對了則選擇較困難的題目，答錯了便會選擇較簡單的題目。依據其理論基礎可將電腦化適性測驗分為二大類 [32]：一類是以試題反應理論（item response theory(IRT)）為基礎[5]，另一類則是以知識或試題結構為基礎[12]。

透過以試題反應理論為基礎的電腦化適性測驗進行施測後，受試者成績為一

「能力值」(ability) 或「量尺分數」(scale score)，比較適合用於教育資源分配情境，例如：基本學力測驗、大學入學測驗等。但其所提供的訊息不適用於錯誤類型診斷。

以知識或試題結構為基礎的電腦化適性測驗，則得先透過次序理論（ordering theory）來建構學生的知識結構。次序理論中提到，大量受試者進行試題 A 與試題 B 的作答，若答對試題 A 就會答對試題 B，但答對試題 B 則不一定會答對試題 A 時，便可設定試題 A 是試題 B 的上位概念，反之，試題 B 則為試題 A 之下位概念。透過知識或試題為基礎的適性測驗中，學生答對一個題目時，便假設其下位概念都會了，則可省略不進行測驗，而挑選答對題目的上位概念來繼續施測，因此每位學生作答的題目不盡相同，以此方式建構之電腦化適性測驗，則可在節省作答題目的狀況下，有高準度的判斷學生的錯誤概念在哪裡 [42]。

電腦化適性測驗一次僅出一個題目，作答後無更改的機會，且目前的研究均為選擇題的題型，會有猜測的問題；而本研究欲建立之題庫測驗系統，是基於希望學生可自行進行精熟練習為目的，因此本研究將採用傳統測驗之電腦化測驗，

並放眼未來能以本系統為基礎建立適性診斷的功能，提供老師在評量分析上更多的幫助。

2.2.6 線上測驗的優點與缺點

日前，教育部推動每校一電子白板、班班有單槍等計畫，打造國中、小ｅ化教學環境，透過電腦、媒體科技進行教學已日趨普及，教科書廠商亦提供互動功能豐富的電子教科書供教師使用，其中不乏有與學習環境搭配的電腦化測驗題目，可讓老師於課室中讓學生進行電腦化測驗，因此利用電腦從事線上電腦測驗的活動作為教學的輔助媒介，在現今的教學活動中已逐漸被重視，配合電腦的快速處理能力及網路無遠弗界的特性，更能擴大教學活動的範圍。各家研究者從應用的觀點提出線上測驗所具有的優點，兹將優點從教師、受試者這兩個面向，分別摘述如下： [26,21,24]

從教師的面向來看：

1. 可透過圖片、聲音、影像、動畫等方式將題目呈現於受測者眼前，把試

在文檔中基植於國小數學分年細目之線上題庫研發 (頁 13-19)