• 沒有找到結果。

和測驗相關的概念還有 測量、評量和評鑑等

N/A
N/A
Protected

Academic year: 2021

Share "和測驗相關的概念還有 測量、評量和評鑑等"

Copied!
30
0
0

加載中.... (立即查看全文)

全文

(1)

第二章 文獻探討

本章主要針對前述之研究目的,做相關之文獻探討,共分為三 節,第一節從測驗的意義與功能、多媒體的評量方式以及題型、媒體 格式來探討網路化測驗;第二節探討測驗系統的發展及開發方式;第 三節則探討教學系統評鑑的方法及實施。

第一節 網路化測驗

一、測驗的意義與功能

就教學而言,測驗的主要目的在於增進學習的效果,所以在學習 的各個階段及擬訂教學計畫之時,必須將測驗納入成為整個教學過程 的一部份(陳英豪、吳裕益,1982)。郭生玉(1990)認為,測驗是

「採用一套標準的刺激,對個人的特質作客觀測量的有系統程序」,

其中,標準的刺激是指測驗的試題在難度上適中並具代表性;個人的 特質是指認知及情感方面的特質;有系統的程序是指測驗的標準化過 程,測驗在實施、計分與解釋上的一致性。而 Mehrens 和 Lehmann

(1991)則認為,測驗就是一種測量的工具。和測驗相關的概念還有 測量、評量和評鑑等。評量(assessment)是指利用測驗、觀察等工 具對於個人或群體或某一計畫的表現所得的質與量方面的訊息,因此 測驗(testing)是評量的工具,測量(measurement)是評量的歷程。

但 所 得 的 資 訊 呈 現 了 什 麼 意 義 ,需要 標準去 判斷,則是 屬評鑑

(evaluation)。因此,測驗是指測量的工具,測量是指測量的歷程,

評量即經由測驗工具及測量的歷程所得的資料,評鑑則是指對測量結 果的判斷。

(2)

然而,上述分法也只是廣義或狹義的區分,施玉惠等人(1999)

在「國民中小學英語教學及評量模式」研究中指出:許多學者如 Valette

(1994),對 evaluation(評鑑 評量)、assessment(評量)、testing

(測驗)並不作特別區分;更多的學者僅作二分法,一類是層次較低 testing,另一類則層次較高,有的學者用 assessment 一詞(Bailey, 1998),有的用 evaluation(Genesee & Upshur, 1996)。

測驗有許多不同的功能,在教育上可以提供教學決定、行政決 定、及諮商與輔導決定方面的用途(陳英豪、吳裕益,1996)。余民 寧(1997)認為測驗在教育上可作為教學評量、診斷學習、及幫助學 習等三方面用途。李連順(2000)更將其歸納如下:

(一)教學評量的用途

1、瞭解學生的起點行為。

2、作為改進教學的參考。

3、確保教學目標的達成。

4、評定學生的學習成果。

(二)診斷學習的用途

1、診斷學生的學習。

2、改進命題的技巧。

3、作為補救教學的依據。

(三)幫助學習的用途

1、激勵學生的學習動機。

2、幫助學生的記憶和學習遷移。

(3)

3、促進學生的自我評量。

總結以上說法,測驗不僅僅是指測量、施測的工具,同時亦可以 是教與學的工具,有其教學評量、診斷學習以及幫助學習的用途。教 師能夠從測驗之中,得知學生對於課程的瞭解程度,並針對學生不瞭 解之處予以適當、正確的回饋,從而協助學生獲得必要的資訊或是採 取補救教學。

二、多媒體的評量方式

根據科學研究報告指出,人類接受的資訊中有百分之八十是來自 於視覺,因此如何使教學評量的方式具有與受試者更良好的溝通,一 直是資訊科技與計量學者追求的目標(區國良、陳國棟、劉寶均,

1997)。近年來多媒體技術蓬勃發展,使得文字(text)、圖形(graphic) 語音(audio)、影像(image)、視訊(video)、動畫(animation)可 以 整 合 在 一 起 , 並 可 透 過 軟 體 以 同 步 (synchronization)與合作

(collaboration)的方式展現在學習者的面前。此外,生動活潑的多 媒體所提供的聲光效果與創意設計,能夠激發學習者的外在動機,而 且多媒體的互動性、個別化學習等亦是激發學習動機的原因(陳新 豐,1999)。

目前的全球資訊網瀏覽器,在畫面的呈現上已能整合多種媒體元 素,加上網路上不受時間、空間限制的遠距教學環境,已漸漸成為教 育的新趨勢。多媒體靈活與交互的運用,正是其廣受歡迎的一大特 點,根據尹玫君(1995)的研究顯示,以電腦網路為基礎的遠距教學 環境有以下特色,分別為:(1)學習途徑開放性,(2)學習方法多樣 性,(3)資訊流通全球化,(4)學習評量進度個別化,(5)學習評量

(4)

對象普及化,(6)學習空間分散化,(7)學習評量時間即時化。

因此,在遠距教學環境之下,以網路架構為基礎,多媒體的運用 為內涵,便可在教與學的層面上,突破原本僵化呆板的傳統評量模 式。在目前追求人性化、生動化、適切化的教學趨勢下,多媒體評量 除了是一個兼顧認知、技能、情意的活潑生動評量過程外,並具有提 高參與興趣、提供真實情境評量、增進學生的間接學習,以及教師可 以獲得教學回饋等優點(邱龍斌,2002)。

由以上分析可知,運用多媒體進行線上測驗的評量方式已有跡可 循,且能兼顧認知、情意、技能三大構面,符合教育部(2003)國民 中小學九年一貫課程教學評量中所提到「評量的層面應包括認知、技 能與情意」的要求。林璟豐(2001)在「全球資訊網測驗題型研究」

一文中更就認知、情意、技能三大構面對傳統題型在網路上實施之可 行性及限制做出如下分析,如表 2-1 所示:

2-1 傳統題型在網路上實施之可行性及限制

領域 傳統題型 可行性 體 描 述

是非題

選擇題

配合題

在網路測驗上可以進行此類題型之測驗,並 且可以利用電腦自動閱卷,比之傳統方式更 有效率。

填充題

認知 領域

問答題

在網路上皆以進行此類題型之測驗,但仍有 部份必須人工閱卷。

直接觀察法 直接觀察法必須在「實際情境」之中進行觀 察,無法在網路上進行。

面談法

可以利用網路進行面談法,但是必須雙方都 有特殊設備及軟體,如小型視訊攝影機和通 訊軟體。

情意 領域

問卷或調查表

在網路測驗上可以進行此類題型之測驗,並 且可以利用電腦自動閱卷,比之傳統方式更 有效率。

(5)

領域 傳統題型 可行性 具 體 描 述

投射法

可以利用網路進行投射法,但是必須雙方都 有特殊設備及軟體,如小型視訊攝影機、電 子白板和通訊軟體。

情意 領域

暗地測量法 暗地測量法必須在「實際情境」之中暗地觀 察,無法在網路上進行。

書面測驗

辨認測驗 結構化表現測驗

在網路測驗上可以進行此類題型之測驗,營 造出測驗的標準情境,並且可以利用電腦自 動閱卷,比之傳統方式更有效率。

模擬表現測驗

要利用網路來進行模擬表現測驗,可以在現 今的網路環境之中可以達成某些技能的模擬 表現測驗。

在部份技能的模擬表現上,則須有更特殊的 設備,才能完成與真實作業相同的動作,而 達成模擬表現測驗。

技能 領域

實地測驗 實地測驗必須在真實的環境之中測驗,無法 在網路上進行。

資料來源:林璟豐,2001。

由表 2-1 的分析及描述可看出,在網路上,認知領域的評量無太 大問題,情意領域則較難以評量,而技能領域雖有無法以網路達成的 部分,但僅佔少數。因此,只要充分運用多媒體機制,應可製作兼顧 認知、情意及技能的多媒體線上評量。以下舉例科學教學中常用的十 二種評量方式,搭配表 2-1 的分析,分項敘述其利用多媒體線上評量 的作法及可行性(張鑫安、游光昭,2004):

(一)實地觀察(wild field observation)

實地觀察強調的是觀察現場活動實況,若想利用多媒體 線上評量達成此方式,可在實地架設攝影機等擷取設備,並 利用網路即時傳播的技術即時連線做觀察。亦可在事後透過 錄影重複觀察學生的學習情形,但須注意現場儀器可能對學

(6)

生造成的干擾以致影響其表現。

(二)簡單口頭問答(question and answer)

簡單口頭問答的方式特點是可針對重點發問,且可對行 為的動機做進一步的瞭解。欲使用多媒體線上評量的方式來 達成,可以採同步或非同步的方式,若採同步問答則必須雙 方都有特殊設備及軟體,如麥克風、小型視訊攝影機和通訊 軟體,若考慮傳輸品質,可以僅作音訊傳輸。而非同步問答 則可先將問題錄製好,答題者則利用線上錄音功能做口頭回 答。

(三)面談(interview)

面談的特點是針對某主題,經一系列問答得到某人對此 一問題的認識、見解等相關資訊。亦可以多媒體線上評量的 方式來進行,必須雙方都有特殊設備及軟體,如小型視訊攝 影機和通訊軟體。由於面談不僅僅考量到受試者的回答,其 表情、動作及態度亦是觀察重點,故視訊擷取有其必要,但 需要較高的網路傳輸品質,就目前寬頻網路的普及,要達成 此目的已非難事。

(四)紙筆測驗(paper-pencil test)

紙筆測驗是傳統評量最常用的方式,對於概念認知及其 應用的能力有很好的評量功能。紙筆測驗的題型在網路上已 經有很好的支援及成效。多數的「選擇反應式題型」如是非、

選擇題等,還可以利用電腦自動閱卷,比傳統人工閱卷或是

(7)

光學辨識方式更有效率,且加入多媒體元素將可使傳統紙筆 測驗在網路上呈現不同的面貌。

(五)報告(report)

報告在於瞭解撰寫者對整個事件的瞭解程度及對重點 的掌握情形,撰寫報告者可將報告內容以文字、圖片、聲音 及影像等方式上傳、發佈在網站上,利用線上互動機制達成 教師批改、回饋及同儕互評。

(六)操作評量(manipulating skill test)

操作評量重點在於技能方面,適用於確定的目標,且為 非語言文字所能區辨的能力。利用多媒體線上評量,可以用 模擬的技術如虛擬實境來達成此評量方式,即模擬表現測 驗。某些技能的評量可以在現今的網路環境之中達成,而部 份技能的模擬表現上,則須有更特殊的設備,才能完成與真 實作業相同的動作。在線上進行操作評量的模擬表現測驗,

除了可初步判斷學生是否正確學會該項技能,亦可避免實地 操作可能發生的危險,待學生能在線上操作環境熟練後,在 現實環境的操作亦能駕輕就熟。

(七)實驗評量(laboratory examination)

實驗評量除實驗操作技能外,尚須評量學生如何將問題 具體轉化為可試驗的工作,例如安排儀器、規劃工作流程,

分析、研判解釋資料等。利用多媒體線上評量,可以以模擬 技術表現實驗情境,並搭配其他線上測驗的機制,使受試者

(8)

能在網站上直接作規劃分析並寫下解釋資料,形成一個完整 的線上實驗評量。

(八)專題報告(thematic report)

專題報告類似於上述所提及的報告,但著重在瞭解撰寫 者規劃、執行、研究等各方面的能力。專題報告的線上運作 的方式和報告相同,撰寫報告者可將報告內容以文字、圖 片、聲音及影像等方式發佈在網站上,利用線上互動機制達 成教師批改、回饋及同儕互評。

(九)卷宗評量(portfolio assessment)

卷宗評量可評量出學生對問題的認識程度,對變因的重 要性認識、能作有層次有組織的表達能力,其實施方式便是 要求學生能針對某主題,蒐集相關資料作展示。此評量方式 在網路上可充分發揮其成效,多媒體機制可以讓受試者使用 多種媒體的表現方式在網路上呈現、展演自己所蒐集的作 品,形成同儕互評,互相給予意見及回饋。

(十)進階式評量(hierarchical assessment)

進階式評量是以進階評量單給學生在學習活動前自我 評量,幫助學生及教師了解自我學習能力,以作為個別學習 的參考,通常用於學習活動前。此種評量可以用多媒體線上 評量的方式作學習前測,以探知學習者對問題的認識與瞭 解,以作為教學的參考,若為網路教學,亦可以此為根據,

系統自動給予學生不同的線上學習教材。

(9)

(十一)實作評量(performance assessment)

實作評量是根據學生的實際表現所做的評量,可評測學 生概念認知的程度與處理問題的能力。其方式可藉由直接的 現場觀察與判斷,或間接從學生的作品去評判,如科學實 驗、教學解題、寫作、口頭報告等。直接的現場觀察與判斷 利用多媒體線上評量的機制較不易達成,而間接的作品評 判,即可在線上輕易達成,學生可以充分利用多媒體機制在 網路上展演自己的作品,達成間接的實作評量。

(十二)真實評量(authentic assessment)

真實評量強調情境的真實性與證據的真實可信度,是在 實際的教學活動中,教學和評量兩者的密切配合,教師在教 學活動中透過觀察及與學生的談話,蒐集各個學生學習的資 料。因此,若能將教學活動轉移到網路上進行,將可充分利 用多媒體展示教材,並利用系統自動記錄的功能將學生的學 習歷程完整記錄下來。

三、網路化測驗題型分析

一般而言,以紙筆為基礎的測驗方式可說是從傳統的紙筆測驗

Paper-Based Testing, PBT),轉為電腦單機操作的電腦化測驗

Computer-Based Testing, CBT ), 再 演 進 至 今 日 的 網 路 化 測 驗

(Web-Based Testing, WBT)。而網路化測驗即為電腦網路輔助測驗,

其 為 電 腦 化 測 驗 和 網 際 網 路 的 結 合 , 亦 稱 為 線 上 測 驗 (online testing)。McCormack 和 Jones(1997)認為,網路化測驗具備節省時

(10)

間、即時回饋、減少資源、保存記錄以及利於資料分析等特點,因此 能夠改善評量的程序和方法。網路化測驗除了承襲電腦化測驗的優點 外,還兼具:(1)跨越時空的限制,(2)加速資訊的流通與共享,(3)

促進科際的整合,(4)營造個別化的測驗環境,(5)可能取代部份現 有課堂評量,(6)可合作建立題庫等特色(引自劉亞平,1998)。

因此,由原本單機施測的環境,發展出以網際網路為骨幹的遠距 測驗是必要的,它能夠結合網際網路的優點,提供超越時空、隨選隨 測(test-on-demand)、更具彈性的施測環境(何榮桂,1997)。而林 璟豐(2001)更在「全球資訊網測驗題型之研究」一文中,探討及開 發各種適用於網際網路測驗的題型,以歸納出全球資訊網測驗題型

(表 2-2),並敘述如下:

2-2 網路測驗題型表

題型 題型簡述

是非題 利用多媒體呈現必須以大量文字敘述的題目,採用標示型按鈕

ratio button)的方式進行作答。

選擇題 利用多媒體呈現題目,以下拉式選單(pull-down menu)的方 式進行作答。

配合題 運用多媒體呈現題目,以拖曳(dragging)的方式進行作答。

填充題 運用多媒體呈現題目,採單行文字方塊的方式輸入答案。

問答題 採用多媒體呈現題目,並以多行文字方塊的方式進行答案的輸 入。

操作題 以互動性進行模擬操作,以滑鼠拖曳的方式進行作答。

模擬題 以互動性進行情境之模擬,以滑鼠拖曳以及點選的方式進行作 答。

語音題 利用口語的方式進行作答,以麥克風錄製答案,並上傳到資料庫。

連鎖題 進行同一範圍題目的連鎖性測驗,以比較其前後答案是否有不相 同之處。

討論題 利用網路對談的功能,進行小組討論,各抒己見以探討各項議 題,最後並撰寫討論報告。

資料來源:林璟豐,2001。

(11)

(一)是非題:

是非題在網路測驗上是常見的題型,當測驗的答案只有

「正確」或是「錯誤」兩種選項時,宜利用是非題來測驗。

是非題能夠應用於各學科領域,進行較低層次的認知、情 意、和技能三方面的能力之測量。

(二)選擇題:

選擇題在網路測驗上亦是一種常見的題型,選擇題的適 應性極大,記分客觀且容易,除了能夠測量簡單的學習結果 之知識層面外,當題目設計良好時,應可測量出理解、應用、

分析、綜合、和評鑑等複雜的能力。此外,利用多媒體的方 式來進行測驗,可測得無法利用傳統紙筆測驗測出的能力。

(三)配合題:

當有一系列相關連之題目與答案要測驗時,可將題目與 答案各自進行錯綜排列,讓受試者進行配對,即可在同一題 型之中測出多題選擇題才能達到相同目的之測驗,亦可增進 受試者對比的觀念與整理之能力。

(四)填充題:

當測驗的目的是要受試者主動提供簡短的、明確的答 案、或是完成一個未完的敘述句時,可利用填充題來測驗。

填充題能夠測得術語知識、特定事實、原則知識、方法和程 序、資料的解釋等中等層次的能力。

(12)

(五)問答題:

當欲測量受試者複雜的學習成果,與組織和提出觀念等 高層次的能力時,宜採用問答題來測驗。與傳統問答題相較 之下,問答題在電腦測驗之中文字輸入的模式與速度,會造 成受試者額外的負擔,至於是否更有效率,則須進一步研 究。此外,問答題在閱卷方面,比較難以利用電腦閱卷的方 式來進行,仍然必須以人工閱卷的方式來進行,但可利用電 腦龐大的運算能力,提供閱卷者該填答內容的相關資料,如 關鍵字的次數,總字數等。

(六)操作題:

在技能的模擬操作測驗上,利用電腦模擬的方式雖可以 進行模擬操作測驗,但是卻比較難以在全球資訊網的環境之 中,達到模擬操作的目的和層次。

(七)模擬題:

模擬題型乃是模擬出一個標準且有控制之情境,在結構 性的情境之中,要求受試者表現出相同的反應動作時,可利 用模擬題來測驗,如實驗或是輸入不同的參數,以模擬出不 同之結果的測驗形式。

(八)語音題:

利用網路多媒體上傳的功能,讓需要利用口語方式作答 的測驗能夠利用網路來進行,如國文、英文、音樂、或是口

(13)

語傳播等,能夠測得語言技能或聲音表現方面之能力,亦可 用於測驗口語表達能力。

(九)連鎖題:

當需要驗証受試者答案的一致性,或是檢查受試者對於 該知識者觀念是否正確時,可以運用連鎖題的題型來實施。

(十)討論題:

在全球資訊網的環境之中,利用其合作學習的特性,可 以營造出小組討論或合作答題的環境。此外,亦可用於情意 領域觀察學生合作學習時的態度。

由上述對網路化測驗的概述與題型分析,我們不難發現,網路化 測驗其實已經包含多媒體的條件在其中,亦可稱之為「網路化多媒體 測驗」。若以「網路化」及「多媒體」兩者之定義做解釋,網路多媒 體測驗應該是「結合了多種類型的媒體元素,包括影像、聲音、圖形 及文字等,並藉由電腦在網際網路上實施的測驗方式」。它能運用網 際網路的多媒體特性,搭配不同的題型,以豐富的考題內涵,形成一 種近似於多元評量的形式,來測得學生不同向度的能力。鑑於目前寬 頻網路的日益普及,多媒體在網路上的傳輸問題將能妥善得到控制。

因此,若能開發一個充分運用網路多媒體特質的測驗編輯系統,將可 充分拓展教學評量的方式與空間。

四、多媒體檔案格式分析

在電腦多媒體的資料形式中,通常可分為文字、圖形、影像、音

(14)

訊,以及動畫等資料形式,茲分述如下(羅綸新,2002):

(一)文字資料:

通常文字代表了各種語文的文字、數字及符號等資料,

這些資料仍可謂為電腦多媒體當中最重要的訊息元素。文字 也是多種媒體裡最易於瞭解也是最容易處理的資料。

(二)圖形資料:

電腦圖形是以點(point)為基本單位,這個點又稱為像 素(pixel),也是印表機及螢幕顯示的基本單位,常見圖形 檔案格式如*.jpg、*.bmp 等。

(三)影像及影片:

電腦的影像資料可分為兩種,一為靜止的影像(still images),另一種為動態的視訊(motion video)或稱視訊

(video)。靜止的影像即為單張的影像或圖畫,這種資料和 圖形檔一樣,由不同顏色的像素或點所構成的電腦畫面,如

*.jpg、*.bmp 等;而動態視訊就是如電影或電視一般的影 片,是一種連續演出的畫面,在電腦螢幕上播出的連續影像 便構成了電腦視訊資料,包括動畫與影片兩種,常見檔案格 式如*.mpg、*.avi 等。

(四)音訊:

電腦多媒體的音訊包括製作聲音、編輯聲音以及將聲音 融入節目等工作,其種類包括波形音訊(waveform audio)、

(15)

MIDI 音訊(midi audio)及 CD 音訊等三種,常見檔案格式 如*.wav、*.mid 等。

(五)動畫:

動畫可謂為年輕的學習者最喜愛的節目,它也是最易引 起人類視覺意向的媒體資料。因此,善用動畫可為多媒體教 學帶來不錯的效果,常見檔案格式如*.swf 等。

而目前在網路上流通多媒體檔案格式,若依以上分類和定義,可 大致可分為文字、圖形、聲音、影像、動畫等格式,其中文字通常不 談媒體格式,而是強調其字型變化及顯示效果。此外,由於圖形、影 像和動畫的定義有所交集,因此本研究僅就其電腦檔案格式來做區 別,彙整如下:

2-3 常見電腦媒體格式分類

媒體元素 常見電腦檔案格式 補充說明

圖形 .bmp、.jpg、.gif、.png 以靜態影像為主,但.gif 亦 可呈現動態效果

影像 .avi、.mpg、.wmv、.asf、.rm 以動態視訊(video)為主 聲音 .wav、.mid、.wma、.mp3、.ra .mid 為數位音樂介面,不支

援人聲

動畫 .swf Macromedia Flash 之檔案 格式

(16)

本節摘要

本節由測驗的意義與功能、多媒體的評量方式、網路化測驗題型 分析以及多媒體檔案格式分析來探討網路化測驗,可得到以下結論:

一、測驗是教學中的重要部份

測驗有其教學評量、診斷學習以及幫助學習的用途。教師能 夠從測驗之中,得知學生對於課程的瞭解程度,必要時給予適 當、正確的回饋,協助學生獲得必要的資訊或是採取補救教學。

二、多媒體評量方式能多方面評量出學生的能力

運用多媒體檔案,來呈現多樣化試題,是一個兼顧認知、情 意、技能活潑生動的評量過程,且能提高受試者對於題目內容的 了解程度,使學生充分發揮能力作答。此外,從多種角度的媒體 形式來輔助測驗學生在學習目標下的學習成果,亦符合教育部

(2003)國民中小學九年一貫課程教學評量中所提到「評量的層 面應包括認知、技能與情意」的要求。

三、網路測驗題型已有初步的研究成果

網路化測驗能結合網際網路的優點,提供彈性的施測環境,

而相對應的題型亦有初步研究成果,林璟豐(2001)分析出適合 在網路上施測的題型有是非、選擇、配合、填充、問答、操作、

模擬、語音、連鎖、討論等十種題型。

四、常見電腦媒體檔案格式可分為圖形、影像、聲音及動畫

(17)

此四類媒體元素均有相關電腦媒體格式,易於在網際網路上 流通運作,其中圖形以靜態影像為主(如*.jpg),而影像則以動 態視訊為主(如*.mpg),聲音較無分類上的爭議,動畫雖可稱 為動態視訊,但本研究以 Macromedia Flash 之檔案格式*.swf 為 主。

(18)

第二節 測驗系統的發展與開發方式

一、測驗系統的發展

目前國外已發展許多網路測驗評量系統,Scott、Robert、Aaron Larry(2000)指出,典型的線上評量系統主要都著重於「能夠經 由一般標準的瀏覽器進行網路連線」、「利用密碼判別使用者身份」、

「自動評分」「收集記錄相關學生成績」四種功能的達成。較著名的 網路評量網站如密西根州立大學的 CAPA,以及商用形式的 WebCT,

這些線上評量系統可以呈現 Web 畫面,取代傳統紙筆測驗形式,有 些可以加入音效與影像於試卷當中,甚至可以加入虛擬或動態畫面,

增加試題的靈活度(引自王子華、黃世傑,2001)。

國內關於網路測驗評量系統的研究,最近幾年已有不錯的成果,

對於多媒體測驗系統的前瞻性規劃也多所敘述。周倩(2000)認為一 套真正可落實推廣的網路評量系統,必須走出大學實驗室,以確定其 可行性(feasibility)、可用度(usability)與擴充性(scalibility),才 有其價值。目前國內提供網路評量服務的網站,例如中山網路大學,

係利用旭聯科技所開發之網路教學系統「智慧大師」所建置,提供遠 距教學及評量的服務。而對於網路評量系統的功能面,周朝宜(1999)

在其研究中提到,一個線上學習評量系統應包含:教師題庫系統、教 師出題系統、學生考試系統、批改試卷系統、查詢系統等五大功能,

而簡瑞華(2002)亦提出,一個完整的線上題庫評量系統,應包含以 下幾項功能:(1)安全的認證機制,(2)方便的使用者管理介面,(3)

完整的題庫管理,(4)友善的試卷製作與管理,(5)完善的線上測驗,

(6)即時成績查詢與結果分析,(7)互動的討論機制,(8)即時的 試題訊息。茲將國內近五年對於多媒體測驗及網路測驗評量系統相關

(19)

文獻列舉如下(表 2-4):

2-4 近五年多媒體測驗、測驗評量系統相關文獻

年代 作者 論文名稱

2003 林敏慧、

陳慶帆

植基於Web 的多媒體線上測驗系統之建置 2002 王子華、

黃世傑

網際網路評量與試後分析系統(WATA)之設計

2002 翁全志 九年一貫自然與生活科技能力指標之網路多媒體教材與測 驗評量研究

2002 簡瑞華 線上題庫與評量系統之開發

2002 柯俊良 新式題型網路題庫測驗系統之建置─以國小高年級數學科 為例

2002 翁正雄 多媒體線上測驗系統之建置及其相關研究 2001 陳新豐 線上題庫與適性測驗整合系統之發展研究

2001 邱龍斌 線上體育多媒體評量系統之研究與開發(以國中課程排球 基本動作為例)

2000 何榮桂 網路環境題庫與測驗之整合系統

2000 蔡文富 網路測驗系統之建置-應用於國民中小學課程

2001 林裕集 適用於電腦教室之網路測驗系統:以國小英語科為例 1999 李連順 國中生活科技線上測驗系統發展研究

1999 黃朝恭 國民小學國語科多媒體線上測驗系統建置之相關研究

二、系統開發模式

系統開發模式之發展約起源於 1950 年代,最早之模式稱為編碼 與修正模式(Code-and-fix Model),後來 Benington(1956)提出階 段模式(Stagewise Model),接著Royce(1970)提出瀑布模式(Waterfall Model),Mills(1971)提出漸增模式(Intermental Model),Bally、

Brittan 和 Wagner(1977)提出雛形模式(Prototyping Model),Mills、

Linger 和 Hevner(1986)及 Boehm(1988)提出螺旋模式(Spiral Model),最後Aoyama(1993)提出同步模式(Concurrent Model)(詳

(20)

2-1)。在這些模式中,編碼與修正模式及階段模式被實際應用的 機率較低,其餘則為目前常被使用的系統開發模式。

2-1 系統開發模式之演進 資料來源:吳仁和、林信惠,2003。

本研究所要開發的是一多媒體與網路結合之測驗編輯系統,特點 在於包含多樣題型以及兼容多種媒體格式,將以林璟豐(2001)所探 討出的十種全球資訊網測驗題型,作為本研究系統題型模版開發的重 要依據。本研究的重點,正是要開發全球資訊網測驗題型的模版,使

1950

※最早提出之編碼與修正模式(1950 年代)確切時間不可考

1960 1970 1980 1990

階段模式 (Benington, 1956)

瀑布模式 (Royce, 1970)

漸增模式 (Mills, 1971)

雛形模式

(Bally 等人, 1977) 同步模式 (Aoyama, 1993) 螺旋模式(Mills

等人, 1986;

Boehm, 1988)

(21)

教師能易於製作多媒體試題。因此,在考慮題型需求、多媒體特性與 各 種 不 同 開 發 方 式 後 , 決 定 採 用 系 統 發 展 生 命 週 期 (System Development Life Cycle, SDLC),也就是所謂的瀑布模式(Waterfall Model),以進行系統開發,該方法將系統開發的過程分成「幾」個 階段,每個階段清楚定義要做哪些工作及交付哪些文件,每個階段是 循序的執行且僅循環一次(吳仁和、林信惠,2003)。適用於需求明 確,領域知識(domain knowledge)容易取得的專案,強調開發過程 需有完整的規劃、分析、設計、測試及文件等管理控制,沒有明確規 定要劃分成多少個階段,但每一階段皆有文件產出。90 年代雖有較 新的同步模式(Concurrent Model)來進行系統開發,但其強調多個 團隊同時開發,必須有足夠的人力參與,就本研究人力考量,並不足 以支援此系統開發方式,故本系統將遵循瀑布模式的流程進行開發。

當系統開發問題較小或單純,瀑布模式劃分的階段可能少至三 個,例如分析、設計、實施等階段(如圖2-2);若面對較大或複雜之 問題時,其階段可再被細分成更多個階段,通常劃分5∼7 階段不等。

例如可能劃分為:初步調查(Preliminary Investigation)、系統分析

(System Analysis)、系統設計(System Design)、系統開發(System Development )、 系 統 實 施 與 評 估 ( System Implementation and Evaluation)等五階段。

(22)

分 析

實 施 設 計

2-2 瀑布模式之開發階段 資料來源:吳仁和、林信惠,2003。

根據以上測驗系統功能探討與開發模式,本系統功能可大致分為 教師功能模組、學生功能模組以及管理者模組,並以瀑布模式進行系 統開發。特色在於對教師模組中的多媒體命題部分做重點建置,以強 調本測驗編輯系統對多媒體的彈性運用,因此根據研究目的及實際需 要,本研究歸納出「網路多媒體測驗編輯系統」之開發階段,如圖 2-3 所示:

2-3 「網路多媒體測驗編輯系統」之開發階段 分析

設計

發展

評鑑

□題型分析

□媒體格式分析

□系統功能分析

□開發技術分析

□軟硬體需求分析

□系統結構化分析

□題型模版設計

□系統功能設計 □教師模組製作

□學生及管理模組製作

□系統整合及功能測試

□系統美工製作

□內部評鑑(專家評估)

□外部評鑑(教師試用與 學生測驗)

(23)

三、系統開發工具及網頁技術

本系統為一網路多媒體測驗編輯系統,由於要能架構在網際網路 上,因此動態網頁如 ASP(Active Server Page)、PHP(Hypertext Preprocessor)、JSP(Java Server Page)等運用是不可或缺的技術。在 目前常見的動態網頁開發工具中,以Microsoft FrontPage、Macromedia Dreamweaver 為主流。

從資料傳輸的角度來看,由於網路測驗系統必須能負擔龐大的資 料傳送需求,例如多媒體的測驗試題網頁、學生資料、測驗結果資料 等,均需要相當大的網路傳輸頻寬。隨著軟硬體技術的進步,網路伺 服器的負載能力日益提升,運算處理及網路傳輸頻寬也相對提升,對 於在同一區域網路(Local Area Network, LAN)內的電腦教室學生主 機而言,已經沒有傳送速度太慢的問題(林裕集,2001)。而隨著寬 頻網路的日益普及,在廣域網路(Wide Area Network, WAN)上進行 多媒體測驗亦是時勢所趨。

林裕集(2001)在「適用於電腦教室之網路測驗系統」一文中曾 提出,為了製作具有多樣化題型的測驗系統,在評估各種開發工具 後,發現 Macromedia 公司所研發的 Dreamweaver UltraDev 4.0 最為 適合。因為它的開發界面相當人性化,支援所有最新的網頁功能,同 時有強大的資料庫開發工具,更特別的是它的 Extension 功能,能夠 外掛該公司針對 UltraDev 4.0 所免費提供的 Course Builder。在目前市 面上的各式開發工具中,Course Builder 具有強大的測驗式網頁開發 能力,同時它提供了方便的操作界面,讓命題者可以快速的產生功能 強大的選擇題、是非題、填充題、問答題、拖曳式連連看、拖曳式填 答等各式題目,達到了多樣化題型的目的。

然而,使用Course Builder 來形成多樣化試題,對命題者而言仍

(24)

舊是一項挑戰,林裕集(2001)在其研究建議中亦提到:往後測驗系 統的相關研究,可加入試卷製作模組。因其所開發的系統,試卷網頁 的製作方式是在 Dreamweaver 4.0 上開啟已完成的試卷模組,利用 Course Builder 加以修改或增刪題目,同時配合修正相關的程式碼,

以便處理成績資料傳送或權限控管的功能。這種製作方式對一般教師 而言,需要花費許多時間學習製作的流程,若能加入一個方便的試卷 製作模組,讓教師可以逐題設定題目類型、題目內容與計分方式,將 能增進教師出題的便利性。

因此,本研究嘗試突破上述之限制,讓教師能直接在網頁上開發 多種題型,無須透過其他外掛編輯程式的協助,且各種題型還可因多 媒體元素的加入,而變化出不同的呈現形式。

(25)

本節摘要

本節由測驗系統的發展、系統開發模式、系統開發工具及網頁技 術來探討測驗系統的發展與開發方式,可得到以下結論:

一、測驗系統開發已逐漸成為一個新的研究領域

從文獻數量看來,目前國內外對網路化測驗系統的研究已有 不錯的研究成果,對於測驗系統的前瞻性亦多所探討及規劃,將 能為教學評量的實施提供一個解決方案。

二、可以系統發展生命週期(SDLC)作為測驗系統的開發模式 系統發展生命週期(SDLC)即為瀑布模式,適用於需求明 確,領域知識(domain knowledge)容易取得的專案,強調開發 過程需有完整的規劃、分析、設計、測試及文件等管理控制。本 研究以林璟豐(2001)所規劃的網路測驗題型作為明確的需求基 礎,並將系統分為分析、設計、發展、評鑑等階段進行開發,除 了將重點放在測驗題型模版的設計及製作外,其他系統功能將依 研究目的及需求加以規劃,初步分為教師、學生以及管理者模組。

三、多媒體評量所需應用的技術層次較高

多媒體的測驗方式雖然較傳統紙筆測驗更能真切地測量學 習成效,但製作上往往存在著技術上的問題,並非每一位有心採 取多媒體評量方式的教師都能輕易做到。本研究期望能突破此限 制,以動態網頁技術開發一個在網路環境下,提供多樣題型模版 及兼容多種媒體格式的測驗編輯系統,教師只要準備好媒體元

(26)

素,即可透過簡單的操作導引,製作多媒體試題。

(27)

第三節 教學系統評鑑的方法及實施

一、教學系統的評鑑工作

本研究屬於教學評量系統之發展,因此進行系統評鑑階段 時,需考慮專為教學系統設計的評鑑方式。「評鑑」的定義甚多,

最普遍而廣被接受者,是將評鑑視為一種有計畫、有系統的收集 資料、分析資料及提出報告的過程,其目的在診斷問題、進行判 斷,以促進決策的合理性(Felton & McConachy, 1980;Tamir, 1985 ; Lewy, 1985 ) 。 測 驗 系 統 架 構 是 屬 於 電 腦 管 理 教 學

(Computer- Managed Instruction, CMI)之範圍(李連順,2000),

而測驗乃教學的一部份,對於測驗系統的評鑑,除了系統本身測 試外,也應重視其實施的成效或影響。在目前教學系統的評鑑方 法中,智慧型教學系統(Intelligent Tutoring Systems, ITS)的評 鑑方式可謂發展相當成熟,對教學系統評鑑帶來新的思維,其以 內部評鑑(internal evaluation)及外部評鑑(external evaluation)

的分類方式可供一般教學系統作評鑑參考(張鑫安、蘇照雅,

2004)。

二、系統內、外部評鑑的意義

內部評鑑和外部評鑑反映了系統評鑑需求很重要的一個問 題(Iqbal, Oppermann, Patel & Kinshuk, 1999):「什麼是該被評 鑑的 – 是整個系統或只是系統的一部份?」若評鑑的是整體系 統,則稱為外部評鑑(external evaluation);若評鑑的是系統架 構、元件或其他特徵,則稱之為內部評鑑(internal evaluation)。

(28)

Siemer 和 Angelides(1998)曾提出和 Iqbal 等人相類似的 概念:若評鑑的是系統結構及其行為之間的關係,稱之為內部評 鑑;若評鑑的是系統所展現的行為對學生的影響,則稱之為外部 評鑑(詳圖 2-4)。

2-4 ITS 的內部及外部評鑑 資料來源:Siemer & Angelides, 1998

統合上述專家的說法,若評鑑的是系統結構及其行為之間的關 係,其實就是對系統內部結構或其他元件的測試,稱之為內部評鑑;

若評鑑的是系統所展現的行為對學生的影響,可等同於對整體系統的 效能的評鑑,此稱之為外部評鑑。而以內/外部評鑑的分類方式正回 應了 Littman 和 Soloway(1988)對評鑑提供的兩個議題:

(一)對學生而言什麼是ITS 的教育影響?

指的就是系統所展現的行為對學生的影響,也就是對整 體系統的效能的評鑑,即外部評鑑。

(二)ITS 的結構和其行為有何關係?

指的就是系統結構及其行為之間的關係,其實就是對系 統內部結構或其他元件的測試,是為內部評鑑。

系統結構 提供 影響 系統行為 學生

內部評鑑 外部評鑑

(29)

由以上探討可知,對於教學系統的評鑑而言,不僅僅是就系統本 身的測試而已,還需考慮系統對教育所帶來的影響。本研究為一網路 多媒體測驗編輯系統,主要使用者為教師,但亦具備學生進行線上測 驗的功能。因此就內部評鑑而言,可以專家評估系統內部結構及其行 為的方式來達成,用以確定系統的程式是否能到達一個展示的標準等 級;外部評鑑方面,本系統使用對象為教師及學生,故應探討系統對 兩者而言產生了什麼影響或衝擊。由於系統以試題編輯為核心功能,

將調查教師對系統之試用經驗,此外,學生使用此系統進行網路多媒 體測驗之成效,亦為本研究之探討重點,將以準實驗研究的方式來完 成評鑑,茲將本研究之內、外部評鑑示意如下:

2-5 本研究之內部與外部評鑑

系統結構 提供 影響 系統行為 教師與學生

內部評鑑 外部評鑑

專家評估 教師試用

學生測驗

(30)

本節摘要

ITS 的評鑑可謂目前發展相當成熟的評鑑方式,其分為內部及外 部的評鑑,可供其他教學系統作為評鑑的參考,其通則為:若評鑑的 是系統結構及其行為之間的關係,即是對系統內部結構及元件的測 試,稱之為內部評鑑;若評鑑的是系統所展現行為對使用者之影響,

可等同於對整體系統的效能的評鑑,稱之為外部評鑑。本研究以此為 基礎,規劃本系統的評鑑方式,將邀請專家評估本系統內部結構及其 行為,以完成內部評鑑;並調查教師試用系統經驗,以及學生網路多 媒體測驗的結果,分析本系統對教學上所帶來的影響,以完成外部評 鑑。

數據

圖 2-1)。在這些模式中,編碼與修正模式及階段模式被實際應用的 機率較低,其餘則為目前常被使用的系統開發模式。  圖 2-1  系統開發模式之演進  資料來源:吳仁和、林信惠,2003。  本研究所要開發的是一多媒體與網路結合之測驗編輯系統,特點 在於包含多樣題型以及兼容多種媒體格式,將以林璟豐(2001)所探 討出的十種全球資訊網測驗題型,作為本研究系統題型模版開發的重 要依據。本研究的重點,正是要開發全球資訊網測驗題型的模版,使1950 ※最早提出之編碼與修正模式(1950 年代)確切時間不可考  1
圖 2-4  ITS 的內部及外部評鑑  資料來源:Siemer & Angelides, 1998

參考文獻

相關文件

(十) 由監評人員主持公開抽題(無監評人員親自在場主持抽題時,該場次 之測試無效)

複選通過標準:國語文性向測驗成績達平均數正 2 個標準差或 PR97 以上,外 語文性向測驗成績達平均數正 1.5 個標準差或 PR93

 1932 年提出李克特量表( Likert Scale ),是一種 心理測量量表,通常用於問卷設計,為目前最受調查 研究者廣泛使用的測量方法.

舉例: 中一以隨筆一作前測診斷,發現 學生的描寫多欠具體清晰.

並藉由適當工具與資訊,去描述、模擬、解釋與 預測各種現象,發揮數學思維方式的特長,做出

策劃較為周全的學校,能善用質性和量性 的評估數據,辨識學生需要加強的質素,並根

測驗 自評 + 問卷 晉階

是屬於層次較高之檢測工作。由此類工作的特質 是屬於層次較高之檢測工作。由此類工作的特質 來看,其應屬於非破壞評估(Non-Destructive