評量的種類可依據測驗結果解釋方式的不同,與教學歷程的評量時機進行分 類,並具有功能性各異的評量方法。以下茲就評量的分類與多元評量的多元觀進行 說明。
一、評量的分類
測驗的種類繁多,依照分類方式而有不同的測驗名稱,以下依學者論述(郭為 藩、高強華,1987;郭生玉,1990;陳新豐,2015),扼要說明各種測驗的分類。
(一)依據測驗結果解釋分類
測驗分類中,依照測驗結果的解釋可分為「常模參照測驗」以及「標準參照測 驗」。
1.「常模參照評量」(Norm-Referenced Evaluation)
測驗結果是根據分數在團體中的相對位置解釋,以其他學生的表現作為參照對 象。測驗內容涵蓋較廣的目標,因而每個測驗概念的完整性較淺,分數變異度較 大。常見於性向測驗和標準化成就測驗,評量結果的呈現方式,常見為標準分數或 是百分等級。主要目的是在區分學生之間的成就水準,適合用於行政決策,如分組 編班或鑑定能力。
2.「標準參照評量」(Criterion-Referenced Evaluation)
測驗結果是根據教學前訂定的標準答案解釋,以預定的精熟標準作為參照基 準,呈現方式如:通過或不通過、等級甲乙丙丁等。測驗內容涵蓋較少的目標,因 而每個測驗概念的內容完整性較佳,分數變異度較小。主要目的在於理解學生的在 學習歷程中是否有困難存在,強調學習者個人之能與不能完成的學習結果,以判斷 學習的精熟程度。
17
(二)依據教學歷程的評量時機與功能分類
測驗分類中,依照教學歷程的評量時機與功能的不同,可分為「預備性評 量」、「形成性評量」、「診斷性評量」、「總結性評量」。
1.預備性評量(Preparative Evaluation):
於教學前實施,測量學習前所需的知能和已達課程目標的程度,包括準備和安 置的向度。準備的向度是考慮學習者是否具備教學內容的先備知識,若尚未達成,
則需要於教學活動前補強;安置的向度是考慮學習者是否已經具有教學預期結果的 程度,若是已達到能力目標,則需安排學習更高階的教學內容,或是以此作為學生 分組的依據。評量主要目的,在瞭解學生的起點行為與基本能力。
2.形成性評量(Formative Evaluation):
於教學中進行,並且藉以判斷學習者是否達到階段性預期的學習目標,以診斷 其學習歷程中遇到的困難因素。教師可以提供適當的回饋讓學生瞭解,並穩固學習 內容。例如:隨堂測驗、單元小考等。重視測量所教過特定內容的學習效果,並且 使用測量的結果來改進學習。評量主要的目的在於監控學習者學習的歷程,提供師 生有關學習進步的回饋,作為實施個體或團體補救教學之依據。
3.診斷性評量(Diagnostic Evaluation):
於教學中進行,是針對上述形成性評量所無法矯正的嚴重困難,提供更進一步 的診斷訊息。對於特定學習內容或是知能上的障礙,進行更綜合性、準確的分析處 理。例如:教師為全面了解學生學習困難的原因,而實施的評量策略。評量主要的 目的在於提供更綜合且精細的診斷訊息,提供教師採行必要治療措施之參考。
4.總結性評量(Summative Evaluation):
18
多元評量的理念,主要受到 Gardner(1983)提出的「多元智慧論」所影響。他 認為智慧是多向度的展現,揚棄以往以標準化智力測驗,以分數決定人類聰明程度
19
1.實作評量(Performance Assessment):
根據 Whleeler 和 Haertel(1993)的定義,實作評量是有別於紙筆測驗的變通 性評量,學生需完成一項特定任務或工作,展現其具備的知識和技能,教師則依據 其在過程中的表現進行評量。實作評量的評分相當依賴專業的觀察與判斷,因而需
20
界定清楚的目標,並設定相應的評分基準供學生依循。其評量方法包括:問題解決 方式、實驗操作、展示、作品集、教師觀察、檢核表等。
2.真實評量(Authentic Assessment)
真實評量注重情境知識的學習,教學必須架構於真實情境的課程設計之中,強 調學生從相符於實際生活經驗的問題情境脈絡中習得知識,評量時間常持續一學 年,教師與學生共同改進學生的工作品質(Maurer,1996)。
真實評量的特點是必須於教學活動中進行評量,立即性評估學習者在教室活動 中的執行或操作的工作表現。以時機點和功能性來分類乃屬於形成性的評量,教師 可從學生的概念圖、軼事記錄、觀察記錄、設計圖稿等資料,以多元觀點瞭解學生 的學習情形。
3.檔案評量(Portfolio Assessment)
檔案評量是指有目的、系統性的蒐集學生在相關領域的作業,將整個學習歷程 產生的學習單、報告、圖片資料、心得札記等放入檔案卷宗內檢視。重要的是要學 生一同參與檔案建置的過程,內容的選擇可明確呈現出教師的指導綱領、判斷標準 與學生自我反省的證據,不僅展現學生在這段時間的投入程度與進步情形,更有助 於對自我的學習歷程進行自評與反省,激發學習動機(甄曉蘭,2008)。
4.另類評量(Alternative Assessment)
另類評量又稱變通性評量,立基於互動論(interactivism)的觀點,強調學生 對知識建構的自我決策、組織性、自我評鑑與自我校正的能力,重視解決問題取 向、知識獲得的統整性(吳碧純,1996)。教師依據教學目標與課程內容、學生個 別的學習特質、社經背景、性別、成就動機設計評量模式,並拉長評量的時間,使 教師得以對學生的學習歷程做長時間的觀察分析,觀察項目的範圍廣泛,考核學生 高層認知能力、實際生活表現、進步情形、組織能力等(江雅琪,2004)。
21
5.動態評量(Dynamic Assessment)
動態評量是由 Feuerstein(1979)首先提出,相對於傳統評量模式,著重學習 歷程或認知改變的評量,以及評量中評量者與被評量者的關係是互動的。主張透過 積極、協助的動態評量歷程,降低對文化不利或身心障礙學生的影響,重新評估其 認知學習潛能,改變認知功能與結構。教師透過「測驗-介入-再測驗」的形式,對 學生的一般認知能力或特定學科領域,進行持續性的歷程評量。藉此了解教師介入 與學生認知之間的關係,找出其最大學習潛能並診斷學習錯誤原因,提供處方性訊 息,回饋給教師進行適當的補救教學措施。因而測驗的結果解釋傾向個體內的比 較,而非在團體中的表現,例如:以表現的高峰點為個人學習潛能的指標。
綜上所述,多元評量的目的在於重視學生多元智能,顧及學生的個別差異與多 向度智慧表現,提供多樣化的檢核方式,創造出不同的學習及被評量的機會,讓學 生得以調整自我,達到成就自我的目標,感受學習成就,激發學習動機。評量取向 發展至今,與 12 年國教提倡之「成就每一個孩子—適性揚才、終身學習」理念相呼 應,茲於下一節梳理教育部之課綱演進要點。
22
根據教育部(2003)發布之九年一貫課程綱要(97 課綱)藝術與人文學習領域,
其內容涵蓋(一)基本理念、(二)課程目標、(三)分段能力指標、(四)分段能 力指標與十大基本能力的關係、(五)實施要點、(六)附錄-教材內容等六項。其 中在實施要點的第五項編列了教學評量。內容包括: