評量的種類與方法 - 新北市新埔國中藝術才能班教學評量發展之研究(101-106)

評量的種類可依據測驗結果解釋方式的不同，與教學歷程的評量時機進行分類，並具有功能性各異的評量方法。以下茲就評量的分類與多元評量的多元觀進行說明。

一、評量的分類

測驗的種類繁多，依照分類方式而有不同的測驗名稱，以下依學者論述（郭為藩、高強華，1987；郭生玉，1990；陳新豐，2015），扼要說明各種測驗的分類。

（一）依據測驗結果解釋分類

測驗分類中，依照測驗結果的解釋可分為「常模參照測驗」以及「標準參照測驗」。

1.「常模參照評量」（Norm-Referenced Evaluation）

測驗結果是根據分數在團體中的相對位置解釋，以其他學生的表現作為參照對象。測驗內容涵蓋較廣的目標，因而每個測驗概念的完整性較淺，分數變異度較大。常見於性向測驗和標準化成就測驗，評量結果的呈現方式，常見為標準分數或是百分等級。主要目的是在區分學生之間的成就水準，適合用於行政決策，如分組編班或鑑定能力。

2.「標準參照評量」（Criterion-Referenced Evaluation）

測驗結果是根據教學前訂定的標準答案解釋，以預定的精熟標準作為參照基準，呈現方式如：通過或不通過、等級甲乙丙丁等。測驗內容涵蓋較少的目標，因而每個測驗概念的內容完整性較佳，分數變異度較小。主要目的在於理解學生的在學習歷程中是否有困難存在，強調學習者個人之能與不能完成的學習結果，以判斷學習的精熟程度。

（二）依據教學歷程的評量時機與功能分類

測驗分類中，依照教學歷程的評量時機與功能的不同，可分為「預備性評量」、「形成性評量」、「診斷性評量」、「總結性評量」。

1.預備性評量（Preparative Evaluation）：

於教學前實施，測量學習前所需的知能和已達課程目標的程度，包括準備和安置的向度。準備的向度是考慮學習者是否具備教學內容的先備知識，若尚未達成，

則需要於教學活動前補強；安置的向度是考慮學習者是否已經具有教學預期結果的程度，若是已達到能力目標，則需安排學習更高階的教學內容，或是以此作為學生分組的依據。評量主要目的，在瞭解學生的起點行為與基本能力。

2.形成性評量（Formative Evaluation）：

於教學中進行，並且藉以判斷學習者是否達到階段性預期的學習目標，以診斷其學習歷程中遇到的困難因素。教師可以提供適當的回饋讓學生瞭解，並穩固學習內容。例如：隨堂測驗、單元小考等。重視測量所教過特定內容的學習效果，並且使用測量的結果來改進學習。評量主要的目的在於監控學習者學習的歷程，提供師生有關學習進步的回饋，作為實施個體或團體補救教學之依據。

3.診斷性評量（Diagnostic Evaluation）：

於教學中進行，是針對上述形成性評量所無法矯正的嚴重困難，提供更進一步的診斷訊息。對於特定學習內容或是知能上的障礙，進行更綜合性、準確的分析處理。例如：教師為全面了解學生學習困難的原因，而實施的評量策略。評量主要的目的在於提供更綜合且精細的診斷訊息，提供教師採行必要治療措施之參考。

4.總結性評量（Summative Evaluation）：

多元評量的理念，主要受到 Gardner（1983）提出的「多元智慧論」所影響。他認為智慧是多向度的展現，揚棄以往以標準化智力測驗，以分數決定人類聰明程度

1.實作評量（Performance Assessment）：

根據 Whleeler 和 Haertel（1993）的定義，實作評量是有別於紙筆測驗的變通性評量，學生需完成一項特定任務或工作，展現其具備的知識和技能，教師則依據其在過程中的表現進行評量。實作評量的評分相當依賴專業的觀察與判斷，因而需

界定清楚的目標，並設定相應的評分基準供學生依循。其評量方法包括：問題解決方式、實驗操作、展示、作品集、教師觀察、檢核表等。

2.真實評量（Authentic Assessment）

真實評量注重情境知識的學習，教學必須架構於真實情境的課程設計之中，強調學生從相符於實際生活經驗的問題情境脈絡中習得知識，評量時間常持續一學年，教師與學生共同改進學生的工作品質（Maurer，1996）。

真實評量的特點是必須於教學活動中進行評量，立即性評估學習者在教室活動中的執行或操作的工作表現。以時機點和功能性來分類乃屬於形成性的評量，教師可從學生的概念圖、軼事記錄、觀察記錄、設計圖稿等資料，以多元觀點瞭解學生的學習情形。

3.檔案評量（Portfolio Assessment）

檔案評量是指有目的、系統性的蒐集學生在相關領域的作業，將整個學習歷程產生的學習單、報告、圖片資料、心得札記等放入檔案卷宗內檢視。重要的是要學生一同參與檔案建置的過程，內容的選擇可明確呈現出教師的指導綱領、判斷標準與學生自我反省的證據，不僅展現學生在這段時間的投入程度與進步情形，更有助於對自我的學習歷程進行自評與反省，激發學習動機（甄曉蘭，2008）。

4.另類評量（Alternative Assessment）

另類評量又稱變通性評量，立基於互動論（interactivism）的觀點，強調學生對知識建構的自我決策、組織性、自我評鑑與自我校正的能力，重視解決問題取向、知識獲得的統整性（吳碧純，1996）。教師依據教學目標與課程內容、學生個別的學習特質、社經背景、性別、成就動機設計評量模式，並拉長評量的時間，使教師得以對學生的學習歷程做長時間的觀察分析，觀察項目的範圍廣泛，考核學生高層認知能力、實際生活表現、進步情形、組織能力等（江雅琪，2004）。

5.動態評量（Dynamic Assessment）

動態評量是由 Feuerstein（1979）首先提出，相對於傳統評量模式，著重學習歷程或認知改變的評量，以及評量中評量者與被評量者的關係是互動的。主張透過積極、協助的動態評量歷程，降低對文化不利或身心障礙學生的影響，重新評估其認知學習潛能，改變認知功能與結構。教師透過「測驗-介入-再測驗」的形式，對學生的一般認知能力或特定學科領域，進行持續性的歷程評量。藉此了解教師介入與學生認知之間的關係，找出其最大學習潛能並診斷學習錯誤原因，提供處方性訊息，回饋給教師進行適當的補救教學措施。因而測驗的結果解釋傾向個體內的比較，而非在團體中的表現，例如：以表現的高峰點為個人學習潛能的指標。

綜上所述，多元評量的目的在於重視學生多元智能，顧及學生的個別差異與多向度智慧表現，提供多樣化的檢核方式，創造出不同的學習及被評量的機會，讓學生得以調整自我，達到成就自我的目標，感受學習成就，激發學習動機。評量取向發展至今，與 12 年國教提倡之「成就每一個孩子—適性揚才、終身學習」理念相呼應，茲於下一節梳理教育部之課綱演進要點。

根據教育部（2003）發布之九年一貫課程綱要（97 課綱）藝術與人文學習領域，

其內容涵蓋（一）基本理念、（二）課程目標、（三）分段能力指標、（四）分段能力指標與十大基本能力的關係、（五）實施要點、（六）附錄－教材內容等六項。其中在實施要點的第五項編列了教學評量。內容包括：

在文檔中新北市新埔國中藝術才能班教學評量發展之研究(101-106) (頁 25-31)