• 沒有找到結果。

實作評量的學理基礎與相關研究

第二章 文獻探討

第三節 實作評量的學理基礎與相關研究

壹、 實作評量的定義及相關理論

一、實作評量的定義與特色

謝苑玫(2002)認為教學評量的角色有二:第一是被視為反映教育品質的 重要工具,學生學習表現的具體紀錄成為教育品質好壞的重要指標之一;另一方 面教學評量被視為教育改革的工具,部分教育改革者相信,經由設計良好的評量 可帶動教學的改變,評量方式的標的嚴重關係教與學的內容。因此,藉由透過評

30

量方式改善進教學過程,提升教育品質,是每一位教師應有的認知與責任。(黃 于芬,2007)

實作評量(performance assessment)的概念來自於多元評量,其定義:(1)

評量專業化、目標化;(2)評量方式多元化、彈性化;(3)評量內容多元化、生 活化;(4)評量人員多元化、互動化;(5)教學與評量統合化、適性化;(6)評 量結果人性化、增強化(林小玉,2001)。那麼何謂「實作評量」?以觀察和專 業判斷來評量學生學習成就的評量方式都可以稱為實作評量,其型式非常的多元 化,例如建構反應題、書寫測驗、書面報告、問題解決、作文、演說、操作、實 驗、表演、資料蒐集、作品展示,以及團體合作計畫等,都是實作評量的方式,

因此廣義的實作評量包含了檔案評量和真實評量(李青芬,2013;李坤崇,)。

以觀察和專業判斷來評量學生學習成就的評量方式都可以稱為實作評量(盧雪 梅,1998;Stiggins, 1987),而實作評量一開始在教育上的應用被稱為表現本位評 量(performance-based assessment)。由「實作」一詞即可窺知其工作導向之特質

—即執行或經歷(process)一個任務,或稱為作業(task),並完成該任務

(Wiggins, 1993)。因此,一般以為實作評量必定是要學生實際操作(hands-on)的 觀念並不完全正確,畢竟,實際操作只是學生學習的表現形式之一,也並非動手 操作就是實作評量的形式。如果實際操作只是簡單的肢體操作,或知識的複製

(reproduct),沒有涉入知識或技巧自我製造性(product)的應用,就沒有學生個 人「表現」(performance)的意義(林小玉,2001;李坤崇,1998;呂金燮,

1999)。

提及實作評量方式可以了解學生能否將課堂上所學的技巧應用出來,並可評 估其運用的程度與技巧性,推測學生在真實場景的表現情形(彭森明,1996)。

實作評量具有下列幾點特徵:(1)要求學生執行或製作一些需要高層次思考或問 題解決技能的事或物(2)評量的作業(tasks)是具有意義性、挑戰性且與教學

活動相結合(3)評量的作業能與真實生活產生關聯(4)歷程(process)與作品

(product)通常是評量的重點(5)表現的規準(criteria)和標準(standards)也 就是評量的重要層面與給分標準,要事先確定。(洪曉憶,2010;Herman,

Aschbacher&Winters,1990)。林小玉(2001)則認為實作評量有以下特性:(1)

實作的表現:學生要在工作中應用他們所習得的知識和技巧,表現出認知複雜 度;(2)真實的情境:實作評量是在實際的情境中或模擬的評量作業中完成一個 特定的任務,呈現給學生在真實生活中所需要面臨與解決的情境;(3)結構的特 質:為了提供適度的挑戰性與真實性,評量的題目須具開放性,學生的解題才能 有彈性,方式及結果也才能多元;(4)過程性:問題解決的表現不僅限於解題的 結果,更在解題的過程,兩者都是評量的結果和媒介;(5)彈性的解題時間:要 求學生呈現個別思考過程,彈性的時間以符合個別差異就是必要的條件;(6)社 會化互動結果:往往藉由小組討論法使學生發揮思考的廣度與深度;(7)多向度 的評分系統:評分的系統就不單一化,學生所完成的評量項目或結果,得依特定 的標準和過程做觀察及評分(呂金燮,1999,頁 177)。

二、實作評量的實施與限制

盧雪梅(1998)提及實作評量在國內的實施可以借助美國的經驗,有以下幾 點實施內容:

(一)建立正確的評量觀,落實多元化的評量:教學目標是多元化的,評量 目的和方法基本上也是多元的,評量者應熟悉各種評量方法的優點和限制,配合 教學目標,妥善靈活運用各種評量方式,才是正確的評量觀。;(二)加強教師 評量的專業知能:教師是班級教學和評量的主導者,在評量多元化的時代裡,教 師評量的專業知能越顯重要,此外,建立教學評量的諮詢和支援的系統,提供教 師相關的服務和協助,也是推動多元化評量的重要一環。;(三)發揮團隊合作 的精神:美國推展實作評量的經驗也非常強調團隊合作精神的重要性,例如,鼓

32

勵教師、課程專家、心理學家和測驗專家共同合作來研發實作評量的作業;鼓勵 教師之間、學校之間做經驗的分享與交流;強調學校與社區觀念溝通與合作的重 要性,以及行政人員對教師支持的重要性;(四)呼籲更多的評量實徵研究:雖 然評量活動是教學歷程中很重要的一環,然而在教育方面的研究中,教學評量的 相關實徵研究並不多見。希望有更多的學者、研究生和第一線的教師能投入這一 個重要且實際的研究領域,期盼透過研究來瞭解目前教學評量的現況、各種評量 方面的功能、教學評量重要課題和研究改進的方法,並累積評量相關研究的成 果。

實作評量在實施上有些困難之處,包括正確客觀的評分規範、時間與人力的 耗費以及信度與效度的評估(彭明森,1996)。李盈葒(2009)認為實作評量是 讓學生創作答案,而不是提供答案選項讓學生選擇,每個學生的表現當然有所 差,如何評估這些表現,有賴於清楚的評分規範。但由於每個表現的產生過程牽 涉個人的思考分析、策略選擇等不同層次的影響,再加上如果評鑑人員不只一 位,大家對評分標準有有不同想法時,要達成客觀、公平與一致性的目標就會更 加困難。實作評量須花較長時間討論設計,在實施時需較長時間完成,評分時需 更多人力,在時間與人力上的花費往往比傳統測驗來的多。另外,評鑑設計必須 符合效度與信度,實作評量在設計上有取材內容不盡相同的現象,而評鑑人員本 身對評鑑規範的了解與其接受的評鑑訓練也都會影響到實作評鑑的信效度。由此 可見,建立一個有效可行的實作評量並不容易。而和客觀式試題相比,實作評量 雖是非常不經濟的評量方法,但不能為了運用上的方便或簡單的理由,把評量的 層面給窄化或偏狹,評量者應配合教學目標選擇和其目的相合的評量方式和工 具,以落實多元化的評量(盧雪梅,1998)。

貳、 表現等級描述之於實作評量

一、表現等級描述

表現等級描述(performance level description)主要是用來定義評分範圍與解 釋評分結果的評量工具(Lauress L. Wise, & Leslie R. Taylor.,2007),而這個描述 是為了要讓評分者、被評分者、家長、學校與社會都能夠在評量之後,了解被評 分者在評量項目所獲得的診斷(diagnostic)與分析(analytical)。(MENC

Committee on Performance Standards,1996)。

在我國國民中學即將要推行之的評分標準,是採「標準參照」的方式,而表 現等級描述是評分標準中,透過絕對的學習成就表現標準來描述學生的學習成就 表現。其目的在於了解學生對於學習內容的精熟程度,即學生知道多少與知道的 程度為何。標準參照並不需注意排名或與他人的分數進行比較,學生自己的學習 狀況才是標準參照關注的焦點。由於評量標準是以質性描述來說明學生的學習成 效,若教師使用評量標準來評量學生,不僅可知道學生經過一系列的教學活動 後,其表現為何,並能診斷學生需要加強學習之處,即時進行補救教學,以此提 升學習成效,達到適性教育的教學目標。(國民中學學生學習本位成就評量,

2016)

二、表現等級描述於實作評量的運用

實作評量是老師以客觀的標準來進行評分的一種評量方式,所要評量的重點 是「學生如何整合、運用知識及技能後的表現」。對學生來說,執行任務是一種 學習,而對評量者來說,學生執行任務的過程與結果是評量的資料來源(林玫 君,2013)。評量標準的構成元素可分為內容標準、表現標準、評分規準與作業 示例。內容標準明確定義學生的學習內容與表現能力;表現標準則敘述學生的表

34

現程度,這兩者皆影響教師設立教學目標與教學活動(國民中學學生學習成就評 量標準(試行),2015)。

吳巧吟(2010)整理許多學者想法,認為實作評量包括兩部分:「一是要求 學生建構或實作的作業、一是用來評斷表現的評分或評分規範(rubric)的組 合」。廣義的評分規範是指評量真實或複雜學生工作的評分工具,包括表現重要 面向的評分規準,及達到這些準則的標準,此規範告訴引導者及學生評量時的重 點為何。

實作評量可依據教師對學生作品的觀察評定方式,分成整體式(global rating 等級)與分析式(analytic rating)兩大類,而評分規準(

scoring rubrics

)則屬於 分析式評定方式的一種(廖怡君,2007)。評分規準是用來判斷特質或品質的敘 述系統(呂金燮,2004),目的是為了讓評分人在評分時能有共同依循的標準,

而不至於因其主觀認知造成評結果太大的差異(李盈葒,2009),它也是指一種 雙向的表格,可以讓教師向學生說明,教師對於作業期待的標準,而學生也可以 依據評分規準來進行、修改和評鑑自己的作業,並避免評分時流於主觀,評量專 家近年來發展各種學科的評分規準。

編製與使用實作評定量表,宜掌握下列九項原則:(1)評定特質不僅呼應教 學目標與評量目的,且具教育意義。(2)確認評量的學習結果應呼應評量目的,

以評定的重要學習結果。(3)評定特質應可直接觀察,無法充份觀察者應予略

以評定的重要學習結果。(3)評定特質應可直接觀察,無法充份觀察者應予略