第二章 文獻探討
第一節 實作評量的本質
本節將分別就實作評量(performance assessment)的意涵、類型、優點與限 制、編製步驟、數學實作評量的相關研究進行探討及說明。
壹、實作評量的意涵
隨著社會的變遷,知識與資訊快速的成長,為了因應未來多元且複雜的社 會,各國的教育目標亦從重視基礎知識轉變成強調高層次認知與情意能力的培養
(Collison, 1992; Hambleton, 2000)。此外,認知學習理論的興起,取代行為主義 的學習理論,使得學習從強調記憶、被動的機械式重複練習轉而強調應用與有意 義建構的主動學習,兼顧內容知識和過程知識。然而傳統的紙筆測驗只能測量學 生「知道」什麼,無法知道學生「能做」什麼,對於教師的教學及學生的學習造 成偏差的影響,有鑑於此,美國的教育學者在 1980 年代末期開始探討一些能代 替傳統評量的方法,而實作評量便是其中最受重視的ㄧ種評量方式(盧雪梅,
1999;Collison, 1992; Hambleton, 2000)。
「實作評量」究竟是什麼?其定義多元,雖沒有一個共同的標準看法,不過 意涵相去不遠,茲將國內外專家學者對實作評量的定義,分述如下:
一、Stiggins(1987)認為實作評量的目的在評量學生將知識、理解化為行動
的能力,強調學生善用有用的技能與知識,透過學生的計畫、建構及表達原始反 應來評定其學習結果,只要教師以觀察和專業判斷來評量學生學習成就的評量方 式即屬於實作評量。
二、桂怡芬與吳毓瑩(1997)認為實作評量是一種以學生在評量過程中的表 現或製作出的物品作為評量依據的評量方式,教師根據其判斷及事先指定的標準 來評定學生於評量工作項目上的實際行為表現,教師所要求學生表現的行為是與 重要的教學目標相符的,評量的目的在使教師能夠直接觀察學生達到結果的過 程,不只是結果的正確性。
三、Wiggins(1998)指出實作評量是一種根據學生表現所做的評量,教師可 以直接觀察學生表現,或是間接透過學生作品去評量學生。
四、鄒惠英(1998)提出實作評量是是一種由觀察跟判斷來評量學生成就的 一種評量方式,實作評量也強調學生將學到的知識與瞭解的事物,轉換成具體的 行動歷程與結果。
五、夏淑琴(1999)主張凡是以學生評量過程中的表現或成果作為評量的依 據,再根據老師的判斷,用事先指定的的標準來來評定等級的評量方式均可稱作 實作評量。
六、李虎雄與張敏雪(1999)主張實作評量就是教師設計相關的情境,由此 情境,針對學生所應達到的學習成果設計一些問題,讓學生在情境中實際操作或 觀察之後,以分組活動或個別思考的形式進行問題的解決,同時針對學生在過程 中的表現,以客觀的標準加以評分的一種評量方式。
七、Linn and Gronlund(2000)認為實作評量是評量學生執行一項工作時展 現出的過程和成果的有效程度。
八、李長柏(2002)認為實作評量是學生藉由實物操弄的觀察記錄來解題推 論以便獲得結論,是屬於高層次認知的表現。
九、余民寧(2002)提出實作評量是介於評量認知能力所用的紙筆測驗和將
學習結果應用於真實情境中的表現之間,在模擬各種不同真實程度的測驗情境 下,提供教師一種有系統的評量學生實作表現的方法。
十、張永杰(2003)認為實作評量是教師設計一個與實際生活經驗非常接近 的情境,以學生在情境中操弄的結果為依據,用事先指定的標準來評定等級的評 量方式。
十一、Linn and Miller(2005)認為實作評量包括文章寫作、科學實驗、語言 表達與運用數學解決問題,強調的是做,而不僅是知,要求歷程與結果並重。
十二、李坤崇(2006)認為實作評量是具相當評量專業素養的教師,編擬與 學習結果應用情境頗類似的模擬測驗情境,讓學生表現所知、所能的學習結果。
由以上各學者的定義可以發現,實作評量在情境方面,可以為不同真實程度 的測驗情境;在評量重點方面,強調歷程與結果並重;在評分方面,要求客觀標 準的評分規則及評分者的專業素養。因此,綜合各學者的觀點,本研究將實作評 量定義為:教師依其專業素養,根據教學目標設計相關的問題情境,學生藉由實 物操弄來解題、推論,以便獲得結論,教師則根據事先制定的計分規準來評定學 生在情境中操弄的過程及結果的評量方式。
貳、實作評量的類型
Gronlund(1993)依據實作評量施行情境的真實程度,將教學情境下常用的 實作評量分成五個類型,茲分別陳述如下:
一、紙筆的實作評量
此評量有別於傳統的紙筆測驗,它更強調在模擬情境中應用知識與技能的能 力,時常使用設計、擬定、編製、撰寫、製造、創造等行為動詞,如:設計海報、
擬定活動流程、撰寫讀書報告等。
二、辨認測驗
此測驗要求學生辨認解決實作作業問題所需的知識或技能,如:辨認未知的
化學物質、辨認機器故障的原因、辨認數學解題的正確程序等。
三、結構化表現實作評量
此評量是要求學生在標準、控制的結構化情境下完成實作作業,要求每位學 生都能表現出相同的反應動作,如:遵守安全守則來啟動一部機器,學生必須完 全遵守程序。
四、模擬實作評量
此評量是要求學生在模擬情境中,完成與真實作業相同的動作,如:在駕駛 訓練模擬儀器上展現駕駛技能的評量。
五、工作樣本實作評量
此評量是要求學生表現實際作業情境所需的真實技能,評量內容包括全部表 現中最重要的元素,並在控制良好的情境下進行,如:操作機器、修復儀器設備 等。
除了根據測驗情境之真實程度區分實作評量外,亦有研究者將實作評量分成 限制反應實作評量與擴展反應實作評量(Linn & Gronlund, 1995)。限制反應實作 評量要求學生的表現較為狹隘,且明確指出希望學生表現的形式與限制,其結構 性較高且計分也較容易,然而缺點是較難評量學生資料統整及創造能力;擴展反 應實作評量則是讓學生自由展現其選擇、組織、統整及評鑑訊息與概念的能力。
參、實作評量的優點及限制
一、實作評量的優點
實作評量是兼顧歷程與結果的評量,所關心的是學生在真實情境下應用知識 與技能的能力,近年來受到相當的重視,主要是因為它具有以下優點(余民寧,
2002;李坤崇,2006;詹元智,2002;盧梅雪,1999;Linn & Gronlund, 2000; Linn
& Miller, 2005):
(一)評量的內涵與真實生活相結合
實作評量的內涵與真實生活相關,因此能夠增進學生學習的動機、提高學生 參與和投入的程度、幫助學生建構有意義的學習情境、發展問題解決能力、批判 性思考和表達自我的能力,讓學生學以致用,使得知識、能力能更充分應用於日 常生活。
(二)兼重評量的結果與歷程
實作評量不僅強調評量的結果,也重視學生解題的歷程,能彌補傳統紙筆測 驗過於僵化、內容與現實脫節、重視結果而忽略過程等缺失。
(三)評量高層次認知思考與問題解決能力
實作評量不僅評量學生的理解能力,更強調學生統整運用知識以解決問題的 歷程與結果,較能評量高層次認知思考與問題解決的能力。
(四)完整反應學生的學習結果,具有診斷功能
實作評量能讓教師更了解每位學生對問題瞭解的程度、投入的程度、解決的 技能和表達自我的能力,完整的反映出學生的學習結果,對於教和學均能提供較 完整的回饋訊息,有助於教師教學品質和學生學習成就的提升。
(五)促進學生自我決定與負責
實作評量要求學生將學習結果運用於日常生活情境,學生能自由選擇、應用 所學的知識和技能,自行建構出解決問題的方法,可促進學生自我決定與負責的 態度,成為有意義建構的主動參與者。
(六)教學與評量結合
實作評量也可以做為一種教學策略,透過實作評量的內涵、具體的表現及計分規 準,除了能釐清學習目標外,更能提供學生明確的回饋,使其主動學習、內省,提高學 習興趣和學習結果。
二、實作評量的限制
寧,2002;李坤崇,2006;陳英豪、吳裕益,1992;詹元智,2002;盧梅雪,1999;
Linn & Gronlund, 2000; Linn & Miller, 2005):
(一)試題編製困難
實作評量不僅要求學生了解評量內涵,更要求其運用知識解決問題的能力,
使得試題設計需兼顧了解、應用、分析等認知層次,在編製上較為困難。
(二)評分標準訂定不易
評量和觀察重點的掌握和評分標準的訂定也是一個難題,尤其是對非結構性 的作業項目進行評量時。
(三)發展的成本過高
時間方面,實作評量在實施上和計分上所需的時間比較多;經費方面,實作 評量的花費通常比紙筆測驗來的多,有時需要購置一些器材或儀器,在空間的需 求和器材的保管及維護上也可能遇到問題;人力方面,計分時較紙筆測驗費力,
較難以機械計分。
(四)信效度較具爭議
在信度方面,評分者對實作評量觀察重點的掌握和評分標準解讀不一,評分 較紙筆測驗主觀、複雜,且易受評分者個人特質影響,評分者間評分的一致性通 常不高;在效度方面,由於實作評量的實施通常需較多的時間,因此題目通常較 少,取樣的題目是否具代表性,令人有所疑慮。
雖然實作評量近幾年來受到重視,但實作評量與傳統紙筆測驗並非相對立,
而是互補的工具(陳華傑,2000;楊銀興,2000)。實作評量強調知識整合及應 用的優點可以彌補傳統紙筆測驗僅重視的知識、結果的缺失;但相對的,實作評
而是互補的工具(陳華傑,2000;楊銀興,2000)。實作評量強調知識整合及應 用的優點可以彌補傳統紙筆測驗僅重視的知識、結果的缺失;但相對的,實作評