2.4 評量的變革
2.4.3 新式評量
欲完成有意義的學習不僅需要形成學習意向,還須演示學習的證據,亦即透過評量 顯現學習情形、結果和成就,這往往是教育政策的重要宗旨。過去對評量系統常見的評 判是教師測量學生成就的結果,往往和所期待的教學和學習取向相抵觸;這是鼓勵教師 為評量準備而不是讓評量傳達教學成效(Avalos, 2001)。
過去對測驗方策(programmes)的研究顯示測驗分數隨時間增加可能導因於教師與學 生教師與學生對測驗的熟悉而非學習的增加,McDonald(2001)聚焦於測驗焦慮與其對學 生表現的影響,他將其劃分為一般的害怕(general fears)與測驗的焦慮(test anxiety)(害怕 負面的評價),前者隨年齡而減弱,後者隨年齡而增加。其中女性高於男性,因為測驗
的分數與考察影響學生的未來狀態。整體而言測驗焦慮對學生表現的影響是足夠大的,
且居處負面,並對五分之一學生測驗的通過與否產生差異。
Madaus & Clarke(1999)和 Mcneil & Valenzuela(引自 Harlen & Crick, 2003)曾在舉辦 於哈佛大學的 K-12 高風險測驗(high stakes testing)會議上,發表對高風險測驗議題的研 究。他們指出美國的高風險測驗是處在驅動測量的施教(measuremet-driven instruction)之 脈絡中並影響教與學的內容,教師使用過去評量卷來定義課程、並注意其內容與形式,
並總結到:
(1)高風險、高標準對教室的教與學不具有標籤化的正面效應。
(2)高風險測驗不能激發未具動機的學生。
(3)高風險評量的本真形式對於評估不同種族、文化、語言或性別學生的進展,不是個更 平等的方式。
(4)高風險測驗方策顯示增加中學的輟學率—特別是中間學生群。
傳統的量化評量,只能概述學生的學習情形,並無法衡量學生解決疑難問題、推論 以及建構知識的能力,因此發展新的評量形式與規準(criterion)是科學教育關注的焦點。
目前引人注目的是另類評量,它以質性化的形式呈現,翔實記載與學生學習有關的重要 資訊,它所構成的文化包含四個特點:
(1)教學與評量實務應是整合的。
(2)在發展評量程序過程中,學生是積極參與者,包含判斷其表現的規準。
(3)評量事務的成品與過程應該被評估。
(4)評量結果的報告應該是質性輪廓的形式,而非單一分數或數量化
(Wolf et al ,1991;Birenbaum,1996;引自 Brian, 2001)。
針對另類評量的效度與倫理,Brian(2001)綜合過去成果,從批判觀點提出其架構:
(1)公正性(Fairness):是否考量學生的所有觀點以及符合倫理行為。
(2)本體論本真性(ontological authenticity):學生是否以有意義的方式使用評量的資訊。
(3)跨參照本真性(Cross-referential authenticity):是否學生更理解教師等學校人員觀點。
(4)衝擊/後果效度(impact/consequential validity):檢視價值蘊含、測驗的社會後果、評 量過程衍生的預期與非預期成果。
(5)演進的權力關係(evolved power relation):是否參與者改變了彼此的相處方式,這樣的 變革是否使關係穩定,抑或建立可轉換與變動的權力關係。從其論述中可知評量是一 種透過權力運作試圖溝通教與學的過程。
Hargreaves & Earl (2002)研究 29 位加拿大安大略省經校長認定的七、八年級教師,
這些教師曾實施新課程政策、定義學習成果、另類評量報告,而提出技術、文化、政治、
後現代四種觀點來審視另類評量
一、技術觀點:
聚焦於組織、結構、策略以及相關技能的議題,強調量度技術、發展教師評量素養 以及管理組織才能。技術觀點使我們注意到擬定與精鍊量度的有效形式之困難例 如:檔案夾牢籠(portfolio prison)使教師承受巨大時間壓力,以及如何發展可靠工具 以測量成果等。所面臨的困難包含各種評量技能與策略的習得,將挑戰教師的以往 面相;需要使學校與家長對評量的期望能和諧一致;時間與資源的議題能輔助(或 阻止)新評量實務引入校園例行公事中。但這些實施所引發的技術議題,往往是不 當使用、政治與科層干預(bureaucratic interference)或制度上優先和需要所造成。
二、文化觀點:
文化是一個群體的規範、價值、信念、期望與相沿成習的活動,文化觀點檢視在學 校的社會與文化脈絡下,詮釋與整合另類評量的方式,它把評量視為學習的一部分,
關注在學習階段中,經由師生經由評量的對話,發展共同的瞭解與評量規準,相當 注意偵測學生重要觀念和解決問題能力的心智表徵。本真評量(authentic assessment) 是多方向、直接、深入且大幅依賴教師的判斷。教師控制學習綱領並且正向使用回 饋機會。鼓勵教師為測驗而教學,因為學習事務構成學生成功所需精熟的真實情境。
評量與課程是學習中兩個解不開地成對執行緒(thread)。Hargreaves & Earl (2002)他們 追溯 1995 年安大略省的教育與訓練(Ontario Ministry of Education and Training)報告 中的建議,認為這與本真評量的某些原理若干符合:
(1)評量必須包括各種方法的使用,使學生成就的評價盡可能精確。
(2)評量、評鑑及報告是教師的責任,他必須考慮個別學生需要並與他們及家人緊密 配合。教師擬定有關學生學習方策與進步的決策時,應包括學生與家長。
(3)評量、評鑑與報告是課程及教室實務連續與不或缺的一環。綜合言之,在本真評 量的文化觀點中,教育者事務不在於迎合有關評量的大眾成見或假定,而是加深 每個人對學習與評量議題的領會(understanding)。這不僅是更清晰且開放地解釋評 量規準,也與他們合作發展,特別是學生。
三、政治觀點:
政治是一個有權力關係或衝突的情境中權威性的價值分配,人權是以人的資格而享 受的基本權益(right)。權力(power)是使他人從事你指派事務的能力,包括影響或控 制成員行為的各種模式 ,例如個人聲望伴隨而來的影響力。權威(authority)則是建 立在相互信賴與自願服從的基礎上,某來源的特定影響。教育革新的政治觀點包括 群體間的權力、權威與競爭利益的運動和協商,認為所有的評量包含權力的運作,
實施另類評量除了技術一致性與人際溝通之外,也含括學校與社會中的意識型態和 利益團體的權力爭鬥,此觀點也處理另類評量為本身是受人存疑的-一個不能使人 增權(empower)但可能成為一種篩選與監視(surveillance)的新策略。評量有兩個取 向:聚斂評量(convergent assessment),明瞭孩童是否能認識、了解或做預定的事,
而擴散評量則重視學習者的領會而非評量者的綱領,學生需接受某些學習的責任,
教師則承擔創造產生此過程的條件。教室評量另類取向的根本哲學為評量是學習過 程的一部份,因此評量規準是顯而易見,公開公正的。評量的判斷是協商的運作。
過程是多方向(學生-學生、學生-教師、家長與教師)。
此外政治觀點不只點亮傳統與另類評量的差異,也凸顯另類評量的政治風險與超量 (excessess),尤其評估情意似乎等同於無時無刻監測學生行為,許多教師評估學生 情意領域都使用考核表(checklists)評估學生肢體語言、作品的總量、學生對伙伴的 評述、教室的專注程度、對學科的正向態度等,但許多情意評量只是與學校教育的 行為準則相比的遵從程度。依據傅科 1977 年的作品,今日的規訓(discipline)與處 罰,已逾越報復及折磨而變成是對身體與心智嚴密且細微的控制。學校中的考查 (examination)則結合規範化裁決(刑罰、行為矯正、標籤化)與層級監視(讓學生擔任 班長、輔導員、觀察員等等),並且不斷將個體特徵轉化為文書檔案,以供未來提 取與檢索(張銀富,2001)。
四、後現代觀點:
後現代情景重塑公共教育和教育變革綱領,有三個議題獨特關係到評量改革的討論 (1)複雜性(電子化衍生知識與資訊過多和混亂,挑戰教學精粹內容的假定)、分歧性(學 生的文化差異增大,挑戰既有課程中的西方知識與信念)、不確定性(學校教育是多 元智能的提升者與傳統內容標準的防衛者,而受到多元文化者、特創論者、殖民 主義等之間不確定的抨擊,在一些地方政府有時打轉於不確定與複雜性中,重視 多元智能、分歧學習風格、以過程為主的課程,但在遭遇不確定性的浪潮下,有 些政府則有力地肯定與施受確定性,迎合家長所留戀的學校圖像,躲到有效性的 程序假象中回到標準考試,以提供令人心安的技術確定性)。
(2)電子模擬與擬像改變學生應該學的技能、重新組織教與學。市場-選擇原理侵入公 共教育,家長變成個人消費者,不再重視讓所有社會孩童共享公益。包裝教育產 品(報告卡)與過程(教室)是至關重要的。
(3)家庭結構更複雜,孩童的真正家庭與雙親常常不是那麼清楚,家庭的結構不再是 單一或不證自明之事,智能不再是單一、固定與可預測的,在文化分歧的教室中,
教師似乎不再能了解或預知學生行為。
這樣的後現代觀點建基於今日複雜和不確定的世界觀,人類不是全知全能,它批判 地省察本真評量的概念,認為後現代典範下的另類評量有多重來源,是立體派畫作,
以多角度重新產生實相,有時候以檔案夾反應學生成就、複雜柵格評估學生,或從 事雙親與學生的三方式訪談,在初始點上不會比舊式流行“B+,再努力”的回應更 本真與誠摯。其中檔案夾評量可能是模擬(simulate)而非引發(stimulate)學習成就,誤 使教師與學生重視形式而非實質、重視光鮮封面、優雅字形、多彩圖形的影像。當 檔案夾定義學生的成就時,學生為了良好的檔案夾不是為了道德價值而執行社區服 務與課外活動,而削減學習的本來面貌。
另外各種自我評量讓學生進入內心探索的過程,在自我省察的名義下,也養成內心 自戀(narcissistic)、自我放縱、自我中心人格,個體不能學習到限制自我與欲念,過 度估計自己轉變世界的能力,在缺乏誠實地批判下,引導年輕人公開地炫耀的心理,
而忽略學習成就的價值。
教師為了避免等第階層(grading hierarchy)而採用檔案夾的複雜表徵,換言之教師使用 檔案夾是為了使自己能連接其專業的其他成員。並非為了與學生家長清晰的溝通。
教師為了避免等第階層(grading hierarchy)而採用檔案夾的複雜表徵,換言之教師使用 檔案夾是為了使自己能連接其專業的其他成員。並非為了與學生家長清晰的溝通。