第二章 文獻探討
第三節 訓練結果及評估
古韓愈有云:師者,所以傳道、授業、解惑也。故教學的目的即在於,將知 識或技能傳授予學習者;而評量的目的則在於,考核並理解學習者學到了多少。
所以評量是一種方法、一種手段、也是一種系統。本節將對於訓練結果如何評估 加以分述說明。
一、評估的定義 1、評鑑
在「系統的評鑑」(Systematic Evaluation)一書中將評鑑定義為:一種選擇、
收集及描述與判斷資訊以利決策,並增加對研究現象的瞭解及符合績效責任的要 求(Stufflebeam & Shinkfield,1985)。湯志民(2001)認為評鑑是,一種用系統 的方法收集、分析資料,再加以評估其價值,以幫助決策的一種歷程,黃政傑(1993)
也指出評鑑不單只是對現象質與量的描述,尚應包含價值或功績的判斷。
泰勒(R. H. Tyler)是第一位將「評鑑」(evaluation)一詞使用在教育領域 中的人,因此有「教育評鑑之父」之稱。他於1950年將評鑑定義為:確定教育目 標是否達成之過程。Kemmis(1982)認為評鑑是「整理資料訊息與理由依據的 過程」;McMillan(2000)將評鑑定義為「收集資料,以利做決定的一種過程」;
Oliva(1997)更指出評鑑,其實就是收集與解釋訊息的一種持續過程;中國大 陸學者陳玉琨(1998)也曾分析歸納指出,教育評鑑的學科性質為:具有一定理 論基礎的綜合應用學科。美國「教育評鑑標準聯合委員會」(The Joint Committee on Standard for Educational Evaluation,1994),則將教育評鑑定義為:「有系統 的評估某一對象的價值或優點」。
教育評鑑係確保教育品質的一種手段,隨著社會大眾對教育品質的重視,教 育評鑑也日益重要。而教育評鑑亦為一條漫長的歷程,其成效非一蹴可及,需有 賴教育行政機關、學術界及各級學校和家長們長期努力,方能成功。
2、評估
評鑑(evaluation)代表著一種價值判斷的動態過程,而在不同的教育領域,
用法亦不盡相同。在教育心理、測驗統計學及課程教學上,多以「評量」稱之;
而在教育行政領域上,則多用「評鑑」、「考核」或「評價」等詞(謝文全,2003),
在中國大陸,大多數學者會使用「教育評價」或「教育評估」(侯光文,1996;
陶西平,1998;劉本固,2000),至於台灣,除了少數學者會使用教育評價外(李 聰明,1972;黃炳煌,1983),近年來幾乎都是使用「教育評鑑」一詞。
教育評估的定義為:對教育工作、教育組織與教育工作人員等的成效進行評 價和估計的一門科學。評估與評鑑實質上意義相同,有些地區使用教育評估一詞,
有些國家則稱為教育評鑑,而在台灣則多以教育評鑑稱之。
二、評估與教育
教育是國家進步的原動力,也是主導經濟、政治、社會、文化、國防等整體 發展的根基,因此各國皆致力於推展教育,以利於提升國民素質及培育國家人才,
而教學評量則是教育中重要的一環。林寶山(1998)認為教學過程包涵了:瞭解 學生的起點行為、準備適合的學習環境、擬定教學規劃及目標及評量學習成果四 種歷程。
自有正式教育以來,評鑑即扮演重要的角色(Dochy,2001)。一般說來,
完整的訓練計劃須包含評鑑 (evaluation),因為唯有透過評鑑才能瞭解訓練時所 投入的時間、人力、資金等成本效益,且對訓練單位來說,評鑑是一項持續不間 斷的任務 (Robert,1990)。教育之所以能夠不斷地發展,除了計畫和執行外,
評鑑亦是重要的一環,唯有透過有效的評鑑,才能一方面改進教育缺失,一方面 又提升教育品質。因此,評鑑為教育永續發展的動力(吳清山、王湘栗,2004)。
而教育評鑑的兩大本質為:描述與判斷。郭昭佑(2006)就曾經提出過,評鑑在 教育行為中扮演的角色有:1、管理的角色。2、導引的角色。3、工具與跨越學 科的角色。教育評鑑理論具有不同類型,Scriven(2003)認為,教育評鑑理論可分
為兩種類型:一種是規範性(normative)教育評鑑理論,一種是描述性(descriptive)
的教育評鑑理論,而良好的教育評鑑,則應兼顧教育評鑑的事實面和應用面,才 易使教育評鑑收到良好的效果。
教育的永續發展需有「計畫」、「執行」和「評鑑」三者相輔相成,且缺一 不可。近十多年來我國大力推動各種教育改革,因此,為了瞭解教育改革成效及 確保教育品質,教育評鑑顯得非常重要(吳清山、王湘栗,2004)。教學評量不 儘是一種方法,也是一種手段,是一種用來瞭解學習情況,判斷教學目標是否達 成的一種工具,並可依此做為改進教學的參考依據。由此可知教育與評估有著密 不可分的關係。
三、教學評量
教學評量(assessment in teaching)係指教師將其在課堂上蒐集之各種質化或 量化的資料、訊息,加以組織、選擇再加以解釋,以利於學生做決定或價值判斷 的一種過程(Airasian,1996)。而教學評量的原則為:1、客觀評量。2、過程與 結果並重。3、主動溝通回饋與不斷的改進(張自成,2009)。
吳靜吉(1988)曾指出,所有的教學活動不外乎有四個部分,即「教學目標」、
「教學行為」、「教學歷程」及「教學評量」等四項,而教學則是此四部分之不斷 循環的歷程。而李坤崇(1999)認為:評量包括四個涵意「測」、「量」、「評」、「鑑」, 並可區分為二種,一為「質的描述」、一為「量的描述」。所謂「質的描述」係意 指教師以文字敘述方式來呈現學生的表現;而「量的描述」則係指教師以評定的 分數來呈現學生的表現。故經由「評量」得到的最終結果,可提供給學校老師、
輔導人員、教育行政人員、學生或學生家長等人員,來對學習做出不同反應與評 估、預查和診斷等功能,並可引發學習動機、提高學習效果(張春興、林清山,
1989)。
訓練成效評估並非得要等到訓練成效結束後才進行,就訓練成效評估的時機 而言,從訓練需求開始到執行訓練計畫,隨時都可以對訓練成果予以檢驗與評估,
換言之,訓練評估可分為訓練前評估、訓練中評估與訓練後評估三個階段 (黃臺 生、任可怡,1995)。
蕭鍚錡(1990)認為有效的教學評量,是應使評量的方法與內容及預期的學 習結果相關連。陳正昌(1993)曾提出,評量應與教學密切配合,兩者的關係基 本上是以教學為主、評量為輔。而教學評量並非是教學歷程的終點,也並不是教 學活動的結束,而是教學評量配合教學活動隨時進行。技能教學評量的特色則是 重視知識與技能的結合,故技能教學的目標則在於訓練學生學會某些技術,並使 其能應用在工作或生活中,進而落實「做中學」的理念(張自成,2009)。 (一)、教學評量的方式
彭東烈(2003)認為教學的主要目的是要改變學生的認知、情意和技能行為,
並依據教學評量重整教學方法與教學進度,甚至於補救教學等措施,故由此可見 教學評量於教學過程中之重要性。教學評量不應只限定於所謂傳統的紙筆測驗,
應採用不同的測驗方法及各種多元化的評量方式,而近幾年來評量的技術及模式 皆不斷改進,從最早的筆試測驗到口試測驗或實作測驗;從量的測驗到屬於質的 測驗,不論其如何演進,其目的皆在於希望提高效率,並使評量結果更標準、客 觀,也更可靠、可行。但受到升學主義掛帥的影響,學校教學評量仍多以傳統的 紙筆測驗為主,一般社會大眾仍僅是重視試卷上的分數及記憶與演繹的能力,眾 多的評量方式依然無法因應(趙雅靜,2010)。莊謙本(1995)指出,技能教學 的評量應依據各種不同技術本身的特質,而應有不同程度上的要求,而其要素則 有:準確度、速度、複雜度、創造度等。
張春興與林清山曾對於教學評量提出建議:在評定學生的學業成績時,不宜 採取絕對分數,也應避免只以籠統的分數就代表學生的學業成就,測驗的方法愈 多元化,則其結果愈具有代表性。
一般教學評量有紙筆測驗、實作評量、檔案評量等方式,而黃天與程萱(2004)
則將當代教學評量分為:真實性評量、動態性評量、檔案評量、生態評量及變通
性評量等五項。技能測驗以形式來分可分為:紙筆測驗、認辨測驗、情境模擬測 驗及實地測驗等(李大偉,1989)。而許榮富(1986)則認為:就紙筆測驗與實 作測驗兩相比較下,紙筆測驗的缺點為無法評量學生於實際操作過程中的動態及 能力,而以實作測驗來說則較不易掌握。
(二)、傳統評量
黃秀莉(2006)認為傳統評量具客觀性、標準化、信度及效度等特性,且 有心理計量學的理論基礎支持。傳統評量多是以紙筆測驗為主,大量使用於團 體施測中,因其計分較為客觀、批閱也較為簡單迅速。而教師常使用成就測驗 做為評量的工具並以總分代表學生評量的結果,但總分相同的學生其反應型態 卻不一定相同。
傳統評量雖有許多優點但亦有其缺失,例如:傳統的單一測驗不易測出學 生的真正能力,亦無法多元化的說明學生之問題所在,更無法得知學生於學習 中的改變(Campione,1989;Hambleton & Murphy,1992;Stiggins,1992),
且傳統的學習評量大多只能提供出「量」的差異,並無法提供學生在「質」的 方面之差異與變化。
傳統評量重視的是評量的結果與分數,因而常會忽略了評量中的過程,紙 筆測驗僅能測出學生在知識部分的結果,卻無法真實地呈現出學生在學習過程 與多元智慧的成長(曾玉娟,2005)。但傳統評量在實施上較為容易,試題可以 單獨針對一位學生,也可以對群體施測,且若於大規模施測時,較為經濟實用 並可節省許多成本,故傳統評量是教育界中普遍使用的一種評量模式。
(三)、多元化評量
多元化評量(Multiple Assessment)是指應用多種不同的評量方式進行的一 種評量方法。即意指評量的目標內容、情境方式、人員次數都屬多元的即時評
多元化評量(Multiple Assessment)是指應用多種不同的評量方式進行的一 種評量方法。即意指評量的目標內容、情境方式、人員次數都屬多元的即時評