第二章 文獻探討
本章主要在探討教育評鑑相關文獻、國內校務評鑑沿革及校務評鑑實施現 況,希透過探討分析歸納,對研究主題有更深入的瞭解。本章共分三小節,第一 節為教育評鑑相關理論之探討;第二節為我國校務評鑑沿革與現況;第三 節為國內校務評鑑實證之探討。茲就上述逐節分述如下:
第一節 教育評鑑相關理論之探討
本節係評鑑、後設評鑑及教育評鑑等相關理論之探討分析歸納,進而對研究 主題能有深入的瞭解。
壹、 評鑑之探討
本小節係由評鑑的意義、目的、原則、方式、範疇、步驟與類型等分析歸納,
藉以就評鑑予以瞭解及定義。
一、 評鑑的意義與目的 (一) 評鑑的意義
評鑑最早起源於中國,其目的是衡鑑地方官吏的施政績效,而就其意義而 言,則在根據平時調查與紀錄之詳實程度,據以考核其績效、責任等,以作為升 遷任免之準據(林天祐、蔡菁芝,2001)。而評鑑(evaluation)一詞,國內外諸多學 者予以定義過,茲分述如下:
謝文全(1980,2003)認為,評鑑是對事象加以審慎的評析,以量定其得失及 原因,據以決定如何改進或重新計畫的過程。包含以下三項要點:其一評鑑是對 事象加以審慎的評析:評鑑是對有關事象,加以仔細的評審分析;亦即評析的態 度是嚴謹的,以求深入瞭解事實的真象,而不被外表的假象所蒙蔽;其二評鑑是 量度得失及究其原因:評鑑不僅是在評定事象的真假,而且還進一步衡量其優劣 得失的程度,並分析造成優劣得失產生的原因;其三評鑑旨在決定如何改進或重 新計畫:其目的是在藉對事象優劣得失及其原因的瞭解,做為擬定改進計畫的依
據,使工作能更為完善,日益發展。亦即評鑑的目的,在鑑往知來,即檢討過去 策劃將來。
盧增緒(1993)言及,評鑑就是正確而有效的價值判斷,其品質的提升自與其 依據之資訊是否確實密切相關。
游家政(1997)提及評鑑,認為是種價值判斷,對某一個現象,運用系統方法 來蒐集資料,針對其價值或優缺點加以判斷,唯其判斷的對象可以是人員、方案 或教育,若是以國民小學作為判斷對象,則可稱之為國民小學教育評鑑。
吳政達及郭昭佑(1997)指稱,評鑑係透過評鑑者、被評鑑者以及有關人員彼 此間的交互作用過程而建構成的意義。
高薰芳(1998)指出,評鑑是運用現有或自訂一套規準,蒐集受評鑑人員一切 相關的訊息,藉以了解受評人員表現的優缺點及其成因,作為改進、自我成長或 達成其他教育性或行政性目的的活動。
羅清水(1999)指稱,評鑑係根據教育專家的判斷或意見,對教育體系或過程 作評估或診療工作;評鑑一辭採用 appraisal 較能呈現評鑑的意義,包括以績效 為考量的 evaluation 和以專業成長為導向的 enhancement。
江文雄(1999)認為,評鑑就是評審鑑定,是一種經瞭解、評績效、明得失、
找原因、尋改進、再出發的循環歷程。評鑑具有引領組織領導者自動自發,努力 向上的經營動力,是借助內省與外證,期使藉由反省、學習及成長三者並行,以 達成自我改進的功能。自動自發是評鑑的起點,自我改進是評鑑的本質,自我管 理是評鑑的精神,激勵成長則是評鑑的目的,自我研究則是評鑑的核心。
Stufflebeam(1971)認為,評鑑就是評斷決定方案之有用資料,加以界定、取 得及提供的歷程。
Worthen 與 Sanders(1987)則認為,評鑑乃是一件事實表象的價值判斷,評鑑 者選擇一項或多項的評鑑規準,蒐集評鑑對象有關的資料,根據評鑑的規準決定 評鑑對象的價值,再根據評鑑結果促使評鑑對象改進其服務品質。
綜上所述,評鑑可謂是一種以系統的方法進行資料蒐集與分析,並評定其價
值,以作為決策改進的依據的一種過程。
吳明清(民 90)提及教育評鑑(educational evaluation)係作有系統的蒐集並解釋 相關證據、然後判斷已執行、或執行中的教育活動之優劣,以提供教育決策的參 考。
吳清山及林天祐(2002)指出,校務評鑑係指系統化蒐集學校發展計畫的規 劃、執行與結果等方面的相關資料,並加以客觀的描述,以作為判斷學校績效或 協助學校持續改進的過程。
湯志民(2002)則稱,校務評鑑是一種以系統的方法蒐集和分析學校各種資 料,並加以描述和價值判斷,以協助決策的歷程。
潘慧玲(2003)指稱,校務評鑑係以學校為單位所做的評鑑,在這單位中,可 針對學校整體運作進行評鑑。
吳和堂(2004)認為校務評鑑乃是對於學校整體表現,運用系統化的方法與客 觀的評鑑規準,以收集和分析資料,而加以描述和價值判斷的歷程,以幫助學校 改進教學品質與作為決策之用。
綜上所述,校務評鑑係指運用系統化蒐集學校發展計畫、執行與結果相關的 資料,並加以客觀的分析描述,以協助學校持續改進的過程或作為判斷學校績效 的依據;本研究所指稱之校務評鑑,係指桃園縣政府依據教育基本法第十三條、
國民教育法第九之一條暨其施行細則第十二條等法令規定所訂頒「桃園縣中小學 校務評鑑實施要點」以及「桃園縣辦理九十二學年度中小學校務評鑑工作計畫」
等,針對該縣國民小學進行辦學績效以及協助渠等學校持續改進的一套評量措 施。
(二) 評鑑的目的
Stufflebeam(1983)曾言,評鑑的目的不在證明而在改進。
謝文全(2003)歸類出評鑑的功能或目的為診斷組織得失、協助決策者做決策 及擬訂計畫、增加交流溝通與士氣、促進成長專業進修、提供組織選擇之參考及 提高組織運作品質與績效。
吳清山(2000)指出,校務評鑑的目的為診斷學校教育缺失、改進學校教育缺 失、維持學校教育水準和提高學校教育績效。
張素貞(2001)則認為,校務評鑑具有形成性與總結性的功能,對於學校教育 而言,具有積極、正面的價值與意義,歸納其目的有下列四項:1 診斷學校教育 缺失,作為將來改進的參考。2 改進學校教育缺失,提升教育品質。3 維持學校 教育水準,使學校的素養為社會所認同。4 提高學校教育績效,使各種教育投入 有最佳的產出,避免教育浪費。
湯志民(2002)指稱,校務評鑑的目的在改進學校教育,提升教育績效,促進 學校發展,使之更臻完美。
綜上所述,校務評鑑的目的係在診斷學校教育缺失,以做為改進的參考,同 時亦在相關資料蒐集,協助學校透過藉此發展出學校永續發展之特色,故校務評 鑑的實施不僅可提升學校辦學績效,亦可促進校務發展,維持學校教育品質。
二、 評鑑的原則與方式 (一) 評鑑的原則
謝文全(1997,2003)談及任何行政工作在計畫及執行過程及完結後,宜進行 評鑑,以明真得失,做為改進的依據;而如何將評鑑做好,於實施評鑑時應注意 下列七大原則:方法要科學化、過程要民主化、兼顧歷程與結果評鑑、兼做形成 性與總結性評鑑、內部和外部評鑑兼用、注意評鑑項目的綜合性及整體性、注重 評鑑後的追踪改進。
張鈿富(2001)指稱現階段校務評鑑應注意的原則如下:科學化方法、民主化 過程、兼顧歷程與結果、平衡內部與外部評鑑、注重整體性。
張素貞(2001)認為,校務評鑑是一複雜歷程,為使其發揮評鑑應有之功能,
規劃時必須遵循下列五項原則:客觀性、合作性、完整性、描述性、繼續性。
湯志民(2002)指出,校務評鑑的工作是一種複雜的歷程,為發揮評鑑的功 能,達成評鑑的目的,必須遵循下列八大原則:客觀性、民主性、廣泛性、個別 性、多元性、統整性、動態性、繼續性。
吳清山(2002)認為校務評鑑是一複雜性和持續性的歷程,須遵守一定的原 則,方能發揮評鑑效果,而把握實施的原則如下:專業、互信、客觀、彈性、多 樣、整體以及發展等七項原則。
綜上所述,就學者所倡校務評鑑的原則,可得知校務評鑑原則計有下列各 項:方法科學化、過程民主化、兼採內部與外部評鑑、兼顧歷程與結果以及注重 統整性與持續性等。
(二) 評鑑的方式
吳清山(2000)認為在複雜的評鑑過程中,為達到評鑑的目的,評鑑工作必須 因時、因地制宜,採取多種的評鑑方法,並介紹常見的學校評鑑方法有以下四種:
1. 自我評鑑
由學校校長、主任、組長和教師所選出的代表組成評鑑小組,辦理學校自我 評鑑,此乃針對學校本身需要而進行,不一定需藉由外部團體的壓力。而所蒐集 到的資料,小組應加以分析和檢討,以作為改進校務之參考。
2. 交互觀摩評鑑
旨在收相互觀摩及學習之效,而學校可自行邀請他校觀摩評鑑,評鑑結果相 互檢討,可以了解彼此的優缺點,具有激勵和學習的雙重功效。
3. 評鑑小組評鑑
係由專家學者組成評鑑小組,具有崇高的學術地位,評鑑小組以專業的知識 來判斷學校的素質,然為了蒐集更多的評鑑資料,可採用觀察法、詢問法、座談 會、問卷法以及檢核有關資料等方式,以瞭解實況並獲致正確之評鑑結果。
4. 追蹤評鑑
就學校本身而言,針對自我評鑑所發掘的問題,擬訂改進辦法,列為督導執 行,並定期追蹤檢查其成效;就教育行政主管機關而言,針對專家小組評鑑結果,
績效較差者列為追蹤輔導之對象,一定時間(一學期或一學年)以後,再延聘學 者、專家組成小組,實施到校之追蹤評鑑,以督促學校不斷改進與發展。
Kells(1993)則指出,目前世界各國常用的評鑑方式說明如下(引自蘇錦麗,
1997):
1. 參與式的自我評鑑:自我評鑑是受評學校全體教職員及相關群體代表對於 辦學進行系統化診斷,藉此檢討缺失並尋求改善方針。
2. 外部同僚評鑑:係藉由外部同僚專家的專業看法與判斷,協助受評學校建 立績效相關觀念並提出改進措施。
3. 表現指標、常模以及效率之比較使用:此係用於進行機構間之相互比較之 用。
4. 後設評鑑:後設評鑑為評鑑的評鑑,亦是將既有的規劃設計之評鑑置於受 評者的位置,有系統的蒐集資料,依既定標準評斷其價值以及優、缺點的 歷程。
5. 趨勢資料之使用、績效與預定目標之符合程度、以及相關顧客對績效之看 法:即評鑑團體運用高等教育機構各方面長期表現的資料,以判斷學校辦 學績效為何。
6. 邊際誘因制度的使用:係促使學校行政人員或其他相關人員積極參與評鑑 工作。
7. 制裁的威脅或主要誘因:此所謂制裁係針對無法達到評鑑最低標準者所施 行的懲罰措施,而其方式各國不一,主要有由評鑑團體撤銷大學許可資 格、或政府撤銷大學核准或承認資格,抑或經費的撤銷或關閉學校等。
張素貞(2001)指出,校務評鑑的方式計有下列八種:文件分析法,茲就規章、
計畫報表、出版工作紀錄、成果報告等據以分析瞭解;觀察法,實地考查及資料 驗證;訪問法,以面對面的方式進行;座談會,有關人員相互交換意見;問卷法,
以主題方式呈現,以供受評者填答;調查表法,事實資料以及數據的蒐集;評量 表法,優劣等級;其他。
湯志民(2002)則歸類出以下七種常用方法:文件分析法、觀察法、訪問法、
座談會、問卷法、調查表法、評量表法。
歸納上述學者的看法,可知校務評鑑的方法最主要的方法為自我評鑑以及外
部人員訪視評鑑二種,現今國內各縣市亦多採此二種方法進行。
三、 評鑑的範疇與步驟 (一) 評鑑的範疇
依據 Nevo(1995)及郭昭佑(2000)所為之詮釋,學校評鑑的範疇可包括以下六 項:學生評鑑、教師評鑑、課程評鑑、教材評鑑、方案或計畫評鑑、學校整體評 鑑。
張鈿富(2001)校務評鑑的範圍涵蓋極廣,舉凡如組織目標、師資、課程、入 學資格、教材、教學方法、圖書與設備、教學與研究成果、經費支配、人事任用、
校友會、家長與社區皆屬之;另有關校務問題之事宜,如學校組織型態、學校活 動、學生學習與素質、教師工作滿意等亦可納入校務評鑑的範疇。
潘慧玲(2003)則將學校評鑑區分為下列四項:校務評鑑、方案評鑑、教材評 鑑、人員評鑑,而人員評鑑又可細分為校長評鑑及教師評鑑。
綜上所述,可得知校務評鑑所含範圍極為廣泛,舉凡學校教育一切事務均囊 括在其評鑑範圍內,即所有的教學與行政事務均可納入校務評鑑的範疇。
(二) 評鑑的步驟
謝文全(1990)認為評鑑過程可以分為列下九個階段:決定評鑑的目標、確定 評鑑的範圍、分析評鑑的細目、訂定衡量的標準、編製評鑑表格、進行評鑑資料 蒐集、分析資料、做成結論及提出建議、研擬改進計畫並進行改進。
張素貞(2001)認為在規劃校務評鑑上,應有一套步驟和蒐集資料工具,其步 驟如下:準備階段、執行階段、總結階段、追蹤階段。
總而言之,校務評鑑於實施之前,應有妥善之規劃與準備,如在各校自我評 鑑之前,主管教育行政機關應就規劃好之自我評鑑規準、相關規定、做法、步驟 說明清楚,包括評鑑內容、指標等都應事先規範與公布,讓實施自評學校有所遵 循,而於實施外部評鑑訪視時,評鑑委員的擇聘、評鑑小組的組成應具公平、客 觀,而經由事前的講習以取得共識,亦是必須的。
四、 評鑑的類型
校務評鑑可分為諸多不同的類型,而湯志民(2002)依據相關研究加以彙整,
摘錄如下:
(一) 就目標情形而言:可分為基於目標的評鑑及免於目標的評鑑二種;
(二) 就評鑑內容而言:可分為綜合的評鑑及部分的評鑑二種;
(三) 就評鑑時機而言:可分為形成性評鑑及總結性評鑑二種;
(四) 就實施重點而言:可分為內在評鑑及成果評鑑二種;
(五) 就評鑑人員而言:可分為內部評鑑、外部評鑑及合作評鑑三種;
(六) 就評鑑取向而言:計分為假評鑑、準評鑑及真評鑑三種;
(七) 就評鑑目的而言:計分為績效的評鑑、發展的評鑑及知識的評鑑三種。
貳、 後設評鑑之探討
本小節係就後設評鑑的意義、目的、角色及範圍等進行分析歸納,藉以瞭解 後設評鑑的屬性。
一、 後設評鑑的意義與目的 (一) 後設評鑑的意義
藉由探討後設評鑑的發展,可知後設評鑑是基於瞭解和改進教育評鑑品質的 需求而形成。早在 1940 年 Oratra 曾提出「評鑑的評鑑」的概念,而在 1969 年 Scriven 提出「後設評鑑」一詞,並將其定義為「評鑑的評鑑」,亦後設評鑑就是 次層評鑑(second-order evaluation)。就理論而言,後設評鑑涉及評鑑角色的方法 論評估;就實務而言,後設評鑑關注特定評鑑各種表現的評鑑(Scriven,1972,84)。
典型的後設評鑑,即由另一個評鑑者去評鑑一項已計畫好的或已完成的評鑑,亦 即後設評鑑將評鑑者置於受評者的位置,對該評鑑者及其活動表現進行價值判斷 (Scriven,1981,95)。
Stufflebeam(1974,69-70)亦採用 Scriven 的術語認為後設評鑑是「較高層級評 鑑」(higher-order evaluation),或「評鑑的評鑑」。基本上後設評鑑的形式,其概
念和評鑑概念相互契合的,說明如下:
1. 評鑑是優缺點的評估。是以,後設評鑑意指評估評鑑實施的優缺點。
2. 評鑑為決策和績效服務。而後設評鑑必須在評鑑實施前提供資訊,支持評 鑑者所為評鑑的決策,以及在評鑑實施後提供資訊,協助評鑑者了解其評 鑑工作的品質,是以後後評鑑應該是形成性與總結性的。
3. 評鑑應評估方案的目標、設計、實施和結果。後設評鑑應評估評鑑目標的 重要性、評鑑設計的適合性、評鑑實施的妥當性、評鑑結果的品質與重要 性。
4. 評鑑必須為所有受到方案影響的人服務。而後設評鑑應為評鑑者及對其評 鑑工作感到興趣的人服務。
5. 評鑑必須由內部與外部人員實施,通常內部人員實施形成性評鑑,以獲得 決策的資訊,外部人員實施總結性評鑑,以了解績效。而後設評鑑者必須 對進行中的評鑑實施總結性評鑑,以及對已完成的評鑑活動之整體優缺點 實施外部判斷。
6. 評鑑包括描述問題、獲取所需的資訊、以及利用資訊做決策和判斷績效等 程序。而後設評鑑者首先必須進行此三個步驟。後設評鑑者須描述特定後 設評鑑問題,次為須蒐集、組織、分析所需的資訊,最後則須將所獲得的 資訊應用到合適的決策和績效責任上。
7. 評鑑必須在技術上是合適的、有用的和符合成本利益的。而後設評鑑亦必 須滿足這些相同的規準。
Stufflebeam(1978,9-10)更進一步將後設評鑑解釋為針對一項評鑑的技術之適 當性、利用性、倫理性和實用性,進行描述、獲取和使用敘述性和判斷性資訊的 過程,藉以指出該項評鑑的技術報告的優、缺點。
Cook 和 Gruder(1978)則將後設評鑑限定在對總結性評鑑進行評鑑。Straw 和 Cook(1990)承續前述的觀點,認為後設評鑑係泛指一項評鑑或一組評鑑的技術品 質及其結果進行評鑑的各種活動。
由上述定義可得知,評鑑學者普遍將「後設評鑑」視為「評鑑的評鑑」,亦 即對「原級評鑑」進行「較高層級評鑑」或「次層評鑑」的歷程。
(二) 後設評鑑的目的
Scriven(1967,40)認為評鑑的目的,在回答有關某些「實體」(entities)的某些
型態的「問題」。這些實體是指教育的各種工具,諸如過程、人員、程序和方案 等,都是評鑑的對象;而所問的問題型態,包括就某些規準看來,這個工具表現 有多好?是否比其他工具優良?那些變項受到這個工具的影響?就成本看來,這 個工具是否值得?簡而言之,就是價值判斷的問題。綜此,評鑑的目的就是判斷 或評估事物的優缺點和價值。
由前述後設評鑑的定義為「評鑑的評鑑」,可知原級評鑑是後設評鑑所要評 鑑的實體,後設評鑑的目的則在判斷原級評鑑的價值,亦就是將原級評鑑置於受 評者的位置,對該評鑑者及其活動的表現進行價值判斷,此係就後設評鑑的整體 目的而言,不因後設評鑑的對象而有變化;而在整體目的之下,依據後設評鑑在 特定情境運作,則可分為許多不同的次級目標或角色。
二、 後設評鑑的角色與範圍 (一) 後設評鑑的角色
Stufflebeam(1967,72-73)認為後設評鑑任務有二,其一為「做決定」(decision making)服務;其二為「績效責任」服務。首先就做決定服務而言,經常是由內 部人員所實施的「形成性後設評鑑」,在評鑑活動之前,對評鑑的設計和實施提 供適時的建議,藉以確保評鑑結果在技術上妥當、有用和成本或效能的標準。其 次,就為績效責任服務而言,係指「總結性後設評鑑」,大多由外部人員對已完 成評鑑工作,提出優缺點的判斷,藉以確認評鑑者的績效和評鑑結果的可靠性。
Smith(1981b,267)亦認為實施後設評鑑的基本理由是要改進評鑑本身的理論 與實務。更精確而言,後設評鑑是為了完成以下一項或多項的任務:
1. 評估評鑑工作的品質、影響或利用;
2. 探討評鑑的性質;
3. 糾正可能發生的評鑑濫用;
4. 提供評鑑的績效以證明評鑑工作;
5. 說明控制評鑑的偏誤;
6. 評估新評鑑取向的實效性。
不論係屬形成性或總結性的角色,後設評鑑都具有品質控制的功能,且尚具 有統整各種評鑑研究的功能。Cook(1974,160-174)從「再評鑑」原級評鑑報告資 料的途徑,認為實施後設評鑑的主要理由有八項:
1. 減低評鑑結果的不確定性;
2. 獲得另一種觀點和評鑑獨立的精神;
3. 突破學術本位的限制,建立科技整合的研究;
4. 提供多層面的訓練功能;
5. 整體評估各種原始評鑑的效果;
6. 知識的累積和多元的資料利用;
7. 對傳統知識的質疑;
8. 增進專業的能力。
此八項係基於政策與評鑑研究的關係而提出,對決策者而言,經由資料的多 元分析與利用,可以協助決策者確認方案評鑑的結論,評估方案的整體績效,獲 得新的評鑑結論或新知識,做為選擇變通方案的參考;對評鑑研究而言,後設評 鑑可以協助評鑑者獲得科際整合的學術訓練,增進評鑑的專業能力,擴展評鑑的 研究領域。
綜上所述,就整體目的而言,後設評鑑的目的在判斷原級評鑑的價值優缺 點;就各種角色而言,後設評鑑所扮演的角色有三,第一是為做決定服務的形成 性後設評鑑,旨在協助評鑑者改進評鑑的實施或確保評鑑的正確進行,以提高評 鑑的可行性。第二是為績效責任服務的總結性後設評鑑,旨在判斷已完成的評鑑 活動之優缺點,確認評鑑品質、影響和利用。第三是為評鑑研究服務的啟發性後 設評鑑,旨在突破學術本位的限制,建立資料多元使用和科技整合的研究途徑,
發現新的觀點與知識。
(二) 後設評鑑的內容
後設評鑑究竟要評鑑些什麼?這是個重要議題,由後設評鑑的定義得知,後
設評鑑是以某些標準對一項評鑑的過程,或對一項或一組已完成的評鑑,進行價 值判斷的歷程。故如欲探討後設評鑑的範圍,可從評鑑角色分析、評鑑要素以及 評鑑標準來考量。
1. 從評鑑的角色分析後設評鑑的對象
不論是形成性或總結性後設評鑑,都是採取描述資訊要件、獲取資訊和應用 資訊等三個步驟,對原級評鑑的目的、設計、過程以及結果提出建議或判斷 (Stufflebeam,1974,70-74),說明如下:
(1)評鑑目的
評鑑目的關係評鑑所欲達成的結果,由於各種當事人需求的不同,評鑑者會 面臨各種競爭性的評鑑目的。故形成性的後設評鑑須蒐集當事者的需求、可能的 評鑑目的和選擇規範,進行評鑑目的的邏輯分析,並對應選的評鑑目的提出建 議;結總性後設評鑑則根據評鑑需求、規準和當事者的相關分析,判斷選定評鑑 目的之價值。
(2)評鑑設計
評鑑設計的選擇,有著許多不同的變通方案;選擇合適的評鑑設計須依據評 鑑的目的以及考慮相關的策略和社會政治因素。故形成性後設評鑑須分析各種變 通設計和選擇規準,對應選的評鑑設計提出建議;總結性後設評鑑則根據評鑑目 的、規準,對選定的評鑑設計加以判斷。
(3)評鑑過程
在評鑑的實施過程中經常會遇到的實際問題,諸如概念、社會政治、法規、
技術、行政、道德以及倫理等問題,都會影響評鑑的程序、進度、人員分工與評 鑑結果。形成性後設評鑑須評估潛在的評鑑實施問題,追蹤評鑑的過程,提出修 正評鑑設計和過程的建議;總結性後設評鑑則分析評鑑設計與評鑑過程的差距,
判斷評鑑實施的優缺點。
(4)評鑑結果
評鑑的問題是否獲得回答?回答的程度如何?值回成本?發現是否與預定 的當事者溝通?發現是否被利用?這些均涉及評鑑目的、評鑑品質、評鑑成本、
評鑑影響以及利用的問題,是判斷評鑑結果所需要考慮的。形成性後設評鑑須分 析所蒐集的這些資訊提出改進評鑑結果的建議;總結性後設評鑑則對評鑑活動的 品質、利用以及成本效益提出價值判斷。
2. 從評鑑要素分析後設評鑑的焦點
Brinkerhoff 等人(1983)認為從事一項評鑑,至少必須考慮以下七項要素,而 前六項為第七項後設評鑑的對象,說明如下:
(1)決定評鑑(focusing evaluation)
決定評鑑的任務是決定評鑑什麼和如何評鑑;後設評鑑旨在評估和協助修正 計畫中的評鑑目的和問題,或確認實施中評鑑目的和問題的可行性,或判斷完成 後評鑑目的和問題的優缺點。
(2)設計評鑑(designing evaluation)
評鑑設計通常包括實施的程序和策略;後設評鑑旨在評估和修正計畫中的評 鑑程序和策略,評估評鑑設計在實施中的效果,或決定完成後設評鑑設計的優缺 點。
(3)蒐集資訊(collecting information)
此之任務是蒐集評鑑問題所需的資訊;後設評鑑旨在評估和修正計畫中的工 具和策略,或觀察和評鑑進行中的資料蒐集,或評估已蒐集資料和方法的品質與 關聯性。
(4)分析資訊(analyzing information)
分析資訊的任務是要解釋和發現資料的意義;後設評鑑旨在指導計畫中的資 料分析策略和解釋方案的選擇,或評估進行中的資料分析和整理,或評估資料分 析完成後的正當性和精確性。
(5)報導資訊(reporting information)
其任務事項為當事者溝通評鑑結果及其利用的建議;後設評鑑旨在評估計畫 中報告的策略和內容,或評估和修正報告初稿,或評估總結報告。
(6)管理評鑑(managing evaluation)
其任務是安排或督導評鑑所有各項工作的執行;後設評鑑旨在評估和修正管 理計畫、預算和契約,或評估實施中的管理、契約和預算的合適性,或評估管理 計畫和預算的執行情形、契約的確認情形。
(7)後設評鑑
後設評鑑的實施可以在評鑑計畫階段和評鑑進行階段,期使評鑑活動更加完 善;亦可在評鑑完成階段後實施,讓評鑑者或其他人瞭解評鑑的成效。在各個評 鑑階段,依據評鑑任務的不同,擬定後設評鑑的焦點。
3. 從評鑑標準分析後設評鑑的對象
Scriven(1974,1981)認為評鑑包含多元的向度,因此對方案實施評鑑,必須運 用以下十三項標準:(1)需求、(2)市場、(3)影響的規模和種類、(4)因果關係、(5) 受影響的人口、(6)持續性、(7)普遍性、(8)統計意義、(9)合法性/倫理性/接受性、
(10)成本、(11)未來的利用/改進、(12)比較意義、(13)整體價值等。評鑑者除以上 述十三項規準進行評鑑外,還須回頭檢核評鑑本身。Millman(1981)利用 Scriven 上述十三項檢核項目,組成方案評鑑的三組標準:
(1)方案和評鑑的先備條件,包括需求、市場和影響的規模和種類。
(2)方案和評鑑的效果,包括因果關係、受影響的人口、持續性、普遍性、
統計意義、合法性/倫理性/接受性。
(3)方案和評鑑的效用,包括成本、未來的利用/改進、比較意義、整體價值。
從上述三組標準考慮後設評鑑的兩個焦點或對象,一為方案的評鑑;二為評 鑑結果。評鑑標準和後設評鑑對象交互作用,構成後設評鑑的六個範圍,以表 2-1 示之:
表 2-1 後設評鑑的六個範圍
先備條件 效果 效用
方案評鑑 Ⅰ Ⅱ Ⅲ
後設評鑑的焦
點或對象 評鑑結果 Ⅳ Ⅴ Ⅵ
資料來源:Millman,1981,310
由表 2-1 可知 Millman 將後設評鑑的範圍分為六個,前三個範圍屬於對方案 評鑑品質的評鑑,判斷評鑑過程的優缺點,後三個範圍則屬於評鑑本身的評鑑,
判斷評鑑結果優缺點,各範圍的檢核項目如下(Millman,1981,316-318):
(1)方案評鑑的品質
範圍Ⅰ:判斷評鑑者對方案「先備條件」之評估
對方案需求的評鑑,包括需求內容、需求者、需求的範圍和時機、需求的理 由、預期的價值;對方案市場的評鑑,包括使用者和使用人數的確認;對方案推 廣計畫的評鑑,包括推廣的方式和預期的問題。
範圍Ⅱ:判斷評鑑者對方案「效果」之評估
對評鑑指標的評鑑,包括預期結果的指標、指標特性、副作用的檢討、運作 過程的觀察;對因果關係(內部效度)的評鑑;對結果推論性(外部效度)的評鑑;
對資料分析的評鑑。
範圍Ⅲ:判斷評鑑者對方案「效用」之評估 對方案成本的評鑑以及效益的評鑑。
(2)評鑑本身的品質 範圍Ⅳ:評鑑的先備條件
對評鑑需求的評鑑,包括評鑑需求者、評鑑項目、相關當事人、評鑑利用、
利益、觀點、資源、決策、潛在問題等確認;對評鑑協議的妥當性和時效性的評 鑑。
範圍Ⅴ:評鑑效果
對評鑑預期效果的評鑑;對評鑑副作用的評鑑;對減低或增強評鑑影響因素 的評鑑。
範圍Ⅵ:評鑑的成本和效益
對評鑑成本的評鑑以及效益的評鑑。
由以上的分析可得知 Stufflebeam 以評鑑目的、評鑑設計、評鑑過程和評鑑 結果作為後設評鑑的對象。Brinerhoff 等人則從決定評鑑、設計評鑑、蒐集資訊、
分析和解釋資訊、報告資料和管理評鑑等評鑑要素界定後設評鑑的焦點。Millman 則從先備條件、效果和效用等評鑑標準分析後設評鑑的範圍。雖說項目數量多少 不一,但所涵蓋的內容卻大同小異。
綜而言之,後設評鑑是評鑑品質的管理與控制,評鑑的過程和結果都是後設 評鑑的範圍,而後設評鑑的內容則視其功能或作用,而有不同的焦點,形成性後 設評鑑以改進評鑑為目的,因此評鑑內容著重於過程變項;總結性後設評鑑以判 斷績效為目的,評鑑內容則以結果變項為焦點。
參、 教育評鑑之探討
本小節係就評鑑設計及指標建構等進行分析,藉以瞭解主要的幾項教育評鑑 模式及教育評鑑指標與標準等。
一、 評鑑設計
本小節擬就評鑑的模式進行分析探討,首先了解模式(model)係指以抽象的 綱要型式來描述、解釋、或規範複雜的現象或活動,亦即一個模式乃是學者針對 特定對象或活動所做的假設性描述、解釋、或規範,而以抽象的簡單形式來表達 (吳明清,1995)。
近廿年來歐美教育評鑑的研究在學理的探討頗多,方法和技術亦不繼推陳出 新,而建構的教育評鑑模式繁多,茲簡介主要幾項模式如下:
(一) 目標達成模式(goal-attainment model)
由 Tyler 所提倡,評鑑者依據預定之課程目標,蒐集學生實際表現資料,再
與目標比較,以確定目標達成的程度。Tyler 認為評鑑是方案發展的一個重要階 段,必須遵循一系列的步驟而展開,而其主要步驟可分為八項(黃光雄,民 78):
1. 擬定一般目標(goals)或具體目標(objectives)。
2. 把具體目標約略加以分類。
3. 以行為語詞界定具體目標。
4. 建立可以展示具體目標業已達成的情境或情況。
5. 在某些情況下,向與方案有關人員解釋評鑑策略的目的。
6. 選擇或發展適當的測量方法。
7. 蒐集行為表現的資料。
8. 比較資料和行為目標之符合情形,以判定目標的達成程度。
此一模式的優點是以具體的行為目標作為達成程度的評鑑指標,評鑑設計較 簡明且易於實施。但過於重視產出而忽視輸入及過程,忽略了個別差異及評鑑是 一繼續過程的特定,且具體行為目標失之瑣碎,稍有不慎容易產生見樹不見林之 後果。
(二) 外貌模式(countenance model)
Stake 於 1967 年提出資料矩陣圖,採用系統化的程序蒐集資料,作為評鑑人 員蒐集資料和合理判斷資料的依據。而此模式主要為評鑑各種計畫而設計,評鑑 人員必須由各種不同的對象蒐集資料並列成矩陣圖,在處理資料時,須顧及計畫 實施前、實施中、實施後三個階段的邏輯性與實證性的關係,並找出原先意圖資 料與實際觀察資料是否具有相當程度的符合性,進而做成絕對比較與相關比較的 價值判斷,而最終目的在提供制定政策的依據(轉引自劉奕權,民 74),以圖 2-1 示之:
理論依據 原先意圖 觀察結果 理想標準 價值判斷 (計畫實施前)
(實施過程中) (結果)
描述性矩陣 判斷性矩陣 圖 2-1 Stake 外貌模式評鑑架構之資料矩陣圖
資料來源:江文雄(1982)。
此一模式的優點在於以系統的方法來安排描述和判斷的資料,加強彼此間內 部交互作用,具有明確的標準;考慮絕對的與相對的目標並比較判斷、兼具客觀 和彈性的標準,適合一般的評鑑使用;缺點為資料矩陣圖之各細格資料分類不 易,且易混淆,再者對於關鍵性的資料蒐集不夠嚴謹,恐導致事前、執行和成果 間整個價值判斷的衝突。
(三) 差距模式(discrepancy model)
Provus(1971)認為評鑑是一種實用的歷程,使人能正確的透視學校中教學活 動進行的情形,藉以發現問題與解決問題。此一模式類似於目標模式,相異處在 於目標模式係預定具體的行為目標,而差距模式則是事先設定客觀的標準,再比 較實際結果與標準之差距,分析原因及研定改進行動;是一種解決問題的評鑑模 式,而解決任何問題均經過辨認、比較、選擇、行動等四個步驟,再由行動引出 新問題,週而復始循環不已。
此模式常用於教學計畫的評鑑,先界定教學活動的標準,再比較學生作業與 上述標準之間的符合情形,決定是否具有差異存在,再利用差異的資料改變原計 畫標準或改變學生作業的表現;而優點在於計畫和評鑑間有反饋機制,作為持續 不斷的溝通,而評估與改進是並行的,較能掌握計畫的正確方向,達成計畫目標;
缺點是需花費長時間觀察、比較與考核,耗費人力、時間及經費,且恐著重整體 發展之評鑑而忽略評鑑本身的正確性。
(四) 認可模式(accreditation model)
認可模式源於美國工商團體為確保產品之品質及防止違法團體加入,而由工 商團體認可以達到權益保障之目的。後來發展成高等教育認可制度,主要目的在 透過自我評鑑的過程,發揮學校自主與自我管理的精神,進而促使全校教職員共 同參與改進校務,達成提升學校教育品質的目的,並向社會大眾確認學校教育水 準是否已達到預定的標準。
而認可制度的精神是自願的,學校依據「非官方學術團體」所定的認可標準,
自行研究訂定學校應達成的目標據以執行,並以自我評鑑的方式檢核目標達成 度,再由認可機構派專家組成的訪問小組實地評鑑,最後認可機構參考評鑑小組 的書面報告和建議及其他相關資料,開會審查決定認可名單,認可評鑑的重點在 於品質,學校如獲認可,即表示具有相當的教育品質,而被認可的有效期限,初 次為三至五年,而再認可為五至十年,有效期間學校仍須每年進行自我評鑑並提 出報告,且應對評鑑結果與評鑑小組所提出的改進建議,擬定改進計畫及實施方 案,不斷自我評估改進計畫之執行成效,以確保學校教育品質,認可制度實施步 驟如下(蘇錦麗,1997):
1. 學校成員研討決定提出認可或再認可之申請。
2. 向適當的認可機構提出申請。
3. 依據認可標準進行自我評鑑。
4. 認可機構派員蒞校訪問評鑑。
5. 訪問評鑑小組提出結果報告。
6. 學校針對訪問評鑑結果報告做出反應。
7. 認可團體做出最後決定。
8. 學校對認可團體的決定做出反應。
9. 定期追蹤評鑑。
此一模式的優點扮演品質保證的角色、提出被認可學校持改進的能力,儼然 成為檢驗教育機構之效能與品質的一種手段,然其缺點不外乎耗費成本,且被批
評為認可標準不切實際。
(五) 評鑑研究中心模式(Center for Study of Evaluation;CSE)
Alkin(1969)為提倡者,因其曾擔任美國加州大學洛杉磯校區的評鑑中心主任 (director of center for the study of evaluation),故所提倡之評鑑模式稱之為 CSE 模 式。其認為評鑑係為蒐集、分析資料供決策之用,故將系統理論應用於評鑑模式 中;首先確定與決策有關的範圍,選擇適當的資料,蒐集並分析資料,再將有用 的資料摘要性提供予決策者,依其與決策有關之範圍畫分,計分為五個階段:
1. 系統評估(system assessment)
蒐集並分析系統之現況資料,以供決策之參考。
2. 方案設計(program planning)
蒐集並分析資料,以協助選擇或設計可能有效的特殊方案。
3. 方案實施(program implementation)
蒐集並分析資料,以瞭解方案之實施對象的認知及方案主旨與原先意圖之符 合度。
4. 方案改進(program improvement)
方案進行中,提供有關方案運作、達成中間目標或造成非預期結果之過程相 關資料。
5. 方案檢定(program certification)
提供有用資料,供決策者對方案的價值及其他相關情境所具之潛在可類化性 作一判斷,以確定案方是否終止、修正、保留或推廣的可能。
Alkin 指出傳統的評鑑方式是屬於個體的或微觀的層次,評鑑重點在詳細規 定目標,然在總體的或巨觀的層次上,社會與組織環境亦非常重要,故於評鑑教 育系統時,不能只重視目標的規定,還應考慮環境和投入變項及其交互作用(楊 文雄,1981)。
(六) 司法模式(Judicial Evaluation Model)
Rober Wolf(1979)利用法庭審案方法,將改革內容訴諸大眾,以求得最客觀 的判斷,而司法評鑑成員為調查團隊、案例分析者、案例陳述者、法庭主持人、
陪審團、陪審團指導員等(秦夢群,1997);而此一模式之進行可分為四個基本階 段:
1. 階段一:議題形成期
廣泛蒐集有關議題,由主辦單位與調查團隊成員儘量發掘相關問題,以確保 議題之完整。
2. 階段二:議題選擇期
於上一階段所蒐集的資料中,挑選最重要的議題,以作為辯論之議題。
3. 階段三:辯論準備期
雙方進行資料蒐集,準備為己方看法及所持提出有利證據。
4. 階段一:辯論法庭期
正式陳述己方意見,雙方傳訊證人,質詢程序,以期影響陪審團,而陪審團 經過討論與溝通後,完成建議書(秦夢群,1997)。
若一項政策具有下列特殊性,即可選用司法評鑑模式為評估項:關於公眾利 益的政策;重大且影響甚鉅的政策;內容複雜,涉及政治、社會乃至於心理層面 的政策;走向不明確、相互矛盾之政策;有極大爭議性,且為利益團體爭逐之政 策。
(七) 背景、輸入、過程、成果評鑑模式(Context,Input,Process,Product;CIPP) Stuffelbeam(1971)認為評鑑旨在描述、取得及提供資料,以供作為判斷或決 定方案之用。背景評鑑旨在提供確定目標的依據,輸入評鑑則在確定如何運用資 源以達成目標,過程評鑑則係提供定期回饋予負責實施計畫的人,而成果評鑑則 在瞭解教育系統產生的結果(郭昭佑,2000);評鑑人員盡力去描述、蒐集和提供 有助於決策者做決定的資料。
依據 Stuffelbeam 的說法,決定和目的或方法有關,也與意圖或實際有關,
認為所有的教育決定,依其功能都可劃分為四類(楊文雄,1981):意圖的目的(即 目標);意圖的方法(即程序設計);實際的方法(即使用程序);實際目的(即成就)。
依據上述分類法又將決定分成四類:設計決定(即決定目標);構造決定(即設計程 序);實施決定(即使用、控制和改善程序);循環決定(即對產出的判斷和反應)。
評鑑類型與決定類型及其功能關係對照如圖 2-2 示之:
意圖的 實際的 設計決定
(由背景評鑑支持)
循環決定
(由成果評鑑支持) 目
的 方 法
構造決定
(由投入評鑑支持)
實施決定
(由歷程評鑑支持) 圖 2-2 決定類型與評鑑類型對照圖
資料來源:江文雄(1982)。
根據上述分析,茲將 CIPP 評鑑模式以圖 2-3 所示:
背 景
設 計 決 定
投 入
構 造 決 定
歷 程
實 施 決 定
成 果
循 環 決 定
圖 2-3 Stufflebeam CIPP 評鑑模式架構圖(1971) 資料來源:楊文雄(1982)。
吳明清(2001)認為 CIPP 模式提供了一個較為完整的評鑑架構,可以在方案 規劃階段進行,亦可以在方案執行後實施;且既可以分項評鑑,亦可以整體評鑑;
如以 CIPP 模式為主幹,融合目標導向及判斷導向的精神和優點,並兼採質化導 向的評鑑方法,則可能建構一個比較理想的評鑑模式。
(八) Smith 和 Andrews 校務評鑑模式
Smith 和 Andrews(1987)根據臨床視導的觀念,設計了一套校務評鑑模式,
將評鑑過程分為三個階段—設計、資料蒐集、分析與評鑑。各階段活動安排實施 時間表,並列出視導人員與校長在一學年內應完成的具體活動,各階段活動概述 如下:
1. 第一階段—設計
開學前視導人員與校長會商未來一年的計畫,檢視前一年的目標,訂定來年 的目標,提出行動方案及評鑑每一目標的工具,並安排訪視人員訪視日期。
2. 第二階段—資料蒐集
在一學年間,視導人員及校長各自蒐集有關評鑑目標及規準的資料;視導人 員也會安排期中評鑑會議,與校長會商,評估校務推展情形,進而修正調整之,
並適時補充資源,以協助校長辦學成功。而透過直接的視導,視導人員可檢視校 長的領導作風、校務運用實況,瞭解學校風氣及社區人士的參與情形。
3. 第三階段—分析與評鑑
在學年的最後一個月,視導人員再與校長會商,比較分析一年來蒐集的資 料,即可瞭解學校辦學的績效,並確認應行改進之處,導引學校進入另一個循環 期(張清濱,1997)。
此一評鑑模式可顧及各校背景、資源、需求的不同,以及訂定目標的不同,
同時以個別視導的方式,予以具體的評鑑標準,協助學校朝向新的目標發展,績 效亦較易評估。惟其主要條件是視導人員須具備高度的教育及評鑑專業知能,方 有能力引導學校校務正確發展。
總而言之,評鑑模式的多元導向,顯示學者觀點確有歧異之處,亦顯示教育 評鑑的複雜性;然如何因應評鑑目的及個別需求,擇定一種評鑑模式或兼採數種 適用之評鑑方法結合應用,或許能發展出一個更適合現況的校務評鑑方法。
二、 指標建構
游進年(2003)教育評鑑指標的建構涉及指標的選定、建構過程以及方法等;
就指標的選定而言,經濟合作發展組織之社會組織工作小組(OECD,1982)認為應 考量以下標準:結果性、政策關聯性、穩定性、可分割性、可比較性、可描述性、
以及實用性等七項。依據馬信行(2000)的研究指出,均等指標與品質指標均應包 括在教育評鑑指標之內。是以,學校評鑑的指標結構需涵蓋知識的取得、成就的 壓力與專業教學的條件。郭昭佑(2000)考量學校本位評鑑指標系統的選擇,歸納 出四種學校評鑑指標:規範指標系統、借用指標系統、修訂指標系統與發展指標 系統。
至於教育評鑑主要指標的建構方法則包括:德懷術、專業團體、專家判斷、
提名小組、焦點團體、以及問卷調查法(郭昭佑,2000;Greenber,1999)各種方法 均有其優缺點;故建構指標時應儘量採用多種方法,以獲致較佳的共識與觀點。
教育評鑑標準的建構,首先係由 Guba,Stufflebeam,以及 PDK 研究委員會 (Phi Deta Kappa Study Committee)所提出,計包括內部效度、外部效度、信度、
客觀性、相關性、評鑑範圍、重要性、公信力、時效性、流通性、與效率等十一 項(Stufflebeam,1974),在這些標準當中,第一至四項屬於評鑑技術的適用性,第 五至十項為評鑑的效用性,第十一項標準則涉及評鑑的成本效益,而這些標準即 為日後美國「教育評鑑標準委員會」所發展出來的《教育方案、計畫及資料評鑑 的標準》(The Standards for Evaluations of Educational program, Project, and Material)的基礎。
上述《教育方案、計畫及資料評鑑的標準》係於 1981 年首度出版,並於 1994 年將部分內容予以修訂,除了評鑑的細目與用字遣詞略有調整外,最重要的意涵 乃在於其能因應時勢的遞移,並配合評鑑發展與需求:一方面擴大其使用範圍,
一方面增刪標準的內容,以維持評鑑標準擴充之後的適用性,並將學校、大學、
法律、醫學、護理、軍事、商業與社會服務機構納入適用範圍。其目的旨在發展 適用於學校及其他教育相關活動的評鑑參考所列標準分成四部分,共計三十項
(The Joint Committee on Standards for Educational evaluation,1994):
(一) 適用性(utility)
利害關係人的確認、評鑑人員的公信力、資料的範圍和選擇、報告的清晰度、
報告的流通、評鑑的影響。
(二) 可行性(feasibility)
實際的程序、政治的可行性、成本效益。
(三) 正當性(propriety)
服務導向、正式的協議、人類主體的權利、人際的互動、徹底與公正的評估、
結果的報導、利益的衝突、會計的責任。
(四) 精確性(accuracy)
方案的簽署、脈絡的分析、目的與程序的描述、可靠的資料來源、有效的資 訊、可信的資訊、系統化的資訊、量化資料的分析、質化資料的分析、正當可靠 的結論、客觀的報告、後設評鑑(轉引自游進年,2003)。
吳和堂(2004)則將評鑑的規準分為主規準、次規準以及細規準三個層面,分 述如下:
(一) 主規準
此為規準中最初始的分類,其涵蓋範圍大,以臺北市的校務評鑑為例,包括 行政管理、課程教學、專業發展、訓導輔導、家長參與、學校特色等(吳清山,
2002);而英國中小學校務評鑑主要規準計有學生學習表現、課程設計、學生出 席率、就業狀況(張德銳、李俊達,2001)。
郭昭佑(2000)歸納國內外研究,主要的評鑑規準依序為學生學習表現、教學 品質、環境規劃、校長領導、家長參與、教師工作滿足、課程安排、學校組織氣 氛、溝通協調、組織產能、學校發展、適應力等領域。
(二) 次規準
將前述主規準再細分成幾條概念較明確,涵蓋範圍較小的規準成規準;其作 用只要是將主規準再進一步的具體化。
(三) 細規準
將每條主規準或次規準分成概與範圍具體明確者,而稱為細規準,又稱為指 標,其為評鑑的統計量,用來描述教育現況與健康情形(Oakes,1986;Odden,1990;
轉引自吳和堂,2004);每一個指標代表一個行為表現,其作用猶如教案中的「具 體行為目標」,能具體明確指出所欲達成的目標。因細規準是評鑑時的依據,須 具體可察的,所以指標用來測量事物的品質或數量。
指標本身是價值中立,須藉助某些準則,才能作價值判斷。而指標要有利用 價值,必須符合可計量、簡明、容易判斷,具有效度等原則(吳清山,2002a)。
然評鑑細規準若較為抽象,或一部分較為抽象,不易在短時間內具體而明確的加 以判斷,往往不易提供具體而詳細的資料(高新建,2003)。
游進年(2003)認為,教育評鑑指標與標準的建構涉及價值的選擇與判斷,故 易衍生爭議,就中小學校務評鑑而言,各縣市的評鑑項目各有所不同,而內容大 抵包括:理念與目標、計畫與推動、領導與溝通、革新與發展、行政效能、課程 教學、學生輔導、環境設施、教師專業與資源整合等層面,而各層面在建構各項 評鑑指標大體上已能符合前述的要求,然會引起爭議之處乃在於建構過程與詮 釋,如基層教育實際工作者的觀點與解讀不同;教育現場全貌未被重視或納入;
指標的歸類混淆不清或重疊等。
第二節 我國校務評鑑實施現況之探討
本節係就我國教育評鑑的萌芽及當時受到國外評鑑方案的實施與評鑑概念 的影響予以探討。
壹、 我國目前校務評鑑現況
秦夢群(1997)綜合教育評鑑界 Madaus、Stufflebeam 以及 Scriven 等人的研 究,認為教育評鑑的發展沿革計有下列六個時期:(一)改革時期(age of reform,
1800-1900);(二)效率與測驗時期(age of efficiency and testing,1900-1930);(三)
泰勒時期(Tylerian age,1930-1945);(四)純真時期(age of innocence,1946-1957);
(五)擴張時期(age of expansion,1958-1972);(六)專業時期(age of professionalization,1973 至今)。
而促使教育評鑑逐漸受到重視的原因略述如下:教育資源日漸短絀、公立學 校辦學績效遭質疑、課程與教學方法的更新、自由市場化的要求等;教育評鑑的 起源,遠因係深受科技進步因素的影響,而近因為教育生態的蛻變與轉型則為不 容忽視的重要因素。其中又以績效責任運動(accountability movement)對於教育評 鑑具有深遠的影響,由於績效責任的概念含有成本效益分析與成果評鑑之意,因 此,評鑑乃成為績效制度中不可或缺的一部分。
依據 Popham(1975)的研究指出,人類歷史上較正式的評鑑活動,最早見於 中國的文官考試制度上,但直至民國 53 年至 58 年所實施「國民教育發展五年計 畫」的評鑑,才可視為我國教育評鑑的開始。盧增緒(1985)歸納促成的背景因素 如下:
一、 以評鑑來檢驗教育方案實施成效的觀念開始萌芽
為加強基礎教育並因應世界教育潮流,教育部於民國 53 年提出第一個「國 民教育發展五年計畫」,係為了解其實施成效,遂有教育評鑑之議;是項評鑑係 由聯合國教科文組織兒童基金會協助參與,期中、期末報告亦分別於民國 56、
59 年提出。此番評鑑為亞洲風氣先河,播下教育評鑑的種子,為日後各項評鑑 奠定基礎。
二、 受到國外評鑑方案的實施與評鑑概念的影響
「國民教育發展五年計畫」的評鑑時間,與美國「初等與中等教育法案」
(Elementary and Secondary Education Act,1965,簡稱 ESEA)頒布時間相近,故 評鑑的設計多少受其影響,形成性評鑑與總結性評鑑並行概念亦開始形成。
就蘇錦麗(1993)及楊文雄(1981)研究之所得,我國首次的學校評鑑則於民國 57 年開始辦,省教育廳依據所頒布的「臺灣省國民中學校務設施評量表」,進行 國民中學輔導工作評鑑,接著於民國 63 年指定若干高中試辦學生評量與輔導工
作,後來教育廳為瞭解試辦的情形,以作為改進參考依據,乃制定「高級中學試 辦學生評量與輔導工作評鑑表」,逐年辦理評鑑工作。此二項評鑑為試辦與局部 辦理性質,但已顯然成為我國學校評鑑之濫觴。
而潘慧玲(2003)談及國內教育評鑑的實施,可溯自民國 50、60 年代,然積 極推動則屬近幾年之事,尤其民國 84 年「國民教育法」修訂,將校長辦學績效 納入遴選之考量,評鑑之風盛行。另為講求績效責任,大學評鑑、後期中等教育 評鑑(包括高中、職、綜合高中與完全中學評鑑等),亦接連實施。然以上所述之 評鑑,均由學校外部人員所執行,是一種外部評鑑,其目的重在總結性評鑑。惟 除此之外,評鑑亦可由學校內部人員進行,如此做時,則屬一種內部評鑑。
多年來,國內學校評鑑以校務評鑑為主,而校務評鑑卻又採以專家意見導向 的評鑑模式:由學校先行自評,再由專家以半天至二天不等的時間進行實地訪 評;係屬完全側重外部評鑑的模式,然而在當今講求學校本位管理的教改氣氛 下,宜有所調整。易言之,除實施外部評鑑的校務評鑑外,也要呼籲推動一種以 學校為基地,所進行的自發性評鑑,亦即學校本位評鑑(school-based evaluation)。
學校本位評鑑可採內部評鑑,亦可結合內外部評鑑,而其實施,除能彰顯學校自 主性,要求學校擔負起績效責任外,亦可促進教師彰權益能(teacher
empowerment)。
貳、 國小校務評鑑探討
本小節係以我國教育基本法及國民教育法暨其施行細則等相關法令的頒布 後,主管教育行政機關所實教育研究與評鑑工作,並以臺北縣市、高雄縣市、臺 中縣等辦理校務評鑑概況予以分析討論。
一、 我國國民小學校務評鑑現況概述
由於教育基本法及國民教育法暨其施行細則的頒布,明訂主管教育行政機關 應加強教育研究與評鑑工作,以提升教育品質,並對於校長之遴聘應就其辦學績 效詳為評鑑,以作為應否繼續遴聘之依據。
各縣市政府基於執行法令與檢核教育品質與成效之需要,各有不同處理方 式,部分縣市實施分項評鑑,而部分縣市則實施整體評鑑;部分縣市實施校長評 鑑,而部分縣市則實施校務評鑑。茲就臺北縣市、高雄縣市、臺中縣等辦理校務 評鑑概況,摘述如下並以表 2-2 示之。
表 2-2 臺北縣市、高雄縣市及臺中縣等辦理校務評鑑概述表
縣市 名稱
臺北市 高雄市 臺北縣 高雄縣 臺中縣
評鑑 目的
1 探討學校教育 政策成效,回應 社會對教育改革 的期望。
2 瞭解各學校辦 績效及特色,提 供主管教育行政 機關推動教育改 革之參考。
3 發現學校的困 難,謀求改進策 略,提升教學品 質。
4 激發學校教師 與行政人員士 氣,強化自我成 長,創造優質教 育環境。
1 瞭解學校經 營現況。
2 診斷學校教 育問題。
3 提昇學校教 育品質。
4 促進學校發 展特色。
5 持續學校校 務發展。
為瞭解縣立中小 學辦學成效、困 境及協助學校發 展特色。
1 檢核學校辦 學績效,提供 行政決定的資 訊,並作為校 務改進之依 據。
2 激勵學校士 氣,凝聚學校 教學與行政之 共識,提升學 校教育品質。
3 整合年度例 行評鑑,簡化 學校行政工 作,並瞭解各 校校務推展現 況。
1 協助學校改 進校務,提升 教育品質。
2 激勵教育人 員士氣,促進 專業成長。
3 評定學校績 效,提供決定 的資訊。
評鑑 期程
九十學年度起實 施,預計四年完 成。
八十七學年度 起實施,九十 一學年度修 正,以三年為 期(第一年各 校自評、第二 年評鑑小組評 鑑、第三年追 蹤評鑑)
八十八學年度起 實施,分第二階 段進行,為初評 對象、複評對 象。
八十八學年度 起實施。
八十九學年度 起實施。
評鑑 對象
全市國民小學。 全市國民小 學。
全縣國民中小 學。
校長任期屆滿 及有意參加校
將全縣分為國 中組、國小甲
表 2-2(續)
縣市 臺北市 高雄市 臺北縣 高雄縣 臺中縣 長遴選之學校 組、國小乙組
三組。
評鑑 內容
組織與行政、課 程與教學、訓導 與輔導、環境與 設備、教師與專 業、家長與社 區。
學校經營、教 學實施、 學校 特色。
行政規劃與校務 運作、課程實施 與教學活動、訓 輔措施與學生表 現、環境營造與 設備維護、社區 互動與家長參 與、行政支援與 支持系統、經費 使用績效。
校務行政、校 務工作、訓導 工作、總務工 作、輔導工 作、學校特 色。
一般行政與校 長領導、課程 與教學、訓導 實施、輔導活 動、環境與設 備、人事與會 計、社區關 係、教師專業 與研究發展。
1 辦理校務評鑑 說明會
2 學校自評 3 委員評鑑(審查 資料、晤談、綜 合座談、撰寫評 鑑報告)
4 追蹤輔導
1 辦理校務評 鑑工作說明會 2 校內自我評 鑑
評鑑 程序 與方 式
3 小組評鑑(評 鑑說明、學校 簡報、現場評 鑑、綜合座談)
1 辦理受評學校 會議
2 辦理校務評鑑 作業會議 3 評鑑小組評鑑 一至二天(簡 報、參觀、資料 查閱、問卷、與 教職員工生及家 長晤談、綜合座 談、填寫評鑑結 果)
1 辦理校務評 鑑內涵研習 2 學校自我評 鑑與訪問評鑑 (聽取簡報、觀 察學校教育活 動、訪問有關 人員、與教職 員工生座談、
檢核資料)
1 辦理受評學 校說明會 2 辦理行前說 明會
3 自我評鑑 4 委員評鑑(聽 取簡報、進行 訪視、綜合座 談、書面報告) 5 受評學校提 出改進方案 6 複評 7 追蹤輔導
評鑑 結果 處理 方式
評鑑結果以質性 敘述,不排等級 亦不獎勵。
1 評鑑標準採
“符合”或“不 符合”二項。
2 評鑑結果評 鑑指標均達百 分之八十以上
“符合”者,有 功人員嘉獎一 次之獎勵;未 達百分之六十 以上“符合”
者,相關人員
計分優、良、尚 可、待改進四個 等級,評鑑結果 送受評學校參 考,如有補充意 見得向評鑑小組 說明;受評優良 學校得予敘獎。
訂有各項目計 分方式,成績 採五等第 (優、甲、乙、
丙、丁)。
公布評鑑成績 優良學校(特 優、優等、甲 等、乙等、丙 等),並施予獎 勵或懲處。
表 2-2(續)
縣市 臺北市 高雄市 臺北縣 高雄縣 臺中縣 列入年度考核
或予以懲處。
3 評鑑指標“不 符合”由學校 相關人員或教 師於一個月內 提出改進計 畫,並接受追 蹤;評鑑結果 提供資源分配 及人事考核的 參考。
備註 完全質化評鑑,
提供學校回饋,
並接受學校申 訴。
落實追蹤評鑑機 制,將教師評鑑 納入校務評鑑系 統。
資料來源:研究者自行彙整
綜上所述,歸納以上五縣市校務評鑑實施,茲分別就評鑑目的、評鑑內容、
評鑑方式、評鑑程序、評鑑結果處理方式等歸納如下:
(一) 評鑑目的
國內各縣市實施校務評鑑最主要的目的計有檢核辦學績效,提供決策參考;
診斷學校問題,協助校務改進與發展;激勵教育人員士氣,促進專業成長;整合 相關評鑑,推動教育政策以及提供校長遴選之參考等。
(二) 評鑑內容
應可涵蓋目標與願景、課程與教學、訓導與輔導、組織與行政、專業發展與 研究、環境與設備、社區關係與家長參與、學校特色以及經費使用等項目。
(三) 評鑑方式
評鑑方式不外乎採用自我評鑑與評鑑小組到校訪問評鑑等方式,且均採用評 鑑表進行評鑑,而資料的蒐集則採晤談、座談、觀摩、查閱資料等方法進行。
(四) 評鑑程序
評鑑進行程序計有簡報、實地參觀、檢閱資料、晤談教職員工生、綜合座談 等。
(五) 評鑑結果處理方式
上述各縣市對於評鑑結果列有應改進項目,均實施追蹤輔導,以協助校務改 善,而部分縣市對於評鑑績優學校訂有獎勵規定,部分縣市將結果作為校長遴選 之依據或參考等。
二、 桃園縣國民小學校務評鑑的概況
有鑒於自民國 88 年教育基本法公布後,其中第十三條關於提升教育品質與 促進教育發展,暨國民教育法第九之一條及其施行細則第十一條所示校長遴選迭 度需就校長辦學績效予以評鑑,以為遴聘之依據以及優先遴聘之考量。
再者,桃園縣政府為因應教育改革之趨勢,提升學校效能之所需,首度於 89 學年度實施校務評鑑工作;次年,即 90 學年度桃園縣全縣國民中、小學計有 52 所學校參加評鑑,並於評鑑辦理完畢後,邀集評鑑規劃小組及擔任該學年度 評鑑委員等就該學年度校務評鑑作業之優劣進行檢討,以作為未來辦理校務評鑑 作業之改進方向。
桃園縣政府為期所實施之校務評鑑工作規劃、設計與實施能更為精進與週 妥,於 91 學年度,亦即該縣實施國民中小學校務評鑑之第三學年,於擬訂該學 年度校務評鑑工作計畫之前,特延聘專家學者籌組該縣校務評鑑諮詢顧問團,應 聘學者專家計有黃萬益教授、吳明清教授、陳惠邦教授、潘慧玲教授、楊思偉教 授、張美玉教授、顏國樑教授等,為期廣徵意見,期間並邀集該縣校長、家長會 長協會及教師會代表協助研擬評鑑指標修訂事宜,進而修訂頒布「桃園縣中小學 校務評鑑實施要點」暨桃園縣辦理學年度中小學校務評鑑工作計畫,以作為針對 所轄中小學校務評鑑的實施之依據。
而 92 學年度桃園縣國民中小學校務評鑑的實施,即桃園縣政府依據上述校 務評鑑實施要點之規定頒訂「桃園縣辦理九十二學年度中小學校務評鑑工作計 畫」據以實施,亦即為桃園縣政府修正所頒訂國民中小學校務評鑑相關規定後據
以實施國民中小學校務評鑑工作之第二年,茲可就新修訂之桃園縣國民中小學所 實施校務評鑑工作相關事宜進行研究,以瞭解其實施概況、優劣以及受評學校人 員對校務評鑑的覺知情形,協助主管教育行政機關建立長久可行之校務評鑑機 制。
茲就「桃園縣中小學校務評鑑實施要點」(2003)暨「桃園縣辦理九十二學年 度中小學校務評鑑工作計畫」(2004)、「桃園縣辦理九十三學年度中小學校務評 鑑工作計畫」(2005)以及「桃園縣辦理九十四學年度中小學校務評鑑工作計畫」
(2006)之評鑑目的、評鑑對象、評鑑項目、評鑑方式、評鑑實施期程暨評鑑運用 等摘述如下:
(一) 評鑑目的
了解學校辦學績效,促進校務興革;激勵學校團隊士氣,發揮專業功能;整 合例行評鑑工作,提升行政效能;評析學校特色文化,帶動多元發展。
(二) 評鑑對象
桃園縣縣立中小學校長任期屆滿學校及自願參加學校;桃園縣政府教育局依 視導會報決議,擇定受評學校。
(三) 評鑑項目
評鑑項目計有校務發展、教務發展、訓導發展、總務發展及輔導發展等五大 項目,各項目下均訂定有五個評鑑重點,且評鑑重點一至四之下均設有一至六個 不等的評鑑指標;然評鑑重點五因設定為其他,而未訂定有評鑑指標,授權由受 評學校自行訂定評鑑指標,係有鑒於評鑑重點一至四所訂定之評鑑指標未能充分 涵蓋受評學校所欲彰顯之學校辦學特色,而為之特有設計。
(四) 評鑑方式 1、學校自我評鑑 2、評鑑小組評鑑
由桃園縣政府教育局遴聘學者專家籌組評鑑小組。
3、評鑑程序
評鑑小組赴受評學校後,進行程序為學校簡報、校園訪視、查閱資料、
人員訪談、評鑑小組會議、綜合座談等;評鑑委員基於評鑑需要或協助 受評學校校務發展,得於評鑑實施期間自行擇期前往訪視。
(五) 評鑑運用
各校自我評鑑結果作為校務發展改進依據;評鑑小組評鑑結果評定之缺點 及改進意見,桃園縣政府教育局列管追蹤輔導,以協助受評各校改進;評鑑總 評報告由教育局公告,具有特色值得推廣之學校則推介參考或前往觀摩學習 (詳見附錄一)。
第三節 我國校務評鑑相關研究之探討
國內外對於教育評鑑的研究文獻頗為豐富,若一一臚列恐使文獻資料過於龐 雜,本節擬僅就近年來針對我國國民小學校務評鑑之相關研究文獻,加以歸納整 理,如表 2-3 所示:
表 2-3 國民小學校務評鑑之相關實證研究一覽表 研究者
(年代)
研究主題 研究對象 研究方法 研究發現摘要
陳 劍 賢 (2002)
國 民 中 小 學 校 務 評 鑑之研究- 以 臺 東 縣 為例
臺 東 縣 國 民中小學
問卷調查 1.校務評鑑對學校校務之發展很重 要,應納入學校計畫辦理。
2.臺東縣校務評鑑的實施要點暨評 鑑指標,仍待溝通、探討。
3.評鑑重心已由訪問評鑑價值與事 實的判斷變為自我評鑑決策的歷 程。
4.評鑑委員應由專業素養、公平、公 正學者專家組成。
5.評鑑結果擇優公布,以鼓勵學校的 士氣。
表 2-3(續)
研究者 研究主題 研究對象 研究方法 研究發現摘要
6.後續評鑑的追蹤管制,解決學校的 困難。
1.校務評鑑是改善國民小學教學品 質、診斷學校缺失的重要手段,其 目的若為品質導向,應協助學校改 進。
蘇 秀 花 (2002)
臺 北 市 國 民 小 學 校 務 評 鑑 實 施 成 效 及 整 合 之 研 究
臺 北 市 公 私 立 國 民 小學
文 件 分 析 問卷調查
2.校務評鑑的實施是學校所有人的 職責。
3.外部評鑑診斷的趨勢,應建立在落 實自我評鑑,達到改進校務,提升 教學品質的功能。
4.評鑑種類過多,分割學校人力與資 源,應整合建構「整體學校評鑑」。 5. 校 務 評 鑑 在 臺 北 市 國 民 小 學 實
施,最大的優點是促進學校定期自 我檢核。
6.校務評鑑實施在國民小學,最大的 問題是評鑑書面作業干擾學校正 常運作、影響判斷價值的最重要因 素是評鑑標準與內容的確定、以及 改善教學品質的重要教育活動。
7.校務評鑑辦理的時間以第二學期 末結束前一個月最適,評鑑天數以 一至三天為宜。
8.校務評鑑受評學校的擇定,以自願 申請參加,並以週期規範參加較為 理想。
9.校務評鑑規劃辦理單位,由各國民 小學聯合組成評鑑小組辦理,提供 一種由同儕角度檢視。
10. 提 出 可 行 的 校 務 評 鑑 步 驟 之 設 計。
表 2-3(續)
研究者 研究主題 研究對象 研究方法 研究發現摘要
11.校務評鑑委員組成應發揮專業、
客觀、具實務經驗之角色功能,並 建立評鑑專業人才庫。
12.校務評鑑結果宜以文字敘述,不 作等第排名,並作為補助學校經費 之依據。
潘 俊 程 (2003)
臺 中 縣 國 民 小 學 校 務 評 鑑 之 研究
以 89、90 學年度接 受臺中縣 政府教育 局校務評 鑑之國民 小學受評 學校
文獻分析 問卷調查 訪談
1. 國 民 小 學 教 育 人 員 接 受 校 務 評 鑑,會感受到很大的壓力與焦慮,
尤其是主任與組長。
2.評鑑指標在評鑑後應參考各層面 的改進建議,作適當的整合與修 正。
3. 各 校 對 於 接 受 校 務 評 鑑 相 當 重 視,並且認為在評鑑的過程中受到 重視。
4.校務評鑑未整合其他訪視、考核,
無法減輕學校的負擔。
5.對於評鑑委員的建議,學校有信心 可以針對缺失、持續改進。但教育 行政機關應繼續追蹤,落實校務評 鑑的正面功能。
6.評鑑結果的公平性與客觀性受到 質疑。
7.對於臺中縣校務評鑑各向度及單 題的認同度,校長最肯定,組長的 認同度則偏低。
8.職務別是造成受試者填答差異的 最主要因素,服務年資與教育程度 次之。
洪 梓 祥 (2003)
臺 中 縣 國 民 小 學 實
臺 中 縣 國 民 小 學 接
文件分析 深度訪談
1.校務評鑑的實施受到學校人員重 視與肯定,並能坦然接受,無排斥 與抗拒的現象。