第二章

(1)

第二章文獻探討

本章主要在探討教育評鑑相關文獻、國內校務評鑑沿革及校務評鑑實施現況，希透過探討分析歸納，對研究主題有更深入的瞭解。本章共分三小節，第一節為教育評鑑相關理論之探討；第二節為我國校務評鑑沿革與現況；第三節為國內校務評鑑實證之探討。茲就上述逐節分述如下：

第一節教育評鑑相關理論之探討

本節係評鑑、後設評鑑及教育評鑑等相關理論之探討分析歸納，進而對研究主題能有深入的瞭解。

壹、評鑑之探討

本小節係由評鑑的意義、目的、原則、方式、範疇、步驟與類型等分析歸納，

藉以就評鑑予以瞭解及定義。

一、評鑑的意義與目的 (一) 評鑑的意義

評鑑最早起源於中國，其目的是衡鑑地方官吏的施政績效，而就其意義而言，則在根據平時調查與紀錄之詳實程度，據以考核其績效、責任等，以作為升遷任免之準據(林天祐、蔡菁芝，2001)。而評鑑(evaluation)一詞，國內外諸多學者予以定義過，茲分述如下：

謝文全(1980，2003)認為，評鑑是對事象加以審慎的評析，以量定其得失及原因，據以決定如何改進或重新計畫的過程。包含以下三項要點：其一評鑑是對事象加以審慎的評析：評鑑是對有關事象，加以仔細的評審分析；亦即評析的態度是嚴謹的，以求深入瞭解事實的真象，而不被外表的假象所蒙蔽；其二評鑑是量度得失及究其原因：評鑑不僅是在評定事象的真假，而且還進一步衡量其優劣得失的程度，並分析造成優劣得失產生的原因；其三評鑑旨在決定如何改進或重新計畫：其目的是在藉對事象優劣得失及其原因的瞭解，做為擬定改進計畫的依

(2)

據，使工作能更為完善，日益發展。亦即評鑑的目的，在鑑往知來，即檢討過去策劃將來。

盧增緒(1993)言及，評鑑就是正確而有效的價值判斷，其品質的提升自與其依據之資訊是否確實密切相關。

游家政(1997)提及評鑑，認為是種價值判斷，對某一個現象，運用系統方法來蒐集資料，針對其價值或優缺點加以判斷，唯其判斷的對象可以是人員、方案或教育，若是以國民小學作為判斷對象，則可稱之為國民小學教育評鑑。

吳政達及郭昭佑(1997)指稱，評鑑係透過評鑑者、被評鑑者以及有關人員彼此間的交互作用過程而建構成的意義。

高薰芳(1998)指出，評鑑是運用現有或自訂一套規準，蒐集受評鑑人員一切相關的訊息，藉以了解受評人員表現的優缺點及其成因，作為改進、自我成長或達成其他教育性或行政性目的的活動。

羅清水(1999)指稱，評鑑係根據教育專家的判斷或意見，對教育體系或過程作評估或診療工作；評鑑一辭採用 appraisal 較能呈現評鑑的意義，包括以績效為考量的 evaluation 和以專業成長為導向的 enhancement。

江文雄(1999)認為，評鑑就是評審鑑定，是一種經瞭解、評績效、明得失、

找原因、尋改進、再出發的循環歷程。評鑑具有引領組織領導者自動自發，努力向上的經營動力，是借助內省與外證，期使藉由反省、學習及成長三者並行，以達成自我改進的功能。自動自發是評鑑的起點，自我改進是評鑑的本質，自我管理是評鑑的精神，激勵成長則是評鑑的目的，自我研究則是評鑑的核心。

Stufflebeam(1971)認為，評鑑就是評斷決定方案之有用資料，加以界定、取得及提供的歷程。

Worthen 與 Sanders(1987)則認為，評鑑乃是一件事實表象的價值判斷，評鑑者選擇一項或多項的評鑑規準，蒐集評鑑對象有關的資料，根據評鑑的規準決定評鑑對象的價值，再根據評鑑結果促使評鑑對象改進其服務品質。

綜上所述，評鑑可謂是一種以系統的方法進行資料蒐集與分析，並評定其價

(3)

值，以作為決策改進的依據的一種過程。

吳明清(民 90)提及教育評鑑(educational evaluation)係作有系統的蒐集並解釋相關證據、然後判斷已執行、或執行中的教育活動之優劣，以提供教育決策的參考。

吳清山及林天祐(2002)指出，校務評鑑係指系統化蒐集學校發展計畫的規劃、執行與結果等方面的相關資料，並加以客觀的描述，以作為判斷學校績效或協助學校持續改進的過程。

湯志民(2002)則稱，校務評鑑是一種以系統的方法蒐集和分析學校各種資料，並加以描述和價值判斷，以協助決策的歷程。

潘慧玲(2003)指稱，校務評鑑係以學校為單位所做的評鑑，在這單位中，可針對學校整體運作進行評鑑。

吳和堂(2004)認為校務評鑑乃是對於學校整體表現，運用系統化的方法與客觀的評鑑規準，以收集和分析資料，而加以描述和價值判斷的歷程，以幫助學校改進教學品質與作為決策之用。

綜上所述，校務評鑑係指運用系統化蒐集學校發展計畫、執行與結果相關的資料，並加以客觀的分析描述，以協助學校持續改進的過程或作為判斷學校績效的依據；本研究所指稱之校務評鑑，係指桃園縣政府依據教育基本法第十三條、

國民教育法第九之一條暨其施行細則第十二條等法令規定所訂頒「桃園縣中小學校務評鑑實施要點」以及「桃園縣辦理九十二學年度中小學校務評鑑工作計畫」

等，針對該縣國民小學進行辦學績效以及協助渠等學校持續改進的一套評量措施。

(二) 評鑑的目的

Stufflebeam(1983)曾言，評鑑的目的不在證明而在改進。

謝文全(2003)歸類出評鑑的功能或目的為診斷組織得失、協助決策者做決策及擬訂計畫、增加交流溝通與士氣、促進成長專業進修、提供組織選擇之參考及提高組織運作品質與績效。

(4)

吳清山(2000)指出，校務評鑑的目的為診斷學校教育缺失、改進學校教育缺失、維持學校教育水準和提高學校教育績效。

張素貞(2001)則認為，校務評鑑具有形成性與總結性的功能，對於學校教育而言，具有積極、正面的價值與意義，歸納其目的有下列四項：1 診斷學校教育缺失，作為將來改進的參考。2 改進學校教育缺失，提升教育品質。3 維持學校教育水準，使學校的素養為社會所認同。4 提高學校教育績效，使各種教育投入有最佳的產出，避免教育浪費。

湯志民(2002)指稱，校務評鑑的目的在改進學校教育，提升教育績效，促進學校發展，使之更臻完美。

綜上所述，校務評鑑的目的係在診斷學校教育缺失，以做為改進的參考，同時亦在相關資料蒐集，協助學校透過藉此發展出學校永續發展之特色，故校務評鑑的實施不僅可提升學校辦學績效，亦可促進校務發展，維持學校教育品質。

二、評鑑的原則與方式 (一) 評鑑的原則

謝文全(1997，2003)談及任何行政工作在計畫及執行過程及完結後，宜進行評鑑，以明真得失，做為改進的依據；而如何將評鑑做好，於實施評鑑時應注意下列七大原則：方法要科學化、過程要民主化、兼顧歷程與結果評鑑、兼做形成性與總結性評鑑、內部和外部評鑑兼用、注意評鑑項目的綜合性及整體性、注重評鑑後的追踪改進。

張鈿富(2001)指稱現階段校務評鑑應注意的原則如下：科學化方法、民主化過程、兼顧歷程與結果、平衡內部與外部評鑑、注重整體性。

張素貞(2001)認為，校務評鑑是一複雜歷程，為使其發揮評鑑應有之功能，

規劃時必須遵循下列五項原則：客觀性、合作性、完整性、描述性、繼續性。

湯志民(2002)指出，校務評鑑的工作是一種複雜的歷程，為發揮評鑑的功能，達成評鑑的目的，必須遵循下列八大原則：客觀性、民主性、廣泛性、個別性、多元性、統整性、動態性、繼續性。

(5)

吳清山(2002)認為校務評鑑是一複雜性和持續性的歷程，須遵守一定的原則，方能發揮評鑑效果，而把握實施的原則如下：專業、互信、客觀、彈性、多樣、整體以及發展等七項原則。

綜上所述，就學者所倡校務評鑑的原則，可得知校務評鑑原則計有下列各項：方法科學化、過程民主化、兼採內部與外部評鑑、兼顧歷程與結果以及注重統整性與持續性等。

(二) 評鑑的方式

吳清山(2000)認為在複雜的評鑑過程中，為達到評鑑的目的，評鑑工作必須因時、因地制宜，採取多種的評鑑方法，並介紹常見的學校評鑑方法有以下四種：

1. 自我評鑑

由學校校長、主任、組長和教師所選出的代表組成評鑑小組，辦理學校自我評鑑，此乃針對學校本身需要而進行，不一定需藉由外部團體的壓力。而所蒐集到的資料，小組應加以分析和檢討，以作為改進校務之參考。

2. 交互觀摩評鑑

旨在收相互觀摩及學習之效，而學校可自行邀請他校觀摩評鑑，評鑑結果相互檢討，可以了解彼此的優缺點，具有激勵和學習的雙重功效。

3. 評鑑小組評鑑

係由專家學者組成評鑑小組，具有崇高的學術地位，評鑑小組以專業的知識來判斷學校的素質，然為了蒐集更多的評鑑資料，可採用觀察法、詢問法、座談會、問卷法以及檢核有關資料等方式，以瞭解實況並獲致正確之評鑑結果。

4. 追蹤評鑑

就學校本身而言，針對自我評鑑所發掘的問題，擬訂改進辦法，列為督導執行，並定期追蹤檢查其成效；就教育行政主管機關而言，針對專家小組評鑑結果，

績效較差者列為追蹤輔導之對象，一定時間(一學期或一學年)以後，再延聘學者、專家組成小組，實施到校之追蹤評鑑，以督促學校不斷改進與發展。

Kells(1993)則指出，目前世界各國常用的評鑑方式說明如下(引自蘇錦麗，

(6)

1997)：

1. 參與式的自我評鑑：自我評鑑是受評學校全體教職員及相關群體代表對於辦學進行系統化診斷，藉此檢討缺失並尋求改善方針。

2. 外部同僚評鑑：係藉由外部同僚專家的專業看法與判斷，協助受評學校建立績效相關觀念並提出改進措施。

3. 表現指標、常模以及效率之比較使用：此係用於進行機構間之相互比較之用。

4. 後設評鑑：後設評鑑為評鑑的評鑑，亦是將既有的規劃設計之評鑑置於受評者的位置，有系統的蒐集資料，依既定標準評斷其價值以及優、缺點的歷程。

5. 趨勢資料之使用、績效與預定目標之符合程度、以及相關顧客對績效之看法：即評鑑團體運用高等教育機構各方面長期表現的資料，以判斷學校辦學績效為何。

6. 邊際誘因制度的使用：係促使學校行政人員或其他相關人員積極參與評鑑工作。

7. 制裁的威脅或主要誘因：此所謂制裁係針對無法達到評鑑最低標準者所施行的懲罰措施，而其方式各國不一，主要有由評鑑團體撤銷大學許可資格、或政府撤銷大學核准或承認資格，抑或經費的撤銷或關閉學校等。

張素貞(2001)指出，校務評鑑的方式計有下列八種：文件分析法，茲就規章、

計畫報表、出版工作紀錄、成果報告等據以分析瞭解；觀察法，實地考查及資料驗證；訪問法，以面對面的方式進行；座談會，有關人員相互交換意見；問卷法，

以主題方式呈現，以供受評者填答；調查表法，事實資料以及數據的蒐集；評量表法，優劣等級；其他。

湯志民(2002)則歸類出以下七種常用方法：文件分析法、觀察法、訪問法、

座談會、問卷法、調查表法、評量表法。

歸納上述學者的看法，可知校務評鑑的方法最主要的方法為自我評鑑以及外

(7)

部人員訪視評鑑二種，現今國內各縣市亦多採此二種方法進行。

三、評鑑的範疇與步驟 (一) 評鑑的範疇

依據 Nevo(1995)及郭昭佑(2000)所為之詮釋，學校評鑑的範疇可包括以下六項：學生評鑑、教師評鑑、課程評鑑、教材評鑑、方案或計畫評鑑、學校整體評鑑。

張鈿富(2001)校務評鑑的範圍涵蓋極廣，舉凡如組織目標、師資、課程、入學資格、教材、教學方法、圖書與設備、教學與研究成果、經費支配、人事任用、

校友會、家長與社區皆屬之；另有關校務問題之事宜，如學校組織型態、學校活動、學生學習與素質、教師工作滿意等亦可納入校務評鑑的範疇。

潘慧玲(2003)則將學校評鑑區分為下列四項：校務評鑑、方案評鑑、教材評鑑、人員評鑑，而人員評鑑又可細分為校長評鑑及教師評鑑。

綜上所述，可得知校務評鑑所含範圍極為廣泛，舉凡學校教育一切事務均囊括在其評鑑範圍內，即所有的教學與行政事務均可納入校務評鑑的範疇。

(二) 評鑑的步驟

謝文全(1990)認為評鑑過程可以分為列下九個階段：決定評鑑的目標、確定評鑑的範圍、分析評鑑的細目、訂定衡量的標準、編製評鑑表格、進行評鑑資料蒐集、分析資料、做成結論及提出建議、研擬改進計畫並進行改進。

張素貞(2001)認為在規劃校務評鑑上，應有一套步驟和蒐集資料工具，其步驟如下：準備階段、執行階段、總結階段、追蹤階段。

總而言之，校務評鑑於實施之前，應有妥善之規劃與準備，如在各校自我評鑑之前，主管教育行政機關應就規劃好之自我評鑑規準、相關規定、做法、步驟說明清楚，包括評鑑內容、指標等都應事先規範與公布，讓實施自評學校有所遵循，而於實施外部評鑑訪視時，評鑑委員的擇聘、評鑑小組的組成應具公平、客觀，而經由事前的講習以取得共識，亦是必須的。

(8)

四、評鑑的類型

校務評鑑可分為諸多不同的類型，而湯志民(2002)依據相關研究加以彙整，

摘錄如下：

(一) 就目標情形而言：可分為基於目標的評鑑及免於目標的評鑑二種；

(二) 就評鑑內容而言：可分為綜合的評鑑及部分的評鑑二種；

(三) 就評鑑時機而言：可分為形成性評鑑及總結性評鑑二種；

(四) 就實施重點而言：可分為內在評鑑及成果評鑑二種；

(五) 就評鑑人員而言：可分為內部評鑑、外部評鑑及合作評鑑三種；

(六) 就評鑑取向而言：計分為假評鑑、準評鑑及真評鑑三種；

(七) 就評鑑目的而言：計分為績效的評鑑、發展的評鑑及知識的評鑑三種。

貳、後設評鑑之探討

本小節係就後設評鑑的意義、目的、角色及範圍等進行分析歸納，藉以瞭解後設評鑑的屬性。

一、後設評鑑的意義與目的 (一) 後設評鑑的意義

藉由探討後設評鑑的發展，可知後設評鑑是基於瞭解和改進教育評鑑品質的需求而形成。早在 1940 年 Oratra 曾提出「評鑑的評鑑」的概念，而在 1969 年 Scriven 提出「後設評鑑」一詞，並將其定義為「評鑑的評鑑」，亦後設評鑑就是次層評鑑(second-order evaluation)。就理論而言，後設評鑑涉及評鑑角色的方法論評估；就實務而言，後設評鑑關注特定評鑑各種表現的評鑑(Scriven,1972,84)。

典型的後設評鑑，即由另一個評鑑者去評鑑一項已計畫好的或已完成的評鑑，亦即後設評鑑將評鑑者置於受評者的位置，對該評鑑者及其活動表現進行價值判斷 (Scriven,1981,95)。

Stufflebeam(1974,69-70)亦採用 Scriven 的術語認為後設評鑑是「較高層級評鑑」(higher-order evaluation)，或「評鑑的評鑑」。基本上後設評鑑的形式，其概

(9)

念和評鑑概念相互契合的，說明如下：

1. 評鑑是優缺點的評估。是以，後設評鑑意指評估評鑑實施的優缺點。

2. 評鑑為決策和績效服務。而後設評鑑必須在評鑑實施前提供資訊，支持評鑑者所為評鑑的決策，以及在評鑑實施後提供資訊，協助評鑑者了解其評鑑工作的品質，是以後後評鑑應該是形成性與總結性的。

3. 評鑑應評估方案的目標、設計、實施和結果。後設評鑑應評估評鑑目標的重要性、評鑑設計的適合性、評鑑實施的妥當性、評鑑結果的品質與重要性。

4. 評鑑必須為所有受到方案影響的人服務。而後設評鑑應為評鑑者及對其評鑑工作感到興趣的人服務。

5. 評鑑必須由內部與外部人員實施，通常內部人員實施形成性評鑑，以獲得決策的資訊，外部人員實施總結性評鑑，以了解績效。而後設評鑑者必須對進行中的評鑑實施總結性評鑑，以及對已完成的評鑑活動之整體優缺點實施外部判斷。

6. 評鑑包括描述問題、獲取所需的資訊、以及利用資訊做決策和判斷績效等程序。而後設評鑑者首先必須進行此三個步驟。後設評鑑者須描述特定後設評鑑問題，次為須蒐集、組織、分析所需的資訊，最後則須將所獲得的資訊應用到合適的決策和績效責任上。

7. 評鑑必須在技術上是合適的、有用的和符合成本利益的。而後設評鑑亦必須滿足這些相同的規準。

Stufflebeam(1978,9-10)更進一步將後設評鑑解釋為針對一項評鑑的技術之適當性、利用性、倫理性和實用性，進行描述、獲取和使用敘述性和判斷性資訊的過程，藉以指出該項評鑑的技術報告的優、缺點。

Cook 和 Gruder(1978)則將後設評鑑限定在對總結性評鑑進行評鑑。Straw 和 Cook(1990)承續前述的觀點，認為後設評鑑係泛指一項評鑑或一組評鑑的技術品質及其結果進行評鑑的各種活動。

(10)

由上述定義可得知，評鑑學者普遍將「後設評鑑」視為「評鑑的評鑑」，亦即對「原級評鑑」進行「較高層級評鑑」或「次層評鑑」的歷程。

(二) 後設評鑑的目的

Scriven(1967,40)認為評鑑的目的，在回答有關某些「實體」(entities)的某些

型態的「問題」。這些實體是指教育的各種工具，諸如過程、人員、程序和方案等，都是評鑑的對象；而所問的問題型態，包括就某些規準看來，這個工具表現有多好？是否比其他工具優良？那些變項受到這個工具的影響？就成本看來，這個工具是否值得？簡而言之，就是價值判斷的問題。綜此，評鑑的目的就是判斷或評估事物的優缺點和價值。

由前述後設評鑑的定義為「評鑑的評鑑」，可知原級評鑑是後設評鑑所要評鑑的實體，後設評鑑的目的則在判斷原級評鑑的價值，亦就是將原級評鑑置於受評者的位置，對該評鑑者及其活動的表現進行價值判斷，此係就後設評鑑的整體目的而言，不因後設評鑑的對象而有變化；而在整體目的之下，依據後設評鑑在特定情境運作，則可分為許多不同的次級目標或角色。

二、後設評鑑的角色與範圍 (一) 後設評鑑的角色

Stufflebeam(1967,72-73)認為後設評鑑任務有二，其一為「做決定」(decision making)服務；其二為「績效責任」服務。首先就做決定服務而言，經常是由內部人員所實施的「形成性後設評鑑」，在評鑑活動之前，對評鑑的設計和實施提供適時的建議，藉以確保評鑑結果在技術上妥當、有用和成本或效能的標準。其次，就為績效責任服務而言，係指「總結性後設評鑑」，大多由外部人員對已完成評鑑工作，提出優缺點的判斷，藉以確認評鑑者的績效和評鑑結果的可靠性。

Smith(1981b,267)亦認為實施後設評鑑的基本理由是要改進評鑑本身的理論與實務。更精確而言，後設評鑑是為了完成以下一項或多項的任務：

1. 評估評鑑工作的品質、影響或利用；

2. 探討評鑑的性質；

(11)

3. 糾正可能發生的評鑑濫用；

4. 提供評鑑的績效以證明評鑑工作；

5. 說明控制評鑑的偏誤；

6. 評估新評鑑取向的實效性。

不論係屬形成性或總結性的角色，後設評鑑都具有品質控制的功能，且尚具有統整各種評鑑研究的功能。Cook(1974,160-174)從「再評鑑」原級評鑑報告資料的途徑，認為實施後設評鑑的主要理由有八項：

1. 減低評鑑結果的不確定性；

2. 獲得另一種觀點和評鑑獨立的精神；

3. 突破學術本位的限制，建立科技整合的研究；

4. 提供多層面的訓練功能；

5. 整體評估各種原始評鑑的效果；

6. 知識的累積和多元的資料利用；

7. 對傳統知識的質疑；

8. 增進專業的能力。

此八項係基於政策與評鑑研究的關係而提出，對決策者而言，經由資料的多元分析與利用，可以協助決策者確認方案評鑑的結論，評估方案的整體績效，獲得新的評鑑結論或新知識，做為選擇變通方案的參考；對評鑑研究而言，後設評鑑可以協助評鑑者獲得科際整合的學術訓練，增進評鑑的專業能力，擴展評鑑的研究領域。

綜上所述，就整體目的而言，後設評鑑的目的在判斷原級評鑑的價值優缺點；就各種角色而言，後設評鑑所扮演的角色有三，第一是為做決定服務的形成性後設評鑑，旨在協助評鑑者改進評鑑的實施或確保評鑑的正確進行，以提高評鑑的可行性。第二是為績效責任服務的總結性後設評鑑，旨在判斷已完成的評鑑活動之優缺點，確認評鑑品質、影響和利用。第三是為評鑑研究服務的啟發性後設評鑑，旨在突破學術本位的限制，建立資料多元使用和科技整合的研究途徑，

(12)

發現新的觀點與知識。

(二) 後設評鑑的內容

後設評鑑究竟要評鑑些什麼？這是個重要議題，由後設評鑑的定義得知，後

設評鑑是以某些標準對一項評鑑的過程，或對一項或一組已完成的評鑑，進行價值判斷的歷程。故如欲探討後設評鑑的範圍，可從評鑑角色分析、評鑑要素以及評鑑標準來考量。

1. 從評鑑的角色分析後設評鑑的對象

不論是形成性或總結性後設評鑑，都是採取描述資訊要件、獲取資訊和應用資訊等三個步驟，對原級評鑑的目的、設計、過程以及結果提出建議或判斷 (Stufflebeam,1974,70-74)，說明如下：

(1)評鑑目的

評鑑目的關係評鑑所欲達成的結果，由於各種當事人需求的不同，評鑑者會面臨各種競爭性的評鑑目的。故形成性的後設評鑑須蒐集當事者的需求、可能的評鑑目的和選擇規範，進行評鑑目的的邏輯分析，並對應選的評鑑目的提出建議；結總性後設評鑑則根據評鑑需求、規準和當事者的相關分析，判斷選定評鑑目的之價值。

(2)評鑑設計

評鑑設計的選擇，有著許多不同的變通方案；選擇合適的評鑑設計須依據評鑑的目的以及考慮相關的策略和社會政治因素。故形成性後設評鑑須分析各種變通設計和選擇規準，對應選的評鑑設計提出建議；總結性後設評鑑則根據評鑑目的、規準，對選定的評鑑設計加以判斷。

(3)評鑑過程

在評鑑的實施過程中經常會遇到的實際問題，諸如概念、社會政治、法規、

技術、行政、道德以及倫理等問題，都會影響評鑑的程序、進度、人員分工與評鑑結果。形成性後設評鑑須評估潛在的評鑑實施問題，追蹤評鑑的過程，提出修正評鑑設計和過程的建議；總結性後設評鑑則分析評鑑設計與評鑑過程的差距，

(13)

判斷評鑑實施的優缺點。

(4)評鑑結果

評鑑的問題是否獲得回答？回答的程度如何？值回成本？發現是否與預定的當事者溝通？發現是否被利用？這些均涉及評鑑目的、評鑑品質、評鑑成本、

評鑑影響以及利用的問題，是判斷評鑑結果所需要考慮的。形成性後設評鑑須分析所蒐集的這些資訊提出改進評鑑結果的建議；總結性後設評鑑則對評鑑活動的品質、利用以及成本效益提出價值判斷。

2. 從評鑑要素分析後設評鑑的焦點

Brinkerhoff 等人(1983)認為從事一項評鑑，至少必須考慮以下七項要素，而前六項為第七項後設評鑑的對象，說明如下：

(1)決定評鑑(focusing evaluation)

決定評鑑的任務是決定評鑑什麼和如何評鑑；後設評鑑旨在評估和協助修正計畫中的評鑑目的和問題，或確認實施中評鑑目的和問題的可行性，或判斷完成後評鑑目的和問題的優缺點。

(2)設計評鑑(designing evaluation)

評鑑設計通常包括實施的程序和策略；後設評鑑旨在評估和修正計畫中的評鑑程序和策略，評估評鑑設計在實施中的效果，或決定完成後設評鑑設計的優缺點。

(3)蒐集資訊(collecting information)

此之任務是蒐集評鑑問題所需的資訊；後設評鑑旨在評估和修正計畫中的工具和策略，或觀察和評鑑進行中的資料蒐集，或評估已蒐集資料和方法的品質與關聯性。

(4)分析資訊(analyzing information)

分析資訊的任務是要解釋和發現資料的意義；後設評鑑旨在指導計畫中的資料分析策略和解釋方案的選擇，或評估進行中的資料分析和整理，或評估資料分析完成後的正當性和精確性。

(14)

(5)報導資訊(reporting information)

其任務事項為當事者溝通評鑑結果及其利用的建議；後設評鑑旨在評估計畫中報告的策略和內容，或評估和修正報告初稿，或評估總結報告。

(6)管理評鑑(managing evaluation)

其任務是安排或督導評鑑所有各項工作的執行；後設評鑑旨在評估和修正管理計畫、預算和契約，或評估實施中的管理、契約和預算的合適性，或評估管理計畫和預算的執行情形、契約的確認情形。

(7)後設評鑑

後設評鑑的實施可以在評鑑計畫階段和評鑑進行階段，期使評鑑活動更加完善；亦可在評鑑完成階段後實施，讓評鑑者或其他人瞭解評鑑的成效。在各個評鑑階段，依據評鑑任務的不同，擬定後設評鑑的焦點。

3. 從評鑑標準分析後設評鑑的對象

Scriven(1974,1981)認為評鑑包含多元的向度，因此對方案實施評鑑，必須運用以下十三項標準：(1)需求、(2)市場、(3)影響的規模和種類、(4)因果關係、(5) 受影響的人口、(6)持續性、(7)普遍性、(8)統計意義、(9)合法性/倫理性/接受性、

(10)成本、(11)未來的利用/改進、(12)比較意義、(13)整體價值等。評鑑者除以上述十三項規準進行評鑑外，還須回頭檢核評鑑本身。Millman(1981)利用 Scriven 上述十三項檢核項目，組成方案評鑑的三組標準：

(1)方案和評鑑的先備條件，包括需求、市場和影響的規模和種類。

(2)方案和評鑑的效果，包括因果關係、受影響的人口、持續性、普遍性、

統計意義、合法性/倫理性/接受性。

(3)方案和評鑑的效用，包括成本、未來的利用/改進、比較意義、整體價值。

從上述三組標準考慮後設評鑑的兩個焦點或對象，一為方案的評鑑；二為評鑑結果。評鑑標準和後設評鑑對象交互作用，構成後設評鑑的六個範圍，以表 2-1 示之：

(15)

表 2-1 後設評鑑的六個範圍

先備條件效果效用

方案評鑑 Ⅰ Ⅱ Ⅲ

後設評鑑的焦

點或對象評鑑結果 Ⅳ Ⅴ Ⅵ

資料來源：Millman,1981,310

由表 2-1 可知 Millman 將後設評鑑的範圍分為六個，前三個範圍屬於對方案評鑑品質的評鑑，判斷評鑑過程的優缺點，後三個範圍則屬於評鑑本身的評鑑，

判斷評鑑結果優缺點，各範圍的檢核項目如下(Millman,1981,316-318)：

(1)方案評鑑的品質

範圍Ⅰ：判斷評鑑者對方案「先備條件」之評估

對方案需求的評鑑，包括需求內容、需求者、需求的範圍和時機、需求的理由、預期的價值；對方案市場的評鑑，包括使用者和使用人數的確認；對方案推廣計畫的評鑑，包括推廣的方式和預期的問題。

範圍Ⅱ：判斷評鑑者對方案「效果」之評估

對評鑑指標的評鑑，包括預期結果的指標、指標特性、副作用的檢討、運作過程的觀察；對因果關係(內部效度)的評鑑；對結果推論性(外部效度)的評鑑；

對資料分析的評鑑。

範圍Ⅲ：判斷評鑑者對方案「效用」之評估對方案成本的評鑑以及效益的評鑑。

(2)評鑑本身的品質範圍Ⅳ：評鑑的先備條件

對評鑑需求的評鑑，包括評鑑需求者、評鑑項目、相關當事人、評鑑利用、

利益、觀點、資源、決策、潛在問題等確認；對評鑑協議的妥當性和時效性的評鑑。

範圍Ⅴ：評鑑效果

(16)

對評鑑預期效果的評鑑；對評鑑副作用的評鑑；對減低或增強評鑑影響因素的評鑑。

範圍Ⅵ：評鑑的成本和效益

對評鑑成本的評鑑以及效益的評鑑。

由以上的分析可得知 Stufflebeam 以評鑑目的、評鑑設計、評鑑過程和評鑑結果作為後設評鑑的對象。Brinerhoff 等人則從決定評鑑、設計評鑑、蒐集資訊、

分析和解釋資訊、報告資料和管理評鑑等評鑑要素界定後設評鑑的焦點。Millman 則從先備條件、效果和效用等評鑑標準分析後設評鑑的範圍。雖說項目數量多少不一，但所涵蓋的內容卻大同小異。

綜而言之，後設評鑑是評鑑品質的管理與控制，評鑑的過程和結果都是後設評鑑的範圍，而後設評鑑的內容則視其功能或作用，而有不同的焦點，形成性後設評鑑以改進評鑑為目的，因此評鑑內容著重於過程變項；總結性後設評鑑以判斷績效為目的，評鑑內容則以結果變項為焦點。

參、教育評鑑之探討

本小節係就評鑑設計及指標建構等進行分析，藉以瞭解主要的幾項教育評鑑模式及教育評鑑指標與標準等。

一、評鑑設計

本小節擬就評鑑的模式進行分析探討，首先了解模式(model)係指以抽象的綱要型式來描述、解釋、或規範複雜的現象或活動，亦即一個模式乃是學者針對特定對象或活動所做的假設性描述、解釋、或規範，而以抽象的簡單形式來表達 (吳明清，1995)。

近廿年來歐美教育評鑑的研究在學理的探討頗多，方法和技術亦不繼推陳出新，而建構的教育評鑑模式繁多，茲簡介主要幾項模式如下：

(一) 目標達成模式(goal-attainment model)

由 Tyler 所提倡，評鑑者依據預定之課程目標，蒐集學生實際表現資料，再

(17)

與目標比較，以確定目標達成的程度。Tyler 認為評鑑是方案發展的一個重要階段，必須遵循一系列的步驟而展開，而其主要步驟可分為八項(黃光雄，民 78)：

1. 擬定一般目標(goals)或具體目標(objectives)。

2. 把具體目標約略加以分類。

3. 以行為語詞界定具體目標。

4. 建立可以展示具體目標業已達成的情境或情況。

5. 在某些情況下，向與方案有關人員解釋評鑑策略的目的。

6. 選擇或發展適當的測量方法。

7. 蒐集行為表現的資料。

8. 比較資料和行為目標之符合情形，以判定目標的達成程度。

此一模式的優點是以具體的行為目標作為達成程度的評鑑指標，評鑑設計較簡明且易於實施。但過於重視產出而忽視輸入及過程，忽略了個別差異及評鑑是一繼續過程的特定，且具體行為目標失之瑣碎，稍有不慎容易產生見樹不見林之後果。

(二) 外貌模式(countenance model)

Stake 於 1967 年提出資料矩陣圖，採用系統化的程序蒐集資料，作為評鑑人員蒐集資料和合理判斷資料的依據。而此模式主要為評鑑各種計畫而設計，評鑑人員必須由各種不同的對象蒐集資料並列成矩陣圖，在處理資料時，須顧及計畫實施前、實施中、實施後三個階段的邏輯性與實證性的關係，並找出原先意圖資料與實際觀察資料是否具有相當程度的符合性，進而做成絕對比較與相關比較的價值判斷，而最終目的在提供制定政策的依據(轉引自劉奕權，民 74)，以圖 2-1 示之：

(18)

理論依據原先意圖觀察結果理想標準價值判斷 (計畫實施前)

(實施過程中) (結果)

描述性矩陣判斷性矩陣圖 2-1 Stake 外貌模式評鑑架構之資料矩陣圖

資料來源：江文雄(1982)。

此一模式的優點在於以系統的方法來安排描述和判斷的資料，加強彼此間內部交互作用，具有明確的標準；考慮絕對的與相對的目標並比較判斷、兼具客觀和彈性的標準，適合一般的評鑑使用；缺點為資料矩陣圖之各細格資料分類不易，且易混淆，再者對於關鍵性的資料蒐集不夠嚴謹，恐導致事前、執行和成果間整個價值判斷的衝突。

(三) 差距模式(discrepancy model)

Provus(1971)認為評鑑是一種實用的歷程，使人能正確的透視學校中教學活動進行的情形，藉以發現問題與解決問題。此一模式類似於目標模式，相異處在於目標模式係預定具體的行為目標，而差距模式則是事先設定客觀的標準，再比較實際結果與標準之差距，分析原因及研定改進行動；是一種解決問題的評鑑模式，而解決任何問題均經過辨認、比較、選擇、行動等四個步驟，再由行動引出新問題，週而復始循環不已。

此模式常用於教學計畫的評鑑，先界定教學活動的標準，再比較學生作業與上述標準之間的符合情形，決定是否具有差異存在，再利用差異的資料改變原計畫標準或改變學生作業的表現；而優點在於計畫和評鑑間有反饋機制，作為持續不斷的溝通，而評估與改進是並行的，較能掌握計畫的正確方向，達成計畫目標；

缺點是需花費長時間觀察、比較與考核，耗費人力、時間及經費，且恐著重整體發展之評鑑而忽略評鑑本身的正確性。

(19)

(四) 認可模式(accreditation model)

認可模式源於美國工商團體為確保產品之品質及防止違法團體加入，而由工商團體認可以達到權益保障之目的。後來發展成高等教育認可制度，主要目的在透過自我評鑑的過程，發揮學校自主與自我管理的精神，進而促使全校教職員共同參與改進校務，達成提升學校教育品質的目的，並向社會大眾確認學校教育水準是否已達到預定的標準。

而認可制度的精神是自願的，學校依據「非官方學術團體」所定的認可標準，

自行研究訂定學校應達成的目標據以執行，並以自我評鑑的方式檢核目標達成度，再由認可機構派專家組成的訪問小組實地評鑑，最後認可機構參考評鑑小組的書面報告和建議及其他相關資料，開會審查決定認可名單，認可評鑑的重點在於品質，學校如獲認可，即表示具有相當的教育品質，而被認可的有效期限，初次為三至五年，而再認可為五至十年，有效期間學校仍須每年進行自我評鑑並提出報告，且應對評鑑結果與評鑑小組所提出的改進建議，擬定改進計畫及實施方案，不斷自我評估改進計畫之執行成效，以確保學校教育品質，認可制度實施步驟如下(蘇錦麗，1997)：

1. 學校成員研討決定提出認可或再認可之申請。

2. 向適當的認可機構提出申請。

3. 依據認可標準進行自我評鑑。

4. 認可機構派員蒞校訪問評鑑。

5. 訪問評鑑小組提出結果報告。

6. 學校針對訪問評鑑結果報告做出反應。

7. 認可團體做出最後決定。

8. 學校對認可團體的決定做出反應。

9. 定期追蹤評鑑。

此一模式的優點扮演品質保證的角色、提出被認可學校持改進的能力，儼然成為檢驗教育機構之效能與品質的一種手段，然其缺點不外乎耗費成本，且被批

(20)

評為認可標準不切實際。

(五) 評鑑研究中心模式(Center for Study of Evaluation；CSE)

Alkin(1969)為提倡者，因其曾擔任美國加州大學洛杉磯校區的評鑑中心主任 (director of center for the study of evaluation)，故所提倡之評鑑模式稱之為 CSE 模式。其認為評鑑係為蒐集、分析資料供決策之用，故將系統理論應用於評鑑模式中；首先確定與決策有關的範圍，選擇適當的資料，蒐集並分析資料，再將有用的資料摘要性提供予決策者，依其與決策有關之範圍畫分，計分為五個階段：

1. 系統評估(system assessment)

蒐集並分析系統之現況資料，以供決策之參考。

2. 方案設計(program planning)

蒐集並分析資料，以協助選擇或設計可能有效的特殊方案。

3. 方案實施(program implementation)

蒐集並分析資料，以瞭解方案之實施對象的認知及方案主旨與原先意圖之符合度。

4. 方案改進(program improvement)

方案進行中，提供有關方案運作、達成中間目標或造成非預期結果之過程相關資料。

5. 方案檢定(program certification)

提供有用資料，供決策者對方案的價值及其他相關情境所具之潛在可類化性作一判斷，以確定案方是否終止、修正、保留或推廣的可能。

Alkin 指出傳統的評鑑方式是屬於個體的或微觀的層次，評鑑重點在詳細規定目標，然在總體的或巨觀的層次上，社會與組織環境亦非常重要，故於評鑑教育系統時，不能只重視目標的規定，還應考慮環境和投入變項及其交互作用(楊文雄，1981)。

(21)

(六) 司法模式(Judicial Evaluation Model)

Rober Wolf(1979)利用法庭審案方法，將改革內容訴諸大眾，以求得最客觀的判斷，而司法評鑑成員為調查團隊、案例分析者、案例陳述者、法庭主持人、

陪審團、陪審團指導員等(秦夢群，1997)；而此一模式之進行可分為四個基本階段：

1. 階段一：議題形成期

廣泛蒐集有關議題，由主辦單位與調查團隊成員儘量發掘相關問題，以確保議題之完整。

2. 階段二：議題選擇期

於上一階段所蒐集的資料中，挑選最重要的議題，以作為辯論之議題。

3. 階段三：辯論準備期

雙方進行資料蒐集，準備為己方看法及所持提出有利證據。

4. 階段一：辯論法庭期

正式陳述己方意見，雙方傳訊證人，質詢程序，以期影響陪審團，而陪審團經過討論與溝通後，完成建議書(秦夢群，1997)。

若一項政策具有下列特殊性，即可選用司法評鑑模式為評估項：關於公眾利益的政策；重大且影響甚鉅的政策；內容複雜，涉及政治、社會乃至於心理層面的政策；走向不明確、相互矛盾之政策；有極大爭議性，且為利益團體爭逐之政策。

(七) 背景、輸入、過程、成果評鑑模式(Context,Input,Process,Product；CIPP) Stuffelbeam(1971)認為評鑑旨在描述、取得及提供資料，以供作為判斷或決定方案之用。背景評鑑旨在提供確定目標的依據，輸入評鑑則在確定如何運用資源以達成目標，過程評鑑則係提供定期回饋予負責實施計畫的人，而成果評鑑則在瞭解教育系統產生的結果(郭昭佑，2000)；評鑑人員盡力去描述、蒐集和提供有助於決策者做決定的資料。

(22)

依據 Stuffelbeam 的說法，決定和目的或方法有關，也與意圖或實際有關，

認為所有的教育決定，依其功能都可劃分為四類(楊文雄，1981)：意圖的目的(即目標)；意圖的方法(即程序設計)；實際的方法(即使用程序)；實際目的(即成就)。

依據上述分類法又將決定分成四類：設計決定(即決定目標)；構造決定(即設計程序)；實施決定(即使用、控制和改善程序)；循環決定(即對產出的判斷和反應)。

評鑑類型與決定類型及其功能關係對照如圖 2-2 示之：

意圖的實際的設計決定

(由背景評鑑支持)

循環決定

(由成果評鑑支持) 目

的方法

構造決定

(由投入評鑑支持)

實施決定

(由歷程評鑑支持) 圖 2-2 決定類型與評鑑類型對照圖

資料來源：江文雄(1982)。

根據上述分析，茲將 CIPP 評鑑模式以圖 2-3 所示：

背景

設計決定

投入

構造決定

歷程

實施決定

成果

循環決定

圖 2-3 Stufflebeam CIPP 評鑑模式架構圖(1971) 資料來源：楊文雄(1982)。

吳明清(2001)認為 CIPP 模式提供了一個較為完整的評鑑架構，可以在方案規劃階段進行，亦可以在方案執行後實施；且既可以分項評鑑，亦可以整體評鑑；

(23)

如以 CIPP 模式為主幹，融合目標導向及判斷導向的精神和優點，並兼採質化導向的評鑑方法，則可能建構一個比較理想的評鑑模式。

(八) Smith 和 Andrews 校務評鑑模式

Smith 和 Andrews(1987)根據臨床視導的觀念，設計了一套校務評鑑模式，

將評鑑過程分為三個階段—設計、資料蒐集、分析與評鑑。各階段活動安排實施時間表，並列出視導人員與校長在一學年內應完成的具體活動，各階段活動概述如下：

1. 第一階段—設計

開學前視導人員與校長會商未來一年的計畫，檢視前一年的目標，訂定來年的目標，提出行動方案及評鑑每一目標的工具，並安排訪視人員訪視日期。

2. 第二階段—資料蒐集

在一學年間，視導人員及校長各自蒐集有關評鑑目標及規準的資料；視導人員也會安排期中評鑑會議，與校長會商，評估校務推展情形，進而修正調整之，

並適時補充資源，以協助校長辦學成功。而透過直接的視導，視導人員可檢視校長的領導作風、校務運用實況，瞭解學校風氣及社區人士的參與情形。

3. 第三階段—分析與評鑑

在學年的最後一個月，視導人員再與校長會商，比較分析一年來蒐集的資料，即可瞭解學校辦學的績效，並確認應行改進之處，導引學校進入另一個循環期(張清濱，1997)。

此一評鑑模式可顧及各校背景、資源、需求的不同，以及訂定目標的不同，

同時以個別視導的方式，予以具體的評鑑標準，協助學校朝向新的目標發展，績效亦較易評估。惟其主要條件是視導人員須具備高度的教育及評鑑專業知能，方有能力引導學校校務正確發展。

總而言之，評鑑模式的多元導向，顯示學者觀點確有歧異之處，亦顯示教育評鑑的複雜性；然如何因應評鑑目的及個別需求，擇定一種評鑑模式或兼採數種適用之評鑑方法結合應用，或許能發展出一個更適合現況的校務評鑑方法。

(24)

二、指標建構

游進年(2003)教育評鑑指標的建構涉及指標的選定、建構過程以及方法等；

就指標的選定而言，經濟合作發展組織之社會組織工作小組(OECD,1982)認為應考量以下標準：結果性、政策關聯性、穩定性、可分割性、可比較性、可描述性、

以及實用性等七項。依據馬信行(2000)的研究指出，均等指標與品質指標均應包括在教育評鑑指標之內。是以，學校評鑑的指標結構需涵蓋知識的取得、成就的壓力與專業教學的條件。郭昭佑(2000)考量學校本位評鑑指標系統的選擇，歸納出四種學校評鑑指標：規範指標系統、借用指標系統、修訂指標系統與發展指標系統。

至於教育評鑑主要指標的建構方法則包括：德懷術、專業團體、專家判斷、

提名小組、焦點團體、以及問卷調查法(郭昭佑，2000；Greenber,1999)各種方法均有其優缺點；故建構指標時應儘量採用多種方法，以獲致較佳的共識與觀點。

教育評鑑標準的建構，首先係由 Guba，Stufflebeam，以及 PDK 研究委員會 (Phi Deta Kappa Study Committee)所提出，計包括內部效度、外部效度、信度、

客觀性、相關性、評鑑範圍、重要性、公信力、時效性、流通性、與效率等十一項(Stufflebeam,1974)，在這些標準當中，第一至四項屬於評鑑技術的適用性，第五至十項為評鑑的效用性，第十一項標準則涉及評鑑的成本效益，而這些標準即為日後美國「教育評鑑標準委員會」所發展出來的《教育方案、計畫及資料評鑑 的標準》(The Standards for Evaluations of Educational program, Project, and Material)的基礎。

上述《教育方案、計畫及資料評鑑的標準》係於 1981 年首度出版，並於 1994 年將部分內容予以修訂，除了評鑑的細目與用字遣詞略有調整外，最重要的意涵乃在於其能因應時勢的遞移，並配合評鑑發展與需求：一方面擴大其使用範圍，

一方面增刪標準的內容，以維持評鑑標準擴充之後的適用性，並將學校、大學、

法律、醫學、護理、軍事、商業與社會服務機構納入適用範圍。其目的旨在發展適用於學校及其他教育相關活動的評鑑參考所列標準分成四部分，共計三十項

(25)

(The Joint Committee on Standards for Educational evaluation,1994)：

(一) 適用性(utility)

利害關係人的確認、評鑑人員的公信力、資料的範圍和選擇、報告的清晰度、

報告的流通、評鑑的影響。

(二) 可行性(feasibility)

實際的程序、政治的可行性、成本效益。

(三) 正當性(propriety)

服務導向、正式的協議、人類主體的權利、人際的互動、徹底與公正的評估、

結果的報導、利益的衝突、會計的責任。

(四) 精確性(accuracy)

方案的簽署、脈絡的分析、目的與程序的描述、可靠的資料來源、有效的資訊、可信的資訊、系統化的資訊、量化資料的分析、質化資料的分析、正當可靠的結論、客觀的報告、後設評鑑(轉引自游進年，2003)。

吳和堂(2004)則將評鑑的規準分為主規準、次規準以及細規準三個層面，分述如下：

(一) 主規準

此為規準中最初始的分類，其涵蓋範圍大，以臺北市的校務評鑑為例，包括行政管理、課程教學、專業發展、訓導輔導、家長參與、學校特色等(吳清山，

2002)；而英國中小學校務評鑑主要規準計有學生學習表現、課程設計、學生出席率、就業狀況(張德銳、李俊達，2001)。

郭昭佑(2000)歸納國內外研究，主要的評鑑規準依序為學生學習表現、教學品質、環境規劃、校長領導、家長參與、教師工作滿足、課程安排、學校組織氣氛、溝通協調、組織產能、學校發展、適應力等領域。

(二) 次規準

將前述主規準再細分成幾條概念較明確，涵蓋範圍較小的規準成規準；其作用只要是將主規準再進一步的具體化。

(26)

(三) 細規準

將每條主規準或次規準分成概與範圍具體明確者，而稱為細規準，又稱為指標，其為評鑑的統計量，用來描述教育現況與健康情形(Oakes,1986；Odden,1990；

轉引自吳和堂，2004)；每一個指標代表一個行為表現，其作用猶如教案中的「具體行為目標」，能具體明確指出所欲達成的目標。因細規準是評鑑時的依據，須具體可察的，所以指標用來測量事物的品質或數量。

指標本身是價值中立，須藉助某些準則，才能作價值判斷。而指標要有利用價值，必須符合可計量、簡明、容易判斷，具有效度等原則(吳清山，2002a)。

然評鑑細規準若較為抽象，或一部分較為抽象，不易在短時間內具體而明確的加以判斷，往往不易提供具體而詳細的資料(高新建，2003)。

游進年(2003)認為，教育評鑑指標與標準的建構涉及價值的選擇與判斷，故易衍生爭議，就中小學校務評鑑而言，各縣市的評鑑項目各有所不同，而內容大抵包括：理念與目標、計畫與推動、領導與溝通、革新與發展、行政效能、課程教學、學生輔導、環境設施、教師專業與資源整合等層面，而各層面在建構各項評鑑指標大體上已能符合前述的要求，然會引起爭議之處乃在於建構過程與詮釋，如基層教育實際工作者的觀點與解讀不同；教育現場全貌未被重視或納入；

指標的歸類混淆不清或重疊等。

第二節我國校務評鑑實施現況之探討

本節係就我國教育評鑑的萌芽及當時受到國外評鑑方案的實施與評鑑概念的影響予以探討。

壹、我國目前校務評鑑現況

秦夢群(1997)綜合教育評鑑界 Madaus、Stufflebeam 以及 Scriven 等人的研究，認為教育評鑑的發展沿革計有下列六個時期：(一)改革時期(age of reform，

1800-1900)；(二)效率與測驗時期(age of efficiency and testing，1900-1930)；(三)

(27)

泰勒時期(Tylerian age，1930-1945)；(四)純真時期(age of innocence，1946-1957)；

(五)擴張時期(age of expansion，1958-1972)；(六)專業時期(age of professionalization，1973 至今)。

而促使教育評鑑逐漸受到重視的原因略述如下：教育資源日漸短絀、公立學校辦學績效遭質疑、課程與教學方法的更新、自由市場化的要求等；教育評鑑的起源，遠因係深受科技進步因素的影響，而近因為教育生態的蛻變與轉型則為不容忽視的重要因素。其中又以績效責任運動(accountability movement)對於教育評鑑具有深遠的影響，由於績效責任的概念含有成本效益分析與成果評鑑之意，因此，評鑑乃成為績效制度中不可或缺的一部分。

依據 Popham(1975)的研究指出，人類歷史上較正式的評鑑活動，最早見於中國的文官考試制度上，但直至民國 53 年至 58 年所實施「國民教育發展五年計畫」的評鑑，才可視為我國教育評鑑的開始。盧增緒(1985)歸納促成的背景因素如下：

一、以評鑑來檢驗教育方案實施成效的觀念開始萌芽

為加強基礎教育並因應世界教育潮流，教育部於民國 53 年提出第一個「國民教育發展五年計畫」，係為了解其實施成效，遂有教育評鑑之議；是項評鑑係由聯合國教科文組織兒童基金會協助參與，期中、期末報告亦分別於民國 56、

59 年提出。此番評鑑為亞洲風氣先河，播下教育評鑑的種子，為日後各項評鑑奠定基礎。

二、受到國外評鑑方案的實施與評鑑概念的影響

「國民教育發展五年計畫」的評鑑時間，與美國「初等與中等教育法案」

(Elementary and Secondary Education Act，1965，簡稱 ESEA)頒布時間相近，故 評鑑的設計多少受其影響，形成性評鑑與總結性評鑑並行概念亦開始形成。

就蘇錦麗(1993)及楊文雄(1981)研究之所得，我國首次的學校評鑑則於民國 57 年開始辦，省教育廳依據所頒布的「臺灣省國民中學校務設施評量表」，進行國民中學輔導工作評鑑，接著於民國 63 年指定若干高中試辦學生評量與輔導工

(28)

作，後來教育廳為瞭解試辦的情形，以作為改進參考依據，乃制定「高級中學試辦學生評量與輔導工作評鑑表」，逐年辦理評鑑工作。此二項評鑑為試辦與局部辦理性質，但已顯然成為我國學校評鑑之濫觴。

而潘慧玲(2003)談及國內教育評鑑的實施，可溯自民國 50、60 年代，然積極推動則屬近幾年之事，尤其民國 84 年「國民教育法」修訂，將校長辦學績效納入遴選之考量，評鑑之風盛行。另為講求績效責任，大學評鑑、後期中等教育評鑑(包括高中、職、綜合高中與完全中學評鑑等)，亦接連實施。然以上所述之評鑑，均由學校外部人員所執行，是一種外部評鑑，其目的重在總結性評鑑。惟除此之外，評鑑亦可由學校內部人員進行，如此做時，則屬一種內部評鑑。

多年來，國內學校評鑑以校務評鑑為主，而校務評鑑卻又採以專家意見導向的評鑑模式：由學校先行自評，再由專家以半天至二天不等的時間進行實地訪評；係屬完全側重外部評鑑的模式，然而在當今講求學校本位管理的教改氣氛下，宜有所調整。易言之，除實施外部評鑑的校務評鑑外，也要呼籲推動一種以學校為基地，所進行的自發性評鑑，亦即學校本位評鑑(school-based evaluation)。

學校本位評鑑可採內部評鑑，亦可結合內外部評鑑，而其實施，除能彰顯學校自主性，要求學校擔負起績效責任外，亦可促進教師彰權益能(teacher

empowerment)。

貳、國小校務評鑑探討

本小節係以我國教育基本法及國民教育法暨其施行細則等相關法令的頒布後，主管教育行政機關所實教育研究與評鑑工作，並以臺北縣市、高雄縣市、臺中縣等辦理校務評鑑概況予以分析討論。

一、我國國民小學校務評鑑現況概述

由於教育基本法及國民教育法暨其施行細則的頒布，明訂主管教育行政機關應加強教育研究與評鑑工作，以提升教育品質，並對於校長之遴聘應就其辦學績效詳為評鑑，以作為應否繼續遴聘之依據。

(29)

各縣市政府基於執行法令與檢核教育品質與成效之需要，各有不同處理方式，部分縣市實施分項評鑑，而部分縣市則實施整體評鑑；部分縣市實施校長評鑑，而部分縣市則實施校務評鑑。茲就臺北縣市、高雄縣市、臺中縣等辦理校務評鑑概況，摘述如下並以表 2-2 示之。

表 2-2 臺北縣市、高雄縣市及臺中縣等辦理校務評鑑概述表

縣市名稱

臺北市高雄市臺北縣高雄縣臺中縣

評鑑目的

1 探討學校教育政策成效，回應社會對教育改革的期望。

2 瞭解各學校辦績效及特色，提供主管教育行政機關推動教育改革之參考。

3 發現學校的困難，謀求改進策略，提升教學品質。

4 激發學校教師與行政人員士氣，強化自我成長，創造優質教育環境。

1 瞭解學校經營現況。

2 診斷學校教育問題。

3 提昇學校教育品質。

4 促進學校發展特色。

5 持續學校校務發展。

為瞭解縣立中小學辦學成效、困境及協助學校發展特色。

1 檢核學校辦學績效，提供行政決定的資訊，並作為校務改進之依據。

2 激勵學校士氣，凝聚學校教學與行政之共識，提升學校教育品質。

3 整合年度例行評鑑，簡化學校行政工作，並瞭解各校校務推展現況。

1 協助學校改進校務，提升教育品質。

2 激勵教育人員士氣，促進專業成長。

3 評定學校績效，提供決定的資訊。

評鑑期程

九十學年度起實施，預計四年完成。

八十七學年度起實施，九十一學年度修正，以三年為期(第一年各校自評、第二年評鑑小組評鑑、第三年追蹤評鑑)

八十八學年度起實施，分第二階段進行，為初評對象、複評對象。

八十八學年度起實施。

八十九學年度起實施。

評鑑對象

全市國民小學。全市國民小學。

全縣國民中小學。

校長任期屆滿及有意參加校

將全縣分為國中組、國小甲

(30)

表 2-2（續)

縣市臺北市高雄市臺北縣高雄縣臺中縣長遴選之學校組、國小乙組

三組。

評鑑內容

組織與行政、課程與教學、訓導與輔導、環境與設備、教師與專業、家長與社區。

學校經營、教學實施、學校特色。

行政規劃與校務運作、課程實施與教學活動、訓輔措施與學生表現、環境營造與設備維護、社區互動與家長參與、行政支援與支持系統、經費使用績效。

校務行政、校務工作、訓導工作、總務工作、輔導工作、學校特色。

一般行政與校長領導、課程與教學、訓導實施、輔導活動、環境與設備、人事與會計、社區關係、教師專業與研究發展。

1 辦理校務評鑑說明會

2 學校自評 3 委員評鑑(審查資料、晤談、綜合座談、撰寫評鑑報告)

4 追蹤輔導

1 辦理校務評鑑工作說明會 2 校內自我評鑑

評鑑程序與方式

3 小組評鑑(評鑑說明、學校簡報、現場評鑑、綜合座談)

1 辦理受評學校會議

2 辦理校務評鑑作業會議 3 評鑑小組評鑑一至二天(簡報、參觀、資料查閱、問卷、與教職員工生及家長晤談、綜合座談、填寫評鑑結果)

1 辦理校務評鑑內涵研習 2 學校自我評鑑與訪問評鑑 (聽取簡報、觀察學校教育活動、訪問有關人員、與教職員工生座談、

檢核資料)

1 辦理受評學校說明會 2 辦理行前說明會

3 自我評鑑 4 委員評鑑(聽取簡報、進行訪視、綜合座談、書面報告) 5 受評學校提出改進方案 6 複評 7 追蹤輔導

評鑑結果處理方式

評鑑結果以質性敘述，不排等級亦不獎勵。

1 評鑑標準採

“符合”或“不符合”二項。

2 評鑑結果評鑑指標均達百分之八十以上

“符合”者，有功人員嘉獎一次之獎勵；未達百分之六十以上“符合”

者，相關人員

計分優、良、尚可、待改進四個等級，評鑑結果送受評學校參考，如有補充意見得向評鑑小組說明；受評優良學校得予敘獎。

訂有各項目計分方式，成績採五等第 (優、甲、乙、

丙、丁)。

公布評鑑成績優良學校(特優、優等、甲等、乙等、丙等)，並施予獎勵或懲處。

(31)

表 2-2（續)

縣市臺北市高雄市臺北縣高雄縣臺中縣列入年度考核

或予以懲處。

3 評鑑指標“不符合”由學校相關人員或教師於一個月內提出改進計畫，並接受追蹤；評鑑結果提供資源分配及人事考核的參考。

備註完全質化評鑑，

提供學校回饋，

並接受學校申訴。

落實追蹤評鑑機制，將教師評鑑納入校務評鑑系統。

資料來源：研究者自行彙整

綜上所述，歸納以上五縣市校務評鑑實施，茲分別就評鑑目的、評鑑內容、

評鑑方式、評鑑程序、評鑑結果處理方式等歸納如下：

(一) 評鑑目的

國內各縣市實施校務評鑑最主要的目的計有檢核辦學績效，提供決策參考；

診斷學校問題，協助校務改進與發展；激勵教育人員士氣，促進專業成長；整合相關評鑑，推動教育政策以及提供校長遴選之參考等。

(二) 評鑑內容

應可涵蓋目標與願景、課程與教學、訓導與輔導、組織與行政、專業發展與研究、環境與設備、社區關係與家長參與、學校特色以及經費使用等項目。

(三) 評鑑方式

評鑑方式不外乎採用自我評鑑與評鑑小組到校訪問評鑑等方式，且均採用評鑑表進行評鑑，而資料的蒐集則採晤談、座談、觀摩、查閱資料等方法進行。

(四) 評鑑程序

(32)

評鑑進行程序計有簡報、實地參觀、檢閱資料、晤談教職員工生、綜合座談等。

(五) 評鑑結果處理方式

上述各縣市對於評鑑結果列有應改進項目，均實施追蹤輔導，以協助校務改善，而部分縣市對於評鑑績優學校訂有獎勵規定，部分縣市將結果作為校長遴選之依據或參考等。

二、桃園縣國民小學校務評鑑的概況

有鑒於自民國 88 年教育基本法公布後，其中第十三條關於提升教育品質與促進教育發展，暨國民教育法第九之一條及其施行細則第十一條所示校長遴選迭度需就校長辦學績效予以評鑑，以為遴聘之依據以及優先遴聘之考量。

再者，桃園縣政府為因應教育改革之趨勢，提升學校效能之所需，首度於 89 學年度實施校務評鑑工作；次年，即 90 學年度桃園縣全縣國民中、小學計有 52 所學校參加評鑑，並於評鑑辦理完畢後，邀集評鑑規劃小組及擔任該學年度評鑑委員等就該學年度校務評鑑作業之優劣進行檢討，以作為未來辦理校務評鑑作業之改進方向。

桃園縣政府為期所實施之校務評鑑工作規劃、設計與實施能更為精進與週妥，於 91 學年度，亦即該縣實施國民中小學校務評鑑之第三學年，於擬訂該學年度校務評鑑工作計畫之前，特延聘專家學者籌組該縣校務評鑑諮詢顧問團，應聘學者專家計有黃萬益教授、吳明清教授、陳惠邦教授、潘慧玲教授、楊思偉教授、張美玉教授、顏國樑教授等，為期廣徵意見，期間並邀集該縣校長、家長會長協會及教師會代表協助研擬評鑑指標修訂事宜，進而修訂頒布「桃園縣中小學校務評鑑實施要點」暨桃園縣辦理學年度中小學校務評鑑工作計畫，以作為針對所轄中小學校務評鑑的實施之依據。

而 92 學年度桃園縣國民中小學校務評鑑的實施，即桃園縣政府依據上述校務評鑑實施要點之規定頒訂「桃園縣辦理九十二學年度中小學校務評鑑工作計畫」據以實施，亦即為桃園縣政府修正所頒訂國民中小學校務評鑑相關規定後據

(33)

以實施國民中小學校務評鑑工作之第二年，茲可就新修訂之桃園縣國民中小學所實施校務評鑑工作相關事宜進行研究，以瞭解其實施概況、優劣以及受評學校人員對校務評鑑的覺知情形，協助主管教育行政機關建立長久可行之校務評鑑機制。

茲就「桃園縣中小學校務評鑑實施要點」(2003)暨「桃園縣辦理九十二學年度中小學校務評鑑工作計畫」(2004)、「桃園縣辦理九十三學年度中小學校務評鑑工作計畫」(2005)以及「桃園縣辦理九十四學年度中小學校務評鑑工作計畫」

(2006)之評鑑目的、評鑑對象、評鑑項目、評鑑方式、評鑑實施期程暨評鑑運用等摘述如下：

(一) 評鑑目的

了解學校辦學績效，促進校務興革；激勵學校團隊士氣，發揮專業功能；整合例行評鑑工作，提升行政效能；評析學校特色文化，帶動多元發展。

(二) 評鑑對象

桃園縣縣立中小學校長任期屆滿學校及自願參加學校；桃園縣政府教育局依 視導會報決議，擇定受評學校。

(三) 評鑑項目

評鑑項目計有校務發展、教務發展、訓導發展、總務發展及輔導發展等五大項目，各項目下均訂定有五個評鑑重點，且評鑑重點一至四之下均設有一至六個不等的評鑑指標；然評鑑重點五因設定為其他，而未訂定有評鑑指標，授權由受評學校自行訂定評鑑指標，係有鑒於評鑑重點一至四所訂定之評鑑指標未能充分涵蓋受評學校所欲彰顯之學校辦學特色，而為之特有設計。

(四) 評鑑方式１、學校自我評鑑２、評鑑小組評鑑

由桃園縣政府教育局遴聘學者專家籌組評鑑小組。

３、評鑑程序

(34)

評鑑小組赴受評學校後，進行程序為學校簡報、校園訪視、查閱資料、

人員訪談、評鑑小組會議、綜合座談等；評鑑委員基於評鑑需要或協助受評學校校務發展，得於評鑑實施期間自行擇期前往訪視。

(五) 評鑑運用

各校自我評鑑結果作為校務發展改進依據；評鑑小組評鑑結果評定之缺點及改進意見，桃園縣政府教育局列管追蹤輔導，以協助受評各校改進；評鑑總評報告由教育局公告，具有特色值得推廣之學校則推介參考或前往觀摩學習 (詳見附錄一)。

第三節我國校務評鑑相關研究之探討

國內外對於教育評鑑的研究文獻頗為豐富，若一一臚列恐使文獻資料過於龐雜，本節擬僅就近年來針對我國國民小學校務評鑑之相關研究文獻，加以歸納整理，如表 2-3 所示：

表 2-3 國民小學校務評鑑之相關實證研究一覽表研究者

(年代)

研究主題研究對象研究方法研究發現摘要

陳劍賢 (2002)

國民中小學校務評鑑之研究- 以臺東縣為例

臺東縣國民中小學

問卷調查 1.校務評鑑對學校校務之發展很重要，應納入學校計畫辦理。

2.臺東縣校務評鑑的實施要點暨評鑑指標，仍待溝通、探討。

3.評鑑重心已由訪問評鑑價值與事實的判斷變為自我評鑑決策的歷程。

4.評鑑委員應由專業素養、公平、公正學者專家組成。

5.評鑑結果擇優公布，以鼓勵學校的士氣。

(35)

表 2-3（續)

研究者研究主題研究對象研究方法研究發現摘要

6.後續評鑑的追蹤管制，解決學校的困難。

1.校務評鑑是改善國民小學教學品質、診斷學校缺失的重要手段，其目的若為品質導向，應協助學校改進。

蘇秀花 (2002)

臺北市國民小學校務評鑑實施成效及整合之研究

臺北市公私立國民小學

文件分析問卷調查

2.校務評鑑的實施是學校所有人的職責。

3.外部評鑑診斷的趨勢，應建立在落實自我評鑑，達到改進校務，提升教學品質的功能。

4.評鑑種類過多，分割學校人力與資源，應整合建構「整體學校評鑑」。 5. 校務評鑑在臺北市國民小學實

施，最大的優點是促進學校定期自我檢核。

6.校務評鑑實施在國民小學，最大的問題是評鑑書面作業干擾學校正常運作、影響判斷價值的最重要因素是評鑑標準與內容的確定、以及改善教學品質的重要教育活動。

7.校務評鑑辦理的時間以第二學期末結束前一個月最適，評鑑天數以一至三天為宜。

8.校務評鑑受評學校的擇定，以自願申請參加，並以週期規範參加較為理想。

9.校務評鑑規劃辦理單位，由各國民小學聯合組成評鑑小組辦理，提供一種由同儕角度檢視。

10. 提出可行的校務評鑑步驟之設計。

(36)

表 2-3（續)

研究者研究主題研究對象研究方法研究發現摘要

11.校務評鑑委員組成應發揮專業、

客觀、具實務經驗之角色功能，並建立評鑑專業人才庫。

12.校務評鑑結果宜以文字敘述，不作等第排名，並作為補助學校經費之依據。

潘俊程 (2003)

臺中縣國民小學校務評鑑之研究

以 89、90 學年度接受臺中縣政府教育局校務評鑑之國民小學受評學校

文獻分析問卷調查訪談

1. 國民小學教育人員接受校務評鑑，會感受到很大的壓力與焦慮，

尤其是主任與組長。

2.評鑑指標在評鑑後應參考各層面的改進建議，作適當的整合與修正。

3. 各校對於接受校務評鑑相當重視，並且認為在評鑑的過程中受到重視。

4.校務評鑑未整合其他訪視、考核，

無法減輕學校的負擔。

5.對於評鑑委員的建議，學校有信心可以針對缺失、持續改進。但教育行政機關應繼續追蹤，落實校務評鑑的正面功能。

6.評鑑結果的公平性與客觀性受到質疑。

7.對於臺中縣校務評鑑各向度及單題的認同度，校長最肯定，組長的認同度則偏低。

8.職務別是造成受試者填答差異的最主要因素，服務年資與教育程度次之。

洪梓祥 (2003)

臺中縣國民小學實

臺中縣國民小學接

文件分析深度訪談

1.校務評鑑的實施受到學校人員重視與肯定，並能坦然接受，無排斥與抗拒的現象。

第二章

第二章 文獻探討

第一節 教育評鑑相關理論之探討

第二節 我國校務評鑑實施現況之探討

第三節 我國校務評鑑相關研究之探討

第二章文獻探討

第一節教育評鑑相關理論之探討

第二節我國校務評鑑實施現況之探討

第三節我國校務評鑑相關研究之探討