第四代政策評估理論

第二章文獻探討

第三節第四代政策評估理論

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

第三節第四代政策評估理論

壹、政策評估的意涵 一、政策評估的定義

關於評估一詞，Weiss(1998)認為評估是指對某項政策或某個政府方案的運作或結果進行系統性的評量，利用明示或隱示的標準互相對比，用來當作政策或方案改進的一種方式。其中包含五個概念（吳定，2008）：

（一）系統性評量(systematic assessment)，評估過程是遵照一套有邏輯的標準程序，而這套標準是被社會大眾所接受與檢視，來進行嚴謹的評估工作。

（二）評量方案的運作(operation)，評估的焦點在於政策執行的經過，例如研究方案是否依照原計畫進行或多大程度符合原計畫的規定。

（三）評量方案的結果(outcomes)，評估的焦點在於政策的結果和影響，例如一項政策實際的策效果是否如預期或政策標的受到什麼影響。

（四）設定比較的標準(standards for comparison)，將政策的成果與預先設立的標準互相比較，以評斷政策是否成功。

（五）評估的目的在改善方案與政策(the improvement of program and policy)，

政策評估的目標在於使政策或方案變得更好，順利運作，將資源有效分配到效益較高的方案上。

下列是各國學者對於政策評估的定義：

Nachmias 和 Nachmias(1979)指出政策評估是客觀、系統與經驗地檢視現行政策，並以目標成就檢視公共計畫的標的。

Rossi 和 Freeman(1982)對政策評估研究的解釋，是指有系統地應用社會研究程序，評量社會干預方案之概念化與設計、執行及效用。

Hanekom(1987)認為政策評估是政策內容、執行與衝擊的評審或評鑑，以決定特定政策目標完成的程度。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

林水波和張世賢（2006）對政策評估的界定，有系統和客觀的資料蒐集與分析，進行合理判定政策的投入、產出、效能與影響的過程；而其主要的目的在於提供現行政策運行的實況及其效果之資訊，以為政策管理、政策持續、修正，或終結的基礎，擬訂未來決策的方針，發展更為有效和更為經濟的政策。

吳定（2006）定義政策評估指政策評估人員利用科學方法與技術，有系統地蒐集相關資訊，評估政策方案之內容、制訂與執行過程及執行結果的一系列活動。

其目的在提供選擇、修正、持續或終止政策方案所需的資訊。

綜合國內外學者對於政策評估的見解，政策評估的意義在利用科學方法，蒐集有關政策的相關資訊，對一項政策進行系統性的評估，其研究範圍包含政策執行前、執行中到執行後，以及執行成果和政策影響。而評估的結果可做為政府改進、終止、持續該政策的一項重要依據。

二、政策評估的內涵

丘昌泰（2013）基於政策評估的定義，認為應包含下列五種內涵：

（一）政策評估的對象，分為目標實現程度的評估和政策衝擊或影響程度的評估。

（二）政策評估的方式應採用多元社會科學研究方法，分為實驗設計的量化方法和自然調查的質化方法。

（三）政策評估人員包含外部和內部評估者，外部例如第三方評估研究的組織，內部則是政府部門的官方評估。

（四）政策評估的內容有政策產出和政策結果，政策產出指政策執行後政策標的真正接收到的財貨、資源或服務，但看不出政策影響；政策結果指政策標的因政策產出可能有行為或態度的改變，對社會帶來的影響，

或可能帶來新的社會問題，因此更具實際意義。

（五）政策評估的過程是研究政策與政策結果之間的因果關係，經常透過政策監測(policy monitoring)來了解政策是否達到預期的效果，常規化的政策監測是定期檢視政策成效的方法。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

三、政策評估的特質

Dunn(2004)認為政策評估有四項特質：

（一）以價值為焦點(value focus)，政策評估要判斷政策的價值，而價值反映在政策目標上，因此需衡量政策目標的適切性與必要性。

（二）價值與事實互賴(value-fact interdependence)，政策評估需考量政策價值與事實的互動，才不會產生和現實生活脫節的情形。

（三）目標與過去取向(present and past orientation)，政策評估是一種回溯性的評估，不但要衡量當前的政策發展，發展方向是否按政策預定進行，

除此之外還要蒐集政策過去的發展狀況，以對政策或政策目標來改善。

（四）價值雙重性(value duality)，政策評估同時具有內在和外在價值的雙重性，內在價值為政策的直接目標；外在價值為政策的間接目標。為政策完成後的外溢效果，兩者都會對政策目標產生實質影響。

四、政策評估的功能

政策評估檢測政策結果和政策執行時潛在的問題，評估結果將反饋給決策者做為政策改進的依據，因此政策評估有下列功能（丘昌泰，2013）：

（一）提供政策績效的相關資訊，利用科學方法對政策績效進行評估。

（二）重新審視政策目標的適切性，當不如預期時能即時修改政策方向。

（三）當評估結果顯示政策難以實行或不符合目標時，就會形成新的政策問題，以待政府解決。

（四）做為政策建議和未來修改方向的基礎，以判斷是否需要終止或修正政策內容。

五、政策評估的標準

政策評估標準能做為評估者在進行政策評估時的參考和比較標準，以確定政策是否有達到設立時的目標，目前政策評估標準沒有一個統一的參照標的，但各個標準間差異不大，茲列出幾位學者所建構的評估標準，作為後續本研究建立評估標準時能依循的典範：

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

（一）Sabatier 和 Mazmanian(1979)：問題可處置性(tractability of the problem)、

法令規章執行能力(ability of statute to structure implementation)、影響執行的非法規變項(non-statutory variables affecting implementation)。

（二）Nakamura 和 Smallwood(1980)：政策目標達成(policy goal attainment)、

效率(efficiency) 、顧客支持度 (clientele constituency) 、顧客回應性 (clientele responsiveness)、系統持續性(system maintenance)。

（三）Starling(1988)：產出(output)、外部性(externalities)、效率(efficiency)、

策略(strategy)、順服(compliance)、公平(justice)、介入效果(intervention effect)。

（四）Dunn(1994)：效能(effectiveness)、效率(efficiency)、充分(adequacy)、

回應(responsiveness)、公平(equity)、適切(appropriateness)。

（五）顏國樑、宋美瑤（2013）：目標計畫達成度、政策設計的妥適性、執行者的態度與意向、回應性的感受。

貳、政策評估的理論發展

Y. S. Lincoln 與 E. G. Guba(1989)在《第四代評估》(Fourth Generation Evaluation) 中，將政策評估研究的演化過程分成四個階段，前三個階段以實驗設計為主，量化評估為主要的研究方式，從客觀的角度審視政策；第四階段以社會建構為主，

質化評估為主要的研究方式，以主觀的角度來回應政策實施的結果，以下就各個階段分別予以探述：

一、第一代政策評估：實驗室實驗

又稱為測量評估(measurement evaluation)，在這個時期中的政策評估皆以實驗室內的科學評量工具所完成。受到泰勒科學主義的影響，非常強調科學管理原則，因此測量方法以科學化為主。評估結果來自於政策對實驗組的影響，而研究人員運用測量技術衡量政策成效。但限制是研究範圍僅在實驗室，很有可能造成無效率評估發生，而研究結果是否能推估到真正政策的結果，也受到社會質疑，

過於操作化也不符合現實的情況。

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

二、第二代政策評估：實地實驗

又稱為敘述評估(discriptive evaluation)，重視描述，除了延續上一代策量的特性，評估轉而向實際場域進行研究，實地探訪是第二代評估的重點，發展出田野實驗。研究者扮演描述者的角色，不只專注在測量工具上，而增加對政策標的與現場的分析，根據預期目的與現實結果進行評估。缺點是過度客觀描述，忽略掉研究者專業的判斷，價值中立的原則也讓評估無法深究。

三、第三代政策評估：社會或政策實驗

又稱為判斷評估(judgement evaluation)，價值判斷是核心能力，評估人員對政策結果進行評斷。這個時期受到許多社會問題的影響，發展的政策主要是用來解決不公義的現象或改善現有的狀況，例如詹森總統的大社會(The Great Society) 計畫等社會實驗。評估者本身必須考量到各種不同的情況，對被評估者也要依照他們的背景和需求做出判斷，對政策目標和價值也需要衡量，最後能讓政府設計出適合、有效的政策以因應快速變化的時代。

四、第四代政策評估：回應建構評估

第一代到第三代的政策評估都有無法擺脫實驗設計的缺點，有鑑於社會科學的複雜性不單單只是量化科學能夠涵蓋，人的內心也無法藉由量化評估能夠測量和觀察，因此Guba 和 Lincoln(1989)對上述實驗評估進行批判，認為前三代的評估有下列三項問題：

（一）過分重視管理手段，導致評估偏向管理主義(managerialism)，本來管理方式就只是評估工具的一部份，政策評估人員應注重實質的政策目標。

（二）適用於價值單元主義，未能調和當時社會的價值多元主義(value-pluralism)。

（三）過分主張邏輯實證論的科學調查方法，忽視了建構主義 (constructionism)為主的自然調查方法。

基於上述前幾代政策評估的缺點，Stake(1975&1994)做為第一位提出了質化評估的學者，他認為真實的政策評估資訊應該是由回應性評估的途徑(responsive

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

approach)，其中具有下列特色：

一、將焦點放在政策計畫過程評估，而不只是政策計畫目的評估。

二、著重在回應政策利害關係人的需求。

三、以利害關係人的觀點反應政策成敗或表達政策建議。

四、強調利害關係人在政策的參與，藉此加強掌控他們的能力。

五、提倡個案研究方法。

第四代評估強調尋求概念性思維與思考，因此特別在意政策利害關係人的內心感受。回應性評估認為評估人員應該擔任問題建構者，透過與利害關係人互相交流的過程中，創造出利害關係人對政策問題的共識。

參、回應性政策評估的意涵

一、回應性政策評估的背景與定義

誠如上節所述，Guba 和 Lincoln 以為實驗設計的政策評估過分科學化，因此提出自己的觀點與實驗評估做比較（丘昌泰，2013）：

（一）實驗評估認為社會現象是客觀事實，可用量化分析；Guba 和 Lincoln 認為社會現象是公眾所建構出來，並非絕對客觀，當中有融入主觀的意識。

（二）實驗評估認為評估者和被評估者是分立的，兩邊得保留一定的距離，

在文檔中高中體育班制度的回應性政策評估—以棒球專項為例 - 政大學術集成 (頁 47-0)

第二章 文獻探討

第三節 第四代政策評估理論

國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

第三節 第四代政策評估理論

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

‧ 國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y

第二章文獻探討

第三節第四代政策評估理論

立政治大學

第三節第四代政策評估理論

立政治大學

立政治大學

立政治大學

立政治大學

立政治大學