第二章 文獻探討
第三節 第四代政策評估理論
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
第三節 第四代政策評估理論
壹、政策評估的意涵 一、政策評估的定義
關於評估一詞,Weiss(1998)認為評估是指對某項政策或某個政府方案的運作 或結果進行系統性的評量,利用明示或隱示的標準互相對比,用來當作政策或方 案改進的一種方式。其中包含五個概念(吳定,2008):
(一)系統性評量(systematic assessment),評估過程是遵照一套有邏輯的標 準程序,而這套標準是被社會大眾所接受與檢視,來進行嚴謹的評估 工作。
(二)評量方案的運作(operation),評估的焦點在於政策執行的經過,例如研 究方案是否依照原計畫進行或多大程度符合原計畫的規定。
(三)評量方案的結果(outcomes),評估的焦點在於政策的結果和影響,例如 一項政策實際的策效果是否如預期或政策標的受到什麼影響。
(四)設定比較的標準(standards for comparison),將政策的成果與預先設立 的標準互相比較,以評斷政策是否成功。
(五)評估的目的在改善方案與政策(the improvement of program and policy),
政策評估的目標在於使政策或方案變得更好,順利運作,將資源有效 分配到效益較高的方案上。
下列是各國學者對於政策評估的定義:
Nachmias 和 Nachmias(1979)指出政策評估是客觀、系統與經驗地檢視現行 政策,並以目標成就檢視公共計畫的標的。
Rossi 和 Freeman(1982)對政策評估研究的解釋,是指有系統地應用社會研究 程序,評量社會干預方案之概念化與設計、執行及效用。
Hanekom(1987)認為政策評估是政策內容、執行與衝擊的評審或評鑑,以決 定特定政策目標完成的程度。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
林水波和張世賢(2006)對政策評估的界定,有系統和客觀的資料蒐集與分 析,進行合理判定政策的投入、產出、效能與影響的過程;而其主要的目的在於 提供現行政策運行的實況及其效果之資訊,以為政策管理、政策持續、修正,或 終結的基礎,擬訂未來決策的方針,發展更為有效和更為經濟的政策。
吳定(2006)定義政策評估指政策評估人員利用科學方法與技術,有系統地 蒐集相關資訊,評估政策方案之內容、制訂與執行過程及執行結果的一系列活動。
其目的在提供選擇、修正、持續或終止政策方案所需的資訊。
綜合國內外學者對於政策評估的見解,政策評估的意義在利用科學方法,蒐 集有關政策的相關資訊,對一項政策進行系統性的評估,其研究範圍包含政策執 行前、執行中到執行後,以及執行成果和政策影響。而評估的結果可做為政府改 進、終止、持續該政策的一項重要依據。
二、政策評估的內涵
丘昌泰(2013)基於政策評估的定義,認為應包含下列五種內涵:
(一)政策評估的對象,分為目標實現程度的評估和政策衝擊或影響程度的 評估。
(二)政策評估的方式應採用多元社會科學研究方法,分為實驗設計的量化 方法和自然調查的質化方法。
(三)政策評估人員包含外部和內部評估者,外部例如第三方評估研究的組 織,內部則是政府部門的官方評估。
(四)政策評估的內容有政策產出和政策結果,政策產出指政策執行後政策 標的真正接收到的財貨、資源或服務,但看不出政策影響;政策結果 指政策標的因政策產出可能有行為或態度的改變,對社會帶來的影響,
或可能帶來新的社會問題,因此更具實際意義。
(五)政策評估的過程是研究政策與政策結果之間的因果關係,經常透過政 策監測(policy monitoring)來了解政策是否達到預期的效果,常規化的 政策監測是定期檢視政策成效的方法。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
三、政策評估的特質
Dunn(2004)認為政策評估有四項特質:
(一)以價值為焦點(value focus),政策評估要判斷政策的價值,而價值反映 在政策目標上,因此需衡量政策目標的適切性與必要性。
(二)價值與事實互賴(value-fact interdependence),政策評估需考量政策價 值與事實的互動,才不會產生和現實生活脫節的情形。
(三)目標與過去取向(present and past orientation),政策評估是一種回溯性 的評估,不但要衡量當前的政策發展,發展方向是否按政策預定進行,
除此之外還要蒐集政策過去的發展狀況,以對政策或政策目標來改善。
(四)價值雙重性(value duality),政策評估同時具有內在和外在價值的雙重 性,內在價值為政策的直接目標;外在價值為政策的間接目標。為政 策完成後的外溢效果,兩者都會對政策目標產生實質影響。
四、政策評估的功能
政策評估檢測政策結果和政策執行時潛在的問題,評估結果將反饋給決策者 做為政策改進的依據,因此政策評估有下列功能(丘昌泰,2013):
(一)提供政策績效的相關資訊,利用科學方法對政策績效進行評估。
(二)重新審視政策目標的適切性,當不如預期時能即時修改政策方向。
(三)當評估結果顯示政策難以實行或不符合目標時,就會形成新的政策問 題,以待政府解決。
(四)做為政策建議和未來修改方向的基礎,以判斷是否需要終止或修正政 策內容。
五、政策評估的標準
政策評估標準能做為評估者在進行政策評估時的參考和比較標準,以確定政 策是否有達到設立時的目標,目前政策評估標準沒有一個統一的參照標的,但各 個標準間差異不大,茲列出幾位學者所建構的評估標準,作為後續本研究建立評 估標準時能依循的典範:
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
(一)Sabatier 和 Mazmanian(1979):問題可處置性(tractability of the problem)、
法令規章執行能力(ability of statute to structure implementation)、影響 執行的非法規變項(non-statutory variables affecting implementation)。
(二)Nakamura 和 Smallwood(1980):政策目標達成(policy goal attainment)、
效 率(efficiency) 、顧 客支持度 (clientele constituency) 、顧客回應性 (clientele responsiveness)、系統持續性(system maintenance)。
(三)Starling(1988):產出(output)、外部性(externalities)、效率(efficiency)、
策略(strategy)、順服(compliance)、公平(justice)、介入效果(intervention effect)。
(四)Dunn(1994):效能(effectiveness)、效率(efficiency)、充分(adequacy)、
回應(responsiveness)、公平(equity)、適切(appropriateness)。
(五)顏國樑、宋美瑤(2013):目標計畫達成度、政策設計的妥適性、執行 者的態度與意向、回應性的感受。
貳、政策評估的理論發展
Y. S. Lincoln 與 E. G. Guba(1989)在《第四代評估》(Fourth Generation Evaluation) 中,將政策評估研究的演化過程分成四個階段,前三個階段以實驗設計為主,量 化評估為主要的研究方式,從客觀的角度審視政策;第四階段以社會建構為主,
質化評估為主要的研究方式,以主觀的角度來回應政策實施的結果,以下就各個 階段分別予以探述:
一、第一代政策評估:實驗室實驗
又稱為測量評估(measurement evaluation),在這個時期中的政策評估皆以實 驗室內的科學評量工具所完成。受到泰勒科學主義的影響,非常強調科學管理原 則,因此測量方法以科學化為主。評估結果來自於政策對實驗組的影響,而研究 人員運用測量技術衡量政策成效。但限制是研究範圍僅在實驗室,很有可能造成 無效率評估發生,而研究結果是否能推估到真正政策的結果,也受到社會質疑,
過於操作化也不符合現實的情況。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
二、第二代政策評估:實地實驗
又稱為敘述評估(discriptive evaluation),重視描述,除了延續上一代策量的 特性,評估轉而向實際場域進行研究,實地探訪是第二代評估的重點,發展出田 野實驗。研究者扮演描述者的角色,不只專注在測量工具上,而增加對政策標的 與現場的分析,根據預期目的與現實結果進行評估。缺點是過度客觀描述,忽略 掉研究者專業的判斷,價值中立的原則也讓評估無法深究。
三、第三代政策評估:社會或政策實驗
又稱為判斷評估(judgement evaluation),價值判斷是核心能力,評估人員對 政策結果進行評斷。這個時期受到許多社會問題的影響,發展的政策主要是用來 解決不公義的現象或改善現有的狀況,例如詹森總統的大社會(The Great Society) 計畫等社會實驗。評估者本身必須考量到各種不同的情況,對被評估者也要依照 他們的背景和需求做出判斷,對政策目標和價值也需要衡量,最後能讓政府設計 出適合、有效的政策以因應快速變化的時代。
四、第四代政策評估:回應建構評估
第一代到第三代的政策評估都有無法擺脫實驗設計的缺點,有鑑於社會科學 的複雜性不單單只是量化科學能夠涵蓋,人的內心也無法藉由量化評估能夠測量 和觀察,因此Guba 和 Lincoln(1989)對上述實驗評估進行批判,認為前三代的評 估有下列三項問題:
(一)過分重視管理手段,導致評估偏向管理主義(managerialism),本來管理 方式就只是評估工具的一部份,政策評估人員應注重實質的政策目標。
(二)適用於價值單元主義,未能調和當時社會的價值多元主義(value-pluralism)。
(三)過 分 主 張 邏 輯 實 證 論 的 科 學 調 查 方 法 , 忽 視 了 建 構 主 義 (constructionism)為主的自然調查方法。
基於上述前幾代政策評估的缺點,Stake(1975&1994)做為第一位提出了質化 評估的學者,他認為真實的政策評估資訊應該是由回應性評估的途徑(responsive
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
approach),其中具有下列特色:
一、將焦點放在政策計畫過程評估,而不只是政策計畫目的評估。
二、著重在回應政策利害關係人的需求。
三、以利害關係人的觀點反應政策成敗或表達政策建議。
四、強調利害關係人在政策的參與,藉此加強掌控他們的能力。
五、提倡個案研究方法。
第四代評估強調尋求概念性思維與思考,因此特別在意政策利害關係人的內 心感受。回應性評估認為評估人員應該擔任問題建構者,透過與利害關係人互相 交流的過程中,創造出利害關係人對政策問題的共識。
參、回應性政策評估的意涵
一、回應性政策評估的背景與定義
誠如上節所述,Guba 和 Lincoln 以為實驗設計的政策評估過分科學化,因此 提出自己的觀點與實驗評估做比較(丘昌泰,2013):
(一)實驗評估認為社會現象是客觀事實,可用量化分析;Guba 和 Lincoln 認為社會現象是公眾所建構出來,並非絕對客觀,當中有融入主觀的 意識。
(二)實驗評估認為評估者和被評估者是分立的,兩邊得保留一定的距離,
(二)實驗評估認為評估者和被評估者是分立的,兩邊得保留一定的距離,