傾向分數配對法

第四章實證模型

4.3 傾向分數配對法

政策評估（policy evaluation）或制度評估（program evaluation）是在許多經濟學乃至其他社會科學（如社會學與政治學）的研究中扮演著非常重要的角色。

一則其使用的計量方法往往對於其後相關的計量經濟理論之研究中扮演著重要的角色，再者其所研討的議題往往也非常實務地具有很重要的政策意涵。相關的文獻在 Wooldridge（2002）以及 Wooldridge（2007）讀者可以找到非常完整的說明與回顧。所謂的政策評估或制度評估的研究方法，指的是研究者針對收集到的資料，在這些資料的樣本中，某些樣本可能參加某一計畫（program），其他的樣本則未參加該計畫，而評估的重點則在於參加該計畫與否是否在某一目標（政策目標）上有顯著的衝擊。例如這種制度評估，早先在勞動經濟學（labor economics）

中有非常多的討論與文獻，例如 Dehjia and Wahha（1999）探討是否接受勞工訓練之勞工，其接受勞工計畫的效果差異，除此之外，在教育經濟學（education economics）中，亦常被用來分析某一教育制度的變革之效果評估，例如 Angrist and Lavy（2001）分析教師參加在職訓練後，學生的成績是否產生影響。當然，此類的評估方法，在健康經濟學中亦是常被用來分析政策或制度評估的工具，例如，

Chou et al.（2003）以台灣家庭收支調查為資料分析台灣實施全民健保之後，家庭在預防性儲蓄（precautionary saving）上的衝擊，Winkelmann（2006）探討德國的健康保險制度，是否對一般病患的就診次數有所影響，陳昕等（2007）分析台灣健保制度下，部分負擔的改變（政策變動）之價格彈性估計，韓幸紋與連賢明（2008），探討健保部分負擔變動，對於兒童醫療利用的影響，謝鈺婷等（2008）

分析台灣論質計酬專案的效果評估，以及許績天與連賢明（2009）分析當家戶遭遇健康衝擊時，家戶成員消費，儲蓄，以及就業等面向的影響。

從計量經濟學的角度來看，這些制度評估或政策評估所要估計的，事實上為文獻上所稱的處置效果（treatment effects）。假設我們現在想要評估某一政策或制度的施行之效果，那所謂的處置（treatment）指的便是該政策或制度。置言之，

透過樣本的收集，我們可以找到受到該政策影響或加入該制度者，亦即受到該處置影響者（亦即所謂的 treatment group），另外我們或可找到另外不受該政策或制度影響，亦即不受該處置影響者（亦即控制組，control group）。而制度的評估便在於分析這兩狀況下（接受處置與否），效果的差別。舉例而言，倘若某決策者

（i）²²，如果他接受該處置，或受到該政策的影響，那其效果或結果的指標為Y_1i，但是如果該決策者沒有受到處置的影響，或沒有加入該政策或制度，那其效果或結果的指標為Y_0i。置言之，我們用”0” 與”1”來區分是否受到處置的影響，或是否接受處置，而Y_1i與Y_0i則為可能的結果。當然，就此一決策者（i）而言，如果 Y1i－Y_0i為正，那表示就此一決策者而言，該政策或處置的結果為正，或有效果，

反之無效，而此Y_1i－Y_0i亦即是決策者（i ）在此一政策評估中的個別效果

（individual effect）。然而，就同一決策者而言，不太可能在同一時間下，同時參加與不參加此政策或計畫，置言之，就此一決策者而言，不是僅能觀察到他參加計畫或此政策的結果（Y_1i），不然就是僅能觀察到他沒有受到處置影響的結果

（Y_0i），因此在實際的運作中，由於此種遺漏（missing）的特性，使得研究者無法認定個別效果。

限囿於前述在評估過程中的遺漏的特性使得無法認定個別效果，在許多研究中乃進而轉向估計與認定整體決策者（有參加處置與未參加處置者）之帄均的效果，置言之研究乃轉而估計與認定文獻上所謂的帄均處置效果（average treatment effect, ATE）。以前述的說明而言，倘若將樣本區分為接受處置（或參加計畫，或受政策與制度影響者），以及未接受者，前者即為實驗組（treatment group），後者則為控制組（control group），那所謂的帄均處置效果，簡單而言，即是兩組接受與未接受處置後之政策效果的帄均差異：ATEE Y



1Y0



，其中，Y₁為實驗組的政策結果變數，Y₀為控制組的政策結果變數。然而此一帄均處置效果要能夠被認定（identify），那兩組的政策結果（Y₁與Y₀）必須假設與決策者被分到實驗組與控制組之間的機制無關。置言之，如果我們假設W為一指標變數（indicator variable），且用W 1指稱樣本為實驗組，而W 0則用以指稱樣本為控制組。若帄均處置效果能夠被認定的第一條件在於假設（Y₁與Y₀）與 W 之間獨立。置言之，帄均處置效果的認定之基本條件在於樣本是否屬於實驗組或控制組為外生給定，或如文獻上所稱的「自然實驗（ natural experiment ）」或「準實驗

（quasi-experiment）」。

不過前述的外生獨立性假設，在自然科學實驗中相對容易找到可能的實驗組

22 依據評估的主題而有異，可為病人，消費者，廠商，醫院等等。

與控制組，但是在社會科學中，尤其是在許多政策的評估中，政策的施行，乃至某處置的施行，參加者與非參加者往往可能都不是隨機指派（randomly assigned），因此前述的條件不必然達到，而此也使得一般的政策評估所估計出來之效果不具有因果關係。事實上，根據 Wooldridge（2002）以及 Wooldridge（2007），在一般社會科學的實驗（計畫，政策，或制度的施行），往往存在三個可能的樣本選擇偏誤（sample selection bias），使得前述的估計結果產生偏誤。第一為顯性偏誤

（ overt bias ），第二為隱性偏誤（ hidden bias ），最後則為自我選擇偏誤

（self-selection bias）。

所謂顯性偏誤，指的是決策是否加入該計畫或該制度，可能受到其他因素的影響。置言之，可能存在某些可以觀察到（observed）的特性會影響決策者是否屬於實驗組（W=1）或控制組（W=0）。由於這些可以觀察到的特性之故，因此實驗組與控制組樣本便非隨機，進而前述獨立性假設無法成立。此外，除了可以觀察到的特性的影響外，往往也可能存在一些無法觀察到的（unobserved）特性，

例如決策者本身的特性，會讓此一樣本傾向於屬於控制組或傾向於屬於實驗組。

另外，往往許多政策的施行，或許多計畫的施行，參加該政策或計畫的本身便是一決策過程的結果。置言之，決策者根據自己的效用極大的假設決定參加之後是否可以提高福利（效用）等，進而加入該計畫或制度。置言之，決策者是否屬於實驗組或控制組（W=1 或 W=0 本身變成為一自我選擇的結果，進而決策者之 W 變數便存在自我選擇偏誤（self-selection bias）。針對這些偏誤，政策評估或制度評估的方法文獻中有許多精彩的探討與說明。例如 Rosenbaum（2002）利用敏感性分析（sensitivity analysis）來判斷是否存在可能的隱性偏誤；Heckman（1976）

則提出兩階段估計法（two-part model）以解決可能的偏誤。Manski（2003）的邊界分析（bound analysis）則用以當前述獨立外生性假設不成立的時候，如何估計帄均處置效果的上下界。

在各種估計方法中，另外一類評估方法則是所謂的配對法。顧名思義，所謂配對法即是在控制組中，替實驗組配對，因此「理想上」所有參與實驗或加入某計畫，乃至被某政策所影響者，研究者可以幫這些實驗組樣本找尋一個特性與之相近的樣本與之配對（matching），置言之形成「準控制組」。而最後政策的評估，

即是根據前述實驗組與配對後的準控制組進行比較，其概念在於由於研究者不可

能同一時間觀察到參與實驗者或加入某計畫者，或受政策影響者的結果（亦即 Y1i），以及該樣本不參加實驗的結果（亦即 Y_0i），因此透過配對的方法，替該樣本找到（配對）一個與其特性相同的樣本，但沒有加入計畫或參與實驗，或不受政策影響，並透過這兩者之間的差別來進行評估政策效果。不過要進行此類評估，

研究者必須再額外有下列兩者假設（Rosenbaum and Rubin，1983）。第一為



Y Y1, 0



W X ，文獻上稱為無混雜假設（unconfoundedness assumption），而在 Lechner（2001）則稱為條件下之獨立性假設（conditional indenpdence assumption）。在該假設下，當控制所有可觀察到的共同混雜因素（X）後，樣本是否加入實驗

（或政策及計畫），亦即該樣本之 W=1 或 W=0 與其政策結果獨立。事實上，此一假設在傳統參數型態估計模型（parametric model）下，即為所謂的”selection on observables”（Heckman and Robb，1985），或在遺漏資料（missing data）文獻中所提的 “missing at random”。要對此一假設與傳統外生性假設兩者之間進行瞭解與連結，我們可以依據 Wooldridge（2007）的例子進行說明，假設處置效果為固定，亦即Yi

   

¹ Yi ⁰ ，其中Yi

 

¹ 與Yi

 

⁰ 為加入政策或實驗與未加入之效果，

如果我們假設政策效果與 X 之間為線性：

 

⁰

i i i i i

Y   X   X (8)

那我們可以將估計式改寫成

i i i

Y      W X  (9)

置言之，無混雜的假設與傳統上在給定 X 之下，W 與誤差項之獨立性假設相同。

因此無混雜的假設，基本上僅是假設給定 X，為誤差項獨立，亦即 W 為外生變數。

第二個額外的假設為 ^{prob W}



^¹^X



^

 

^0,1 ，文獻上稱為具重疊性假設

（overlap assumption），或在 Rosenbaum and Rubin（1983）古典的文獻中稱為”strongly ignorable treatment assignment”。在此假設下，如果某一足以影響Y₁與 Y0的變數（X）下的某一特性之樣本皆參加實驗，或受政策影響，那在該特性下，





prob W  X x  ，則控制組將完全沒有此一特性的樣本，如此將使得研究者在控制此一變數（X）後，無法進行比較。

我們現在說明配對法，根據 Rosembaum（2002），Abadie and Imbens（2006），加。不過在 Rosenbaum and Rubin（1983）一文中，兩位學者證明在無混雜的獨立性假設下，那根據多維度的 X 變因以配對的方法，其實等同於利用傾向分數進行配對。亦即，如果



Y Y1, 0



W X 成立，那



Y Y1, 0



W p X

 

。其中^{p X 文}

 

獻上稱為傾向分數（propensity score），為給定 X 的數值下，樣本參加計畫，或受到政策或制度影響之機率，其定義為：

  



p X  prob W  X x

由於傾向分數的作法，以及 Rosenbaum and Rubin（1983）的證明，研究者僅需利用一個維度的傾向分數便可以進行配對，因此此法大幅減低研究者的配對

在文檔中全民健保部分負擔制度之研究 (頁 49-58)

第四章 實證模型

4.3 傾向分數配對法









   

 

 

 





 













 

 

  



第四章實證模型