第四章 實證模型
4.3 傾向分數配對法
政策評估(policy evaluation)或制度評估(program evaluation)是在許多經 濟學乃至其他社會科學(如社會學與政治學)的研究中扮演著非常重要的角色。
一則其使用的計量方法往往對於其後相關的計量經濟理論之研究中扮演著重要 的角色,再者其所研討的議題往往也非常實務地具有很重要的政策意涵。相關的 文獻在 Wooldridge(2002)以及 Wooldridge(2007)讀者可以找到非常完整的說 明與回顧。所謂的政策評估或制度評估的研究方法,指的是研究者針對收集到的 資料,在這些資料的樣本中,某些樣本可能參加某一計畫(program),其他的樣 本則未參加該計畫,而評估的重點則在於參加該計畫與否是否在某一目標(政策 目標)上有顯著的衝擊。例如這種制度評估,早先在勞動經濟學(labor economics)
中有非常多的討論與文獻,例如 Dehjia and Wahha(1999)探討是否接受勞工訓 練之勞工,其接受勞工計畫的效果差異,除此之外,在教育經濟學(education economics)中,亦常被用來分析某一教育制度的變革之效果評估,例如 Angrist and Lavy(2001)分析教師參加在職訓練後,學生的成績是否產生影響。當然,此類 的評估方法,在健康經濟學中亦是常被用來分析政策或制度評估的工具,例如,
Chou et al.(2003)以台灣家庭收支調查為資料分析台灣實施全民健保之後,家 庭在預防性儲蓄(precautionary saving)上的衝擊,Winkelmann(2006)探討德 國的健康保險制度,是否對一般病患的就診次數有所影響,陳昕等(2007)分析 台灣健保制度下,部分負擔的改變(政策變動)之價格彈性估計,韓幸紋與連賢 明(2008),探討健保部分負擔變動,對於兒童醫療利用的影響,謝鈺婷等(2008)
分析台灣論質計酬專案的效果評估,以及許績天與連賢明(2009)分析當家戶遭 遇健康衝擊時,家戶成員消費,儲蓄,以及就業等面向的影響。
從計量經濟學的角度來看,這些制度評估或政策評估所要估計的,事實上為 文獻上所稱的處置效果(treatment effects)。假設我們現在想要評估某一政策或 制度的施行之效果,那所謂的處置(treatment)指的便是該政策或制度。置言之,
透過樣本的收集,我們可以找到受到該政策影響或加入該制度者,亦即受到該處 置影響者(亦即所謂的 treatment group),另外我們或可找到另外不受該政策或制 度影響,亦即不受該處置影響者(亦即控制組,control group)。而制度的評估便 在於分析這兩狀況下(接受處置與否),效果的差別。舉例而言,倘若某決策者
(i)22,如果他接受該處置,或受到該政策的影響,那其效果或結果的指標為Y1i, 但是如果該決策者沒有受到處置的影響,或沒有加入該政策或制度,那其效果或 結果的指標為Y0i。置言之,我們用”0” 與”1”來區分是否受到處置的影響,或是 否接受處置,而Y1i與Y0i則為可能的結果。當然,就此一決策者(i)而言,如果 Y1i-Y0i為正,那表示就此一決策者而言,該政策或處置的結果為正,或有效果,
反之無效,而此Y1i-Y0i亦即是決策者(i )在此一政策評估中的個別效果
(individual effect)。然而,就同一決策者而言,不太可能在同一時間下,同時參 加與不參加此政策或計畫,置言之,就此一決策者而言,不是僅能觀察到他參加 計畫或此政策的結果(Y1i),不然就是僅能觀察到他沒有受到處置影響的結果
(Y0i),因此在實際的運作中,由於此種遺漏(missing)的特性,使得研究者無 法認定個別效果。
限囿於前述在評估過程中的遺漏的特性使得無法認定個別效果,在許多研究 中乃進而轉向估計與認定整體決策者(有參加處置與未參加處置者)之帄均的效 果,置言之研究乃轉而估計與認定文獻上所謂的帄均處置效果(average treatment effect, ATE)。以前述的說明而言,倘若將樣本區分為接受處置(或參加計畫,或 受政策與制度影響者),以及未接受者,前者即為實驗組(treatment group),後 者則為控制組(control group),那所謂的帄均處置效果,簡單而言,即是兩組接 受與未接受處置後之政策效果的帄均差異:ATEE Y
1Y0
,其中,Y1為實驗 組的政策結果變數,Y0為控制組的政策結果變數。然而此一帄均處置效果要能夠 被認定(identify),那兩組的政策結果(Y1與Y0)必須假設與決策者被分到實驗 組與控制組之間的機制無關。置言之,如果我們假設W為一指標變數(indicator variable),且用W 1指稱樣本為實驗組,而W 0則用以指稱樣本為控制組。若 帄均處置效果能夠被認定的第一條件在於假設(Y1與Y0)與 W 之間獨立。置言 之,帄均處置效果的認定之基本條件在於樣本是否屬於實驗組或控制組為外生給 定 , 或 如 文 獻 上 所 稱 的 「 自 然 實 驗 ( natural experiment )」 或 「 準 實 驗(quasi-experiment)」。
不過前述的外生獨立性假設,在自然科學實驗中相對容易找到可能的實驗組
22 依據評估的主題而有異,可為病人,消費者,廠商,醫院等等。
與控制組,但是在社會科學中,尤其是在許多政策的評估中,政策的施行,乃至 某處置的施行,參加者與非參加者往往可能都不是隨機指派(randomly assigned), 因此前述的條件不必然達到,而此也使得一般的政策評估所估計出來之效果不具 有因果關係。事實上,根據 Wooldridge(2002)以及 Wooldridge(2007),在一 般社會科學的實驗(計畫,政策,或制度的施行),往往存在三個可能的樣本選 擇偏誤(sample selection bias),使得前述的估計結果產生偏誤。第一為顯性偏誤
( overt bias ), 第 二 為 隱 性 偏 誤 ( hidden bias ), 最 後 則 為 自 我 選 擇 偏 誤
(self-selection bias)。
所謂顯性偏誤,指的是決策是否加入該計畫或該制度,可能受到其他因素的 影響。置言之,可能存在某些可以觀察到(observed)的特性會影響決策者是否 屬於實驗組(W=1)或控制組(W=0)。由於這些可以觀察到的特性之故,因此 實驗組與控制組樣本便非隨機,進而前述獨立性假設無法成立。此外,除了可以 觀察到的特性的影響外,往往也可能存在一些無法觀察到的(unobserved)特性,
例如決策者本身的特性,會讓此一樣本傾向於屬於控制組或傾向於屬於實驗組。
另外,往往許多政策的施行,或許多計畫的施行,參加該政策或計畫的本身便是 一決策過程的結果。置言之,決策者根據自己的效用極大的假設決定參加之後是 否可以提高福利(效用)等,進而加入該計畫或制度。置言之,決策者是否屬於 實驗組或控制組(W=1 或 W=0 本身變成為一自我選擇的結果,進而決策者之 W 變數便存在自我選擇偏誤(self-selection bias)。針對這些偏誤,政策評估或制度 評估的方法文獻中有許多精彩的探討與說明。例如 Rosenbaum(2002)利用敏感 性分析(sensitivity analysis)來判斷是否存在可能的隱性偏誤;Heckman(1976)
則提出兩階段估計法(two-part model)以解決可能的偏誤。Manski(2003)的 邊界分析(bound analysis)則用以當前述獨立外生性假設不成立的時候,如何估 計帄均處置效果的上下界。
在各種估計方法中,另外一類評估方法則是所謂的配對法。顧名思義,所謂 配對法即是在控制組中,替實驗組配對,因此「理想上」所有參與實驗或加入某 計畫,乃至被某政策所影響者,研究者可以幫這些實驗組樣本找尋一個特性與之 相近的樣本與之配對(matching),置言之形成「準控制組」。而最後政策的評估,
即是根據前述實驗組與配對後的準控制組進行比較,其概念在於由於研究者不可
能同一時間觀察到參與實驗者或加入某計畫者,或受政策影響者的結果(亦即 Y1i),以及該樣本不參加實驗的結果(亦即 Y0i),因此透過配對的方法,替該樣 本找到(配對)一個與其特性相同的樣本,但沒有加入計畫或參與實驗,或不受 政策影響,並透過這兩者之間的差別來進行評估政策效果。不過要進行此類評估,
研究者必須再額外有下列兩者假設(Rosenbaum and Rubin,1983)。第一為
Y Y1, 0
W X ,文獻上稱為無混雜假設(unconfoundedness assumption),而在 Lechner(2001)則稱為條件下之獨立性假設(conditional indenpdence assumption)。 在該假設下,當控制所有可觀察到的共同混雜因素(X)後,樣本是否加入實驗(或政策及計畫),亦即該樣本之 W=1 或 W=0 與其政策結果獨立。事實上,此 一假設在傳統參數型態估計模型(parametric model)下,即為所謂的”selection on observables”(Heckman and Robb,1985),或在遺漏資料(missing data)文獻中 所提的 “missing at random”。要對此一假設與傳統外生性假設兩者之間進行瞭解 與連結,我們可以依據 Wooldridge(2007)的例子進行說明,假設處置效果為固 定,亦即Yi
1 Yi 0 ,其中Yi
1 與Yi
0 為加入政策或實驗與未加入之效果,如果我們假設政策效果與 X 之間為線性:
0i i i i i
Y X X (8)
那我們可以將估計式改寫成
i i i
Y W X (9)
置言之,無混雜的假設與傳統上在給定 X 之下,W 與誤差項之獨立性假設相同。
因此無混雜的假設,基本上僅是假設給定 X,為誤差項獨立,亦即 W 為外生變 數。
第 二 個 額外 的 假設 為 prob W
1X
0,1 , 文 獻 上稱 為 具重 疊性 假 設(overlap assumption),或在 Rosenbaum and Rubin(1983)古典的文獻中稱 為”strongly ignorable treatment assignment”。在此假設下,如果某一足以影響Y1與 Y0的變數(X)下的某一特性之樣本皆參加實驗,或受政策影響,那在該特性下,
1
1prob W X x ,則控制組將完全沒有此一特性的樣本,如此將使得研究 者在控制此一變數(X)後,無法進行比較。
我們現在說明配對法,根據 Rosembaum(2002),Abadie and Imbens(2006), 加。不過在 Rosenbaum and Rubin(1983)一文中,兩位學者證明在無混雜的獨 立性假設下,那根據多維度的 X 變因以配對的方法,其實等同於利用傾向分數 進行配對。亦即,如果
Y Y1, 0
W X 成立,那
Y Y1, 0
W p X
。其中p X 文
獻上稱為傾向分數(propensity score),為給定 X 的數值下,樣本參加計畫,或 受到政策或制度影響之機率,其定義為:
1
p X prob W X x
由於傾向分數的作法,以及 Rosenbaum and Rubin(1983)的證明,研究者 僅需利用一個維度的傾向分數便可以進行配對,因此此法大幅減低研究者的配對
由於傾向分數的作法,以及 Rosenbaum and Rubin(1983)的證明,研究者 僅需利用一個維度的傾向分數便可以進行配對,因此此法大幅減低研究者的配對