貳、配對法和傾向分數 - 綜合高中分流政策對學生學習成就的影響

國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

的基本問題（the fundamental problem of causal inference）。然而透過嚴謹的假定

（詳見Morgan & Winship, 2007: 48-50），可以估算母群體的ATE、ATT和ATU三種實驗處理效果，但為了要能估算ATE，需要先估算出ATT和ATU。一般而言，

要能有效估算出一致、無偏誤的ATT所需要的假定比估算ATU寬鬆。以本研究為例的話，此假定是指就讀綜合高中的組別若不就讀綜合高中的話，與不就讀綜合高中組別的效果是一樣的，因為就讀綜合高中的組別若不就讀綜合高中的話，與不就讀綜合高中組別相比，不會表現的比較好或比較差。由於本研究關注的焦點為就讀綜合高中的效果，也就是關注綜合高中政策的實施成效，因此本研究使用 ATT做為評估延緩分流對綜合高中學生學習成就的影響，而使用ATE用來評估綜合高中學術導向組與非學術導向組兩者間，及普通高中與高職兩者間在學生學習成就上的平均差異。

貳、配對法和傾向分數

一、配對法的原理

配對法（matching）是一種用來估算因果處理效果（causal treatment effects）

的統計方法。在生物與醫學研究領域中，個體因接受某種實驗處理所導致的影響稱做實驗效果（experimental effect）或處理效果，其中接受某一實驗處理的樣本稱為實驗組（treatment group），未接受實驗處理的樣本稱為對照組（control group），為了嚴謹的因果推論（causality inference），通常會要求實驗組和對照組在所有的屬性（characteristics）上取得相同或相似，也就是控制會影響推估因果效果的共變項（confounding covariates），使得兩組的樣本在實驗進行後的反應差異，可歸因於實驗處理的效果，而非原先兩組樣本在實驗處理前的屬性差異所混淆（Guo & Fraser, 2010; Morgan & Winship, 2007; Winship, & Morgan, 1999;

Winship & Sobel, 2004）。例如，在醫學研究中，為了試驗某藥物的治療效果時，

通常會要求兩群特性（如過去病吏、性別、年齡、身高、體重、收入、工作及家

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

庭狀況…等）相似的人中，一組給予用藥，另一組則沒有，然後再比較這兩組樣本的病情復原狀況，以檢視該藥物的治療效果。在社會科學研究領域中，也可以採取此種研究方式，將接受某一政策或方案的樣本，與未接受政策或方案的另一樣本進行比較，來估算該政策或方案的影響效果，這會增加因果推論上的嚴謹度。

然而社會科學領域的研究大者屬於觀察研究，而非以實驗研究所得到的資料進行分析，要滿足隨機分派的要求或控制實驗組與對照組在實驗前的屬性沒有差異並不容易，觀察研究所得的樣本經常會非隨機地被分派到某一群體，造成某一群體的樣本屬性與另一群體的樣本屬性間有顯著差異，這產生了選擇偏誤。以本研究為例，比較不同組別的學生在學習成就上的差異，若不同組別學生在家庭社經背景、過去學習成就、族群別…等重要特性上早已存有顯著差異，那麼本研究中的四種實驗處理效果就很難歸因於綜合高中分流政策所造成，有可能是共變項所造成。另一方面，觀察研究所得的資料，在 OLS 迴歸分析中使用虛擬變項來評估政策或實驗效果時，會產生不具外生性（exogeneity）的問題，使得該虛擬變項造成估計所得的係數會產生偏誤（Guo & Fraser, 2010），違反迴歸分析中各預測變項間要互為獨立的假定。如何處理選擇偏誤或不具外生性的問題？

Heckman 與 Robb（1985, 1986）指出選擇偏誤有兩種來源：第一，根據觀察不到的變項（omitted variables）做選擇（selection on unobservables），即是迴歸方程式中的虛擬變項與誤差項具有相關；第二，則是根據可觀察到的變項做選擇

（selection on observables），即是一些會影響實驗處理的變項，並不會構成影響實驗結果的解釋變項。那麼如何處理選擇偏誤呢？隨著統計假定的不同，計量經濟學家和統計學家在處理選擇偏誤的問題上，所採用的策略並不相同，計量經濟學家常使用 Heckman 樣本選擇模式（Heckman’s sample selection model）（Heckman, 1978,1979）及其相關衍生模式，如迴歸轉換迴歸模式（Switching regression model）

（Maddala, 1983)和工具變項分析（Angrist, Imbens, & Rubin, 1996）來處理第一種選擇偏誤；而生物統計學家則是以配對方法來處理第二種選擇偏誤。這兩種方

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

式各有其優缺點及使用限制。

Heckman 樣本選擇模式第一步驟是使用 Probit 或 Logit 模型得到選擇偏誤調整項（即 Inverse Mill’s Ratio），第二步驟則加入此一調整項，作為評估實驗處理效果迴歸模型中的解釋變項。然而 Heckman 樣本選擇模式有兩個問題：第一，

是要找到一個解釋變項與評估實驗效果的迴歸模式中的誤差項沒有相關，但觀察研究中很難找到這一類的變項；第二，是要評估實驗處理效果會因為模型設定的不同而有極大的差異（Heckman, Ichimura, & Todd, 1997, 1998; Ho, Imai, King, &

Stuart, 2007）。

Rubin（1973）則提出配對法來處理選擇偏誤，其基本概念取之於隨機化實驗設計的精神。也就說，在無法做實驗的情況下，儘量使實驗組和對照組在所有觀察到的變項上取得相等或相似，剩下來只有實驗處理的不同，若滿足上述的條件下，那麼就可以直接估算出實驗處理的效果（Winship & Sobel, 2004）。此一概念，已廣泛被應用在生物、公衛、勞動經濟學和社會科學等相關領域上，並被用於估評方案或政策的效果，但配對法也有使用上的限制，無法像 Heckman 模式及 Heckman 相關衍生模式一樣，能控制未觀察到的變項對實驗處理效果的影響。

如何兼顧 Heckman 樣本選擇模式和配對法兩種統計方法的優點，Heckman、

Ichimura 與 Todd 於 1997 年所提出的結合非參數迴歸（Nonparametric Regression）

的傾向分數配對法來估算實驗處理效果，此方法又稱為 Kernel 配對法或雙差分配對法（Difference-in-differences Matching），特別適用於評估政策或方案的實施效果（Heckman, Ichimura, & Todd, 1997,1998）。

二、配對法和傾向分數

（一）何為傾向分數配對分析法

以實驗研究的角度來看，PSM 的假定是合理的，因為透過隨機分派後，可以創造一個實驗組和對照組在各方面條件是相等或接近的狀態。也就是說，實驗

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

組和對照組除了在實驗處理不同外，其他條件接近或相等，要估算因果推論時，

只要將兩組實驗處理後結果相減即可。但在觀察研究裡，往往無法隨機分派，所以會造成實驗組和對照組在處理效果上會有基準線上的差異，以及因自我選擇而產生因果效果上的差異。這些差異，會影響到實驗處理效果的估算。

但傳統的配對方式是採用單一（one-dimension）屬性進行配對，可是當有多個屬性在實驗處理前就存有差異時，配對上就變得相當困難，且配對成功的比例會降低。然而隨著配對條件數的增加，且樣本數有限的情況下，使用傳統的配對法來估算處理效果變得不可行，唯有將配對條件數簡化，才能增加配對的效率，

那麼如何簡化配對條件數？Rosenbaum 與 Rubin（1983, 1985a, 1985b）提出的 PSM，有助於解決配對時屬性維度過多的問題，也就是說不要求兩個樣本在所有觀察到的重要變項要相同或相似，而僅要求兩個樣本在一個粗略的分數上取得相似，這樣就可以提高配對成功的比例。

所謂傾向分數（propensity score）的估算方式，是將所有配對條件數（即可觀察到的用來預測接受實驗處理與否的共變項）化約成為一個預測每一個案接受實驗處理與否（分派到實驗組）的條件機率（conditional probability），而這個機率涵括了所有配對條件的訊息，再拿這單一機率進行配對或分層就會顯得相當容易。估算傾向分數的方式如下：

Prob（D=t | X=x）= P（x）（1）

P（x）是指傾向分數，X 則為可觀察到的共變項，t 為實驗組，而 X 的選取必須是發生在實驗處理之前，且理論上需與實驗處理的分派與結果有所關聯。那麼如何由樣本估算 P（x）？其計算方式是以是否接受實驗處理做為依變項，使用可觀察到的共變項做為自變項進行 Logit 或 Probit 分析，其估算出來的機率即為傾向分數，其值介於 0～1 之間，或者也可以將 P（x）以 log{ P（x）/[1- P（x）]}

再進行轉換，而將 P（x）取 log 的好處比單純以 P（x）做為傾向分數更接近常

‧ 國

立政治大學

‧

N a tio na

l C h engchi U ni ve rs it y

態分配（Guo & Fraser, 2010）。

傾向分數涵括了所有共變項的訊息，可以再拿這單一數值進行後續的配對、

分層或加權（weighting），可以有效減少使用全部共變項進行配對或分層的困難，

使得實驗組和對照組在所有配對的條件上達到平衡或接近，如此可有效降低選擇偏誤（Rosenbaum & Rubin, 1983），是故傾向分數也被稱為平衡分數。

（二）傾向分數配對法的分析步驟

使用 PSM 進行資料分析的步驟其實相當明瞭易懂（Caliendo & Kopeinig, 2008）。首先，以 Logit 或 Probit 分析估算出傾向分數；接著，選擇配對的運算方式；第三，共同重叠區（Common Support）的確認，亦即確認實驗組和對照組在傾向分數的分佈上是否有重叠？如果個案只有分配到其中一組的機率話，則會被排除在共同重叠區外，不納入分析中，使用共同重叠區的優點在於避免拿蘋果和橘子進行相比；第四，確認配對品質和實驗處理效果的估算，而確認配對品質最簡單的方式就是將配對後的共變項或將傾向分數進行 t 考驗；最後，進行敏感度分析（Sensitivity Analysis）。

至於最後需要從事敏感度分析的原因，因 PSM 分析是假定經由控制觀察到的選擇配對變項後，也可控制那些未能觀察到但也可能會影響是否接受實驗處理

（在此為就讀綜合高中的學生），以及實驗處理效果的變項。透過敏感度分析，

研究者則可瞭解經 Kernel 配對法估計得到的實驗處理效果值是否夠強靭

（robust），換言之，研究者可瞭解實驗處理效果受到未觀察到變項干擾的嚴重程度。本研究因使用 Kernel 配對法進行教育分流對綜合高中學生學習成就的影

在文檔中綜合高中分流政策對學生學習成就的影響 - 政大學術集成 (頁 64-74)

貳、配對法和傾向分數

國

立 政 治 大 學

‧

N a tio na

l C h engchi U ni ve rs it y