配對後之平衡診斷 - 文獻探討 - 傾向分數配對與確切配對之合併使用: 蒙地卡羅模擬研究與實證分析

第二章、文獻探討

第五節、配對後之平衡診斷

國

立政治大學

‧

Na tiona

l Ch engchi University

為門檻值時，對於常態分配的變量可以移除 98%的偏誤。取 0.4 倍則可移除 93%

的偏誤，選取 0.6 倍則可移除 86%的偏誤，並建議使用 0.2 倍線性傾向分數標準差做為門檻值。此外，Austin(2009)針對門檻值的選取，就醫學期刊中最常使用的 8 種傾向分數配對門檻值來進行模擬研究，比較處理效果的均方誤，模擬結果顯示使用 0.2 倍線性傾向分數標準差的效果最佳。

（4）最適配對（optimal matching）

Rosenbaum(1989)提出最適配對的作法。最適配對與貪婪配對最大不同在於，

貪婪配對致力於極小化配對樣本中每一對樣本間的距離，而最適配對則是極小化配對樣本中實驗組與對照組的總距離，也就是說貪婪配對尋找局部的最小距離，

最適配對尋找整體的最小距離。在設定控制變數服從常態分配，變數個數分別為 2 個、5 個及 20 個之下，Gu 與 Rosenbaum (1993)以配對後偏誤降低比例來評估兩種配對方法之平衡效果。模擬結果顯示，最適配對和貪婪配對在平衡效果上沒有孰優孰劣的問題，兩種方法都能有效地降低偏誤。貪婪配對在執行上會比最適配對有效率，但貪婪配對需要隨機決定一位實驗組受詴者，若起始的實驗組受詴者改變，最後的配對樣本亦有可能改變。最適配對則沒有類似的困擾。

第五節配對後之平衡診斷

在執行完配對方法之後，我們會得到一組配對樣本，此時需要對此配對樣本進行平衡性的檢查。檢查的目的在於希望配對樣本中實驗組與對照組在控制變數上擁有相似的分配，若使用傾向分數配對，平衡診斷等同於在檢查傾向分數的平衡性質，即, 𝑋 ⊥ 𝑊 - | 𝑒(𝑋)，再平衡性達到一定程度後，方能進一步估計處理效果。Stuart(2010)曾對診斷方法進行分類，將診斷方法分為數值診斷方法和圖形診斷方法兩大類。

一、數值診斷方法 (1)標準化差異

當進行的配對方法屬於「非確切配對」時，兩組群體在控制變數上仍存在些

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

微差異，必須使用一些測量工具幫助我們衡量此差異。其中最常見的平衡診斷工具為 Rosenbaum 與 Rubin(1985a)建議採用的標準化差異(standardized

difference)，標準化差異越小表示兩組群體在此變數的分配越相似。連續型變數的標準化差異為兩群體在變量上平均數的差異除以兩群體的混合標準差，而類別型變數標準化差異的計算方式相同但改以比例來取代。

定義𝑠_𝑡𝑖為原始樣本中第i 個控制變數的標準差，其中 t=1 代表實驗組、t=0 代表 對照組，則兩群體控制變數i 的混合標準差為:

𝑠̅

_𝑖

= ( 𝑠

_1𝑖²

+ 𝑠

_0𝑖²

2 )

1/2

(2.14) 原始樣本中第i 個控制變數的標準化差異定義為:

𝐵

_𝐶𝑖

= 𝑥̅

_1𝑖

− 𝑥̅

_0𝑖

𝑠̅

_𝑖

(2.15) 其中

𝑥̅

_1𝑖

和𝑥̅

_0𝑖分別為原始樣本中實驗組與對照組控制變數i 的樣本平均數。

配對樣本中第i 個控制變數的標準化差異計算公式為:

𝐵

_𝑀𝑖

= 𝑥̅

_𝑀1𝑖

− 𝑥̅

_𝑀0𝑖

𝑠̅

_𝑖

(2.16) 其中

𝑥̅

_𝑀1𝑖

和𝑥̅

_𝑀0𝑖分別為配對樣本中控制變數i 的樣本平均數。

我們分別對每一個控制變數計算標準化差異，若配對後各控制變數的標準化差異較配對前低，則表示我們透過配對的過程，確實能減少群體間的系統性差異。必須注意到的是，兩個標準化差異分母均為混合標準差

𝑠̅

_𝑖

，

其目的在於將差異比例

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

化，接著可設定一個作為平衡診斷標準的比例值，若配對後的標準化差異低於此標準，則認為配對樣本已達到平衡。Normand(2001)建議，平衡診斷標準可設定為 0.1，若超過 0.1 即代表此控制變數仍未被平衡。

(2)顯著性檢定

除了標準化差異之外，也可以利用一般的顯著性檢定來判斷實驗組和對照組在各個控制變數上是否存在顯著差異。針對連續型變數，可以使用兩獨立樣本 T 檢定比較兩群體的平均數是否存在顯著差異；類別型變數則可使用卡方檢定之齊一性檢定，來了解分配的結構是否存在顯著差異。

顯著性檢定相對標準化差異而言是較為客觀的平衡診斷方法，此為其優點。

然而我們必須了解到原始樣本經過配對後在樣本數上必會有所減少，樣本數的變動亦可能會造成檢定結果改變，因此我們並不能將原始樣本的檢定結果與配對樣本的檢定結果進行比較，藉以反應配對的平衡效果，此為其缺點所在。Imai、King 與 Stuart(2008)具體說明配對樣本不適合做顯著性檢定，其原因有二:一為配對樣本的樣本數相對原始樣本有所減少，在配對樣本上做顯著性檢定其檢定力是較低的，平衡性的改善有可能是因為樣本數減少所造成。一為研究者只是想了解此配對樣本是否具備平衡性，並沒有要對母體進行推論。

相反的，無論原始樣本或配對樣本的標準化差異計算公式中，其分母為相同的混合標準差。使標準化差異不會受到樣本數變動的影響，因此在配對前後的標準化差異是可進行合理比較的，此為標準化差異的優點。由於平衡標準的設定與顯著性檢定未必可行，使得標準化差異成為較為主觀的平衡診斷方法。

關於使用顯著性檢定進行平衡診斷，Rosenbaum 與 Rubin (1985b)以及 D'Agostino(1998)之實證研究中，除了使用標準化差異來進行平衡診斷外，在配對前後亦使用兩獨立樣本 T 檢定來進行連續型變數平衡性的檢查。

二、圖形診斷方法

診斷方法除了上述所提及的標準化差異和顯著性檢定之外，亦可使用圖形來進行診斷。針對連續型變數，進行圖形繪製以了解實驗組與對照組分配的相似性。

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

如常見的圖形診斷方法為使用 Quantile-Quantile 圖對實驗組與對照組的百分位數進行比較，若兩組群體變量的分配相同，則在 Quantile-Quantile 圖上可觀察到所有的觀測點會座落於四十五度斜線上。此外對於實驗組與對照組的分配進行直方圖、箱型圖以及累積分配圖的比較，也可以幫助判斷兩組分配是否相似。

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

第三章研究方法

第一節研究設計

文獻中經常可見各種配對方法合併使用的情況，所謂的「合併使用」指的是合併採用多種不同配對方法後，再進行結果的分析。舉例來說，Rubin(2001)於吸菸與肺癌實證研究中，針對名目變數「性別」先作確切配對後，再執行傾向分數配對；Rosenbaum、Ross 及 Silber(2007)於探討腫瘤治療之實證研究中，針對名目變數「治療年份」作確切配對後，再執行傾向分數配對；Stuart(2010)則明確建議研究者可以先就重要的「名目變數」作確切配對後，再執行傾向分數配對。

針對 Stuart (2010)的建議，本文將藉由一蒙地卡羅模擬實驗來加以驗證。欲探討的問題為:「若先對一個重要名目變數進行確切配對後，再進行傾向分數配對，

相較於直接進行傾向分數配對，在後續處理效果的估計是否有所幫助？估計結果是否會較接近真實處理效果？」，此為我們的目的之一。另一個目的則在於 Stuart (2010)所謂的重要名目變數並沒有明確定義，故本文設定了四種情境，

想了解與處理指派以及反應變數相關程度不一的四個名目變數，分別對這四個名目變數作確切配對後，再執行傾向分數配對，哪一種情境的有較好的估計結果。

這其中，傾向分配對我們採用的是一對一貪婪配對，門檻值設定為0.2 倍的線性傾向分數標準差。

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

第二節邊際處理效果

本章中我們欲執行一模擬實驗來了解不同配對方法下的處理效果估計值與真實處理效果的差異。目標是對平均處理效果進行估計，故此處我們所謂的處理效果指的是邊際處理效果。由於第五章實證資料的反應變數為一個二元變數，因此本文使用對數勝算比(log- odds ratio)來衡量處理效果。反應變數發生率與邊際處理效果分別可由下列兩個羅吉斯迴歸模型得到:

𝑙𝑜𝑔𝑖𝑡(𝑝_{𝑜𝑢𝑡𝑐𝑜𝑚𝑒}) = 𝛼_{0,𝑜𝑢𝑡𝑐𝑜𝑚𝑒}+ 𝛽_{𝑡𝑟𝑒𝑎𝑡}𝑊 + 𝛼₁𝑥₁+ ⋯ + 𝛼_𝑝𝑥_𝑝

(3.1) 𝑙𝑜𝑔𝑖𝑡(𝑝_{𝑜𝑢𝑡𝑐𝑜𝑚𝑒}) = 𝛼_{0,𝑜𝑢𝑡𝑐𝑜𝑚𝑒} + 𝛽_{𝑡𝑟𝑒𝑎𝑡}𝑊

(3.2) 一、原始樣本邊際處理效果

根據反應變數模型(3.1)，對照組受試者反應變數發生率可由下式所得:

𝑙𝑜𝑔𝑖𝑡(𝑝₀) = 𝛼_{0,𝑜𝑢𝑡𝑐𝑜𝑚𝑒} + 𝛼₁𝑥₁+ ⋯ + 𝛼_𝑝𝑥_𝑝

(3.3) 而實驗組受試者反應變數發生率可由下式所得:

𝑙𝑜𝑔𝑖𝑡(𝑝₁) = 𝛼_{0,𝑜𝑢𝑡𝑐𝑜𝑚𝑒}+ 𝛽_{𝑡𝑟𝑒𝑎𝑡}+ 𝛼₁𝑥₁+ ⋯ + 𝛼_𝑝𝑥_𝑝

(3.4) 由上兩式，可得每位實驗組受試者反應變數發生率𝑝₁和每位對照組受試者反應變數發生率𝑝₀，並分別以實驗組與對照組的反應變數發生率平均值𝑝̅₁和𝑝̅₀，得到原始樣本邊際對數勝算比估計量為：

𝑙𝑜𝑔 𝑝̅₁ 1 − 𝑝̅₁

𝑝̅₀ 1 − 𝑝̅₀

(3.5)

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

二、配對樣本邊際處理效果

配對樣本屬於成對樣本，因此配對後的資料型態屬於二元成對樣本(binary matched-pairs data)。在此資料型態之下，可以藉由下列的二維列聯表進行來邊際對數勝算比的估計。

二元成對樣本的二維列聯表如下:

表 3-1 二元成對樣本的二維列聯表行

列成功失敗總和

成功 a b a+b

失敗 c d c+d

總和 a+c b+d n

表 3-1 中，成對樣本中兩位受試者皆為「成功」的成對樣本個數定義為a，

皆為「失敗」則定義為d，第一位受試者為「成功」且第二位受試者為「失 敗」的成對樣本個數定義為b，而第一位受試者為「失敗」且第二位受試者 為「成功」的成對樣本個數則定義為c。

根據 Agresti 與 Min(2004)，成對樣本的邊際對數勝算比之最大概似估計量為:

𝑙𝑜𝑔⁡(𝑎 + 𝑐)(𝑐 + 𝑑) (𝑏 + 𝑑)(𝑎 + 𝑏)

(3.6) 而邊際對數勝算比之標準誤為:

√ 𝑛[(𝑎 + 𝑑)(𝑏 + 𝑐) + 4𝑏𝑐]

(𝑎 + 𝑏)(𝑐 + 𝑑)(𝑎 + 𝑐)(𝑏 + 𝑑)

‧ 國

立政治大學

‧

Na tiona

l Ch engchi University

第三節資料生成

本文所使用之軟體為統計軟體 R 2.12 版本，使用範圍包含模擬資料之生成、

第四章的模擬資料分析與第五章之實證分析，其中配對方法所使用的套件為

「nonrandom」。該套件可以執行傾向分數貪婪配對，亦可搭配門檻值之設定，同時亦具備執行傾向分數分層的功能。

一、變數生成之架構

本模擬研究的資料生成方式主要參考 Austin(2007)之模擬研究架構，除了反應變數Y 與處理指派變數𝑊外，考慮實證資料中變數多為二元變數，故加 入八個母體參數比例為 0.5 的二元變數𝑥₁, … , 𝑥₈來進行探討，其中這八個變

在文檔中傾向分數配對與確切配對之合併使用: 蒙地卡羅模擬研究與實證分析 - 政大學術集成 (頁 23-0)

配對後之平衡診斷

第二章、 文獻探討

第五節、 配對後之平衡診斷

國

立 政 治 大 學

‧

第五節 配對後之平衡診斷

‧ 國

立 政 治 大 學

‧

𝑠̅

= ( 𝑠

+ 𝑠

2 )

𝐵

= 𝑥̅

− 𝑥̅

𝑠̅

𝑥̅

和𝑥̅

𝐵

= 𝑥̅

− 𝑥̅

𝑠̅

𝑥̅

和𝑥̅

𝑠̅

，

‧ 國

立 政 治 大 學

‧

‧ 國

立 政 治 大 學

‧

‧ 國

立 政 治 大 學

‧

第三章 研究方法

第一節 研究設計

‧ 國

立 政 治 大 學

‧

第二節 邊際處理效果

‧ 國

立 政 治 大 學

‧

‧ 國

立 政 治 大 學

‧

第三節 資料生成

第二章、文獻探討

第五節、配對後之平衡診斷

立政治大學

第五節配對後之平衡診斷

立政治大學

立政治大學

立政治大學

立政治大學

第三章研究方法

第一節研究設計

立政治大學

第二節邊際處理效果

立政治大學

立政治大學

第三節資料生成