傾向分數配對與確切配對之合併使用: 蒙地卡羅模擬研究與實證分析 - 政大學術集成

全文

(1)國立政治大學統計學研究所碩士論文. 傾向分數配對與確切配對之合併使用: 政治. 大. 立蒙地卡羅模擬研究與實證分析 ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. i Un. v. 指導教授： e n g江振東博士 chi 研究生：賴致淵撰中華民國一百零一年六月.

(2) 謝辭完成論文口試之後，同時亦代表著兩年來的碩士班生活即將告一段落。回顧這段碩班生涯，應該算是在歡樂中過著既辛苦又紮實的研究生活吧! 首先，辛苦與紮實來自於課業與論文。回想當初進入碩士班時，抱持著碩士班就是要紮實學習的態度，選擇成為江老師的學生，而此篇論文得以順利完成，必須感謝老師這一年多來的教導與鼓勵，老師耐心的指導使駑鈍的我在大部分的討論中都能了解問題的所在，老師常鼓勵我們去不斷嘗試，藉由從錯誤中學習來解決問題，並且時常貼心地幫助我們抒發論文壓力。要這邊要跟老師說一聲，辛. 政治大其次，歡樂來自於我親愛的同學們。這段期間我們一起玩樂、一起為學業與立. 苦了，謝謝您。. ‧ 國. 學. 論文努力的日子是一段無可取代的珍貴回憶，謝謝你們。此外，謝謝我的夥伴斯淵、安婷，與你們一起奮鬥使我學習到許多。謝謝宿舍幫聖航、冠全、昱航、強. ‧. 哥、詠勳、瑋哥在日常生活上的陪伴。謝謝斯淵，與你一起學習與討論使我受益. sit. y. Nat. 良多，有你的大力幫助，使這篇論文更臻完美。謝謝一路以來支持我、幫助我的. n. al. er. io. 老朋友們，志偉、大胖、啟賢、名新、阿揚、小朱等等。. i Un. v. 最後，謝謝我最重要的家人們，尤其是我的母親、我的弟妹們、我的阿姨們，. Ch. engchi. 有你們長久以來的支持與照顧，才能成就今日的我。以及最重要的伴侶小婕和肥寶，在我為了論文焦躁不安時，支持我鼓勵我陪伴我，幫助我調適面對壓力與負面情緒，謝謝你的體貼。感謝上天，我何其幸運。有家人與朋友的陪伴，我才能順利地完成碩士學位，未來的日子我也會繼續常保感恩與謙卑的心，邁向人生中的每一個挑戰!希望大家都能健健康康地追求人生中的夢想，夢想就在前方!. 賴致淵 101/07/06 書於政大.

(3) 摘要在觀察性研究或非隨機試驗研究中，欲探討因果效應時，研究者需要重新對觀察性研究進行設計，設計目的在於重新建立一個隨機指派受試者的機制，使其得以近似一個隨機試驗研究，這樣的研究一般稱為「類隨機試驗研究」 (quasi-randomized-experiments)。傾向分數分析即為一種設計觀察性研究的方法，在不牽涉到反應變數結果之下進行設計。本文於一個病例對照研究(case-control study)中使用傾向分數進行配對接著再進一步估計處理效果，傾向分數配對是可降低觀察性研究中的選擇. 政治大所觀察到的控制變數分配達到相似，進而得到處理效果(treatment effect)的不立性偏誤的方法，透過配對可減少實驗組與對照組間的系統性差異，使研究群體在. ‧ 國. 學. 偏估計，為近年廣受流行病學、經濟學以及社會學領域使用的方法之一。傾向分數本身為一個條件機率，定義為研究受試者在其所觀察到的控制變數之下，接受. ‧. 某處理或被指派至某特定群體的機率，估計傾向分數最常見的方法為羅吉斯迴. sit. y. Nat. 歸。. n. al. er. io. 此外，自 1970 年代起，配對方法(matching method)開始被使用來選取合適. i Un. v. 的實驗組與對照組並進行兩群體的比較，其中「確切配對」屬於最常使用的配對. Ch. engchi. 方法，過去文獻中經常可見各種配對方法的結合使用，因此，本文電腦模擬研究部份，欲比較四種情境之下「傾向分數配對」與「確切配對」結合使用的效果，分別以偏誤降低比例、信賴區間覆蓋率、均方誤衡量兩種配對方法結合使用的適合情境。結果顯示若對「與處理指派中度相關的變數」且「與反應變數高度相關的變數」，其效果最為明顯。根據結果，我們總結認為「確切配對與傾向分數配對合併使用」確實會有較好的表現，但表現的好壞也取決於確切配對的變數。實證研究部份，探討家庭結構對青少年偏差行為之影響，欲了解來自非完整家庭之青少年是否較來自完整家庭之青少年更有容易出現偏差行為。關鍵字: 類隨機試驗研究、傾向分數分析、傾向分數配對、確切配對、電腦模擬.

(4) Abstract In observational or nonrandomized studies, treatments are not randomly assigned so that baseline differences between treated and control groups are typically observed. Without properly executed, the differences would bias the treatment effect estimates. There has been a long history of using matching to eliminate confounder bias, and inferences are made based on the matched observations. The theoretical basis for matching has been developed since 1970, and among those matching methods commonly in use, the exact matching is probably the most. 政治大 propensity scores, the conditional probability of being exposed or treated given the 立 popular one. On the other hand, introduced by Rosenbuam and Rubin in 1983,. ‧ 國. 學. observed covariates, has been a welcome alternative used to adjust for baseline differences between study groups of late. Instead of matching a treated with an. ‧. untreated subject by their covariates, subjects in both treated and control groups are. sit. y. Nat. matched by their propensity scores.. n. al. er. io. In this study, we explore the benefits of using propensity score matching together. i Un. v. with the exact matching for adjusting for baseline differences through Monte Carlo. Ch. engchi. simulations. An empirical study is also be provided for illustration.. Key words: Propensity scores analysis, Propensity scores matching, Exact matching, Monte Carlo simulation.

(5) 目錄第一章、緒論…………………………………………………………………………1 第一節、研究背景與動機………………………………………………………1 第二節、研究目的………………………………………………………………2 第三節、本文架構………………………………………………………………3 第二章、文獻探討……………………………………………………………………4 第一節、處理效果………………………………………………………………4 第二節、傾向分數之基本概念…………………………………………………7. 政治大第四節、配對方法之發展………………………………………………………13 立第三節、傾向分數之使用方式…………………………………………………11. ‧ 國. 學. 第五節、配對後之平衡診斷……………………………………………………18 第三章、研究方法……………………………………………………………………22. ‧. 第一節、研究設計………………………………………………………………22. sit. y. Nat. 第二節、邊際處理效果…………………………………………………………23. n. al. er. io. 第三節、資料生成………………………………………………………………25. i Un. v. 第四節、情境設定………………………………………………………………28. Ch. engchi. 第五節、模擬結果之評估方式…………………………………………………29 第四章、模擬分析結果………………………………………………………………31 第一節、對數勝算比之估計……………………………………………………31 第二節、偏誤與偏誤降低比例…………………………………………………32 第三節、均方誤…………………………………………………………………37 第四節、95%信賴區間覆蓋率…………………………………………………41 第五節、小結……………………………………………………………………42 第五章、實證研究……………………………………………………………………44 第一節、實證主題探討…………………………………………………………44 I.

(6) 第二節、資料來源與研究母體…………………………………………………45 第三節、變數定義………………………………………………………………45 第四節、實證結果分析…………………………………………………………47 第六章、結論與建議…………………………………………………………………54 第一節、結論……………………………………………………………………54 第二節、建議……………………………………………………………………55 參考文獻 ……………………………………………………………………………56 附錄一、對數勝算比分配……………………………………………………………59 附錄二、其餘 11 種 Exact-PS 配對實證分析結果…………………………………61. 治政附錄三、內政部臺閩地區少年身心狀況調查表……………………………………61 大立附錄四、程式碼………………………………………………………………………68 ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. II. i Un. v.

(7) 第一章第一節. 緒論. 研究背景與動機. Rosenbaum 於 2010 年《Design of Observational Studies》一書中提出以下觀點:『使用觀察性資料進行因果效應(causal effect)的估計，可將此觀察性資料視為來自一個複雜的隨機實驗，而指派受試者的機制已缺失，因此需要重新建構指派機制。』一般而言，探討因果效應的標準作法通常為執行一個隨機控制試驗 (randomized control trial)。在隨機控制試驗或實驗性研究中，研究者為了正. 政治大. 確衡量處理(treatment)或介入措施(intervention)的效果，會將受試者分為兩. 立. 個群體，即接受處理的實驗組(case group)、以及不接受處理的對照組(control. ‧ 國. 學. group)。在控制住一切干擾變數的情形下，藉由比較實驗組和控制組在反應變數上的變動，便可以獲知處理所帶來的影響，稱之為「處理效果」(treatment effect). ‧. 或因果效應，進而探討「處理」與「反應變數」之因果關係。. y. Nat. io. sit. 在隨機控制試驗中，隨機指派(randomized assignment)所賦予的隨機性是. n. al. er. 試驗的重要特性之一。如果受試者接受處理與否為一隨機現象，表示試驗中的每. Ch. i Un. v. 個受試者有相同的機會被指派至各組，此種試驗屬於隨機試驗；反之則稱為非隨. engchi. 機試驗。當研究者的目的是討論變數間的因果效應時，隨機指派受試者的試驗組別，可確保實驗組和控制組在所有控制變數上僅會出現隨機性的差異，使研究者能明確地衡量出處理效果。然而，現實生活中，諸多現象的探討無法經由隨機試驗來獲取資料。因此，許多學者致力於發展適用之研究方法來改善此問題。一般而言，在觀察性研究中進行因果關係的探討時，研究者必須設法建立一個隨機指派受試者的機制。這是因為觀察性研究使用的資料通常是經由非隨機試驗或調查方法所得到，受試者接受處理與否通常不是一個隨機現象。因此當研究者逕行使用觀察性資料來估計處理效果時，非隨機指派的機制可能使估計帶有偏誤。此種偏誤稱為選樣偏誤. 1.

(8) (selection bias)，可能導致研究者錯誤地詮釋結果。. 第二節. 研究目的. 如同實驗性研究，觀察性研究欲進行因果效應的估計與推論，同樣需要一個良好的設計，配對即可視為一種設計。在觀察性研究中，配對(matching)是一種改善選樣偏誤的方法，將相似的實驗組與對照組受試者配成一對，進而得到一組配對樣本，使用此樣本進行估計可減少估計之偏誤。配對的目的在於將觀察性研究重新設計為一類隨機試驗研究，以探討處理效果。本文探討的配對方法為傾向分數配對(propensity score matching)以及確. 政治大起，而傾向分數將多維度控制變數轉為單一維度的條件機率，可處理變數過多時立切配對。確切配對為最直覺的配對方法，即將控制變數結果完全相同者配對在一. ‧ 國. 學. 難以執行確切配對的困境。研究目的在於探討不同配對方法的合併使用，即「傾向分數配對」與「確切配對」兩種配對方法的合併使用，使用蒙地卡羅模擬研究. ‧. 找出兩種配對方法合併使用之適當情境，在配對方法之結合使用上提出相關建. n. al. er. io. sit. y. Nat. 議。. Ch. engchi. 2. i Un. v.

(9) 第三節. 本文架構. 本文共分為六章節。第一章為緒論，闡述研究動機與背景、研究目的以及本文架構。第二章為文獻回顧，由相關文獻探討「配對」與「傾向分數」的歷史與發展過程，以及過去學者使用傾向分數配對所進行的實證研究與模擬研究結果，其內容包含處理效果、傾向分數之性質、傾向分數之估計，最後說明配對後之平衡診斷。第三章為研究方法，說明本研究所使用的研究方法，以及模擬的假設情境。本文考慮四種情境來進行模擬比較，欲了解在何種情境之下，結合傾向分數配對與確切配對能得到較佳之估計結果。第四章為蒙地卡羅模擬研究的結果與分. 政治大配對與確切配對之實證分析。探討社會學與犯罪學領域之相關議題「家庭結構對立析。第五章為實證研究，使用內政部「青少年身心狀況調查」資料進行傾向分數. ‧ 國. 學. 青少年偏差行為之影響」，目的是想要了解來自非完整家庭之青少年是否較完整家庭之青少年出現較多的偏差行為，希望能了解單親家庭之青少年成長過程中面. ‧. 臨之難題，以協助單親家庭青少年接受到更多社會資源之協助與關懷。第六章. n. al. er. io. sit. y. Nat. 為結論，此章節將說明本研究之結論、研究方法之限制和相關建議。. Ch. engchi. 3. i Un. v.

(10) 第二章. 文獻回顧. 本章將針對因果效應、傾向分數之概念、配對方法的發展、估計方法與使用方式、距離之定義，以及對配對後樣本進行平衡性檢查進行回顧。. 第一節一、. 處理效果. 平均處理效果根據 Neyman(1923)提出的反事實分析架構(counterfactual framework)及. Rubin(1974)對因果效應或稱處理效果的定義，處理效果可被定義為「可觀測到的潛在結果」與「無法觀測到的潛在結果」(也就是所謂的反事實的結果)之間的. 政治大. 比較，這可以是兩者的差異𝑌1 − 𝑌0 或兩者的比率𝑌1 /𝑌0 。. 立. 由於在反應變數上，我們只能觀測到受詴者兩個潛在反應中的其中一個，即. ‧ 國. 學. 受詴者在實驗組之下的潛在結果𝑌𝑖1 或在對照組之下的潛在結果𝑌𝑖0，令 W 為一個代表處理指派的二元變數，受詴者為實驗組時，W = 1，為對照組時，W = 0，. ‧. io. y. sit. Nat. n. al. 𝑖𝑓 𝑊𝑖 = 0 𝑖𝑓 𝑊𝑖 = 1. 𝑌𝑖0 𝑌𝑖1. 𝑌𝑖 = {. er. 則. Ch. n engchi U. iv. (2.1). 其中𝑌𝑖1 表示為受詴者 i 在實驗組之下的潛在結果，𝑌𝑖0 為受詴者 i 在對照組之下的潛在結果。因此受詴者 i 所能觀察到的潛在結果可表示為:. 𝑌𝑖 = 𝑊𝑖 𝑌𝑖1 + (1 − 𝑊𝑖 ) 𝑌𝑖0 (2.2) 而其處理效果(treatment effect)可表示為:. ∆𝑖 = 𝑌𝑖1 − 𝑌𝑖0 (2.3). 4.

(11) 再者，就一組樣本大小為 N 的隨機樣本來說，其平均處理效果(average treatment effect)可定義為:. 𝐴𝑇𝐸 = 𝐸,∆- = 𝐸,𝑌1 − 𝑌0 - = 𝐸,𝑌1 - − 𝐸,𝑌0 -. 而實驗組的平均處理效果(average treatment effect for the treated group) 可定義為:. 𝐴𝑇𝑇 = 𝐸,𝑌1 − 𝑌0 | 𝑊 = 1- = 𝐸,𝑌1 | 𝑊 = 1- − 𝐸,𝑌0 | 𝑊 = 1-. 立. 政治大. 然而，無論於觀察性研究或隨機詴驗，我們皆無法同時觀察到受詴者 i 的兩種潛. ‧ 國. 學. 在結果，使得 ATE 與 ATT 皆無法經由觀察來得到。因此，本文所要探討的內容. 處理指派可忽略. sit. y. Nat. 二、. ‧. 即是針對觀察性研究中，如何使用傾向分數一對一配對的方式來處理這個問題。. io. er. Rosenbaum 與 Rubin(1983)認為在一個觀察性研究中，必須完整地觀察到所有會造成選樣偏誤的變數，這些變數與處理指派或反應變數相關。在控制住這些變數. al. n. iv n C 後，才能達到隨機詴驗的隨機指派特性。而控制住這些變數可等價於假設一。 hengchi U 假設一 :處理指派可忽略(strongly ignorable treatment assignment). , (𝑌0 , 𝑌1 ) ⊥ 𝑊 - | 𝑋. (假設一)中，𝑋代表所有會造成選樣偏誤的變數，已被觀測到且控制住，受詴者接受處理與否與反應變數潛在結果獨立。因此在控制住𝑋之下，便可以得到隨機指派特性。在處理指派可忽略之下，觀察性資料可以(2.4)式得到不偏的 ATE 與 ATT， (2.4)式為可觀察到的結果:. 5.

(12) 𝐸 ,𝑌1 | 𝑊 = 1 , 𝑋- − 𝐸 ,𝑌0 | 𝑊 = 0 , 𝑋(2.4) 對控制變數𝑋取期望值就可以得到不偏處理效果，如下兩式所得: (1)由(2.4)式得不偏 ATE 𝐸𝑋 * 𝐸 ,𝑌1 | 𝑊 = 1 , 𝑋- − 𝐸 ,𝑌0 | 𝑊 = 0 , 𝑋- + = 𝐸𝑋 * 𝐸 ,𝑌1 | 𝑋- − 𝐸 ,𝑌0 | 𝑋- + = 𝐸𝑋 * 𝐸 ,𝑌1 − 𝑌0 | 𝑋- + = 𝐸 ,𝑌1 − 𝑌0 = 𝐸,𝑌1 - − 𝐸,𝑌0 -. 立. (2) 由(2.4)式得不偏 ATT. 政治大. ‧ 國. = 𝐸𝑋 * 𝐸 ,𝑌1 | 𝑊 = 1 , 𝑋- − 𝐸 ,𝑌0 | 𝑊 = 1 , 𝑋- +. 學. 𝐸𝑋 * 𝐸 ,𝑌1 | 𝑊 = 1 , 𝑋- − 𝐸 ,𝑌0 | 𝑊 = 0 , 𝑋- +. (2.5). ‧. = 𝐸𝑋 * 𝐸 ,𝑌1 − 𝑌0 | 𝑊 = 1 , 𝑋- +. sit. y. Nat. = 𝐸 ,𝑌1 − 𝑌0 | 𝑊 = 1-. n. al. er. io. = 𝐸,𝑌1 | 𝑊 = 1- − 𝐸,𝑌0 | 𝑊 = 1-. Ch. engchi U. v ni. (2.6). 在滿足處理指派可忽略之下，𝐸 ,𝑌0 | 𝑊 = 1 , 𝑋-能取代 𝐸 ,𝑌0 | 𝑊 = 0 , 𝑋-。此外，於觀察性研究中我們藉由配對來估計「無法觀測到的潛在結果」，本文使用的傾向分數一對一配對以實驗組為主角，對實驗組受詴者進行𝑌0 的估計，故所估計的處理效果為發生在實驗組受詴者身上的效果，即 ATT。最後，在處理指派可忽略之下，經由(1)與(2)可知 ATT 等價於 ATE。. 6.

(13) 第二節. 傾向分數之基本概念. 如何將觀察性研究的資料經過適當的設計與安排後，能夠視為隨機詴驗的方式來客觀探討處理效果的相關研究相當多，其中傾向分數在過去的這一、二十年來受到各領域學者廣泛使用。舉例來說，Rubin(2001)使用傾向分數配對，來評估吸食菸草對罹患肺癌之影響；Hansen(2004)則藉由傾向分數配對，來評估不同教學方式對學生 SAT 成績的成效；Austin 與 Mamdani(2006)則針對出院三年內的死亡率，使用傾向分數配對，來評估心臟病患者服用處方藥物 Statin 的效果； Rosenbaum、Ross 與 Silber(2007)針對病患出院後的存活率，使用傾向分數配對，. 政治大 Normand(2011)則依據心理衛生醫療服務的使用程度，透過傾向分數配對來評估立來評估不同科別的醫師對於腫瘤的治療成效；Yoon、Huskamp、Busch 與. ‧ 國. 一、. 學. 美國聯邦政府於 2000 年健保政策改變後之成效1 。何謂傾向分數. ‧. 一般而言，研究群體間的系統性差異(system difference)主要來自受詴者. sit. y. Nat. 本身的差異(subject effect)。Rosenbaum 與 Rubin (1983)提出的傾向分數，主. n. al. er. io. 要用途是調整群體間的系統性差異，是一種能夠有效平衡群體間差異的方法。受. i Un. v. 詴者的傾向分數被定義為給定該受詴者所有觀察得到的控制變數的情況下，接受. Ch. engchi. 某處理或被指派至某特定群體的條件機率。以一個病例對照研究(case-control study)來做說明。令𝑊代表處理指派的二元變數，𝑊 = 1代表實驗組、𝑊 = 0代表對照組；令𝑋代表可觀察到之控制變數向量，則一位受詴者 i 的傾向分數可表示為: 𝑒(𝑋𝑖 ) = 𝑝(𝑊𝑖 = 1 | 𝑋𝑖 = 𝑥𝑖 ) (2.7) 即受詴者 i 在其所觀察得到的控制變數之下，接受處理或被指派至實驗組的機率。. 1. 美國聯邦政府所提供之健保政策，於 2000 年增加心理衛生醫療服務方面的保障。. 7.

(14) 二、. 傾向分數的性質. 依據 Rosenbaum 與 Rubin(1983)的論述，傾向分數具有兩項重要性質: (i) 傾向分數為平衡分數、(ii) 給定傾向分數下，處理指派可忽略。 (i)平衡分數(balancing score) 平衡表示兩組群體控制變數的分配相似，任何具有平衡性質的配對依據即可稱為平衡分數。Rosenbaum 與 Rubin(1983)的「定理 1」及「定理 2」證明傾向分數為平衡分數且具有單一維度的優點。傾向分數的平衡性質可以表示為:. , 𝑋 ⊥ 𝑊 - | 𝑒(𝑋). 立. 政治大. (2.8). 即給定傾向分數之下，處理指派與可觀察到的控制變數為獨立。表示若將傾向分. ‧ 國. 學. 數 e(X)定義為控制變數的函數，在給定傾向分數之下，實驗組和對照組控制變. ‧. 數 X 的分配為相同，即平衡之意義可表示為:. y. Nat. n. al. er. io. sit. 𝑝𝑟𝑜𝑏( 𝑋 | 𝑊 = 1 , 𝑒(𝑋) ) = 𝑝𝑟𝑜𝑏( 𝑋 | 𝑊 = 0 , 𝑒(𝑋) ) = 𝑝𝑟𝑜𝑏( 𝑋 | 𝑒(𝑋) ). Ch. n engchi U. iv. (2.9). 因此，使用傾向分數作為配對依據能使兩組群體在控制變數分配達到平衡，即分配相同。 (ii) 給定傾向分數下，處理指派可忽略 Rosenbaum 與 Rubin(1983)的「定理 3」依據「傾向分數具有平衡性質」與「假設 1 處理指派可忽略: , (𝑌0 , 𝑌1 ) ⊥ W - | 𝑋」，證明在控制傾向分數之下，處理指派與反應變數潛在結果獨立，使得在給定傾向分數之下，處理指派可忽略亦成立:. , (𝑌0 , 𝑌1 ) ⊥ W - | 𝑒(𝑋) (2.10). 8.

(15) 因此，若將(2.4)式中控制變數 X 改以傾向分數𝑒(𝑋)取代，得下式:. 𝐸 ,𝑌1 | 𝑊 = 1 , 𝑒(𝑋)- − 𝐸 ,𝑌0 | 𝑊 = 0 , 𝑒(𝑋)(2.11) 使用(2.10)和(2.11)式，同樣可推得不偏的 ATE 與 ATT。 Rosenbaum 與 Rubin(1983)的「定理 4」，即是證明給定傾向分數之下，平均處理效果為不偏的處理效果。三、. 如何估計傾向分數. 在隨機詴驗中，處理指派變數𝑊為隨機指派，每位受詴者有相同機率被指派. 治政至處理，然而在觀察性研究中，被指派至處理的機率未知，故可將傾向分數視為大立一未知函數，需要進一步使用觀察資料進行估計。 ‧ 國. 學. 估計傾向分數最常見的方法為 Rosenbaum 與 Rubin (1983)所使用之羅吉斯. ‧. 迴歸(logistic regression)，模型中反應變數為處理指派 W、解釋變數為所觀. sit. y. Nat. 察到的控制變數 X，令𝛽代表迴歸係數的向量，則對受詴者而言，其傾向分數可. io. n. al. er. 由二元羅吉斯迴歸估計得到:. Ch. engchi. 𝑒(𝑋) = 𝑃(𝑊 = 1 | 𝑋 = 𝑥) =. i Un 𝑒 𝑋𝛽. v. 1+𝑒 𝑋𝛽. =. 1 1+𝑒 −𝑋𝛽. (2.12) 從配適的模型中得到接受處理的預測機率即為傾向分數。由於此模型屬於非線性模型，表示處理指派與控制變數非線性函數關係。 Rosenbaum 與 Rubin (1985b) 提出，在作傾向分數配對時可以使用線性傾向分數(linear propensity score)取代原本的傾向分數。作法為使用 Logit function 對傾向分數𝑒(𝑋)做線性轉換，以便得到線性傾向分數:. 9.

(16) 𝑞(𝑋) = 𝐿𝑜𝑔(. 𝑒(𝑋) 𝑃 ) = 𝐿𝑜𝑔( ) = 𝑋𝛽 1 − 𝑒(𝑋) 1−𝑃 (2.13). 轉換過後的線性傾向分數𝑞(𝑋)與控制變數𝑋為線性函數關係，好處在於其分配近似常態分配。此外，Rosenbaum 與 Rubin (1983)亦提出可以使用 Probit regression model 或透過 Discriminant analysis 來估計傾向分數。. 立. 政治大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 10. i Un. v.

(17) 第三節. 傾向分數之使用方式. 在估計完傾向分數之後，傾向分數的使用方式主要分為四種，分別由 Rosenbaum 與 Rubin (1983)及 Rosenbaum (1987)提出。. 傾向分數使用方式之架構圖. 傾向分數使用方式. 政治大變量調整立配對. 分層. 加權調整. ‧ 國. 學 ‧. Step1. 定義距離. sit. y. Nat. n. al. er. io. Step2. 配對方法. Ch. engchi. Step3. 平衡診斷. i Un. v. No. Yes. Step4. 分析結果. 11.

(18) 一、傾向分數分層(sub-classification on the propensity score) Rosenbaum 與 Rubin (1983)提出之分層方式如下：依據傾向分數來對受詴者區分為五至十層後，分別估計各層的處理效果並以加權方式得到一個整體的平均處理效果估計值。二、傾向分數配對(propensity score matching) Rosenbaum 與 Rubin (1983)使用傾向分數來進行配對。配對的主角為實驗組受詴者，就對照組中尋找與實驗組傾向分數相近的受詴者加以配對以組成配對樣本，再藉由配對樣本來進行處理效果之估計。三、傾向分數變量調整(covariate adjustment using the propensity score). 治政 Rosenbaum 與 Rubin (1983)建議可以將傾向分數視為一個獨立變數。在建構大立探討反應變數的迴歸模型中，解釋變數中除了包含必要的處理指派變數外， ‧ 國. 學. 也一併納入傾向分數來做為一個控制變數。. ‧. 四、傾向分數加權調整（weighting adjustments using the propensity score）. sit. y. Nat. Rosenbaum (1987)建議將將傾向分數的倒數視為一種權重，經由此權重進行. io. n. al. er. 加權調整後來進行平均處理效果的估計。. i Un. v. 其中傾向分數配對與傾向分數分層為較常見的使用方式，Austin與. Ch. engchi. Mamdani(2006)使用標準化差異2來比較傾向分數配對與分層的平衡效果。研究結果顯示，傾向分數配對相較於傾向分數分層能較有效地平衡兩組群體在控制變數上的系統差異。此外，Austin(2007)也採模擬研究的方式，以邊際勝算比作為衡量處理效果的工具，分別使用傾向分數配對、傾向分數分層以及傾向分數變量調整三種方式來估計真實勝算比。評估方式為偏誤減少比例、均方誤以及95%信賴區間覆蓋率，研究結果顯示勝算比的估計，以傾向分數配對的表現最佳。. 2. Rosenbaum 與 Rubin (1985)提出使用標準化差異作為衡量平衡效果的工具，詳見本章第四節。. 12.

(19) 第四節. 配對方法之發展. Stuart(2010)指出任何可以使實驗組與對照組在控制變數分配上達到平衡的方式，均可廣泛定義為配對。配對的想法最早在 1940 年代就已經被提出，不過直到 1970 年代才開始有學者進行配對方法的相關研究（Rubin,1973）。配對經常用來幫助研究者從大量的對照組受詴者中挑選出一部份合適的受詴者與實驗組受詴者配對，進而組成一組配對樣本。因此，配對亦是一種再抽樣（resampling）的方法。不過相對原始樣本而言，配對樣本可推論的廣度亦相對減少。配對的執行可以分為下列四個步驟：. 政治大. 步驟 1:受詴者間的距離定義. 立. 步驟 2:選擇配對方法. ‧ 國. 學. 步驟 3:得到配對樣本並評估是否達到平衡步驟 4:進行結果的分析. ‧. 一. 距離定義. sit. y. Nat. 進行配對前，需要選擇一種距離來測量受詴者間的相似性，Stuart(2010). n. al. er. io. 討論四種類型的距離。 (1)確切距離（exact distance）. Ch. engchi. i Un. v. 確切距離的測量方式是配對變數的值或類別必須完全相同，兩位受詴者才會被配對。就控制變數 X 而言，兩受詴者 i 與 j 的確切距離可表示為:. 𝐷𝑖𝑗 = {. 0 ∞. 𝑖𝑓 𝑋𝑖 = 𝑋𝑗 𝑖𝑓 𝑋𝑖 ≠ 𝑋𝑗. 13.

(20) (2)馬氏距離（Mahalanobis distance）馬氏距離最早被使用於配對上是在 Cochran 與 Rubin(1973)的研究中。就控制變數 X 而言，兩受詴者 i 與 j 的距離，可表示為下式，其中 S 代表樣本之共變異矩陣: 𝑇. M(𝑋𝑖 , 𝑋𝑗 ) = (𝑋𝑖 − 𝑋𝑗 ) 𝑆 −1 (𝑋𝑖 − 𝑋𝑗 ). 馬氏距離的測量考慮到控制變數間共變異的關係，適用於連續型變數且變量個數少於八個時（Zhao , 2004），當變量個數過多或非常態分配時. 政治大. 較不適用（Gu and Rosenbaum ,1993）。. 立. ‧ 國. 學. (3)傾向分數（propensity score）. 傾向分數將高維度的控制變量轉換至單一維度，在控制變數較多時有助. ‧. 於配對的執行。使用傾向分數作為距離時，兩受詴者 i 與 j 的距離，可. n. al. er. io. 𝐷𝑖𝑗 = | 𝑒(𝑋) 𝑖 − 𝑒(𝑋) 𝑗 |. sit. y. Nat. 表示為:. Ch. engchi. i Un. v. Gu 與 Rosenbaum(1993)進行馬氏距離和傾向分數的模擬比較，在設定控制變數服從常態分配，變數個數分別為 2 個、5 個及 20 個之下，使用馬氏距離和傾向分數作為距離，分別進行配對並比較配對樣本的平衡性。結果發現在變數個數較多時，使用傾向分數平衡效果越優於馬氏距離。. (4)線性傾向分數（linear propensity score） Rosenbaum 與 Rubin(1985b)指出使用線性傾向分數會比傾向分數更能有效地減少偏誤。由於線性傾向分數和控制變數間為線性關係，並近似常態分配，此為傾向分數所不具備的性質，因此，傾向分數配對實際多. 14.

(21) 為使用線性傾向分數昨為距離。計算實驗組受詴者與對照組受詴者之間線性傾向分數的絕對差異，兩受詴者 i 與 j 的距離可表示為:. 𝐷𝑖𝑗 = | 𝑞(𝑋). 𝑖. − 𝑞(𝑋) 𝑗 |. 絕對差異越小表示兩個受詴者相似程度越高；相似程度越高的受詴者在執行配對時越可能被配成一對成對樣本。二. 配對方法常見的配對方法可分為下列四大類，即確切配對、貪婪配對、最鄰近配對與最適. 治政配對，下圖為配對方法之分類圖: 大立 ‧ 國. 學. 配對方法主要分類配對方法. ‧. io. 貪婪配對. er. n. al. 最鄰近配對. 馬氏距離配對. Ch. sit. y. Nat 確切配對. engchi. 馬氏距離配對包含傾向分數. i Un. 最適配對. v. 傾向分數配對. （1）確切配對（exact matching）當我們希望將兩群體的受詴者配對成一組配對樣本時，最直覺的配對方法為確切配對，也就是使用確切距離來進行配對。但當配對變數過多時，確切配對的. 15.

(22) 進行將遭遇到困難，部分實驗組受詴者可能會沒有可配對的對照組受詴者，導致配對樣本的樣本數過小。通常在配對變數維度過高時會有此問題，這樣的配對結果稱為不完整配對。由於無法配到對的受詴者過多，將造成大量的資料損失，這是研究者所不樂見的事情。使用確切距離來進行配對時，若配對變數為類別型變數，兩群體間的受詴者在此變數之下的所屬類別必須相同才會被配成一對；若配對變數為連續型變數，則兩群體間的受詴者在此變數下的數值必須相同才會被配成一對。（2）最鄰近配對法（nearest neighbor matching） Rubin (1973)提出，當無法做到確切配對時，可以將距離最近的受詴者配對. 治政在一起，稱為最鄰近配對法。針對每一位實驗組受詴者去尋找一位距離最近的對大立照組受詴者來進行配對，此方法成為一種最常見也最容易執行的配對方法。 ‧ 國. 學. （3）貪婪配對(greedy matching). ‧. 貪婪配對使用最鄰近配對的概念，在實驗組受詴者本身的某個區域內尋找最. sit. y. Nat. 接近的對照組受詴者來配對。配對的流程先將實驗組受詴者隨機進行編號，對編. io. er. 號 1 的實驗組受詴者尋找最近距離的對照組受詴者，配對後便移置配對樣本中，接著對編號 2 實驗組受詴者尋找對照組受詴者，重複此過程直到所有實驗組受詴. n. al. ni Ch 者皆被配對完成為止，即可得到一組配對樣本。 U engchi. v. 常見的貪婪配對法依照不同之距離定義可區分為下列三種：一為馬氏距離貪婪配對、一為傾向分數之貪婪配對、一為馬氏距離包含傾向分數之貪婪配對，即傾向分數被視為馬氏距離中的一個變數。此外，貪婪配對可進一步結合門檻值配對（caliper matching），門檻值配對會設定一個距離來作為門檻值，兩組受詴者距離的差異必須小於門檻值才具有被配對在一起的機會，門檻值設定越小，每一對配對樣本的相似程度會越高，但同時亦會提高資料損失的可能性。一般而言，在進行傾向分數配對時，當實驗組線性傾向分數的變異數較大於對照組時，必須取較小的門檻值。針對門檻值的選取，Rosenbaum 與 Rubin(1985b) 指出，若實驗組的變異數為對照組的兩倍時，選取 0.2 倍的線性傾向分數標準差. 16.

(23) 為門檻值時，對於常態分配的變量可以移除 98%的偏誤。取 0.4 倍則可移除 93% 的偏誤，選取 0.6 倍則可移除 86%的偏誤，並建議使用 0.2 倍線性傾向分數標準差做為門檻值。此外，Austin(2009)針對門檻值的選取，就醫學期刊中最常使用的 8 種傾向分數配對門檻值來進行模擬研究，比較處理效果的均方誤，模擬結果顯示使用 0.2 倍線性傾向分數標準差的效果最佳。（4）最適配對（optimal matching） Rosenbaum(1989)提出最適配對的作法。最適配對與貪婪配對最大不同在於，貪婪配對致力於極小化配對樣本中每一對樣本間的距離，而最適配對則是極小化配對樣本中實驗組與對照組的總距離，也就是說貪婪配對尋找局部的最小距離，. 治政最適配對尋找整體的最小距離。在設定控制變數服從常態分配，變數個數分別為大立 2 個、5 個及 20 個之下，Gu 與 Rosenbaum (1993)以配對後偏誤降低比例來評估 ‧ 國. 學. 兩種配對方法之平衡效果。模擬結果顯示，最適配對和貪婪配對在平衡效果上沒. ‧. 有孰優孰劣的問題，兩種方法都能有效地降低偏誤。貪婪配對在執行上會比最適. sit. y. Nat. 配對有效率，但貪婪配對需要隨機決定一位實驗組受詴者，若起始的實驗組受詴者改變，最後的配對樣本亦有可能改變。最適配對則沒有類似的困擾。. er. io. 第五節 a. n. 配對後之平衡診斷 iv l C n hengchi U 在執行完配對方法之後，我們會得到一組配對樣本，此時需要對此配對樣本進行平衡性的檢查。檢查的目的在於希望配對樣本中實驗組與對照組在控制變數上擁有相似的分配，若使用傾向分數配對，平衡診斷等同於在檢查傾向分數的平衡性質，即, 𝑋 ⊥ 𝑊 - | 𝑒(𝑋)，再平衡性達到一定程度後，方能進一步估計處理效果。Stuart(2010)曾對診斷方法進行分類，將診斷方法分為數值診斷方法和圖形診斷方法兩大類。一、數值診斷方法 (1)標準化差異當進行的配對方法屬於「非確切配對」時，兩組群體在控制變數上仍存在些. 17.

(24) 微差異，必須使用一些測量工具幫助我們衡量此差異。其中最常見的平衡診斷工具為 Rosenbaum 與 Rubin(1985a)建議採用的標準化差異(standardized difference)，標準化差異越小表示兩組群體在此變數的分配越相似。連續型變數的標準化差異為兩群體在變量上平均數的差異除以兩群體的混合標準差，而類別型變數標準化差異的計算方式相同但改以比例來取代。定義𝑠𝑡𝑖 為原始樣本中第 i 個控制變數的標準差，其中 t=1 代表實驗組、t=0 代表對照組，則兩群體控制變數 i 的混合標準差為:. 1/2. 政治大 (2.14). 學. ‧ 國. 立. 2 2 𝑠1𝑖 + 𝑠0𝑖 𝑠̅𝑖 = ( ) 2. 原始樣本中第 i 個控制變數的標準化差異定義為:. sit. y. 𝑥̅1𝑖 − 𝑥̅0𝑖 𝑠̅𝑖. (2.15). n. er. io. al. ‧. Nat. 𝐵𝐶𝑖 =. i Un. v. 其中𝑥̅1𝑖 和𝑥̅0𝑖 分別為原始樣本中實驗組與對照組控制變數 i 的樣本平均數。. Ch. engchi. 配對樣本中第 i 個控制變數的標準化差異計算公式為:. 𝐵𝑀𝑖 =. 𝑥̅𝑀1𝑖 − 𝑥̅𝑀0𝑖 𝑠̅𝑖 (2.16). 其中𝑥̅𝑀1𝑖 和𝑥̅𝑀0𝑖 分別為配對樣本中控制變數 i 的樣本平均數。我們分別對每一個控制變數計算標準化差異，若配對後各控制變數的標準化差異較配對前低，則表示我們透過配對的過程，確實能減少群體間的系統性差異。必須注意到的是，兩個標準化差異分母均為混合標準差𝑠̅𝑖，其目的在於將差異比例. 18.

(25) 化，接著可設定一個作為平衡診斷標準的比例值，若配對後的標準化差異低於此標準，則認為配對樣本已達到平衡。Normand(2001)建議，平衡診斷標準可設定為 0.1，若超過 0.1 即代表此控制變數仍未被平衡。 (2)顯著性檢定除了標準化差異之外，也可以利用一般的顯著性檢定來判斷實驗組和對照組在各個控制變數上是否存在顯著差異。針對連續型變數，可以使用兩獨立樣本 T 檢定比較兩群體的平均數是否存在顯著差異；類別型變數則可使用卡方檢定之齊一性檢定，來了解分配的結構是否存在顯著差異。顯著性檢定相對標準化差異而言是較為客觀的平衡診斷方法，此為其優點。. 治政然而我們必須了解到原始樣本經過配對後在樣本數上必會有所減少，樣本數的變大立動亦可能會造成檢定結果改變，因此我們並不能將原始樣本的檢定結果與配對樣 ‧ 國. 學. 本的檢定結果進行比較，藉以反應配對的平衡效果，此為其缺點所在。Imai、King. ‧. 與 Stuart(2008)具體說明配對樣本不適合做顯著性檢定，其原因有二:一為配對. sit. y. Nat. 樣本的樣本數相對原始樣本有所減少，在配對樣本上做顯著性檢定其檢定力是較. io. er. 低的，平衡性的改善有可能是因為樣本數減少所造成。一為研究者只是想了解此配對樣本是否具備平衡性，並沒有要對母體進行推論。. al. n. iv n C 相反的，無論原始樣本或配對樣本的標準化差異計算公式中，其分母為相同 hengchi U. 的混合標準差。使標準化差異不會受到樣本數變動的影響，因此在配對前後的標準化差異是可進行合理比較的，此為標準化差異的優點。由於平衡標準的設定與顯著性檢定未必可行，使得標準化差異成為較為主觀的平衡診斷方法。關於使用顯著性檢定進行平衡診斷，Rosenbaum 與 Rubin (1985b)以及 D'Agostino(1998)之實證研究中，除了使用標準化差異來進行平衡診斷外，在配對前後亦使用兩獨立樣本 T 檢定來進行連續型變數平衡性的檢查。二、圖形診斷方法診斷方法除了上述所提及的標準化差異和顯著性檢定之外，亦可使用圖形來進行診斷。針對連續型變數，進行圖形繪製以了解實驗組與對照組分配的相似性。. 19.

(26) 如常見的圖形診斷方法為使用 Quantile-Quantile 圖對實驗組與對照組的百分位數進行比較，若兩組群體變量的分配相同，則在 Quantile-Quantile 圖上可觀察到所有的觀測點會座落於四十五度斜線上。此外對於實驗組與對照組的分配進行直方圖、箱型圖以及累積分配圖的比較，也可以幫助判斷兩組分配是否相似。. 立. 政治大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 20. i Un. v.

(27) 第三章. 研究方法. 第一節. 研究設計. 文獻中經常可見各種配對方法合併使用的情況，所謂的「合併使用」指的是合併採用多種不同配對方法後，再進行結果的分析。舉例來說，Rubin(2001)於吸菸與肺癌實證研究中，針對名目變數「性別」先作確切配對後，再執行傾向分數配對；Rosenbaum、Ross 及 Silber(2007)於探討腫瘤治療之實證研究中，針對名目變數「治療年份」作確切配對後，再執行傾向分數配對；Stuart(2010)則明確建議研究者可以先就重要的「名目變數」作確切配對後，再執行傾向分數配對。. 政治大. 針對 Stuart (2010)的建議，本文將藉由一蒙地卡羅模擬實驗來加以驗證。欲探. 立. 討的問題為:「若先對一個重要名目變數進行確切配對後，再進行傾向分數配對，. ‧ 國. 學. 相較於直接進行傾向分數配對，在後續處理效果的估計是否有所幫助？估計結果是否會較接近真實處理效果？」，此為我們的目的之一。另一個目的則在於. ‧. Stuart (2010)所謂的重要名目變數並沒有明確定義，故本文設定了四種情境，. y. Nat. io. sit. 想了解與處理指派以及反應變數相關程度不一的四個名目變數，分別對這四個名. n. al. er. 目變數作確切配對後，再執行傾向分數配對，哪一種情境的有較好的估計結果。. i Un. v. 這其中，傾向分配對我們採用的是一對一貪婪配對，門檻值設定為 0.2 倍的線性傾向分數標準差。. Ch. engchi. 21.

(28) 第二節. 邊際處理效果. 本章中我們欲執行一模擬實驗來了解不同配對方法下的處理效果估計值與真實處理效果的差異。目標是對平均處理效果進行估計，故此處我們所謂的處理效果指的是邊際處理效果。由於第五章實證資料的反應變數為一個二元變數，因此本文使用對數勝算比(log- odds ratio)來衡量處理效果。反應變數發生率與邊際處理效果分別可由下列兩個羅吉斯迴歸模型得到: 𝑙𝑜𝑔𝑖𝑡(𝑝𝑜𝑢𝑡𝑐𝑜𝑚𝑒 ) = 𝛼0,𝑜𝑢𝑡𝑐𝑜𝑚𝑒 + 𝛽𝑡𝑟𝑒𝑎𝑡 𝑊 + 𝛼1 𝑥1 + ⋯ + 𝛼𝑝 𝑥𝑝 (3.1). 政治大. 𝑙𝑜𝑔𝑖𝑡(𝑝𝑜𝑢𝑡𝑐𝑜𝑚𝑒 ) = 𝛼0,𝑜𝑢𝑡𝑐𝑜𝑚𝑒 + 𝛽𝑡𝑟𝑒𝑎𝑡 𝑊. 立原始樣本邊際處理效果. ‧ 國. 學. 一、. (3.2). 根據反應變數模型(3.1)，對照組受試者反應變數發生率可由下式所得:. ‧. n. al. i Un. 而實驗組受試者反應變數發生率可由下式所得:. Ch. engchi. (3.3). er. io. sit. y. Nat. 𝑙𝑜𝑔𝑖𝑡(𝑝0 ) = 𝛼0,𝑜𝑢𝑡𝑐𝑜𝑚𝑒 + 𝛼1 𝑥1 + ⋯ + 𝛼𝑝 𝑥𝑝. v. 𝑙𝑜𝑔𝑖𝑡(𝑝1 ) = 𝛼0,𝑜𝑢𝑡𝑐𝑜𝑚𝑒 + 𝛽𝑡𝑟𝑒𝑎𝑡 + 𝛼1 𝑥1 + ⋯ + 𝛼𝑝 𝑥𝑝 (3.4) 由上兩式，可得每位實驗組受試者反應變數發生率𝑝1和每位對照組受試者反應變數發生率𝑝0，並分別以實驗組與對照組的反應變數發生率平均值𝑝̅1和𝑝̅0 ，得到原始樣本邊際對數勝算比估計量為： 𝑝̅1 1 − 𝑝̅1 𝑙𝑜𝑔 𝑝̅0 1 − 𝑝̅0 (3.5). 22.

(29) 二、. 配對樣本邊際處理效果. 配對樣本屬於成對樣本，因此配對後的資料型態屬於二元成對樣本(binary matched-pairs data)。在此資料型態之下，可以藉由下列的二維列聯表進行來邊際對數勝算比的估計。二元成對樣本的二維列聯表如下: 表 3-1 二元成對樣本的二維列聯表行列. 成功. 成功. a. 失敗. 立. 總和. 失敗. 總和. b 治政 c d 大. a+c. a+b c+d. b+d. n. ‧ 國. 學 ‧. 表 3-1 中，成對樣本中兩位受試者皆為「成功」的成對樣本個數定義為 a，. sit. y. Nat. 皆為「失敗」則定義為 d，第一位受試者為「成功」且第二位受試者為「失. io. 為「成功」的成對樣本個數則定義為 c。. al. er. 敗」的成對樣本個數定義為 b，而第一位受試者為「失敗」且第二位受試者. n. iv n C 根據 Agresti 與 Min(2004)，成對樣本的邊際對數勝算比之最大概似估計量 hengchi U 為: (𝑎 + 𝑐)(𝑐 + 𝑑) 𝑙𝑜𝑔⁡ (𝑏 + 𝑑)(𝑎 + 𝑏) (3.6) 而邊際對數勝算比之標準誤為: √. 𝑛[(𝑎 + 𝑑)(𝑏 + 𝑐) + 4𝑏𝑐] (𝑎 + 𝑏)(𝑐 + 𝑑)(𝑎 + 𝑐)(𝑏 + 𝑑). 23.

(30) 第三節. 資料生成. 本文所使用之軟體為統計軟體 R 2.12 版本，使用範圍包含模擬資料之生成、第四章的模擬資料分析與第五章之實證分析，其中配對方法所使用的套件為「nonrandom」。該套件可以執行傾向分數貪婪配對，亦可搭配門檻值之設定，同時亦具備執行傾向分數分層的功能。一、. 變數生成之架構. 本模擬研究的資料生成方式主要參考 Austin(2007)之模擬研究架構，除了反應變數 Y 與處理指派變數𝑊外，考慮實證資料中變數多為二元變數，故加. 政治大數與處理指派變數及反應變數間的關聯情形如表 3.1 所示。變數𝑥 、𝑥 、𝑥 、𝑥 、立入八個母體參數比例為 0.5 的二元變數𝑥1 , … , 𝑥8 來進行探討，其中這八個變 1. 2. 4. 5. ‧ 國. 學. 𝑥7 及𝑥8 設定為與處理指派有相關之變數，而𝑥1、𝑥2、𝑥3、𝑥4、𝑥5 及𝑥6 ，則為與反應變數有相關之變數，其中𝑥1、𝑥2、𝑥4、𝑥5 為同時與處理指派和反應變. ‧. 數有所關聯的變數，𝑥7、𝑥8 僅與處理指派有相關，𝑥3、𝑥6 則僅與反應變數有. sit. y. Nat. 相關。由於這八個變數與處理指派及反應變數皆為二元隨機變數，參酌. n. al. er. io. Austin(2007)的定義方式，我們將高度相關定義為 5 倍的勝算比，中度相關. i Un. v. 則定義為 2 倍勝算比，無相關定義為 1 倍勝算比。. Ch. engchi. 表 3.1 變數𝑥1 , … , 𝑥8 與處理指派變數及反應變數間之關聯架構. 與反應變數高度相關與反應變數中度相關與反應變數無相關. 與處理指派. 與處理指派. 與處理指派. 高度相關. 中度相關. 無相關. 𝑥1. 𝑥2. 𝑥3. 𝑥4. 𝑥5. 𝑥6. 𝑥7. 𝑥8. -. 24.

(31) 二、. 受試者資料之生成. 我們先就𝑥1 , … , 𝑥8 分別生成樣本數為 1000 及 3000 之兩組樣本資料。 (1)處理指派狀態之生成依據 Austin(2007)的研究結果，使用𝑥1、𝑥2、𝑥4、𝑥5、𝑥7 及𝑥8 此六個與處理指派有相關之變數來建立傾向分數模型最為適合，因此我們也藉由此六個變數來對每一位受試者生成其處理指派資料:. 𝑙𝑜𝑔𝑖𝑡(𝑝𝑡𝑟𝑒𝑎𝑡𝑚𝑒𝑛𝑡 ) = 𝛽0,𝑡𝑟𝑒𝑎𝑡 + 𝛽1 𝑥1 + 𝛽2 𝑥2 + 𝛽3 𝑥4 + 𝛽4 𝑥5 + 𝛽5 𝑥7 + 𝛽6 𝑥8 (3.8). 學. ‧ 國. 治政根據上式可以建立一個服從伯努利分配的處理指派變數𝑊: 大立 𝑊~Bernoulli(𝑝𝑡𝑟𝑒𝑎𝑡𝑚𝑒𝑛𝑡 ). (3.9). ‧. 此外為了使模擬研究的資料能夠適度反應實證研究資料的特性，我們根據實. sit. y. Nat. 證研究的資料特性來設定(3.8)式中的𝛽0,𝑡𝑟𝑒𝑎𝑡 值為−6.3，可使處理指派變數. n. al. er. io. Wi 中的比例參數pi,treatment近似 11%，以符合實證資料中實驗組受試者的比. i Un. v. 例。此外，依據前述高度相關設定為五倍勝算比，故其係數設定為 log(5)，. Ch. engchi. 而中度相關為設定為兩倍勝算比，其係數設定為 log(2)。因此(3.8)式中係數之設定如下所示： 𝛽0,𝑡𝑟𝑒𝑎𝑡 ⁡⁡⁡⁡⁡⁡⁡：−6.3 𝛽1 、𝛽3 、𝛽5 ： log(5) 𝛽2 、𝛽4 、𝛽6 ： log(2). 25.

(32) (2) 反應變數之生成由於變數𝑥1、𝑥2、𝑥3、𝑥4、𝑥5 及𝑥6 設定為與反應變數有相關之變數，因此使用此六個變數以及處理指派變數𝑊 來建立反應變數模型，並藉以生成受試者之反應變數資料。反應變數模型為:. 𝑙𝑜𝑔𝑖𝑡(𝑝𝑜𝑢𝑡𝑐𝑜𝑚𝑒 ) = 𝛼0,𝑜𝑢𝑡𝑐𝑜𝑚𝑒 + 𝛽𝑡𝑟𝑒𝑎𝑡 𝑊 + 𝛼1 𝑥1 + 𝛼2 𝑥2 + 𝛼3 𝑥3 + 𝛼4 𝑥4 + 𝛼5 𝑥5 + 𝛼6 𝑥6. (3.10) 根據上式得到一個服從伯努利分配的反應變數𝑌:. 𝑌~Bernoulli(𝑝𝑜𝑢𝑡𝑐𝑜𝑚𝑒 ). 立. 政治大. (3.11). 一如前述，為了適度反映實證資料的特性，我們將將𝛼0,𝑜𝑢𝑡𝑐𝑜𝑚𝑒 設定為−4.4，. ‧ 國. 學. 可使反應變數比例參數𝑝𝑜𝑢𝑡𝑐𝑜𝑚𝑒 近似 32.5%，以符合實證資料中對照組受試. ‧. 者在反應變數上的發生率。因此(3.2)式中係數之設定如下所示：. io. er. 𝛼1 、𝛼2 、𝛼3 : log(5). sit. y. Nat. 𝛼0,𝑜𝑢𝑡𝑐𝑜𝑚𝑒 : −4.4. n. a l 𝛼4、𝛼5、𝛼6⁡ : log(2) i v n Ch engchi U. 再者，由於係數𝛽𝑡𝑟𝑒𝑎𝑡 代表實驗組與對照組的條件對數勝算比(conditional log-odds ratio)，亦即條件處理效果。本文設定邊際處理效果真實值分別為 log(1)、log(2)、log(4)、log(6)、log(8)之下，模擬結果顯示將𝛽𝑡𝑟𝑒𝑎𝑡 設定為 0、0.989、1.980、2.557697、2.557、2.950，可使邊際處理效果的估計值趨近設定的真實值。. 26.

(33) 第四節. 情境設定. 對於重要名目變數，我們設定此類變數必須與反應變數和處理指派變數皆有關聯，也就是生成架構中的𝑥1、𝑥2、𝑥4 及𝑥5 這四個變數，因此我們考慮對這四個變數分別進行確切配對的四種不同模擬情境，比較「確切配對結合傾向分數配對」與「傾向分數配對」，並找出在何種情境之下，事先執行確切配對會有最好的效果。情境設定如下表: 表 3.3 情境設定四種情境設定與反應變數高度相關. 立. ‧ 國. 中度相關. 與處理指派. 高度相關. 中度相關. 1. 情境二:𝑥2. 情境三:𝑥4. 情境四:𝑥5. 政治大情境一:𝑥. 學. 與反應變數. 與處理指派. ‧. sit. y. Nat. 於情境一中，將「對變數𝑥1 作確切配對，再進行傾向分數配對」來與直接進行「傾. io. er. 向分數配對」作比較。相同地情境二、三及四則分別對𝑥2、𝑥4 及𝑥5 作確切配對。在每種情境之下皆可得到三個邊際處理效果估計值，一為「確切配對結合傾向分. al. n. iv n C 數配對」配對樣本之估計值，一為「傾向分數配對」配對樣本之估計值，一為原 hengchi U 始樣本之估計值。我們將依據這三種估計結果來進行評估與比較。. 27.

(34) 第五節. 模擬結果之評估方式. 欲了解四種情境之估計結果是否接近真實值，本文使用四種評估方式，用以比較「確切配對與傾向分數配對合併使用」與「傾向分數配對」之表現。一、. 偏誤(bias). 根據模擬 1000 次之結果，令𝜃̅代表 1000 個邊際處理效果之平均值，此為估計值，而𝜃𝑇𝑟𝑢𝑒 代表邊際處理效果之真實值，則偏誤可表示為:. 𝑏𝑖𝑎𝑠 = 𝜃̅ − 𝜃𝑇𝑢𝑟𝑒. 政治大若以 Exact-PS 代表「確切配對與傾向分數配對合併使用」配對樣本，PS 代立. ‧ 國. 學. 表「傾向分數配對」配對樣本，而 Crude 代表原始樣本。三組樣本估計偏誤分別以𝑏𝑖𝑎𝑠𝐶𝑟𝑢𝑑𝑒 、𝑏𝑖𝑎𝑠𝑃𝑆 及𝑏𝑖𝑎𝑠𝐸𝑥𝑎𝑥𝑡−𝑃𝑆 來表示。. ‧. 二、. 偏誤降低比例(bias reduction in marginal log-odds ratio). sit. y. Nat. Austin(2007)使用偏誤降低比例對估計的準確性作為評估方式，以原始樣本. n. al. er. io. 的估計偏誤為基準，偏誤計算偏誤減少比例定義為:. 100 ×. Ch 𝑎𝑏𝑠(𝑏𝑖𝑎𝑠. i Un. v. e n g−c𝑎𝑏𝑠(𝑏𝑖𝑎𝑠 h i 𝑒𝑥𝑎𝑥𝑡−𝑝𝑠). 𝑐𝑟𝑢𝑑𝑒 ). 𝑎𝑏𝑠(𝑏𝑖𝑎𝑠𝑐𝑟𝑢𝑑𝑒 ). (3.13). 100 ×. 𝑎𝑏𝑠(𝑏𝑖𝑎𝑠𝑐𝑟𝑢𝑑𝑒 ) − 𝑎𝑏𝑠(𝑏𝑖𝑎𝑠𝑝𝑠 ) 𝑎𝑏𝑠(𝑏𝑖𝑎𝑠𝑐𝑟𝑢𝑑𝑒 ) (3.14). 偏誤降低比例越高，表示配對方法的估計準確性越好。. 28.

(35) 三、. 均方誤(mean square error). 第三個評估指標為均方誤，均方誤越小，表示配對方法的估計精確性越好。 95%信賴區間覆蓋率(coverage of 95% C.I.) 第四個評估指標為 95%信賴區間覆蓋率。藉由這 1000 筆模擬資料，計算 1000 個 95%信賴區間，並計算包含真實值的信賴區間個數，將此區間個數除以模擬次數後得 95%信賴區間覆蓋率，覆蓋率越接近 95%越符合預期。. 立. 政治大. 學 ‧. ‧ 國 io. sit. y. Nat. n. al. er. 四、. Ch. engchi. 29. i Un. v.

(36) 第四章. 模擬結果分析. 由於樣本數 1000 或 3000 結果相同，故本章使用樣本數 1000 的模擬結果進行分析說明。在以下的表格中，Crude 代表未經配對，Exact-PS 代表「確切配對與傾向分數配對合併使用」的配對方式，而 PS 則代表「傾向分數配對」單獨使用的配對方式，故我們將有三組樣本，分別為 Crude 原始樣本、Exact-PS 配對樣本及 PS 配對樣本。我們設定五個對數勝算比真實值：log(1)、log(2)、log(4)、log(6)及 log(8)，並以 1000 次模擬結果之平均值作為對數勝算比之估計值。. 第一節. 對數勝算比之估計. 政治大. 表 4.1 呈現 Crude 原始樣本、PS 配對樣本以及 Exact-PS 配對樣本的估計結果. 立. 2. 3. 4. log(8). 0. 0.69315. 1.3863. 1.79176. 2.07944. 0.7623. 1.4934. 2.2311. 2.7132. 3.0348. 0.0615. 0.7933. 1.5279. 2.0073. 2.3260. 0.0571. 0.7888. 1.5274. 2.0033. 2.3253. 1.4895. 2.2571. 2.6897. 3.0389. 1.9853. 2.3327. al. 0.7555. Ch. PS. 0.0566. Exact-PS. 0.0283. Crude. sit. log(4). n. Crude. log(2). io. Exact-PS. log(1). er. Nat. PS. log(6). ‧. Method. y. True log-odds ratio. Crude 1. 學. Scenario. ‧ 國. 表 4.1 對數勝算比之估計值. v ni. 1.5452 e0.7819 ngchi U 0.7549. 1.5137. 1.9504. 2.2979. 0.7493. 1.4640. 2.2055. 2.7131. 3.0240. PS. 0.0398. 0.7526. 1.5064. 2.0040. 2.3227. Exact-PS. 0.0445. 0.7541. 1.5057. 2.0050. 2.3231. Crude. 0.7413. 1.4673. 2.2286. 2.7037. 3.0397. PS. 0.0267. 0.7597. 1.5270. 1.9935. 2.3350. Exact-PS. 0.0230. 0.7563. 1.5204. 1.9918. 2.3310. 30.

(37) 總體而言，在四種情境之下，不論何種方式，其估計結果皆呈現高估的現象，此乃由於 1000 筆對數勝算比估計值的分配呈現些微右偏1的現象。此外我們也可觀察到偏誤大小與真實值大小呈現正向關聯性，也就是說估計的準確性會隨著真實值的上升而降低，真實值越大偏誤也越大。. 第二節. 偏誤與偏誤降低比例. 表 4.2 為對數勝算比估計值與真實值之差異，即估計的偏誤。表 4-2 對數勝算比之估計偏誤 True log-odds ratio. 立. PS. 1.79176. 2.07944. 0.8003. 0.8448. 0.9215. 0.9553. 0.0615. 0.1002. 0.1416. 0.2156. 0.2465. Exact-PS. 0.0571⋆. 0.0956⋆. 0.1411⋆. 0.2115⋆. 0.2459⋆. Crude. 0.7555. 0.7963. 0.8708. 0.8980. 0.9594. PS. 0.0566. 0.0887. 0.1589. 0.1936. 0.2533. Exact-PS. 0.0283⋆. 0.0617⋆. 0.1274⋆. 0.1586⋆. 0.2184⋆. Crude. 0.7493. 0.7708. 0.8192. 0.9445. 0.0595⋆. 0.1201. io. al. 0.0398⋆. n. PS. Ch. 0.9214. er. Nat. 3. log(8). y. 0.7623. log(6). sit. Crude. log(4) 治政 0.69315 1.3863 大. ‧. 2. 0. log(2). 學. 1. log(1). Method. ‧ 國. Scenario. n 0.0609 0.1194⋆ U i e0.7741 h n g c 0.8423. 0.2122⋆ v i. 0.2433⋆. 0.2132. 0.2436. 0.9119. 0.9603. Exact-PS. 0.0445. Crude. 0.7413. PS. 0.0267. 0.0666. 0.1407. 0.2017. 0.2556. 0.0230⋆ ⋆:表示偏誤最小的方法。. 0.0631⋆. 0.1341⋆. 0.2001⋆. 0.2516⋆. 4. Exact-PS. 一、. 原始樣本與配對樣本比較. 在不同情境與真實值之組合情況下，我們發現原始樣本的估計偏誤皆為三組樣本中最大的，故我們認為經由實驗組與對照組的配對，確實可以改善了估計的準確性。. 1. 1000 筆對數勝算比估計值的分配詳見附錄二。. 31.

(38) 二、. PS 配對與 Exact-PS 配對的比較. 由表 4-2 可以發現在不同真實值設定之下，Exact-PS 配對在情境一、情境二與情境四之下，偏誤皆較 PS 配對小；然而在情境三之下，Exact-PS 配對則僅在真實值為 log(4)時，偏誤小於 PS 配對。三、. 不同情境下 Exact-PS 配對的效果. 由估計偏誤已知配對確實有助於改善估計的準確性，並且發現於情境一、情境二及情境四之下，Exact-PS 配對的改善效果優於 PS 配對。我們將藉由偏誤降低比例，進一步來比較 Exact-PS 配對與 PS 配對的差異。表 4.3 偏誤降低比例. 1.79176. 2.07944. 76.61. 74.19. 77.04†. 74.26†. 78.44. 73.60. 82.33†. 92.51†. 88.05†. 83.30†. PS. 92.51. 88.86. 81.76. Exact-PS. 96.26†. 92.25†. 85.37†. 94.69†. 92.29†. 85.34. 94.06. 92.10. 85.42†. al. 91.40. 83.30. Exact-PS. Exact-PS. 96.40. n. PS. Ch. 96.89†. †:表示偏誤降低比例較高的方法。. 77.23†. y. Exact-PS. 76.97†. 74.24†. 76.86. 74.21. 77.88. 73.38. 78.06†. 73.80†. sit. 83.24. er. 87.48. io. 4. 1.3863. 91.93. PS. log(8). 0.69315. PS. Nat. 3. log(6). ‧. 2. 政log(2)治 log(4) 大. 學. 1. 立0. Method. ‧ 國. Scenario. log(1). v ni. 84.08† e91.85† ngchi U. 表 4-3 與圖 4.1 呈現出偏誤降低比例，基本上偏誤降低比例越高越好，表示配對的改善效果越明顯。整體而言，在所有情境之下，Exact-PS 配對的偏誤降低比例介於 73.8%至 96.89%之間，而 PS 配對介於 73. 38%至 96.4%之間，且發現隨著真實值越大，其偏誤降低比例將越低。除情境三之外，其餘三種情境的 Exact-PS 配對偏誤降低比例皆較 PS 配對來得高，表示在這四種情境之下，有三種情境顯示事先執行確切配對再執行傾向分數配對表現較佳。. 32.

(39) 此外，由於想要找出在何種情境下 Exact-PS 配對的效果較佳，我們將透過 Exact-PS 配對的偏誤降低比例減去 PS 配對的偏誤降低比例的這個指標來進行評比。這項指標值若為正數，即代表 Exact-PS 配對準確性較佳。 (1)情境一中，Exact-PS 配對與 PS 配對的比例差異，依真實值順序分別為 0.58%、0.57%、0.06%、0.43%、0.07%，其平均差異為 0.342%，表示於情境一中執行 Exact-PS 配對，平均約可再降低 0.342%的偏誤。 (2)情境二中，Exact-PS 配對與 PS 配對的比例差異，依真實值順序分別為 3.75%、3.39%、3.61%、3.89%、3.63%，平均差異為 3.654%，表示於情境二中執行 Exact-PS 配對，平均約可再降低 3.654%的偏誤。. 治政 (3)情境三中，Exact-PS 配對與 PS 配對的比例差異，依真實值順序分別為大立 0.63%、 0.19%、0.08%、 0.11%、 0.03%，平均差異為-0.176%，表 ‧ 國. 學. 示於情境三中執行 Exact-PS 配對效果反而較差。. ‧. (4)情境四中，Exact-PS 配對與 PS 配對的比例差異，依真實值順序分別為. sit. y. Nat. 0.49%、0.45%、0.78%、0.18%、0.42%，差異為 0.464%，表示於情境四. io. n. al. er. 中執行 Exact-PS 配對，平均約可再降低 0.464%的偏誤。. Ch. engchi. 33. i Un. v.

(40) 立. 政治大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 圖 4-1 四種情境之偏誤降低比例. 34.

(41) 表 4-4 執行 Exact-PS 配對平均約可再降低的偏誤比例與處理指派. 與處理指派. 高度相關. 中度相關. 與反應變數. 情境一:𝑥1. 情境二:𝑥2. 高度相關. (0.342%). (3.654%). 與反應變數. 情境三:𝑥4. 情境四:𝑥5. 中度相關. (-0.176%). (0.464%). 四種情境設定. 由表 4-4 與圖 4-1，將情境一與情境二作比較，兩情境的確切配對變數皆為與反應變數高度相關，此時，與處理指派中度相關的情境二 Exact-PS 配. 政治大. 對表現會比情境一好(3.654%>0.342%)。若將情境三與情境四作比較，兩情. 立. 境的確切配對變數皆為與反應變數中度相關，此時，與處理指派中度相關的. ‧ 國. 學. 情境四 Exact-PS 配對表現會比情境三好(0.464%>-0.176%)。因此，無論確切配對變數與反應變數的相關程度為何，對「與處理指派中度相關的情境」作. ‧. 確切配對都能帶來較好的效果。. y. Nat. sit. 此外，情境一表現優於情境三(3.654%>-0.176%)、情境二表現優於情境. n. al. er. io. 四(18.27%>2.32%)，因此，無論確切配對變數與處理指派的相關程度為何，. i Un. v. 對「與反應變數高度相關的情境」作 Exact-PS 配對都能帶來較好的效果。. Ch. engchi. 四種情境中，情境二的確切配對變數𝑥2，滿足與反應變數高度相關以及與與處理指派中度相關，為最適合執行 Exact-PS 配對的情境。. 35.

(42) 第三節. 均方誤. 表 4-5 對數勝算比之均方誤 Scenario. 1. 2. log(1). log(2). log(4). log(6). log(8). 0. 0.69315. 1.3863. 1.79176. 2.07944. Crude. 0.6197. 0.6867. 0.7874. 0.9497. 1.0380. PS. 0.0689. 0.0790. 0.1248. 0.1735. 0.2132. Exact-PS. 0.0677⋆. 0.0765⋆. 0.1232⋆. 0.1688⋆. 0.2079⋆. Crude. 0.6126. 0.6821. 0.8294. 0.8976. 1.0449. PS. 0.0712. 0.0815. 0.1196. 0.1571. 0.2218. Exact-PS. 0.0652⋆. 0.0722⋆. 0.1066⋆. 0.1439⋆. 0.1974⋆. 0.6413 治0.7397 政 0.0698⋆ 0.0765 0.1066⋆ 大立 0.0747⋆ 0.1074 0.0722. 0.9396. 1.0179. 0.1653. 0.2119⋆. 0.1638⋆. 0.2137. Crude. 0.5926. 0.6457. 0.7762. 0.9303. 1.0462. PS. 0.0727. 0.0804. 0.1097. 0.1714. 0.2109. Exact-PS. 0.0727. 0.0795⋆. 0.1083⋆. 0.1699⋆. 0.2089⋆. Method. Crude 3. 0.6026. PS. 學. 4. ‧. ‧ 國. Exact-PS. ⋆:表示均方誤最小的方法。. io. sit. y. Nat. n. al. er. 以均方誤來衡量兩種配對方法的估計精確性，均方誤越小表示估計的精確性. Ch. i Un. v. 越佳，代表配對的改善效果越明顯。模擬實驗的結果呈現於表 4-5 與圖 4-2。一、. 原始樣本與配對樣本比較. engchi. 在各種情境與真實值之下，我們發現原始樣本的均方誤皆為三組樣本中最大的，故我們認為經由配對實驗組與對照組，確實可以改善估計的精確性。二、. PS 配對與 Exact-PS 配對的比較. 整體而言，在所有情境之下，Exact-PS 配對的均方誤介於 0.0652 至 0.2137 之間，而 PS 配對則介於 0.0689 至 0.2218 之間。此外，隨著真實值的增加，均方誤會越大。除情境三之外，其餘三種情境的 Exact-PS 配對均方誤皆較 PS 配對小，表示在這四種情境之下，有三種情境顯示事先執行確切配對再執行傾向分數配對估計的精確性較佳。. 36.

(43) 三、. 比較不同情境 Exact-PS 配對的效果. 欲找出在何種情境下 Exact-PS 配對的效果較佳，我們將藉由 PS 配對的均方誤減去 Exact-PS 配對的均方誤來進行評比，這個差異若為正數，即代表 Exact-PS 配對精確性較佳。 (1) 情境一中，Exact-PS 配對與 PS 配對均方誤的差異，依真實值順序分別為 0.0013、0.0025、0.0016、0.0047、0053，平均差異為 0.00308，表示於情境一中執行 Exact-PS 配對，平均約可再降低 0.0154 的均方誤。 (2) 情境二中，Exact-PS 配對與 PS 配對均方誤的差異，依真實值順序分別為 0.006、0.0093、0.013、0.0132、0.0244，平均差異為 0.01318，表. 治政示於情境二中執行 Exact-PS 配對，平均約可再降低大 0.0658 的均方誤。立 (3) 情境三中，Exact-PS 配對與 PS 配對均方誤的差異，依真實值順序分別 ‧ 國. 學. 為 0.0024、0.0018、 0.0008、0.0015、 0.0018，其總差異為-0.00034，. ‧. 表示於情境三中執行 Exact-PS 配對效果反而較差。. sit. y. Nat. (4) 情境四中，Exact-PS 配對與 PS 配對均方誤的差異，依真實值順序分別. io. er. 為 0、0.001、0.0015、0.0015、0.0021，平均差異為 0.00122，表示於情境四中執行 Exact-PS 配對，平均約可再降低 0.006 的均方誤。. n. al. Ch. engchi. 37. i Un. v.

(44) 立. 政治大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. 圖 4-2 四種情境之均方誤. 38. v.

(45) 表 4-6 執行 Exact-PS 配對平均約可再降低的均方誤。與處理指派. 與處理指派. 高度相關. 中度相關. 與反應變數. 情境一:𝑥1. 情境二:𝑥2. 高度相關. (0.00308). (0.01318). 與反應變數. 情境三:𝑥4. 情境四:𝑥5. 中度相關. (-0.00034). (0.00122). 四種情境設定. 由表 4-6 與圖 4-2，可發現情境二表現優於情境一(0.01318>0.00308)、情境四表現優於情境三(0.00122>-0.00034)，因此，無論確切配對變數與反. 政治大. 應變數的相關程度為何，對「與處理指派中度相關的情境」作 Exact-PS 配對. 立. 都可帶來較好的效果。. ‧ 國. 學. 此外，情境一表現優於情境三(0.00308>-0.00034)、情境二表現優於情境四(0.01318>0.00122)，因此，無論確切配對變數與處理指派的相關程度. ‧. 為何，對「與反應變數高度相關的情境」作 Exact-PS 配對都可帶來較好的效. sit. y. Nat. 果。. n. al. er. io. 四種情境中，情境二的確切配對變數𝑥2，滿足與反應變數高度相關及與. i Un. v. 與處理指派中度相關，因此為執行 Exact-PS 配對的最佳選擇變數。. Ch. engchi. 39.

(46) 第四節. 95%信賴區間覆蓋率. 表 4-5 95%信賴區間覆蓋率 Scenario. 1. 2. 3. 4. log(1). log(2). log(4). log(6). log(8). 0. 0.69315. 1.3863. 1.79176. 2.07944. PS. 94.7*. 95.1*. 93.4. 92.6. 93.3. Exact-PS. 95.9*. 95.8*. 93.8*. 93.0. 94.1*. PS. 96.0*. 94.5*. 94.1*. 93.3. 92.2. Exact-PS. 96.6. 95.8*. 94.7*. 94.1*. 94.3*. PS. 94.9*. 95.9*. 94.2*. 93.0. 92.9. Exact-PS. 95.4*. 95.9*. 94.0*. 93.6*. 93.8*. PS. 95.0*. 92.6. 94.2*. 92.9. 93.7*. Method. 政95.3*治 94.5* 大 94.4* 95.1*. 立 *:表示在顯著水準為 5%之下，覆蓋率與 95%無顯著差異。 Exact-PS. 95.2*. ‧ 國. 學. 模擬實驗所得到的 1000 組 95%信賴區間中，預期包含真實值的區間數為 950. ‧. 組，也就是期望覆蓋率為 95%。我們將藉由顯著性檢定來判斷覆蓋率是否與 95%. y. Nat. sit. 有顯著差異。針對不同情境及五種真實值的情況，我們將比較兩種配對方法覆蓋. n. al. er. io. 率的不顯著個數，不顯著個數較多，表示此配對方法在覆蓋率之表現較佳。. i Un. v. 在情境一、情境二、情境三之下，Exact-PS 配對與 PS 配對的不顯著個數分. Ch. engchi. 別為為四比二、四比三、五比三，表示在此三種情境之下，Exact-PS 配對在 95% 信賴區間覆蓋率上的表現較 Exact-PS 配對佳。然而，在情境四之下，Exact-PS 配對與 PS 配對的不顯著個數相同，為四比四。因此，在四種情境之下，有三種情境顯示 Exact-PS 配對在 95%信賴區間覆蓋率上表現較佳。. 40.

(47) 第五節. 小結. (1) 根據偏誤與均方誤的模擬結果，發現原始樣本的偏誤與均方誤皆為三組樣本中最大，故我們認為經由配對實驗組與對照組，確實改善了估計的準確性與精確性。 (2) 根據偏誤與偏誤降低比例、95%信賴區間覆蓋率及均方誤的模擬結果，發現 Exact-PS 配對的表現均較 PS 配對來得好。 (3) 根據偏誤降低比例衡量估計準確性、以均方誤衡量估計精確性的結果，發現對「與處理指派中度相關的變數」或「與反應變數高度相關的變數」. 政治大變數」且「與反應變數高度相關的變數」，其效果最為明顯。立. 作 Exact-PS 配對，都會有較佳的效果，而若對「與處理指派中度相關的. ‧ 國. 學. (4) 由於在準確性、精確性及信賴區間覆蓋率的表現上，Exact-PS 配對皆較 PS 配對佳，由表 4-6 進一步觀察配對資訊，可發現在四種情境之下，. ‧. Exact-PS 配對的門檻值皆較 PS 配對小，這表示受試者被配對的標準較. sit. y. Nat. 為嚴格，我們所得到的 Exact-PS 配對樣本其受試者間的總距離亦會較. n. al. er. io. PS 配對樣本大。在準確性、精確性及信賴區間覆蓋率的表現上，. i Un. v. Exact-PS 配對在情境二效果最為明顯，而我們發現情境二及情境四中. Ch. engchi. 兩種配對方法門檻值的差異是較大的(情境一及情境三差異較小)，表示情境二及情境四的情況下，Exact-PS 配對的配對標準比 PS 配對更為嚴格，而且嚴格的程度會比情境一和情境三高。 (5) 我們所發現的結果顯示了以下兩點，其一為與反應變數高度相關的變數會有較好的效果，對與反應變數高度相關的變數作確切配對理當比中度相關的變數來得好，而其二為與處理指派中度相關的變數會有較好的效果，與處理指派中度相關的變數在傾向分數模型中的影響程度較低，再對其執行確切配對後，則能使此變數更為平衡性，而有較佳的估計結果，也因此使情境二成為最佳情境。. 41.

(48) 表 4-6 四種情境模擬結果之配對樣本資訊 Exact. Method. variable. PS 1. Exact-PS. Exact-PS. Exact-PS. 260. x1 =0. 0.306. 519. 100. x1 =1. 0.3. 481. 160. -. 0.301. 1000. 198. x2 =0. 0.257. 506. 46. x2 =1. 0.248. 494. 152. -. 0.31. 1000. 230. x4 =0. 0.3. 476. 76. 524. 154. 0.298. 大. 1000. 202. x5 =0. 0.252. 522. 42. x5 =1. 0.253. 478. 立-. ‧ 國. Exact-PS. size. 政 0.293治. 學. 160. ‧ y. Nat. io. sit. 4. size 1000. x4 =1. PS. Matched. 0.313. PS 3. Sample. -. PS 2. Caliper. n. al. er. Scenario. Ch. engchi. 42. i Un. v. Case group size. 130. 99. 115. 101.