第三章、 研究方法
第三節、 資料生成
國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
第三節 資料生成
本文所使用之軟體為統計軟體 R 2.12 版本,使用範圍包含模擬資料之生成、
第四章的模擬資料分析與第五章之實證分析,其中配對方法所使用的套件為
「nonrandom」。該套件可以執行傾向分數貪婪配對,亦可搭配門檻值之設定,同 時亦具備執行傾向分數分層的功能。
一、 變數生成之架構
本模擬研究的資料生成方式主要參考 Austin(2007)之模擬研究架構,除了 反應變數Y 與處理指派變數𝑊外,考慮實證資料中變數多為二元變數,故加 入八個母體參數比例為 0.5 的二元變數𝑥1, … , 𝑥8來進行探討,其中這八個變 數與處理指派變數及反應變數間的關聯情形如表 3.1 所示。變數𝑥1、𝑥2、𝑥4、𝑥5、 𝑥7及𝑥8設定為與處理指派有相關之變數,而𝑥1、𝑥2、𝑥3、𝑥4、𝑥5及𝑥6,則為 與反應變數有相關之變數,其中𝑥1、𝑥2、𝑥4、𝑥5為同時與處理指派和反應變 數有所關聯的變數,𝑥7、𝑥8僅與處理指派有相關,𝑥3、𝑥6則僅與反應變數有 相關。由於這八個變數與處理指派及反應變數皆為二元隨機變數,參酌 Austin(2007)的定義方式,我們將高度相關定義為 5 倍的勝算比,中度相關 則定義為 2 倍勝算比,無相關定義為 1 倍勝算比。
表 3.1 變數𝑥1, … , 𝑥8與處理指派變數及反應變數間之關聯架構 與處理指派
高度相關
與處理指派 中度相關
與處理指派 無相關 與反應變數
高度相關 𝑥1 𝑥2 𝑥3
與反應變數
中度相關 𝑥4 𝑥5 𝑥6
與反應變數
無相關 𝑥7 𝑥8 -
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
二、 受試者資料之生成
我們先就𝑥1, … , 𝑥8分別生成樣本數為 1000 及 3000 之兩組樣本資料。
(1)處理指派狀態之生成
依據 Austin(2007)的研究結果,使用𝑥1、𝑥2、𝑥4、𝑥5、𝑥7及𝑥8此六個與處理 指派有相關之變數來建立傾向分數模型最為適合,因此我們也藉由此六個變 數來對每一位受試者生成其處理指派資料:
𝑙𝑜𝑔𝑖𝑡(𝑝𝑡𝑟𝑒𝑎𝑡𝑚𝑒𝑛𝑡) = 𝛽0,𝑡𝑟𝑒𝑎𝑡+ 𝛽1𝑥1+ 𝛽2𝑥2+ 𝛽3𝑥4+ 𝛽4𝑥5 + 𝛽5𝑥7 + 𝛽6𝑥8 (3.8) 根據上式可以建立一個服從伯努利分配的處理指派變數𝑊:
𝑊~Bernoulli(𝑝𝑡𝑟𝑒𝑎𝑡𝑚𝑒𝑛𝑡)
(3.9) 此外為了使模擬研究的資料能夠適度反應實證研究資料的特性,我們根據實 證研究的資料特性來設定(3.8)式中的𝛽0,𝑡𝑟𝑒𝑎𝑡值為−6.3,可使處理指派變數 Wi中的比例參數pi,treatment近似 11%,以符合實證資料中實驗組受試者的比 例。此外,依據前述高度相關設定為五倍勝算比,故其係數設定為 log(5),
而中度相關為設定為兩倍勝算比,其係數設定為 log(2)。因此(3.8)式中係 數之設定如下所示:
𝛽0,𝑡𝑟𝑒𝑎𝑡:−6.3 𝛽1、𝛽3、𝛽5 : log(5) 𝛽2、𝛽4、𝛽6 : log(2)
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
(2) 反應變數之生成
由於變數𝑥1、𝑥2、𝑥3、𝑥4、𝑥5及𝑥6設定為與反應變數有相關之變數,因此使 用此六個變數以及處理指派變數𝑊來建立反應變數模型,並藉以生成受試者 之反應變數資料。反應變數模型為:
𝑙𝑜𝑔𝑖𝑡(𝑝𝑜𝑢𝑡𝑐𝑜𝑚𝑒) = 𝛼0,𝑜𝑢𝑡𝑐𝑜𝑚𝑒+ 𝛽𝑡𝑟𝑒𝑎𝑡𝑊 + 𝛼1𝑥1+ 𝛼2𝑥2+ 𝛼3𝑥3+ 𝛼4𝑥4+ 𝛼5𝑥5+ 𝛼6𝑥6 (3.10) 根據上式得到一個服從伯努利分配的反應變數𝑌:
𝑌~Bernoulli(𝑝𝑜𝑢𝑡𝑐𝑜𝑚𝑒)
(3.11) 一如前述,為了適度反映實證資料的特性,我們將將𝛼0,𝑜𝑢𝑡𝑐𝑜𝑚𝑒設定為−4.4,
可使反應變數比例參數𝑝𝑜𝑢𝑡𝑐𝑜𝑚𝑒近似 32.5%,以符合實證資料中對照組受試 者在反應變數上的發生率。因此(3.2)式中係數之設定如下所示:
𝛼0,𝑜𝑢𝑡𝑐𝑜𝑚𝑒 : −4.4 𝛼1、𝛼2、𝛼3 : log(5) 𝛼4、𝛼5、𝛼6 : log(2)
再者,由於係數𝛽𝑡𝑟𝑒𝑎𝑡代表實驗組與對照組的條件對數勝算比(conditional log-odds ratio),亦即條件處理效果。本文設定邊際處理效果真實值分別 為 log(1)、log(2)、log(4)、log(6)、log(8)之下,模擬結果顯示將𝛽𝑡𝑟𝑒𝑎𝑡設定 為 0、0.989、1.980、2.557697、2.557、2.950,可使邊際處理效果的估計 值趨近設定的真實值。
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University