• 沒有找到結果。

變異數比率應用於成對資料之探討:以傾向分數配對為例 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "變異數比率應用於成對資料之探討:以傾向分數配對為例 - 政大學術集成"

Copied!
90
0
0

加載中.... (立即查看全文)

全文

(1)國 碩. 立. 政 士. 治. 立. 大 學. 學 統 位. 計 學 論. 系 文. 政 治 大. 變異數比率應用於成對資料之探討:以傾向分數配對為例. ‧ 國. 學. ‧. Balance diagnostics for comparing the variances of baseline covariates between treatment groups in propensity-score matched samples. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 指導教授:江振東. 博士. 研 究 生:施俞安. 撰. 中華民國一百零三年六月.

(2) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v.

(3) 謝辭 能夠完這篇碩士論文,最重要的是感謝我的指導老師,江振東老師,總是很有耐心的 幫助我解決問題,論文初稿完成前,也幾乎是陪著我們一起熬夜,希望沒有造成老師太大 的困擾,我會好好做對社會有幫助的事,老師您辛苦了。 研究所的兩年裡,幾乎是把研究室當成第二個家,研究室裡總有我喜愛的人們,喜歡 一起玩、一起做事、一起吃飯、一起聊天,這些在一個月前覺得稀鬆平常的小事,現在來 看,卻是最美好的日子。這個暑假也不一樣了,離開了學生生活,不再是那麼無憂無慮的. 政 治 大. 等著下一個學期的開始,而是要進入職場,希望職場不會改變我們太多,希望 10 年後的 我們,還能是自己喜歡的樣子。. 立. 最後還要感謝我的家人,謝謝你們能夠讓我的學生時期能夠無憂無慮,沒有你們的支. ‧ 國. 學. 持,我想在這最後的學生時期,不會過得這麼快樂。. ‧. 一直督促我又一直放任我的李郁芳. y. Nat. 可以不斷打程式又超美的盧尚文. sit. 什麼都可以聊都可以一起買的張欣惠. n. al. er. io. 總是包容我把桌子弄超亂的陳朝逸 大學四年沒講過話,現在卻話超多的賴柏華. Ch. 交了女友就變得很有人性的王嘉煒. engchi. i n U. v. 很愛偷藏零食和衛生紙的蘇維屏 一起為論文奮鬥的李珮嘉和江怡萱 還有所有的同學們. 全部的你們,都將會讓人想念。. 施俞安 2014/07/28 書於政大. i.

(4) 摘要. 在觀察性研究中,實驗與對照兩組樣本通常無法如隨機控制試驗般,達到某種程度的 平衡,傾向分數配對是一種常用解決方案。然而配對後資料是否確實達到平衡,關係到後 續資料分析結果的真確性。本文中針對傾向分數配對方法之平衡診斷中,Rubin(2001)及 Austin(2009)對於判斷變異數是否相同之建議進行更進一步的探討。透過理論證明及模擬 驗證,分別計算這兩項建發生型一及型二誤差的機率大小,藉以判斷其可行性。結果顯示 Austin(2009)的建議雖然是架構在二獨立常態母體的假設,但實務上應該是可行的。. 政 治 大. 關鍵字:傾向分數配對、平衡診斷、變異數比率. 立. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. ii. i n U. v.

(5) Abstract In observational studies, the samples in treated and control groups are usually not balanced between the two groups. Propensity-score matching is one way to solve the problem. Conditional on the propensity score, the baseline covariates will have similar distributions between treated and control groups so that the matched samples can be treated like samples collected from a controlled experiment. However, whether the matched data is really balanced is the key to a successful subsequent data analysis. Imbalanced data tend to bias the estimates of treatment effects.. 政 治 大 Austin (2009) proposed two simple acceptance regions to determine whether the ratio of 立 variances equals to 1. Through theoretical derivation and Monte Carlo simulations, we calculated In this study, we focused on the balance diagnostics about variances. Rubin (2001) and. ‧ 國. 學. the corresponding type one and type two error rates for both methods to assess their feasibility. The results showed that although the suggestion made by Austin (2009) primarily assumed two is feasible practically.. ‧. independent normal populations, it. sit. y. Nat. io. n. al. er. Keyword: propensity-score matching, balance diagnostics, variance ratio.. Ch. engchi. iii. i n U. v.

(6) 目錄 第一章 緒論................................................................................................................................... 1 第二章 文獻探討........................................................................................................................... 2 第一節 二元常態分配之變異數比率................................................................................... 2 第二節 傾向分數配對方法................................................................................................... 3 第三節 傾向分數之平衡診斷............................................................................................... 4 第四節 傾向分數配對法之處理效果估計........................................................................... 6 第三章 研究方法........................................................................................................................... 9 第一節 研究動機................................................................................................................... 9 第二節 非常態樣本資料生成............................................................................................. 10 第四章 二元常態分配及模擬分析結果..................................................................................... 13 第一節 二元常態之變異數比率分配函數結果............................................................... 13 第二節 非二元常態之變異數比率分配........................................................................... 28 第三節、小結....................................................................................................................... 40 第五章 實證分析......................................................................................................................... 41 第一節 實證主題探討......................................................................................................... 41 第二節 資料來源與變數說明............................................................................................. 42 第六章 結論與建議..................................................................................................................... 52 參考文獻....................................................................................................................................... 53 附錄............................................................................................................................................... 55. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. iv. i n U. v.

(7) 第一章 緒論 在觀察性研究中,實驗組及對照組在基準變數的分配上,往往無法如隨機控制試驗 般,達到某種程度的平衡, 因此針對實驗組及對照組間主效果的差異,較不容易得到客 觀的估計。有鑑於此,Rosenbaum & Rubin在1983年提出傾向分數的概念,將實驗組及對 照組間基準變數的差異由多維空間縮減維度至一維的傾向分數,以此傾向分數作為所有基 準變數的一個綜合指標。Rosenbaum & Rubin (1983)同時也證明只要傾向分數在實驗組及 對照組間達到平衡,即可視此觀察性研究達到類似隨機控制試驗的效果。因此判斷實驗、 對照組間是否達到平衡的平衡診斷,便成為其中很重要的一環。. 政 治 大. 平衡診斷中,最重要的是希望傾向分數及各基準變數在實驗組及對照組間的分配相. 立. 近。當基準變數為二元變數時,可透過比較其比例是否相同來做判斷。但就傾向分數本身. ‧ 國. 學. 及連續型的基準變數中,除了透過機率密度函數圖形來判斷其分佈情形之外,也可藉由兩 組間的平均數及變異數是否相同來加以判斷。Rubin(2001)中提出一項經驗法則,認為只. ‧. 要實驗組及對照組之變異數比率落於0.5及2的區間內,兩組間變異數便可視為沒有不同。. sit. Nat. 獨立常態隨機變數樣本變異數比率之F統計量,使用區間. y. 而Austin(2009)則提出針對配對後樣本數為n的實驗組及對照組之變異數比率,仍可透過兩. 0.975. er. 0.025. io.  F  n  1, n  1 , F  n  1, n  1  作為變異數相同平衡的一個判斷標準。然而配對後的資. al. n. iv n C hengchi U 中無法找到理論依據,因此本文希望藉由模擬實驗的方式,就這兩項建議的可行性進行探 料顯然不符合獨立性的假設,且其分配也未必服從常態分配。針對這兩項建議,由於文獻. 討。 本文共六章。第二章中,我們將就相關議題進行簡要的文獻回顧。第三章為模擬實 驗的構想與設計。第四章將呈現出主要的模擬實驗結果,並就Rubin(2001)及Austin(2009) 這兩項建議的可行性做說明。第五章中,我們將使用一組來自北區某醫院的數據做實證分 析。第六章為總結與建議。. 1.

(8) 第二章 文獻探討. 第一節 二元常態分配之變異數比率 一般而言,當兩獨立隨機樣本服從常態分配時,其變異數比率會服從一個 F 分配, 但若隨機樣本來自一個相關係數不為零的二元常態分配時,其變異數比率之分配函數將不 服從 F 分配。 假設 s1 , s2 為二元常態分配  x1, x2  的樣本變異數,在樣本數為 n 的情況下, 2. 2. Finney(1938)推導出  . 政 治 大. s1 /  1 的機率密度函數 V ; n,   為: s2 /  2. 立. 2 1   2 .  n 1/2. y. sit. Nat. 當   0 時,即為兩獨立的隨機變數,上式可改寫成:. ‧. ‧ 國. 學.  2 2   4    1  V ; n,     n  1  n  1 n  1  1   2   1   2 2  B ,    2   2 n2. n. er. io. 2  n2 , V ; n,   0    2 n 1 n  1 n  1   a l B  ,  1  i v  C  2 2  n. hengchi U. 令 Y   ,經由變數變換可以得到 Y 具有 F  n  1, n  1 的機率分配。 2. 2.  n /2. 。.

(9) 第二節 傾向分數配對方法 ㄧ、 傾向分數基本概念 在隨機控制試驗中,由於受測單位係隨機分配之實驗組與對照組間的因果關係,因此 理論上可以達到隨機處理配置。但在觀察性研究中,實驗組與對照組間的受試者的基準變 數多半無法達到隨機控制試驗的效果,因此在討論實驗組與對照組所可能衍生而來的因果 關係,以及估計處理效應的結果可能就不足以採信,因此 Rosenbaum & Rubin(1983)提出 傾向分數的概念,傾向分數為一平衡的分數,假設基準變數向量為 X ,傾向分數為 ei , 處理指派為 Zi ,平衡的概念可表示為:. 治 政 X  Z |e , 大. 立. i. i. 即給定真實傾向分數之下,基準變數向量與處理指派為獨立,則可透過實驗組與對照組間. ‧ 國. 學. 的差異,來不偏估計平均處理效果。. ‧. 一般而言,可以藉由傾向分數配對(Propensity Score Matching)的方法調整基準變數的 差異,達到類似隨機控制試驗的效果,藉以估計處理效果。. n. al. er. io. sit. y. Nat 二、 定義傾向分數. Ch. i n U. v. Rosenbaum & Rubin(1983)定義傾向分數( ei )為給定所有觀測到的基準變數向量( X )之. engchi. 下,接受處理指派( Zi  1 )的條件機率:. ei  P  Zi  1| X i  , Rosenbaum & Rubin(1983) 更進一步說明真實傾向分數為一個平衡的分數,也就是說在給 定相同的傾向分數下,每個觀測到的基準變數在實驗組與對照組的會有相同的分配。. 3.

(10) 三、 傾向分數估計 實務上常用羅吉斯迴歸模型進行傾向分數的估計,迴歸式中的解釋變數為觀測到的基 準變數,反應變數為是否接受處理。. 四、 傾向分數之配對方法 Rosenbaum & Rubin(1983)提出最常見的傾向分數配對法為一對一配對。估計完傾向分 數之後,在實驗組隨機取出一筆資料,找出對照組中,估計之傾向分數接近的做配對,藉 此可估計感興趣的處理效果。在實務上,通常很難找到相同的傾向分數,因此. 政 治 大. Austin(2011a)提出可用 0.2 倍的羅吉斯傾向分數合併標準差(pooled standard deviation)作為. 立. 配對門檻值,基本上對照組中的資料只要傾向分數差異小於此門檻值,便可從中隨機選取. ‧ 國. 學. 一筆與實驗組做配對。以此作為門檻值,可減少將近 99%的偏誤,Austin(2011b)也提出以 此門檻值可以最小化估計處理效果之均方誤差。. ‧ y. sit. Nat. 第三節 傾向分數之平衡診斷. io. er. 當做完傾向分數配對後,由於傾向分數為縮減維度的概念,將多維度的基準變數縮減 為單維度的分數,無法確定在維度縮減後,各個基準變數都能在配對後達到平衡,因此需. n. al. Ch. i n U. v. 對配對後的實驗組及對照組之傾向分數及基準變數的平衡做診斷,以確定傾向分數及基準. engchi. 變數在實驗組及對照組有相似的分配,如此才能藉由傾向分數配對法使實驗達到類似隨機 控制試驗的結果。一般而言,若要比較實驗組及對照組之傾向分數及基準變數的分配是否 相似,需比較其平均數、變異數、五數概括法、盒狀圖、Q-Q 圖及經驗分配函數等。. ㄧ、 標準化差異(Standardized differences) Flury, Flury, & Riedwy1(1986)提出標準化差異的概念,用來比較平均數是否相同,其 中連續型基準變數之標準化差異定義為:. 4.

(11) d. xtreatment  xcontrol  2 2 streatment  scontrol 2 ,. 2 2 xtreatment 、 xcontrol 為實驗組及對照組之連續型基準變數之平均數, streatment 、 scontrol 為實驗組及. 對照組之連續型基準變數之樣本變異數。而二分類基準變數之標準化差異則定義為:. d. pˆ treatment  pˆ control  pˆ treatment 1 pˆ treatment  pˆ control 1 pˆ control  2. pˆ treatment 、 pˆ control. , 政 治 大 為實驗組及對照組之二分基準變數之平均數或比例。Normand et al.(2001) 立. ‧ 國. 學. 提出當標準化差異小於 0.1 時,實驗組及對照組間平均數或比例的差異則可被忽略。. ‧. 二、 變異數比率(Variance ratio). sit. y. Nat. 要比較變異數是否相同,可依據變異數比率是否為 1 來比較。一般而言,在變異數相. io. er. 同的虛無假設之下,兩獨立來自常態分配的樣本變異數比率服從 F 分配,因此可使用 F 統計量做檢定。但當在成對樣本當中,沒有樣本獨立及常態分配的假設之下,若想要知道. n. al. Ch. i n U. v. 變異數比率為 1,Austin(2009)提出雖然成對樣本的變異數比率分配無法得知,但仍可使. engchi. 用 F 分配的第 2.5 百分位數及第 97.5 百分位數粗略地估計變異數比率是否為 1 的信賴區 間。 Rubin(2001)提出只要成對樣本的變異數比率小於 1/2 或大於 2 的建議,作為估計變 異數比率是否為 1 的信賴區間。. 三、 五數概括法(Five-number summary) Austin(2009)建議使用 Hoaglin(1983) 提出五數概括法:最小值、第一四分位數、中位 數、第三四分位數及最大值,可大概比較連續型變數在配對後實驗組與對照組之間的分. 5.

(12) 配。但此方法並無法具體描述兩組間分配差異的大小,因此五數概括法只可作為其中一種 參考,只能很粗略地做判斷。. 四、 圖解法(Graphical method) 可透過做盒狀圖、Q-Q plot 及畫出經驗分配函數圖形來判斷連續型變數在配對後實驗 組與對照組之間的分配是否相似。. 若在平衡診斷之下,傾向分數或基準變數有不平衡的情形,則針對不平衡之基準變數. 政 治 大. 重新調整估計傾向分數之迴歸式,常見的方法有加入二次項及交互作用項,重新估計傾向. 立. 分數再進行配對及平衡診斷,直到傾向分數及各基準變數達到平衡後,最後進行處理效果. ‧. ‧ 國. 學. 估計。. 第四節 傾向分數配對法之處理效果估計. Nat. sit. y. 當配對後實驗組與對照組之傾向分數及基準變數達到平衡後,則此觀察性研究可以視. io. er. 為類隨機試驗,即可估計處理效果。在觀察性研究中,當結果為二元變數之下, 通常會 用相對風險(relative risk)及其信賴區間作為判斷處理效果是否顯著的依據。. n. al. Ch. i n U. v. Faries(Rosenbaum & Rubin, 1983)提出透過適當的統計方法可建置在配對之下結果的相對. engchi. 風險之信賴區間以判斷相對風險的顯著性。假設結果為 Yi , Yi  1為暴露結果、 Yi  0 為 非暴露結果,處理指派為 Zi , Zi  1 為接受處理指派、 Zi  0 為不接受處理指派。 假設 a 是在配對中接受及不接受處理指派之下,皆為暴露結果之個數;b 是在配對中 接受處理指派之下為非暴露結果,但在配對中不接受處理指派之下為暴露結果之個數;c 是在配對中接受處理指派之下為暴露結果,但在配對中不接受處理指派之下為非暴露結果 之個數;d 是在配對中接受及不接受處理指派之下,皆為非暴露結果之個數。如下表所 示。. 6.

(13) 表 2-1. 相對風險. Yi  1| Z i  0. Yi  0 | Zi  0. Yi  1| Z i  1. a. c. Yi  0 | Zi  1. b. d. 則結果的相對風險可表示成:. 立. 政 a 治 c 大 ab. ‧ 國. 學. 取對數後的相對風險之近似變異數估計值為:. ‧. bc  a  b  a  c . n. al. Ch. bc  a  b  a  c . er. io.  ac  log    Z /2  ab . sit. y. Nat. 由以上結果即可計算出取過數後的相對風險之100 1    % 信賴區間為:. i n U. v. 再將上式計算出的結果取指數,即可得相對風險之之100 1    % 信賴區間,以判斷處. engchi. 理效果是否顯著。 當結果為連續型變數,Conover(1998)提出一般可使用成對樣本 T 檢定比較配對後實 驗組及對照組結果平均數的差異,即使結果在配對後的實驗組及對照組不為常態分配,仍 可使用成對樣本 T 檢定。Conover(1998)若在配對後的實驗組及對照組之結果非常不像常 態分配,則可使用例如 Wilcoxon 符號等級檢定法(Wilcoxon signed rank test)之成對的無母 數檢定。. 7.

(14) 由下圖可簡易說明傾向分數配對方法的過程:. 圖 2-1 傾向函數配對方法流程圖. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 8. i n U. v.

(15) 第三章 研究方法 第一節 研究動機. 依據傾向分數配對後所進行的平衡診斷中,針對變異數比率的部分,雖然成對樣本 的變異數比率分配在文獻中無法找依循的準則,不過 Austin(2009) 建議仍可使用 F(n-1,n1)分配的第 2.5 百分位數及第 97.5 百分位數的範圍來作為粗略地判斷變異數比率是否為 1 的一個依據,其中 n 為配對數;Rubin(2001)則提出只要成對樣本的變異數比率小於 1/2 或 大於 2,則可認為真實的變異數比率不為 1。因為基準變數及傾向分數本身並不一定滿足. 政 治 大. 常態假設,且在實驗組與對照組間一定具有相關性,直接使用 F 分配之百分位數設定拒. 立. 絕域的範圍可能會有偏誤。由於 Finney(1938) 針對二元常態分配,可推導出其變異數比. ‧ 國. 學. 率的分配函數,因此透過此函數即可以與 F(n-1,n-1)分配的百分位數做比較,即可評估 Austin(2009)的建議的可行性;至於非二元常態分配所生成之成對樣本,Austin(2009)的建. ‧. 議是否可行,我們希望藉由模擬實驗加以驗證。至於 Rubin(2001)的建議,我們也將藉由 上述的過程之結果一併做判斷。. n. er. io. sit. y. Nat. al. Ch. engchi. 9. i n U. v.

(16) 第二節 非常態樣本資料生成. 我們將採用以下方法來生成非二元常態的成對樣本 設定 X1 , X 2 的關係式為:. X 2   X1   , 其中 X 1 ,  分別來自相同獨立的分配。假設 X 1 ,  之變異數皆為  , X 2 的變異數則為: 2. Var  X 2     2   2  2 ,. 政 治 大. 立. 且 X1 , X 2 的共變異數為:. ‧ 國. 學. Cov  X 2 , X1   Cov   X 1   , X 1     Var  X 1      2 ,.    2. 2. . . 2 2. y. . 2. . 2. 。. io. er. .   2. sit. Var  X 2  Var  X 1 . Nat. . Cov  X 2 , X 1 . ‧. 因此 X1 , X 2 的相關係數為:. 由於我們想要了解在虛無假設成立的前提下,先假設 X1 , X 2 的變異數比率為 1 的情. n. al. 形,由於:. Ch. engchi. i n U. v. 2 2 2 Var  X 2        1 , Var  X 1  2. 因此     1,代入   2. 2.    2. 中,可得    ,而   1   ,因此給定  , 2. 2. 則可找出一組  ,  的解,如表 3-1 所示,並藉以生成所需的成對樣本. 10. 2.

(17) 表 3-1 係數  ,  與相關係數  的對應關係 ρ. 0.1. 0.2. 0.3. 0.4. 0.5. 0.6. 0.7. 0.8. 0.9. 0.95. 0.99. α. 1. 0.98. 0.96. 0.93. 0.87. 0.8. 0.72. 0.6. 0.44. 0.32. 0.14. β. 0.1. 0.2. 0.3. 0.4. 0.5. 0.6. 0.7. 0.8. 0.9. 0.95. 0.99. 當假設 X1 , X 2 的變異數比率為 2 的情形,可得     2 ,代入中,可得 2. 2.  2  2  2 ,而  2  2 1   2  ,因此給定  ,則可找出一組  ,  的解,並藉以生成所需 的成對樣本。. 立. 政 治 大. 當假設 X1 , X 2 的變異數比率為 3 的情形,可得     3 ,代入中,可得 2. 2. ‧ 國. ‧. 的成對樣本。. 學.  2  3 2 ,而  2  3 1   2  ,因此給定  ,則可找出一組  ,  的解,並藉以生成所需. y. Nat. sit. 由於關係式 X 2   X1   中,假定 X 1 ,  來自相同分配,在不失一般性的前提. n. al. er. io. 下,我們考慮使用對稱但比常態分配厚尾之標準 Laplace  0,1 分配及卡方分配、F 分配. Ch. i n U. v. 及指數分配這三種常見的右偏分配,在自由度的選擇上,使三個分配之變異數相近,以避. engchi. 免變異數不同造成的影響,因此藉由下列隨機變數來生成模擬樣本的基準變數: (1) X 1 , .  2  2. (2) X1, . F  6,6 . (3) X1, . Exp    2. (4) X1, . Laplace  0,1. 模擬實驗中我們將藉由以上分配各抽出 n 筆 X 1 ,  樣本,依照選定的相關係數 ρ,配 合表 3-1 到 3-3 之係數帶入相對應的  ,  值,即可得到樣本 X 2 ,並計算此 n 筆成對樣本 11.

(18) Y , X . 之變異數比率,重複此步驟 50,000 次,可分別得到 50 , 000 筆變異數比率。在假. 設 X1 , X 2 的變異數比率為 1 時,計算此 50,000 筆變異數比率在 F  n  1, n  1 分配之第. . . 2.5 及 97.5 百分位數所形成之接受域 F0.025  n  1, n  1 , F0.975  n  1, n  1 中及落於. ˆ 。此外在假設 X1, X 2 的變異數比率為 (0.5,2)中的比例 pˆ ,可計算犯型一錯誤之機率1  p. . 1.5、2 及 3 時,也計算此 50,000 筆變異數比率在 F0.025  n  1, n  1 , F0.975  n  1, n  1. . ˆ * , pˆ * 及1  pˆ * 即為相對應檢定之型二錯誤機率 及落於(0.5,2)中的比例 pˆ * ,計算1  p 及檢定力,我們將藉此資訊來評估兩項建議之可行性。. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 12. i n U. v.

(19) 第四章 二元常態分配及模擬分析結果 第一節 二元常態之變異數比率分配函數結果 假設成對樣本  x1, x2  來自一個二元常態分配  1, 2 ,1, 2 ,   ,假設 s1 , s2 分別為 2. 樣本變異數,令  . 2. s1 /  1 ,Finney(1938)推導得出  的機率密度函數 V ; n,   為: s2 /  2 2 1   2 .  n 1/2.    4  2 2   V ; n,     1  n  1 n  1  1   2 n1  1   2 2  B ,    2   2. 立.  n /2. n2. ,. 政 治 大. s12 /  12 經由 Y    2 的變數變換後,可得 Y 的機率密度函數為: s2 /  2 2 2. ‧ 國. 學. 2 1   2 .  n1/2. ‧. y ( n3)/2  4 2 y  V  y; n,     1    n  1 n  1  1  y n1  1  y 2  B ,  2   2.  n /2. Nat. sit. y. ,. er. io. 當   0 時,上式可改寫成. al. n. 1 y ( n3)/2i v V  y; n  C  U n n1 , h n  1 n  1  i1  y  B  e n,g c h  2   2 即為 F  n  1, n  1 的機率密度函數。 因此在給定  的情況下,若要計算變異數比率 Y 之第100 1  p  百分位數  ,可 藉由下式來進行: . p  P Y      V y dy . 13. 。.

(20) 2. 由於 Austin(2009)建議可以採用 s1 / s2. 2. 是否落入.  F  n  1, n  1 , F  n  1, n  1  來做為判斷 12 是否等於  22 的依據,因此我們將 0.025. 0.975. 就不同  的情況下,分別計算型一錯誤及型二錯誤的機率。 圖 4-1 到 4-4 分別呈現出在虛無假設  1   2 成立的前提下,n=25, 41,121 及 361 2. 2.  =0, 0.1, 0.5 及 0.9 時, s12 / s22 的機率密度函數圖,亦即 2 1   2 .  n1/2. y ( n3)/2  4 2 y  V  y; n,     1    n  1 n  1  1  y n1  1  y 2  B ,  2   2. 政 治 大 由圖形可看出,無論樣本數大小,當相關係數越大時,使用 立.  n /2. ‧ 國. 0.025. 學.  F  n  1, n  1 , F  n  1, n  1  作為接受域,在二元常態之成對樣本下,變異數 0.975. 比率函數幾乎都會落於接受域中。. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. 14. i n U. v.

(21) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 15. i n U. v.

(22) 我們也分別計算在不同  之下, s12 / s2 2 落於接受域的機率值,由表 4-1 數據可知, 在成對樣本為低度相關時,機率值會略大 0.95,但在中、高度相關時,真實覆蓋機率會接 近 1。這說明了使用 Austin(2009)的建議作為判斷來自二元常態分配之成對樣本變異數比 率是否為 1 時,犯型一錯誤的機率會略低於 0.05,  越大於則幾乎不會有型一錯誤產生 的可能。. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 除了型一錯誤的機率外,我們也想了解發生型二錯誤的機率大小,也就是說當. . . 12   22 時, s12 / s2 2 落於 F0.025  n  1, n  1 , F0.975  n  1, n  1 的機率值。由於. 16.

(23)   s12 P  F0.025  n  1, n  1  2  F0.975  n  1, n  1 | H a  s2      2 2 s12 /  12  22  P  F0.025  n  1, n  1  2  2  F0.975  n  1, n  1  2 | H a  2  1 s2 /  2 1      2  2  P  F0.025  n  1, n  1  22  Y  F0.975  n  1, n  1  22 | H 0  1 1   2 1   2 .  n 1 /2. y ( n 3)/2  4 2 y   1   其中 V  y; n,     n  1 n  1  1  y n 1  1  y 2  B ,  2   2.  n /2. 。. 治 政 我們分別計算母體變異數比率為 1.5、2 及 3 之二元常態之成對樣本 大  X , X  的樣本 立 變異數比率 s / s 落於 F n  1, n  1 之第 2.5 及 97.5 百分位數區間內的機率,即為發生 1. . 2. 2. . 學. ‧ 國. 2 1. 型二錯誤的機率,如表 4-2 到 4-4。. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. 17. i n U. v. 2.

(24) 由表 4-2 可看出在樣本數為 25 及 41 時,當相關係數越大,發生型二錯誤的機率越 大,亦即檢定力會下降;在樣本數為 121 及 361 時,當相關係數越大,發生型二錯誤的機 率越小,亦即檢定力會上升,由圖 4-5 來看,當相關係數遞增時,在虛無假設的前提下, 機率密度函數越集中於 1,而 Austin(2009)建議之接受域,在 12 /  22  1.5 之下,相當於 將區間往右移,以樣本數 25 為例,其接受域由(0.4407,2.2693)變為(0.6611,3.4040),包含 1,當相關係數越大,分配越集中於 1,因此發生型二錯誤的機率會遞增,但以樣本數為 121 為例,其接受域由(0.6980,1.4327)變為(1.0470,2.1491),不包含 1,因此當相關係數遞 增時,落於接受域的筆力會遞減,檢定力就隨之上升。. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 18. i n U. v.

(25) 立. 政 治 大. ‧. ‧ 國. 學 y. Nat. er. io. sit. 由表 4-3 可看出在樣本數為 25 時,在 12 /  22  2 之下,Austin(2009)的建議之接受域 ,由(0.4407,2.2693)變為(0.8814,4.5386),包含 1,因此當相關係數越大,發生型二錯誤的. n. al. Ch. i n U. v. 機率也越大,亦即檢定力越小;但在其他樣本數時,當相關係數越大,檢定力也越大。由. engchi. 圖 4-6 來看,當以樣本數為 121 為例,其接受域由(0.6980,1.4327)變為(1.3960,4.2981),不 包含 1,因此當相關係數遞增時,落於接受域的比例會遞減,檢定力就隨之上升。. 19.

(26) 立. 政 治 大. ‧. ‧ 國. 學 y. Nat. sit. 由下表 4-4 可看出檢定力隨著樣本數及相關係數遞增而遞增,在 12 /  2 2  3 之下,. n. al. er. io. Austin(2009)的建議之接受域皆不包含 1,因此當相關係數越大,發生型二錯誤的機率也 越小,檢定力就隨之上升。. Ch. engchi. 20. i n U. v.

(27) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 21. i n U. v.

(28) 至於 Rubin(2001)提出只要成對樣本的母體變異數小於 1/2 或大於 2 的這項建議,與 表 4-1 做比較可以發現,除了樣本數為 25 的情況外,其他情況下的對應區間都包含於 (0.5,2)之內,因此可預期採用 Rubin(2001)的建議將更不可能會有型一錯誤產生的可能。 為了便於比較,針對不同  值的二元常態分配,我們也計算出 s12 / s2 2 落於(0.5,2)的機率 值,結果如表 4-5 所示。在虛無假設成立的前提下,因二元常態分配函數在相關係數或樣 本數較大時,會越集中於 1,因此落於(0.5,2)的機率值也越接近於 1。. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 22. i n U. v.

(29) 立. 政 治 大. ‧. ‧ 國. 學 y. Nat. 想要計算 Rubin(2001)建議之型二錯誤的機率,我們仍透過分別計算母體變異數比率. er. io. 間內的機率,即為:. sit. 為 1.5、2 及 3 之二元常態分配之成對樣本  X 1 , X 2  的樣本變異數比率 s12 / s2 2 落於(0.5,2)區. n. al. C   s12 h P  0.5  2  e 2 |n H ag c h i s2  . i n U. v.    2 2 s12 /  12  22  P  0.5  2  2  2  2 | Ha  2  1 s2 /  2 1      2  2  P  0.5  22  Y  2  22 | H 0  1 1  . 23.

(30) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 24. i n U. v.

(31) 立. ‧. ‧ 國. 學. io. sit. y. Nat. n. al. er. 表 4-7. 政 治 大. Ch. engchi. 25. i n U. v.

(32) 立. ‧. ‧ 國. 學. io. sit. y. Nat. n. al. er. 表 4-8. 政 治 大. Ch. engchi. 26. i n U. v.

(33) 立. 政 治 大. ‧. ‧ 國. 學. n. al. er. io. sit. y. Nat. 圖 4-11. 3. Ch. engchi. 27. i n U. v.

(34) 第二節. 非二元常態之變異數比率分配. 模擬實驗中,我們藉由  2  2  、 F  6, 6  、 Exp    2  及 Laplace  0,1 四個分配生成成 對樣本  X 1 , X 2  ,得出其變異數比率 s12 / s 2 2 ,透過 P  F0.025  n  1, n  1  s12 / s2 2  F0.975  n  1, n  1  及 P  0.5  s12 / s2 2  2  的計算來分別評估. Austin(2009)及 Rubin(2001)對於變異數是否相同的建議是否可行。 ㄧ、卡方分配 當 X 1 ,  服從自由度為 2 的卡方分配時,我們觀察每一組母體變異數比率為 1 之成對. 政 治 大 落於 F  n  1, n  1 之第 2.5 及 97.5 百分位數區間的比例,結果如表 4-9 所示。我們發現如 立. 樣本  X 1 , X 2  的樣本變異數比率 s12 / s 2 2 ,重複相同步驟 50,000 次,我們可以預估出 s12 / s 2 2. ‧ 國. 學. 果 X 1 ,  服從自由度為 2 的卡方分配時,除非相關係數夠大(比方說   0.8 ),犯型一錯誤 的機率實際上大於 0.05。此外,樣本數越大,犯型一錯誤的機率反而增加。. ‧. io. sit. y. Nat. n. al. er. 表 4-9. Ch. engchi. 28. i n U. v.

(35) 立. ‧. ‧ 國. 學. 圖 4-12. 政 治 大. 接著觀察母體變異數比率為 1.5、2 或 3 之成對樣本  X 1 , X 2  的樣本變異數比率 s12 / s 2 2. Nat. sit. y. 是否落於 F  n  1, n  1 之第 2.5 及 97.5 百分位數區間內,我們同樣重複相同步驟 50,000. n. al. er. io. 次,可以預估出 s12 / s 2 2 落於區間的比例,結果如表 4-10 到 4-12 所示。. i n U. v. 當 12 /  22  1.5 時,由表 4-10 可看出在樣本數為 25 及 41 時,當相關係數越大,發. Ch. engchi. 生型二錯誤機率會上升,亦即檢定力會下降,不過當樣本數上升時,這種現象便不再出 現,由圖 4-13 來看,當相關係數遞增時,機率密度函數會越集中於 1.5,而 Austin(2009) 的建議之接受域在樣本數相同時是固定的,因此落於接受域中之比率會增加,以樣本數 25 為例,其接受域為(0.4407,2.2693),包含 1.5,因此當相關係數遞增時,落於接受域的 比例也會遞增,因此檢定力隨之下降。但當樣本數上升為 121 時,其接受域為 (0.6980,1.4327),不包含 1.5,因此當相關係數遞增時,落於接受域的比例也會遞減,因此 檢定力隨之上升。. 29.

(36) 表 4-10. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 30. i n U. v.

(37) 當 12 /  22  2 時,由表 4-11 可看出當相關係數遞增時,其檢定力在樣本數為 25 時 會下降,但在其他樣本數遞增時,其檢定力會上升,且樣本數越大,檢定力越大,由圖 4-14 來看,隨著相關係數遞增,機率密度函數會越往 2 集中,以樣本數為 25 為例,其接 受域為(0.4407,2.2693),包含 2,因此落於接受域的比例會隨相關係數遞增,檢定力就隨 之下降。但以樣本數為 121 為例,其接受域為(0.6980,1.4327),不包含 2,因此當相關係 數遞增時,落於接受域的比例卻會遞減,而檢定力隨之上升。 表 4-11. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 31. i n U. v.

(38) 立. 政 治 大. ‧. ‧ 國. 學 y. Nat. 當 12 /  2 2  3 時,由表 4-12 可看出當相關係數或樣本數遞增時,其檢定力皆會上. sit. 升。由圖 4-15 來看,當相關係數遞增時,機率密度函數會越集中於 3,在 Austin(2009)的. al. n. 定力隨之上升。. er. io. 建議之下,接受域皆不包含 3,因此當相關係數遞增時,落於接受域的比例會遞減,而檢. Ch. engchi. 32. i n U. v.

(39) 表 4-12. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 33. i n U. v.

(40) Rubin(2001)提出只要成對樣本的變異數比率小於 1/2 或大於 2 便拒絕 12   2 2 的建 議,透過上述模擬之資料,我們分別計算樣本變異數比率落於(0.5,2)區間之比例,如表 413 所示。我們發現如果 X 1 ,  服從自由度為 2 的卡方分配時,在樣本數小時(比方說 n=25, 41),需要在相關係數夠大(比方說   0.8 )時,犯型一錯誤的機率才會小於 0.05。一如預 期,樣本數越大,犯型一錯誤的機率越小。 表 4-13. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 34. i n U. v.

(41) 立. 政 治 大. ‧ 國. 學 ‧. 我們也分別計算母體變異數比率為 1.5、2 及 3 之成對樣本  X 1 , X 2  的樣本變異數比. sit. y. Nat. 率 s12 / s 2 2 落於(0.5,2)區間內的比例,結果如表 4-14 到 4-16 所示。. er. io. 當 12 /  22  1.5 時,由表 4-14 可看出當相關係數或樣本數遞增時,其檢定力皆會下. al. n. iv n C Rubin(2001)建議之接受域包含 1.5,因此當相關係數遞增時,落於接受域的比例會遞增, hengchi U. 降。由圖 4-17 來看,當相關係數或樣本數遞增時,機率密度函數會越集中於 1.5,由於依. 而檢定力隨之下降。. 35.

(42) 表 4-14. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 36. i n U. v.

(43) 當 12 /  22  2 時,由表 4-15 可看出在不同的相關係數或樣本數,檢定力大約在 0.5 附近。由圖 4-18 來看,在不同的相關係數或樣本數,機率密度函數會越集中於 2, Rubin(2001)建議之接受域為(0.5,2),因此落於接受域的比例約為一半,因此檢定力約為 0.5。 表 4-15. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 37. i n U. v.

(44) 立. 政 治 大. ‧. ‧ 國. 學 y. Nat. 當 12 /  2 2  3 時,由表 4-16 可看出當相關係數或樣本數遞增時,其檢定力皆會上. io. sit. 升。由圖 4-19 來看,當相關係數或樣本數遞增時,機率密度函數會越集中於 3,. n. al. er. Rubin(2001)建議之接受域並不包含 3,因此當相關係數或樣本數遞增時,落於接受域的比 例會遞減,而檢定力隨之上升. Ch. engchi. 38. i n U. v.

(45) 表 4-16. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 39. i n U. v.

(46) 二、其他分配 由 F  6, 6  、 Exp    2  及 Laplace  0,1 分配生成之成對樣本,與自由度為 2 的卡分 分配會有類似的結果,此處不再重述,詳見附錄。. 第三節、小結 採用Austin(2009)建議的判斷準則時,模擬實驗顯示,當樣本數或相關係數越大時,. 政 治 大. 型一錯誤的發生的機率幾乎都遠小於設定的顯著水準值0.05,而樣本數大時也幾乎都不會 有型二錯誤產生的可能,因此Austin(2009)的建議應該是可行的。至於Rubin(2001)的建議. 立. 區間,雖然較容易發生犯型一錯誤,但是機率值其實也不是很大,然而在真實變異數相差. ‧ 國. 學. 不大的情況下(比方說母體變異數比率為1.5),容易會有型二錯誤產生的可能,基本上僅在 真實變異數相差很大的情況(比方說母體變異數比率為3),才會有較佳的檢定力,因此. ‧. Rubin(2001)的建議相較之下略顯不足。. n. er. io. sit. y. Nat. al. Ch. engchi. 40. i n U. v.

(47) 第五章 實證分析 第一節 實證主題探討 本章主要探討的主題為「偏頭痛病人與睡眠品質之關聯探討」 偏頭痛(Migraine)是一種出現反覆輕度或重度頭痛的慢性疾病,通常伴有各種自主神 經系統症狀,偏頭痛為一常見的神經性疾病。世界上約有三億的病人具有偏頭痛的症狀, 但這種階段性的頭痛卻經常被病人忽視,直到近年來偏頭痛才逐漸受到重視,因為流行病 學發現偏頭痛不再是先前所認為的血管疾病,而可能與腦部神經系統方面過度活化有關。. 治 政 頭痛的成因,但科學發現已讓我們得以開發新的治療方法。 大 立 因偏頭痛的病人發作時間不規律,平均一星期發作 1~2 次,但 10%的患者每星期發. 世界衛生組織報告指出,偏頭痛是導致失能的四大慢性疾病之一,因此雖未能確實找出偏. ‧ 國. 學. 作,20%的患者會發作 2~3 天,還有多達 14%的患者每月有 15 天以上,因此偏頭痛病症 會影響到病人的日常生活,因此 Seidel, S, Seidel, T, Hartl, M, et al. (2009)針對偏頭痛病人. ‧. 與睡眠品質間的關聯做了觀察性研究,發現使用匹茲堡睡眠品質指數評分(PSQI)作為判斷. y. sit. io. al. er. 別。. Nat. 睡眠品質好壞的標準之下,具有偏頭痛的病人其睡眠品質確實與沒有偏頭痛病症的人有差. n. 因此搜集了台灣北部地區某醫院的資料,想要藉由傾向分數配對法來進行分析,並驗. Ch. i n U. v. 證 Austin(2009)及 Rubin(2001)對於判斷變異數比率是否為 1 的建議可能需要改善。. engchi. 41.

(48) 第二節 資料來源與變數說明 一、資料來源及說明 資料來自北部某醫院之問卷。受訪者為 18 歲以上病患,分為有偏頭痛病症受訪者有 效樣本共 222 份,及無偏頭痛病症之受訪者有效樣本為 103 份。. 二、變數說明 將病人依照有無偏頭痛症狀分為實驗組及對照組,藉由匹茲堡睡眠品質指數評分. 政 治 大. (PSQI)界定受訪者睡眠品質的好壞。考慮的基準變數有七個,分別為性別、年齡、身高、 體重、不寧腿分數(RLS)、醫院焦慮憂鬱量表(HADS)及貝氏憂鬱量表(BDI)。. 立. 匹茲堡睡眠品質指數評分(Pittsburgh sleep quality index, PSQI)為衡量睡眠品質好壞的. ‧ 國. 學. 指標,PSQI 由 7 個分項組成:主觀睡眠品質 (subjective sleep quality)、睡眠遲滯期 (sleep latency)、睡眠總時數 (sleep duration)、習慣性睡眠效率 (habitual sleep efficiency)、睡眠干. ‧. 擾 (sleep disturbances)、使用安眠藥 (use of sleeping medication)及日間功能失調 (daytime. sit. y. Nat. dysfunction),每個分項占 0~3 分,PSQI 分數範圍為 0~21,當 PSQI 大於 5,則表示睡眠. io. er. 品質不佳,小於或等於 5,則表示有良好的睡眠品質。. 不寧腿分數(Restless Legs Syndrome Rating Scale, RLS)為衡量不寧腿症候群的嚴重程. n. al. Ch. i n U. v. 度之指標,1~10 分代表輕度,11~20 分代表中度,21~30 分代表輕重度,31~40 分代表極 度重度。. engchi. 醫院焦慮與憂鬱量表(Hospital Anxiety and Depression Scale, HADS)為衡量焦慮或憂鬱 程度之指標,包括 14 個項目,其中 7 題是焦慮相關問題,7 題為憂鬱相關問題。採四 點記分法(0~3 分),分數越高越代表焦慮或憂鬱程度越高,計算各次量表得分及總得分,分 別可得到焦慮得分 0~21 分、憂鬱得分 0~21 分及總分 42 分。 貝氏憂鬱量表(Beck Depression Inventory, BDI)為評估憂鬱程度的指標,共有 21 組題 目,每項分數依程度為 0~3,BDI 為 21 項的總分,範圍為 0~63,得到的憂鬱指數評估如. 42.

(49) 下:0~13 分代表「可以接受的正常情緒起伏」;14~19 分代表「輕度的憂鬱」;20~28 分 代表「中度的憂鬱」;29~63 分代表「嚴重憂鬱」。 表 5-1. 變數表. 變數名稱. 變數敘述. 使用編碼. sex. 性別. 0=女、1=男. age. 年齡. >18. ht. 身高. 單位:公分. wt rls. 立. 體重 政 治 大 不寧腿量表分數. 單位:公斤 0~8. 醫院焦慮與憂鬱量表分數. 0~21. 學. ‧ 國. hads. 貝氏憂鬱量表分數. bdi. 0~42. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. 43. i n U. v.

(50) 第三節 實證研究分析 一、估計傾向分數之模型 使用性別、年齡、身高、體重、不寧腿分數(RLS)、醫院焦慮憂鬱量表(HADS)及貝氏 憂鬱量表(BDI)七個基準變數對有無偏頭痛病症之反應變數做簡單羅吉斯迴歸模型,係數 估計如下表 表 5-2. 係數估計表. 變數名稱. 變數敘述. (intercept) sex. 政0.0129 治 大 -12.6832. 立. 0.008* 0.976. 0.0121. 0.095. 0.0829. wt. -0.0523. 0.001*. rls. 0.2480. hads. 0.0659. y. bdi. 0.0659. n. Ch. engchi. 0.002* 0.149. sit. io. al. 0.005*. 0.001*. er. Nat. ht. ‧. 學. ‧ 國. age. 使用編碼. i n U. v. 因為性別、年齡及醫院焦慮憂鬱量表(HADS)此三個變數在模型中不顯著,因此不將 其考慮進估計傾向分數之模型中,接下來用身高、體重、不寧腿分數(RLS)及貝氏憂鬱量 表(BDI)三個變數重新對有無偏頭痛病症之反應變數做簡單羅吉斯迴歸模型,新的係數估 計如下表. 44.

(51) 表 5-3. 係數估計表. 變數名稱. 變數敘述. 使用編碼. (intercept). -8.7786. 0.007*. ht. 0.0681. 0.003*. wt. -0.0438. 0.002*. rls. 0.2548. 0.002*. bdi. 0.0765. <0.000*. 政 治 大. 立. 新的模型各變數皆顯著,因此確定估計傾向分數之模型為:. ‧ 國. P  Z  1. 學. log. 1  P  Z  1.  8.7786  0.0681 ht  0.0438  wt  0.2548  rls  0.0765  bdi. ‧ sit. y. Nat. 二、傾向分數配對結果及平衡診斷. al. er. io. 使用 Austin(2011a)提出 0.2 倍的羅吉斯傾向分數合併標準差為配對門檻值,則門檻值. n. 為 0.1804,得到 99 筆配對數。傾向分數在配對前對照組平均為 0.59、標準差為 0.15,實. Ch. i n U. v. 驗組平均為 0.73、標準差為 0.16,標準化差異為 0.29,而配對後對照組平均為 0.60、標準. engchi. 差為 0.15,實驗組平均為 0.62、標準差為 0.15,標準化差異為 0.05,由 Normand et al.(2001)提出當標準化差異小於 0.1 時,實驗組及對照組間平均數或比例的差異則可被忽 略的建議,可知配對後傾向分數在實驗組及對照組間達到平衡。由下圖可看出配對後之傾 向分數密度函數圖實驗祖及對照組明顯較接近。. 45.

(52) 立. ‧ 國. 學. 圖 5-1. 政 治 大. 配對前及配對後傾向分數在實驗組及對照組間的機率密度函數圖. ‧. 在配對後變異數比率為 1.01,Austin(2009)建議之接受域(0.67,1.49),不拒絕變異數比. y. Nat. n. al. er. io. sit. 率為 1,Rubin(2001)建議之接受域(0.5,2)也不拒絕變異數比率為 1。. Ch. engchi. 46. i n U. v.

(53) 立. ‧ 國. 學. 圖 5-2. 政 治 大. 配對前及配對後年齡在實驗組及對照組間的機率密度函數圖. ‧. n. er. io. sit. y. Nat. al. 圖 5-3. Ch. engchi. i n U. v. 配對前及配對後身高在實驗組及對照組間的機率密度函數圖. 47.

(54) 立. ‧ 國. 學. 圖 5-4. 政 治 大. 配對前及配對後體重在實驗組及對照組間的機率密度函數圖. ‧. n. er. io. sit. y. Nat. al. 圖 5-5. Ch. engchi. i n U. v. 配對前及配對後 RLS 分數在實驗組及對照組間的機率密度函數圖. 48.

(55) 立. ‧ 國. 學. 圖 5-6. 政 治 大. 配對前及配對後 HADS 分數在實驗組及對照組間的機率密度函數圖. ‧. n. er. io. sit. y. Nat. al. 圖 5-7. Ch. engchi. i n U. v. 配對前及配對後 BDI 分數在實驗組及對照組間的機率密度函數圖. 49.

(56) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 50. i n U. v.

(57) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 51. i n U. v.

(58) 第六章 結論與建議 為了瞭解Rubin(2001)及Austin(2009)對於變異數比率是否為1之診斷建議的可行性, 本文針對不同分配進行了理論及模擬驗證。對於來自二元常態分配或由卡方分配、F分 配、指數分配及Laplace分配生成之成對樣本,大體上我們獲得十分類似的結果。採行 Austin(2009)之建議時,基本上型一錯誤發生的機率都不大,也就是說如果實驗、對照兩 組的變異數確實相同的話,誤判的可能性極低,且這項誤判機率會隨著樣本數或相關係數 遞增而減少。此外只要樣本數不會太少,也不容易發生型二錯誤的可能,也就是說如果實 驗、對照兩組的變異數確實不同的話,誤判的可能性也極低,檢定力相當大。因此儘管. 政 治 大 可行的。至於Rubin(2001)的建議,型一錯誤的發生機率雖然也不大,但檢定力表現不 立. Austin(2009)的理論基礎架構於二獨立之常態分配母體,但實務上套用於成對樣本依然是. ‧ 國. 學. 佳。當母體變異數差異不大時,檢定力極小,容易發生型二錯誤;只有在母體變異數差異 夠大時,才會有較好的檢定力。因此Rubin(2001)建議之區間顯然不如Austin(2009)來的可. ‧. 行。. 綜而言之,我們認為使用Austin(2009)的建議區間  F0.025  n  1, n  1 , F0.975  n  1, n  1 . y. Nat. n. er. io. al. sit. 來作為變異是否相同的診斷依據,應該是可以採信的。. Ch. engchi. 52. i n U. v.

(59) 參考文獻 Austin, P. C. (2009). Balance diagnostics for comparing the distribution of baseline covariates between treatment groups in propensity-score matched samples. Stat Med, 28(25), 30833107. doi: 10.1002/sim.3697 Austin, P. C. (2011a). An Introduction to Propensity Score Methods for Reducing the Effects of Confounding in Observational Studies. Multivariate Behav Res, 46(3), 399-424. doi: 10.1080/00273171.2011.568786 Austin, P. C. (2011b). Optimal caliper widths for propensity-score matching when estimating. 政 治 大 10(2), 150-161. doi: 10.1002/pst.433 立. differences in means and differences in proportions in observational studies. Pharm Stat,. Conover, W. J. (1998). Practical Nonparametric Statistics: {John Wiley & Sons}.. ‧ 國. 學. Finney, D. J. (1938). The Distribution of the Ratio of Estimates of the Two Variances in a. ‧. Sample from a Normal Bi-Variate Population. Biometrika, 30(1/2), 190-192. doi: 10.2307/2332234. Nat. io. er. Analysis. The American statistician, 40(3), 249-251.. sit. y. Flury, B., Flury, H., & Riedwyl. (1986). Standard Distance in Univariate and Multivariate. al. iv n C Normand, S.-L. T., Landrum, M. B., Guadagnoli, h e n gE.,cAyanian, i U J. Z., Ryan, T. J., Cleary, P. D., & h McNeil, B. J. (2001). Validating recommendations for coronary angiography following n. Hoaglin, D. C. (1983). Understanding robust and exploratory data analysis.. acute myocardial infarction in the elderly: a matched analysis using propensity scores. Journal of clinical epidemiology, 54(4), 387-398. Rosenbaum, P. R., & Rubin, D. B. (1983). The Central Role of the Propensity Score in Observational Studies for Causal Effects. Biometrika, 70(1), 41-55. doi: 10.2307/2335942 Rubin, D. (2001). Using Propensity Scores to Help Design Observational Studies: Application to the Tobacco Litigation. Health Services and Outcomes Research Methodology, 2(3-4), 169-188. doi: 10.1023/A:1020363010465. 53.

(60) Seidel, S., Hartl, T., Weber, M., Matterey, S., Paul, A., Riederer, F., ... & Wöber, C. (2009). Quality of sleep, fatigue and daytime sleepiness in migraine a controlled study. Cephalalgia, 29(6), 662-669.. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 54. i n U. v.

(61) 附錄. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 55. i n U. v.

(62) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 56. i n U. v.

(63) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 57. i n U. v.

(64) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 58. i n U. v.

(65) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 59. i n U. v.

(66) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 60. i n U. v.

(67) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 61. i n U. v.

(68) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 62. i n U. v.

(69) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 63. i n U. v.

(70) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 64. i n U. v.

(71) 指數分配. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 65. i n U. v.

(72) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 66. i n U. v.

(73) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 67. i n U. v.

(74) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 68. i n U. v.

(75) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 69. i n U. v.

(76) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 70. i n U. v.

(77) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 71. i n U. v.

(78) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 72. i n U. v.

(79) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 73. i n U. v.

(80) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 74. i n U. v.

(81) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 75. i n U. v.

(82) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 76. i n U. v.

(83) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 77. i n U. v.

(84) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 78. i n U. v.

(85) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 79. i n U. v.

(86) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 80. i n U. v.

(87) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 81. i n U. v.

(88) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 82. i n U. v.

(89) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 83. i n U. v.

(90) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 84. i n U. v.

(91)

參考文獻

相關文件

二、本校於報名表中對於學生資料之蒐集,係為學生成績計算、資料整理及報 到作業等招生作業之必要程序,並作為後續資料統計及學生報到註冊作業

國立政治大學應用數學系 林景隆 教授 國立成功大學數學系 許元春召集人.

從思維的基本成分方面對數學思維進行分類, 有數學形象思維; 數學邏輯思維; 數學直覺 思維三大類。 在認識數學規律、 解決數學問題的過程中,

- 絕對數值為零

一、成績計算:以術科實作及面試之原始分數計算,術科實作成績佔 70%,面試成績佔 30% (術 科實作原始分數*70%+面試原始分數*30%,分數四捨五入至小數點第 2

After lots of tests, we record two players’ winning probabilities and average number of rounds to figure out mathematical principles behind the problems and derive general formulas

而此時,對於相對成長率為 k 的族群,其滿足族群成長模型 的解為指數函數 Ce kt ,此時的 k 便是指數中時間 t

他所測量了相對成長率 (dP/dt)/P 大約為 0.7944 ,而環境容 量上限大約為 64 。.