• 沒有找到結果。

03-01 非干擾性質的風險因子

N/A
N/A
Protected

Academic year: 2021

Share "03-01 非干擾性質的風險因子"

Copied!
5
0
0

加載中.... (立即查看全文)

全文

(1)

非干擾性質的風險因子

鄭光甫 主任/講座教授 干擾因子的考量起因於簡單的分析邏輯;假設我們使用統計迴歸分析方法去 探討風險因子x 對疾病結果1 y的影響效應時,我們必須確認影響效應是因為曝露 於這個研究的風險因子而不是因為曝露於其他沒考慮的風險因子。因此,應用迴 歸模型探討因子x 對疾病結果1 y的影響效應時,假如存有第三個變數x 也是疾病2 結果y的風險因子時,我們通常都會面臨是否要要將x 放入迴歸模型共同分析的2 困難抉擇。若是放x 進入迴歸模型的前後,發現2 x 對疾病結果1 y的影響效應的估 計有明顯的差異,則我們稱變數x 是2 x 及1 y的干擾因子(confounding factor)。否 則,我們稱變數x 是非干擾性質的因子(non-confounding factor)。若存在干擾因子,2 我們分析x -1 y關聯時必須用干擾因子作調整,否則分析會產生錯誤的結論。 很多人以為風險因子x 是否為干擾因子和因子2 x -1 x 間是否存在有關聯(非2 獨立)有莫大的干係。例如,在醫學的臨床實驗中,若是x =1 或 0 分別代表治療1 組或控制組,由於隨機分派治療組或控制組的作法使得任何風險因子x 和2 x 顯得1 獨立無關;因為x -1 x 間獨立互不存在影響,很多人就認定風險因子2 x 是非干擾2 性質的風險因子。事實上,這種論點有部分是正確的有部分不是正確的。理論證 明,若是風險因子x 和2 x 獨立無關的話,且使用的迴歸模型是線性迴歸模型,則1 2 x 是非干擾性質的風險因子;若是使用的迴歸模型是邏輯斯迴歸模型,則x 仍有2 可能是干擾的風險因子。 下面是一個研究抽菸x 對肺炎1 y影響的案例,年齡x 是肺炎2 y的風險因子 (勝算比為 7.86),年齡-抽菸(x -1 x )的勝算比為 1,顯示2 x 和1 x 不存在關聯。邏輯2 斯迴歸模型中只使用抽菸x 分析對肺炎1 y的影響效應時發現x -1 y勝算比為 7/3, 但若同時使用x 和1 x 分析對肺炎2 y的影響效應時則發現x -1 y勝算比提高為 9/3。 這個例子指出,在邏輯斯迴歸分析中即使x 和1 x 不存在關聯(獨立),2 x 仍然有可2 能是干擾因子。但是,理論也證明,在邏輯斯迴歸分析中若分別在y=0 (非肺炎 的族群)及y=1 (肺炎的族群)下x 和1 x 都不存在關聯(即條件獨立)時,則2 x 一定是2

(2)

非干擾性質的風險因子。 高齡 吸菸 非吸菸 肺炎 90 75 非肺炎 10 25 低齡 吸菸 非吸菸 肺炎 50 25 非肺炎 50 75 高齡 低齡 吸菸 100 100 非吸菸 100 100 吸菸 非吸菸 肺炎 140 100 非肺炎 60 100 認定了x 是一個非干擾性質的風險因子後,2 x 是否應該放在分析的迴歸模型2x 一同研究?通常的答案是應該放,因為這樣做會使得迴歸模型的“合適性1 (goodness of fit)”更好,畢竟x 是一個風險因子。但是,若我們研究的主要重點是2 在探討x 對1 y影響的效應時(例如醫學的臨床實驗),檢定效應是否存在?或效應 的估計有多少?就是我們要分析回答的問題,模型是否合適不是最重要。此時, 我們必須問的應該是:放x 在分析的迴歸模型裡是否會加強檢定方法的檢定力?2 或降低估計方法的誤差? 以下我們分二種迴歸模型來討論不同的代表性做法。 線性迴歸模型的情況: 假設下面的二種線性迴歸模型,且x 是一個非干擾性質的風險因子: 2 模型一, E y( )0*1*x1, 2 1 var( )y ; 模型二, E y( )01 1x2x2, 2 12 var( )yy的期望值是E y( ),變異數是var( )y 。傳統上,我們用最小平方法(y為常態分 配時即為最大槪似估計法)估計 * 1  及 ,估計量記為1  及ˆ1*  。由於模型二是 “正ˆ1 確”的模型, * 2 1 1 2 1 1 2 1 1 ˆ ( ) ( ( i ) i) /( ( i ) ) E E

xx x

xx ,又因為x 是一個非2 干擾性質的風險因子( 2 0),所以x 和2 x 必然是無任何的相關。惟,1  及ˆ1*  估ˆ1 計 同 樣 的 參 數 , 但 是 他 們 的 變 異 數 不 相 同 : 1 2 2 1 2 * , 1 2 , | 1 ˆ (1 ) r ˆ (1 ) x x y x x Va Var    ;

(3)

2 1 2 1 2 1 1 2 1 , , , 2 , | 2 2 , , 1 1 x y x x x y y x x x x x y     , 是 在 給 定 x 下1 x 和2 y 的 部 分 相 關 係 數 (partial correlation), 1,2 x x x 和1 x 的 Pearson 相關係數。因為2 x 和2 x 無任何的關聯,所1 以 1, 2 0 x x  ,導致 2 1 * 1 2 , | 1 ˆ r 1 1 ˆ (1 ) y x x Va Var    。這解釋為何使用模型二有利的原因 (估計1(1*)的誤差較小,檢定 * 1( 1)=0 的檢定力較高)。 結論:若x 是非干擾性質的因子(2   ),探討2 0 x -1 y關聯的研究時使用模型二較 好。 註:反過來, 2 1 , | 0 y x x  (等同於  )滿足時, 2 0 1 2 * 2 1 , 1 ˆ r (1 ) 1 ˆ x x Va Var    ;表示, 若是有x 的模型中加入沒有解釋能力的因子時(1   表示2 0 x 不是影響2 y的風險 因子),可能會導致x 效應1 1(1*)的估計誤差增大或檢定 * 1( 1)=0 的檢定力下 降。但若是x 和2 ( , )x y 互相獨立的話則1 1,2 0 x x  ,和 2 1 , | 0 y x x  同時滿足,導致 * 1 1 ˆ r ˆ Va Var =1,因此x -1 y關聯的研究中使用模型一或二並無不同。 邏輯斯廻歸模型的情況下: 我們討論下面的二種邏輯斯迴歸模型;模型二是 “正確”的模型: 模型一, log

/(1)

0*1*x1; 模型二, log

/(1)

01x12x2。 理論上我們可證明,在邏輯斯廻歸模型的情況下,假如x 是非干擾性質的因子,2 則下面的條件之一會滿足或同步會滿足:(1)給定y時,x 和1 x 獨立無關;(2)給定2 1 x 時,yx 獨立無關(等同於2 2 0)。通常我們用最大槪似估計法估計 * 1  及 ,1 估計量記為 * 1 ˆ  及 。理論結果指出,若是僅有條件(1)滿足的話,則ˆ1 * 1 1 ˆ r 1 ˆ Va Var  會 成立,顯示模型二的作法會增加對 * 1  (= )估計的誤差,並且降低檢定1 * 1 0  (= 1  )的檢定力。這個結果和線性迴歸的結果相反。 結論:x 是非干擾性質的風險因子的話,在邏輯斯廻歸模型的情況下使用模型一2

(4)

較好。 註:若是僅有條件(2)滿足的話(2 0),則 * 1 1 ˆ r 1 ˆ Va Var  也會成立,即放入無效應的 非干擾性質因子在邏輯斯迴歸分析中,對 * 1  (= )的估計誤差會增加,並且降低1 檢定 * 1 0  (= )的檢定力。 1 請特別注意,條件(1)和線性迴歸模型假設的:“x 和1 x 獨立無關”的條件是不同的。2 最後,(1)和(2)同步滿足的話,則條件等同於“x 和2 ( , )x y 互相獨立”的條件,此時1 可證明 * 1 1 ˆ r 1 ˆ Va Var  ,即放或不放x 在邏輯斯廻歸模型中均不會改變2 * 1  (= )估計1 的誤差。 前面針對x -1 y關聯的研究,討論是否要放非干擾性質的風險因子x 進入廻2 歸模型中共同分析的優缺點。Neuhause 等人則特別額外考量x 和1 x 是否相關的2 情形,強調在臨床實驗研究(x 和1 x 獨立無關)時,2 x -1 y關聯迴歸(廣義線性迴歸) 分析中放入非干擾性質的風險因子x 作分析可以提高檢定力以及降低估計誤差;2 另外,在世代研究時(x 和1 x 相關),非干擾性質的風險因子2 x 不應放入迴歸模型2 中分析。 在其他的研究方法中是否使用模型一或二較有利?結論是和取得分析資料 的抽樣方法有關:例如,邏輯斯廻歸模型的情況下,若是資料是病例-對照研究 的資料,x 和1 x 獨立無關,且疾病盛行率高(>20%)時,則使用模型二有較高的檢2 定力,但疾病盛行率很低僅有些許百分比時,則使用模型一經常有較高的檢定力。 參考資料

1. McCullagh, Peter and Nelder, John. (1989). Generalized Linear Models, Second

Edition. Boca Raton: Chapman and Hall/CRC.

2. Henrik Madsen and Poul Thyregod. (2011). Introduction to General and

(5)

3. Dobson, AJ and Barnett, AG. (2008). Introduction to Generalized Linear

Models (3rd ed). Boca Raton, FL: Chapman and Hall/CRC.

4. Hardin, James and Hilbe, Joseph. (2007). Generalized Linear Models and

Extensions (2nd ed). College Station: Stata Press.

5. Robinson, LD and Jewell, NP. (1991). Some Surprising Results about Covariate Adjustment in Logistic Regression Model. International Statistical Review, 59, 227-240.

6. Neuhause, MJ. (1998).Estimation Efficiency with Omitted Covariates in Generalized Linear Models. J American Statistical Association , 93, 1124-1129. 7. Pirinen, M, Donnelly, P and Spencer, CCA. (2012). Including Known Covariates

can Reduce Power to Detect Genetic Effects in Case-Control Studies. Nature Genetics, 44, 848-851.

參考文獻

相關文件

在產品安全監管問題方面,風險評估方法與風險因素之考量為

SF15140A 楊勝舜 利用 JKB-122 評估對於經干擾素(長效 型或短效型)或干擾素和 Ribavirin 組合 治療沒有反應的 C 型肝炎病毒陽性患 者之肝臟功能 (丙胺酸轉胺酶

z Choose a delivery month that is as close as possible to, but later than, the end of the life of the hedge. z When there is no futures contract on the asset being hedged, choose

Therefore, it is our policy that no Managers/staff shall solicit or accept gifts, money or any other form of advantages in their course of duty respectively without the

 Define the non-Abelian gauge transformation of 2-form (decomposed into zero/KK modes):.. (1) Lie-algebra, and reduce to abelian case in

2003~2010: Control experiment  Initial state effects such as Cronin effect, (anti-)shadowing and saturation. 2010~today: Discussion of possibility to create QGP in small

In case of non UPnP AV scenario, any application (acting as a Control Point) can invoke the QosManager service for setting up the Quality of Service for a particular traffic..

{ Title: Using neural networks to forecast the systematic risk..