整合分析方法討論

第三章整合分析方法

第三節整合分析方法討論

進行環境流行病學研究的整合分析時，除了呈現傳統整合分析的結果之外，本研究亦提供另一整合分析方法來評估暴露於戴奧辛汙染中是否會影響到女性罹患乳癌的風險。接下來將分別針對此二種整合分析方法進行說明：

1.傳統整合分析方法

本研究假設居住地區與戴奧辛汙染源之間的距離越遠，女性罹患乳癌的風險越低並且呈線性關係，因此以線性迴歸[29]來估計 5 篇文章的單位暴露風險而此單位暴露風險記作β ，k=1，2，…，5，並以加權最小平方法(Weighted least square, WLS)來進行校正，其模型假設為

ln RR β x x ε

其中ln RR 為第 k 篇文章當中第 m 個暴露分層及其參考組所計算的自然對數相對風險比；x 、x 則分別為第 k 篇文章的第 m 個分層及參考組的代表距離，ε 為誤差項。此模型意義為與戴奧辛汙染源的距離每上升一公里則平均罹患乳癌的風險會增減β 單位，而利用加權最小平方法(Weighted least square, WLS)來估計β 及其標準誤的公式為

28 Cochrane Q test[24, 25]來檢定收集而來的研究著作之間是否存在著異質性(heterogeneity)，其統計量為

根據Cochrane Q test 檢定的結果進行推論，若未達統計上的顯著差異，則代表資料之間的差異性來自於樣本誤差(sample error)，即收集的資料為同質性(homogeneity)；達到統計上的顯著差異，則是資料之間本身存在著差異性，即收集的資料為異質性(heterogeneity)。另外，

亦可輔以I²統計量[34]來觀察資料之間的變異程度大小其計算方式為 I H 1

H 3.6 其中，(3.6)式的 H²計算方式為

H Q

k 1 3.7 而Q 為 Cochrane Q test 的檢定統計量，k 為文章數；此統計量的計算結果為25%( I²=0.25)時屬於低程度異質性；50%( I²=0.5)時屬於中程度異質性；75%( I²=0.75)時屬於高程度異質性[35]。I² 統計量可以補強Cochrane Q test 的不足，由於 Cochrane Q test 只能推論收集的資料間異質性是否存在，而無法得知異質程度的高低，但I²統計量則可以呈現異質程度的高低，因此在檢定異質性是否存在時可同時輔以 I² 統計量來進行推論。

接著，依據Cochrane Q test 的檢定結果來選擇適當的模型以估計共同單位暴露風險(β )，若收集的研究著作為同質性，則選擇使用固定效應模型(fixed-effect model)；反之則選擇使用隨機效應模型 (random-effect model)。最後運用 Wald test 來檢定應用適當模型所估

計的共同單位暴露風險(β )是否有效應存在，若檢定結果有達統計上顯著差異則代表有足夠證據顯示戴奧辛確實會影響到女性罹患乳癌的風險；若檢定結果未達統計上顯著差異則代表沒有足夠證據顯示戴奧辛確實會影響到女性罹患乳癌的風險。再來將說明如何利用固定效應模型與隨機效應模型來估計共同單位暴露風險並檢定是否有效應存在：

(1-A) 固定效應模型(fixed-effect model)[25]：

首先，需估計共同單位暴露風險(β )及其標準誤，單位暴露風險 (β )的公式與(3.5)式相同，而單位暴露風險的標準誤計算方式則為

se β 1

∑ w 3.8 再來，利用估計出來的共同單位暴露風險(β )及其標準誤來進行 Wald test 以檢定 H₀:β 0，計算公式為

Z β

SE β 3.9 此時，(3.9)式服從標準常態分配，經由檢定結果來判斷共同單位暴露風險是否有效應存在；其95%信賴區間計算方式為

β Z_α/ SE β 3.10 (1-B) 隨機效應模型(random-effect model)[25, 26]：

同樣需先估計共同單位暴露風險(β )及其標準誤，與固定效應模型類似但隨機效應模型考慮到資料之間本身存在著差異性即組間變異(between-study variance, τ )，因此計算公式有些許不同，公式如下：

β w β / w 3.11

以及

SE β 1

∑ w 3.12 其中，(3.11)式與(3.12)式的w 計算方式為

w 1

se β τ 3.13 w 同時考慮到組內變異se β 以及組間變異τ ，而τ 的計算方式是由 DerSimonian R 與 Laird N 於 1986 年所提出[26]，其計算方式為

τ max 0, Q k 1

∑ w ∑ w

∑ w

3.14

而(3.14)式是(3.4)式的 Q 統計量經由動差法所計算得到。而在得到τ 後，

利用算出來的共同單位暴露風險(β )及其標準誤來進行 Wald test 以檢定 H₀:β 0，計算公式與(3.9)式相同，並經由檢定結果來判斷共同單位暴露風險是否有效應存在；而95%信賴區間的公式則與 (3.10)式相同。

2.本研究提出之方法

本研究提供另一整合分析方法來評估暴露於戴奧辛汙染中是否會影響到女性罹患乳癌的風險。考慮到在分析環境流行病學相關的整合分析時的一個重要影響因子─距離，因此將模型假設為

ln RR β x

x 1 ε

當中，ln RR 為第k 篇文章當中第 m 個暴露分層及其參考組所計算的自然對數相對風險比；x 為第 k 篇文章參考組與汙染源之間的代表距離，x 為第 k 篇文章當中第 m 個暴露分層與汙染源間的代表距離。而標準化統計量 1 介於 1與0之間，此數值越小距離戴奧辛汙染源之間的距離越近；數值越大距離戴奧辛汙染源之間的距離越遠。此模型將各個研究之間距離標準化的目的，是為了使其更具有可比較性，並且令Y ln RR ； Z 1，此時模型即可

寫成

Y β Z ε 3.15 當中，k 為固定，m=1，…，M。其意義為固定 k 之下，Z 每上升一單位則Y 平均增減β 單位，也就是說當標準化統計量 1 每上升一單位則自然對數相對風險比ln RR 會平均增減β 單位。由於本研究認為 5 篇研究著作之間因為不同的研究設計以及不同的研究地區等因素，致使估計的β ，β ，… ，β 有所差異但皆來自於同一個

分布，因此假設β ~Normal β , σ_β ；並且根據線性迴歸的假設得知β 與ε 獨立、ε ~Normal 0, σ 。由上述條件即可知Y 的平均數和變異數為

E Y β Z 3.16 Var Y Z σ_β σ 3.17 當中，β 為β 的母體平均數、σ_β為β 的母體變異數；而σ 則為ε 的母體變異數。接下來將進行分析的步驟：

(2-A) 檢定 H₀: β 0是否成立若H₀: β 0成立，則

E Y 0 3.18 Var Y E Y E Y Z σ_β σ 3.19 而根據上述二式子並且H₀成立時，Y 可寫成下列形式

Y Z σ_β σ ε 3.20 當中ε 為(3.20)式的誤差項而ε ~Normal 0, σ 。此時，即可以迴歸分析中的最小平方法(Least squares estimates, LSE)來估計σ_β及σ ，並將σ_β的估計結果(記作σ_β)作為參數，則

β ~Normal 0, σ_β ；k 1，，5

在H₀成立時利用此分布，本研究可藉此生成β 以計算ε ，計算方式如下

值。

若H₀: β 0成立，則 b 個利用 Jarque–Bera test 檢定殘差項ε 是否服從常態分布的P 值所建構出的分布之下，其小於第百分之五位數的P 值比例應接近 0.05，若無接近即拒絕虛無假設。

(2-B) H₀: β 0不成立時，估計參數β

當H₀: β 0不成立，就需要估計參數β 。因為本研究假設β ~Normal β , σ_β ；k=1，2，…，5。因此在給定特定參數 β 、σ_β情況下可利用此分布生成β 。當β 得到時代入(3.15)式可估計ε ，計算方式如下

Y β Z ε 3.25 此時ε ~Normal 0, σ 應成立。

由於ε ~Normal 0, σ ，本研究選擇的方式是以ε 之分布是否為常態為依據，也就是(2-A)方法中的方式。在給定參數β 、σ_β下，

本研究利用(2-A)方法得到ε 是否為常態分布檢定的 P 值，在 Bootstrap 的過程中此 P 值之分布小於第百分之五位數的機率值應為 0.05(若顯著水準為 0.05 時)，但並非所有β 皆為如此。因此本研究估計β 的準則為此 P 值的分布小於第百分之五位數的機率值最接近0.05 者為本研究β 的最佳估計值。因此重複b 次生成β 並計算JB 統計量所對應的 P_i值。將其代入函數 g(P)，此函數為

min_β 1

b p _,β 0.05 0.05 3.26 若給定的參數β 能使函數 g(P)達到最小則此參數β 即為本方法之點估計量。而本研究給定β 介於 3至3之間來求得能使函 數 g(P)最小化的β 。

在文檔中中國醫藥大學機構典藏 China Medical University Repository, Taiwan:Item 310903500/32406 (頁 36-46)

第三章 整合分析方法

第三節 整合分析方法討論

1.傳統整合分析方法

2.本研究提出之方法

第三章整合分析方法

第三節整合分析方法討論