• 沒有找到結果。

第三章 整合分析方法

第三節 整合分析方法討論

進行環境流行病學研究的整合分析時,除了呈現傳統整合分析的 結果之外,本研究亦提供另一整合分析方法來評估暴露於戴奧辛汙染 中是否會影響到女性罹患乳癌的風險。接下來將分別針對此二種整合 分析方法進行說明:

1.傳統整合分析方法

本研究假設居住地區與戴奧辛汙染源之間的距離越遠,女性罹患 乳癌的風險越低並且呈線性關係,因此以線性迴歸[29]來估計 5 篇文 章的單位暴露風險而此單位暴露風險記作β ,k=1,2,…,5,並以 加權最小平方法(Weighted least square, WLS)來進行校正,其模型假設 為

ln RR β x x ε

其中ln RR 為第 k 篇文章當中第 m 個暴露分層及其參考組所計算 的自然對數相對風險比;x 、x 則分別為第 k 篇文章的第 m 個分 層及參考組的代表距離,ε 為誤差項。此模型意義為與戴奧辛汙染 源的距離每上升一公里則平均罹患乳癌的風險會增減β 單位,而利用 加權最小平方法(Weighted least square, WLS)來估計β 及其標準誤的 公式為

28 Cochrane Q test[24, 25]來檢定收集而來的研究著作之間是否存在著異 質性(heterogeneity),其統計量為

29

根據Cochrane Q test 檢定的結果進行推論,若未達統計上的顯著 差異,則代表資料之間的差異性來自於樣本誤差(sample error),即收 集的資料為同質性(homogeneity);達到統計上的顯著差異,則是資料 之間本身存在著差異性,即收集的資料為異質性(heterogeneity)。另外,

亦可輔以I2統計量[34]來觀察資料之間的變異程度大小其計算方式為 I H 1

H 3.6 其中,(3.6)式的 H2計算方式為

H Q

k 1 3.7 而Q 為 Cochrane Q test 的檢定統計量,k 為文章數;此統計量的計算 結果為25%( I2=0.25)時屬於低程度異質性;50%( I2=0.5)時屬於中程 度異質性;75%( I2=0.75)時屬於高程度異質性[35]。I2 統計量可以補 強Cochrane Q test 的不足,由於 Cochrane Q test 只能推論收集的資料 間異質性是否存在,而無法得知異質程度的高低,但I2統計量則可以 呈現異質程度的高低,因此在檢定異質性是否存在時可同時輔以 I2 統計量來進行推論。

接著,依據Cochrane Q test 的檢定結果來選擇適當的模型以估計 共同單位暴露風險(β ),若收集的研究著作為同質性,則選擇使 用固定效應模型(fixed-effect model);反之則選擇使用隨機效應模型 (random-effect model)。最後運用 Wald test 來檢定應用適當模型所估

30

計的共同單位暴露風險(β )是否有效應存在,若檢定結果有達統 計上顯著差異則代表有足夠證據顯示戴奧辛確實會影響到女性罹患 乳癌的風險;若檢定結果未達統計上顯著差異則代表沒有足夠證據顯 示戴奧辛確實會影響到女性罹患乳癌的風險。再來將說明如何利用固 定效應模型與隨機效應模型來估計共同單位暴露風險並檢定是否有 效應存在:

(1-A) 固定效應模型(fixed-effect model)[25]:

首先,需估計共同單位暴露風險(β )及其標準誤,單位暴露風險 (β )的公式與(3.5)式相同,而單位暴露風險的標準誤計算方式則 為

se β 1

∑ w 3.8 再來,利用估計出來的共同單位暴露風險(β )及其標準誤來進行 Wald test 以檢定 H0:β 0,計算公式為

Z β

SE β 3.9 此時,(3.9)式服從標準常態分配,經由檢定結果來判斷共同單位暴露 風險是否有效應存在;其95%信賴區間計算方式為

β Zα/ SE β 3.10 (1-B) 隨機效應模型(random-effect model)[25, 26]:

31

同樣需先估計共同單位暴露風險(β )及其標準誤,與固定效應模 型類似但隨機效應模型考慮到資料之間本身存在著差異性即組間變 異(between-study variance, τ ),因此計算公式有些許不同,公式如下:

β w β / w 3.11

以及

SE β 1

∑ w 3.12 其中,(3.11)式與(3.12)式的w 計算方式為

w 1

se β τ 3.13 w 同時考慮到組內變異se β 以及組間變異τ ,而τ 的計算方式是由 DerSimonian R 與 Laird N 於 1986 年所提出[26],其計算方式為

τ max 0, Q k 1

∑ w ∑ w

∑ w

3.14

而(3.14)式是(3.4)式的 Q 統計量經由動差法所計算得到。而在得到τ 後,

利用算出來的共同單位暴露風險(β )及其標準誤來進行 Wald test 以檢定 H0:β 0,計算公式與(3.9)式相同,並經由檢定結果來 判斷共同單位暴露風險是否有效應存在;而95%信賴區間的公式則與 (3.10)式相同。

32

2.本研究提出之方法

本研究提供另一整合分析方法來評估暴露於戴奧辛汙染中是否 會影響到女性罹患乳癌的風險。考慮到在分析環境流行病學相關的整 合分析時的一個重要影響因子─距離,因此將模型假設為

ln RR β x

x 1 ε

當中,ln RR 為第k 篇文章當中第 m 個暴露分層及其參考組所計 算的自然對數相對風險比;x 為第 k 篇文章參考組與汙染源之間的 代表距離,x 為第 k 篇文章當中第 m 個暴露分層與汙染源間的代表 距離。而標準化統計量 1 介於 1與0之間,此數值越小距離戴 奧辛汙染源之間的距離越近;數值越大距離戴奧辛汙染源之間的距離 越遠。此模型將各個研究之間距離標準化的目的,是為了使其更具有 可比較性,並且令Y ln RR ; Z 1,此時模型即可

寫成

Y β Z ε 3.15 當中,k 為固定,m=1,…,M。其意義為固定 k 之下,Z 每上升一 單位則Y 平均增減β 單位,也就是說當標準化統計量 1 每上 升一單位則自然對數相對風險比ln RR 會平均增減β 單位。由於 本研究認為 5 篇研究著作之間因為不同的研究設計以及不同的研究 地區等因素,致使估計的β ,β ,… ,β 有所差異但皆來自於同一個

33

分布,因此假設β ~Normal β , σβ ;並且根據線性迴歸的假設 得知β 與ε 獨立、ε ~Normal 0, σ 。由上述條件即可知Y 的平 均數和變異數為

E Y β Z 3.16 Var Y Z σβ σ 3.17 當中,β 為β 的母體平均數、σβ為β 的母體變異數;而σ 則為ε 的母體變異數。接下來將進行分析的步驟:

(2-A) 檢定 H0: β 0是否成立 若H0: β 0成立,則

E Y 0 3.18 Var Y E Y E Y Z σβ σ 3.19 而根據上述二式子並且H0成立時,Y 可寫成下列形式

Y Z σβ σ ε 3.20 當中ε 為(3.20)式的誤差項而ε ~Normal 0, σ 。此時,即可以迴 歸分析中的最小平方法(Least squares estimates, LSE)來估計σβ及σ , 並將σβ的估計結果(記作σβ)作為參數,則

β ~Normal 0, σβ ;k 1, ,5

在H0成立時利用此分布,本研究可藉此生成β 以計算ε ,計算方式 如下

34

35

值。

若H0: β 0成立,則 b 個利用 Jarque–Bera test 檢定殘差項ε 是 否服從常態分布的P 值所建構出的分布之下,其小於第百分之五位數 的P 值比例應接近 0.05,若無接近即拒絕虛無假設。

(2-B) H0: β 0不成立時,估計參數β

當H0: β 0不成立,就需要估計參數β 。因為本研究 假設β ~Normal β , σβ ;k=1,2,…,5。因此在給定特定參數 β 、σβ情況下可利用此分布生成β 。當β 得到時代入(3.15)式可 估計ε ,計算方式如下

Y β Z ε 3.25 此時ε ~Normal 0, σ 應成立。

由於ε ~Normal 0, σ ,本研究選擇的方式是以ε 之分布是否 為常態為依據,也就是(2-A)方法中的方式。在給定參數β 、σβ下,

本研究利用(2-A)方法得到ε 是否為常態分布檢定的 P 值,在 Bootstrap 的過程中此 P 值之分布小於第百分之五位數的機率值應為 0.05(若顯著水準為 0.05 時),但並非所有β 皆為如此。因此本研 究估計β 的準則為此 P 值的分布小於第百分之五位數的機率值 最接近0.05 者為本研究β 的最佳估計值。因此重複b 次生成β 並 計算JB 統計量所對應的 Pi值。將其代入函數 g(P),此函數為

36

minβ 1

b p 0.05 0.05 3.26 若給定的參數β 能使函數 g(P)達到最小則此參數β 即為本 方法之點估計量。而本研究給定β 介於 3至3之間來求得能使函 數 g(P)最小化的β

37