第三章 研究方法
3.2 Lu & Ades model
3.2.1 兩階段分析
以依變項(dependent variable)的資料型態為連續型作說明,假設第i個試驗比 較Ax、Ay和Az三種治療(three-arm trial),且Ab(i) = Ax。第一階段以固定效應模型 的結果估計隨機效應23。首先將絕對治療效果轉換成相對治療效果
∆𝑖= (∆𝑖∙𝑥𝑦
∆𝑖∙𝑥𝑧) = (y𝑖∙𝑦− y𝑖∙𝑥
y𝑖∙𝑧− y𝑖∙𝑥) (3.4) 三種以上的治療(multi-arm)算出來的∆𝒊會是長度為|Ti| − 1的向量,若試驗只 比較兩種治療(two-arm trial),則∆𝒊將會是純量。∆𝑖∙𝑦𝑧不需要計算,可以透過另外
兩者組合而來
∆𝑖∙𝑦𝑧= (−1 1)∆𝒊
一個∆𝒊對應的𝐗i則為(|Ti| − 1) × (K − 1)的矩陣或向量(K = 2) 𝐗i = (𝑿𝑖∙𝑥𝑦
𝑿𝑖∙𝑥𝑧) 生成的模式如表3.2 所示
表3.2 虛擬變數生成模式
試驗 治療 X𝑖∙12 X𝑖∙13 … X𝑖∙1𝑥 … X𝑖∙1𝑦 … X𝑖∙1𝑧 … X𝑖∙1𝐾 𝑖 Ax 𝑣𝑠 Ay 𝑿𝑖∙𝑥𝑦 0 0 0 -1 0 1 0 0 0 0
Ax 𝑣𝑠 Az 𝑿𝑖∙𝑥𝑧 0 0 0 -1 0 0 0 1 0 0 模型假設同一試驗內的治療效果彼此獨立,因此推導出下列式子
𝑉𝑎𝑟(∆𝑖∙𝑥𝑦) = 𝑉𝑎𝑟(y𝑖∙𝑦 − y𝑖∙𝑥) = 𝑉𝑎𝑟(y𝑖∙𝑦) + 𝑉𝑎𝑟(y𝑖∙𝑥) = 𝑠𝑒𝑖∙𝑦2 + 𝑠𝑒𝑖∙𝑥2 𝑉𝑎𝑟(∆𝑖∙𝑥𝑧) = 𝑉𝑎𝑟(y𝑖∙𝑧− y𝑖∙𝑥) = 𝑉𝑎𝑟(y𝑖∙𝑧) + 𝑉𝑎𝑟(y𝑖∙𝑥) = 𝑠𝑒𝑖∙𝑧2 + 𝑠𝑒𝑖∙𝑥2 𝐶𝑜𝑣(∆𝑖∙𝑥𝑦, ∆𝑖∙𝑥𝑧) = 𝑉𝑎𝑟(y𝑖∙𝑥) − 𝐶𝑜𝑣(y𝑖∙𝑥, y𝑖∙𝑧) − 𝐶𝑜𝑣(y𝑖∙𝑦, y𝑖∙𝑥) + 𝐶𝑜𝑣(y𝑖∙𝑦, y𝑖∙𝑧)
= 𝑠𝑒𝑖∙𝑥2
𝑠𝑒𝑖∙𝑘2 為第i個試驗所報告的Ak治療的標準誤(standard error)。組合起來得到共變異 矩陣(covariance matrix)
𝑾𝑖−1 = 𝑉𝑎𝑟(∆𝑖) = (𝑠𝑒𝑖∙𝑥2 + 𝑠𝑒𝑖∙𝑦2 𝑠𝑒𝑖∙𝑥2
𝑠𝑒𝑖∙𝑥2 𝑠𝑒𝑖∙𝑥2 + 𝑠𝑒𝑖∙𝑧2 ) (3.5) 同樣地,三種以上的治療會算出的𝑾𝑖−1矩陣維度為(|Ti| − 1) × (|Ti| − 1)。若試驗 只比較兩種治療,則𝑾𝑖−1將會是一個純量。𝑾𝑖−1取反矩陣(純量取倒數)則為權重 𝑾𝑖。
將所有試驗的∆𝑖、𝐗i和𝑾𝑖−1分別合併成∑𝐼𝑖=1(|𝑇𝑖| − 1)× 1、∑𝐼𝑖=1(|𝑇𝑖| − 1)×
𝐖∗−1= diag(𝑾∗1−1, … , 𝑾∗𝐼−1)
= 𝑉𝑎𝑟(y𝑖∙𝑧− y𝑖∙𝑦) = 𝑉𝑎𝑟 (y𝑖∙𝑧− 𝑦𝑖∙𝑥− (y𝑖∙𝑦− y𝑖∙𝑥))
3.2.3 帽子矩陣(hat matrix)與貢獻圖(contribution plot)
為了能觀察一個網絡中,每個直接比較的相對治療效果是如何影響模型結
取倒數後,𝑊𝑖∙𝑤𝑥、𝑊𝑖∙𝑤𝑦、𝑊𝑖∙𝑥𝑦即為各自的權重。
略有不同,以表3.1 為例
3.3 Baseline model
假設納入I個試驗比較A1, A2, … , AK共K種治療方式,並以A1, A2, … , AK的順序
3.3.1 分離式模型(separate model)與補值
不同於Lu & Ades model,模型假設參考治療服從常態分布。本研究分離式模 型採取將(3.18)中的參考治療的分布先行估計的方式,也就是先估計如下的模型
𝑔(𝑦̂i∙1) = θi∙1= 𝛽𝑖 (3.20) 𝛽𝑖~𝑁(𝜇1, 𝜎12) (3.21) 參數的估計方法,模仿自傳統統合分析估計參數的方式。參考治療效果的平 均值以加權平均的方式估計,而變異數以類似τ2的方式估計。
𝜇̂1′ = ∑ 𝑤𝑖 𝑖𝑦𝑖∙1
∑ 𝑤𝑖 𝑖 若Ti ∋ 𝐴1 (3.22)
𝜎̂12 = max {
0,∑ 𝑤𝑖 𝑖(𝑦𝑖∙1− 𝜇̂1′)2− 𝑑𝑓
∑ 𝑤𝑖 𝑖− (∑ 𝑤𝑖 𝑖2
∑ 𝑤𝑖 𝑖) }
若Ti ∋ 𝐴1 (3.23)
其中𝑤𝑖 = 1
𝑠𝑒𝑖∙12 為試驗𝑖的權重。𝑠𝑒𝑖∙𝑘2 為第i個試驗所報告的Ak治療的標準誤。自由度 (𝑑𝑓)為∑ 𝐼(T𝐼𝑖 i∋ 𝐴1)− 1。最後在考慮𝜎̂12的情況下,重新估計參考治療效果的平均 值
𝜇̂1 = ∑ 𝑤𝑖 𝑖′𝑦𝑖∙1
∑ 𝑤𝑖 𝑖′ 若Ti ∋ 𝐴1 (3.24) 其中𝑤𝑖′= 1
𝑠𝑒𝑖∙12 +𝜎̂12為試驗𝑖的權重。
估計好參考治療的分布後,以表3.1 第 4、5 個試驗的資料為範例來說明補植 方式,分析需要的治療效果、標準差和樣本數如表3.3 所示。
表3.3 表 3.1 第 4、5 個試驗的資料
3.4 Arm-based model
假設納入I個試驗比較A1, A2, … , AK共K種治療方式,並以A1, A2, … , AK的順序
相獨立,因此採取(3.22)、(3.23)和(3.24)相同的估計方式獲得
Contrast-based 模型以效果隨機為主要的假設,而 Arm-based 模型以研究隨機為主 要假設。
如圖3.1 所示,Lu & Ades model 做為標準的 Contrast-based 模型,假設為效 果隨機。而Baseline model 在效果隨機的基礎上,針對參考治療假設研究隨機,
因此可以估計參考治療的隨機效應。一般在隨機效應的假設上,會使用較強的同 質性(homogenous)的假設去簡化模型,也就是假設所有相對治療效果的變異成度 相同。雖然異質性(heterogeneity)的假設較弱、較有彈性,但需要估計較多參數
20,且不容易解釋。此外,實際執行也不容意,幾乎沒有人會使用。
而Arm-based model 的所有治療都假設研究隨機,那些沒有被我們觀察到的 治療效果為隨機缺失(Missing at random)18。也就是說,若比較K 種治療,理論上 每一個試驗都有全部K 種治療效果,但因為某些原因,部分試驗中的某些治療效
果遺失了,因此我們只能觀察到目前的資料。
Arm-based model 中,不同治療的隨機效應和不同治療之間的相關性可根據 資料狀況做假設18,以一個比較三種治療的變異數矩陣來舉例:
(
𝜎12 𝜌12𝜎1𝜎2 𝜌13𝜎1𝜎3 𝜌12𝜎1𝜎2 𝜎22 𝜌23𝜎2𝜎3 𝜌13𝜎1𝜎3 𝜌23𝜎2𝜎3 𝜎32
)
假設由強到弱,可分成五種程度。Homogenous perfect: 𝜎1 = 𝜎2 = 𝜎3, 𝜌12= 𝜌13= 𝜌23 = 0;Heterogeneity uncorrelated: 𝜎1 ≠ 𝜎2≠ 𝜎3, 𝜌12 = 𝜌13 = 𝜌23 = 0;
Homogenous exchangeable: 𝜎1 = 𝜎2 = 𝜎3, 𝜌12= 𝜌13= 𝜌23 ≠ 0;Heterogeneity exchangeable:𝜎1 ≠ 𝜎2≠ 𝜎3, 𝜌12 = 𝜌13 = 𝜌23 ≠ 0;Heterogeneity unstructured:𝜎1 ≠ 𝜎2 ≠ 𝜎3, 𝜌12≠ 𝜌13≠ 𝜌23。
部分的學者認為研究隨機的假設會破壞隨機分派試驗的隨機性26,因為每個 試驗納入的受試者的族群不完全相同,直接假設它們可交換,顯然有問題。因此 Baseline model 和 Arm-based model 都會破壞隨機性,只有 Lu & Ades model 被認 為能夠完整的保存這個性質。
在圖3.2 視覺化三種模型的假設,Lu & Ades model 和 Baseline model 可明顯 看出區別。前者的參考治療(A 治療)是固定效應,根據不同的試驗有不同的參考 治療效果,因此真正的治療效果不會維持一個水平線;後者參考治療為隨機效 應,不同試驗的差異都被當作抽樣誤差,因此真正的治療效果不管在哪個試驗中 都一樣。
而圖3.2 中 Arm-based model 與 Baseline model 有些相似。但所有個估計都針 對估計絕對治療效果,而非相對治療效果。相關性主要在呈現不同治療間的關 係。若為正值代表同一試驗內的A 治療效果越好,B 治療效果也傾向越好;負值 代表同一試驗內的A 治療效果越好,B 治療效果傾向越差;0 代表 A 和 B 的治療 效果無關。
圖3.1 網絡統合分析假設
呈現三種不同的模型,假設上的異同之處。Arm-based model 針對治療彼此之間 的關係,有五種假設方式。Homogenous perfect 假設治療彼此獨立,且不同治 療的隨機效應相同;Heterogeneity uncorrelated 同樣假設治療彼此獨立,但不同 治療的隨機效應不同;Homogenous exchangeable 假設治療彼此不獨立、相關係 數相同,且不同治療的隨機效應相同;Heterogeneity exchangeable 假設治療彼 此不獨立、相關係數相同,但不同治療的隨機效應不同;Heterogeneity
unstructured 假設治療彼此不獨立、相關係數各不相同,而不同治療的隨機效應 亦不相同。Contrast-based model 中,Homogenous 假設所有相對治療效果的隨 機效應相同;Heterogeneity 假設不同相對治療效果的隨機效應不同。其中以紅 色框起來的是本研究中所使用的假設。
(a) Lu & Ades model (b) Baseline model
(c) Arm-based model 圖3.2 簡易模型示意圖
呈現三種不同的模型的假設。橫軸代表不同的試驗;縱軸代表絕對治療效果;
兩條紅色虛線分別為兩個治療的真正的治療效果;每個點代表一個絕對治療效 果,藍色為A 治療,綠色為 B 治療,在同一垂直線上的治療代表來自同一個試 驗;右側的分布為模型有估計的隨機效應。其中Lu & Ades model 中的試驗根 據A 治療的絕對治療效果重排過。
第四章 模擬
為了模擬在不同的網絡結構下,治療的偏差是如何在影響模型估計,需要設 定網絡結構與偏差的位置。考慮到設定納入的治療只有三、四個會過於簡化網絡 結構,因此模擬中設定研究納入五種治療。
4.1 模擬情境
在此基礎下,我們篩選出具備代表性的五種網絡結構(詳見圖 4.1)。
(a)Network 1 (b)Network 2
(c)Network 3 (d)Network 4 (e)Network 5 圖4.1 網絡結構圖
每個網絡皆納入5 種治療,點的大小代表使用該種治療的總人數;每條線代表 4 個試驗;紅線代表存在偏差的 4 個試驗。(a)Network 1 為所有治療都僅與治療 C 有直接比較的星狀網絡,共 16 個試驗;(b)Network 2 為結構完整的網絡,共 40 個試驗;(c)Network 3 為一個迴圈與一分支組成的網絡,共 20 個試驗;
(d)Network 4 以 Network 3 為基礎,分支與 B 治療相連,形成第二個迴圈,共 24 個試驗;(e)Network 5 為所有治療形成一個大型迴圈,共 20 個試驗。
治療效果參數設定方面,如表4.1 所示。A 到 E 治療的真治療效果皆設定為
研究全部使用R 軟體做分析,三種模型計算方式將會轉換為 R 的程式語言。
每種情境分別模擬500 次,每個網絡下生成的 500 組資料都會使用三種模型做分 析。在Lu & Ades model 中,參考治療指定為 A 治療,基底治療的順序將按照字 母順序挑選;而Baseline model 中的基底治療都指定為 A 治療。
4.2 模擬結果
結果以基礎參數和功能參數的偏差程度,以及與其對應的信賴區間做呈現。
在Lu & Ades model 的部分,以貢獻圖(Contribution plot)和帽子矩陣(Hat matrix)輔 助辨識偏差效果在網絡中傳遞的模式。
圖4.2 到圖 4.6,橫軸為參數軸,5 個治療包含基礎參數總共有 10 個參數 (𝑑𝑋𝑌和𝑑𝑌𝑋估計值視為同一個參數),依順為𝑑𝐴𝐵、𝑑𝐴𝐶、𝑑𝐴𝐷、𝑑𝐴𝐸、𝑑𝐵𝐶、𝑑𝐵𝐷、 𝑑𝐵𝐸、𝑑𝐶𝐷、𝑑𝐶𝐸和𝑑𝐷𝐸;縱軸為偏差程度與其對應的95%信賴區間,以 500 次模擬 結果的點估計和信賴區間的平均值減去真值而得。八張圖分別為(0)unbiased;
(1)C+1;(2)C+2;(3)D+1;(4)D+2;(5)C+1 & D+1;(6)C+2 & D+2;(7)C+1、D-1 設定下的結果。紅色為Arm-based model 的結果;綠色為 Baseline model 的結果;
藍色為Lu & Ades model 的結果。
26
圖4.2 Network 1估計值偏差程度
27
圖4.3 Network 2估計值偏差程度
28
圖4.4 Network 3估計值偏差程度
29
圖4.5 Network 4估計值偏差程度
30
圖4.6 Network 5估計值偏差程度
31
4.2.1 Lu & Ades model
圖4.2 到圖 4.6 的所有圖片的圖型都明顯地呈現 4 個特點,首先情境(1)C+1 與(3)D+1 的結果上下對稱,情境(2)C+2 與(4)D+2 也上下對稱;此外(5)C+1 &
D+1 和(6)C+2 & D+2 的情境下,Lu & Ades model 表現最好,估計值完全不受偏 差效果影響;以及情境(7)的結果與(2)和(4)相同;最後在所有情境下,受到影響 最大的那些估計值,都包含D 治療的相對效果估計值,其中𝑑CD最為嚴重。
各個網絡在情境(5)和(6)之外的不同點。在圖 4.2 的 Network 1 中,不論是 C 還是D 治療偏差,僅 D 治療的相對效果估計值受到影響。偏差的程度與每個情 境下設定的偏差效果相同。圖4.3 的 Network 2,主要是 C 和 D 治療的相對效果 估計值受到輕微地影響。接下來圖4.4 的 Network 3 中,只包含 D 或 E 其中一個 治療的相對效果估計值,能觀察到偏差治療的影響。尤其不論是D 還是 E 治療的 相對效果估計值,偏差的程度都與每個情境下設定的偏差效果相同。而同時包含 D 和 E 治療的相對效果估計值(𝑑DE)依舊能被精準的估計。而圖 4.5 的 Network 4,D 治療的相對效果估計值能觀察到最嚴重的偏差程度。程度低於每個情境下 設定的偏差效果,最多約為每個設定值的0.75 倍。其次為 E 治療,程度比前者 低。其他估計值僅輕微地受影響。最後圖4.6 呈現的 Network 5,基礎參數的部 分,主要是𝑑AC和𝑑AD受到影響,方向相反但程度相同,且略低於設定值的0.5。
其次為dAB和dAE,一樣方向相反、程度相同。
信賴區間的部分。不論在何種網絡結構下,不偏的估計值區間都較為狹窄、
偏差的估計值信賴區間較寬。若包含的治療處在網絡結構中較為稀疏的位置,區 間會更寬。例如以Network 3 來看,圖 4.1(c)的 E 治療處在網絡結構最為稀疏的 位置,對應到圖4.4 的不偏估計的信賴區間皆相當窄。而偏移的估計值中,與 E 治療的相對效果有關的估計值最寬。另外,相對估計值中比較的兩個治療,在網 絡結構中距離較遠的話,信賴區間會略寬。為了排除網絡結構緊密程度的影響,
以Network 5 為例,圖 4.1(e)的結構均勻,每個治療的緊密程度相同,A 和 B 治
32
療的距離比A 和 C 治療的短,因此在圖 4.6 可以觀察到𝑑AB的信賴區間比𝑑AC窄 (情境(5)和(6)較易於觀察)。
圖4.7 到圖 4.16 明確地呈現各個網絡中,相對治療效果傳遞的模式,由於在 同樣的網絡結構下,所有情境傳遞的模式都相同,因此只呈現情境(0)的結果。從 結果能夠觀察到,我們設定的C 和 D 治療效果所形成的相對治療效果,各別提供
圖4.7 到圖 4.16 明確地呈現各個網絡中,相對治療效果傳遞的模式,由於在 同樣的網絡結構下,所有情境傳遞的模式都相同,因此只呈現情境(0)的結果。從 結果能夠觀察到,我們設定的C 和 D 治療效果所形成的相對治療效果,各別提供