網絡統合分析中偏差的傳導模式

(1)

國立臺灣大學公共衛生學院流行病與預防醫學研究所碩士論文

Institute of Epidemiology and Preventive Medicine College of Public Health

National Taiwan University Master Thesis

網絡統合分析中偏差的傳導模式

Bias propagation in network meta-analysis models

李驊 Hua Li

指導教授：杜裕康博士 Advisor: Yu-Kang Tu, DDS, Ph.D.

中華民國 107 年 7 月

July 2018

(2)

口試委員會審定書

(3)

中文摘要

研究目的

研究偏差的治療效果，在不同網絡結構與不同的模型中會如何影響估計值的結果。

研究方法

以頻率學派的架構執行Lu & Ades model、Baseline model 和 Arm-based model。Arm-based model 的相關係數矩陣設定為治療彼此之間互相獨立，每個治療允許有各自的隨機效應。三種模型皆以二階段分析處理。第一階段先以固定效應模型估計，以其結果估計隨機效應變異數的值。第二階段將前面估計出的變異數作為隨機效應模型的權重參數，再估計(相對或絕對)治療效果。Arm-based model 的絕對治療效果將被轉換成相對治療效果後，與其他兩個模型做比較。透過模擬不同的網絡結構下七種偏差情境，來探討偏差在不同模型下傳遞的模式。

研究結果

Lu & Ades model 執行前需將治療做排序，一組成對比較中不論偏差的治療是哪一個，偏差的影響會往兩個治療中排序靠後的治療的估計值傳遞。當兩個治療偏差的方向與大小相同時，偏差影響會互相抵消使估計結果不受影響。偏差在 Baseline model 裡主要影響偏差的治療的相對效果估計值，因此偏差的影響較能如實呈現在對應治療的估計值上。但部分偏差的影響會透過基底治療傳遞到整個網絡，這部分對治療效果評估的影響類似Lu & Ades model，傾向傳遞給排序靠後的治療的估計值。Arm-based model 的偏差會如實地在偏差的治療的相對效果估計值上觀察到，其他完全不會受到影響。

結論

三種模型的偏差情況各有特色，區別在於要由哪些估計值去吸收偏差的效果，因此不存在最好的模型。研究者可以根據資料有疑慮、可能存在偏差的部分，評估使用何種模型最有利，或是較能預期估計值偏差的大小與方向。

(4)

關鍵字：網絡統合分析、contrast-based model、arm-based model、二階段模式、偏差

(5)

Abstract

Aims: To investigate how bias contained in direct evidence of one treatment contrast within a network meta-analysis will impact on the estimation of other treatment contrasts under the Lu & Ades model, baseline model, and arm-based model.

Methods: Simulations of the three statistical models for network meta-analysis within the frequentist framework were undertaken to evaluate the impact of bias in evidence on one treatment contrast. The within-study correlation structure in the arm-based model was assumed to be independent and heterogeneous. The analyses of the three models used two-step methods by first pooling together all pairwise comparisons for each treatment contrast and then undertaking a fixed effect network meta-analysis. This result was used to calculate a variance by the sum square of Pearson residual, and then in the second step we estimated the relative or absolute treatment effect with the variance becoming weighted parameter in random effect model. We simulated seven scenarios to evaluate how different geometrical structures of a network affect the impact of the bias in the evidence of a treatment contrast on the estimates of other treatment contrasts.

Results: In Lu & Ades model, treatments were arranged in an order that started with the global baseline treatment. The bias in one treatment affected the estimate of treatments that were farther in the order. When the biases in the two treatments of a contrast had the same direction and magnitude, the estimated bias in this treatment contrast was cancelled out. In the baseline model, the bias in one treatments partially affected the estimate of this treatment, while some of the bias was propagated through the baseline treatment, yielding small bias in the other relative effects. Under the arm-based model, the effect of the biases did not spread to other treatment contrasts unrelated to the biased

(6)

treatment.

Conclusions: Bias propagation in three different models has various patterns which are also affected by the geometry of the network. When evidence of some treatments may contain biases, researchers could then evaluate which estimates may be affected by these biases and how much the potential impact is.

Keywords: network meta-analysis, contrast-based model, arm-based model, two-

stage model, bias

(7)

表格目錄

表3.1 分組範例 ... 9

表3.2 虛擬變數生成模式 ... 11

表3.3 表 3.1 第 4、5 個試驗的資料 ... 18

表3.4 補值後的參考治療 ... 18

表4.1 基本參數設定 ... 24

表4.2 偏差設定 ... 24

(10)

圖片目錄

圖3.1 網絡統合分析假設 ... 21

圖3.2 簡易模型示意圖 ... 22

圖4.1 網絡結構圖 ... 23

圖4.2 Network 1 估計值偏差程度 ... 26

圖4.7 Network 1 帽子矩陣 ... 33

圖4.8 Network 1 貢獻圖 ... 33

圖5.1 以不同 Contrast-based 模型的角度看網絡結構圖 ... 40

(11)

第一章介紹 1.1 研究背景

目前社會上講究實證醫學¹，各個醫學期刊湧現大量的論文。這使我們無法閱讀完特定藥物或特定疾病治療的相關文獻，且不同研究的結果可能有所差異。

為此發展出了統合分析來幫助我們整合文獻的結果²。然而，隨著越來越多新穎的藥物被開發與治療技術的演進，傳統統合分析受到一個嚴重的限制。它僅能整合兩種治療的相對效果，無法有效的利用文獻中的其他治療證據。例如，要比較的治療有N 種，研究者最多要做 N(N-1)/2 個傳統統合分析才能得到所有治療彼此之間的相對效果。此外，個別執行傳統統合分析的結果並非同步，可能分別做完A 治療比較 C 治療和 B 治療比較 C 治療的結果，得到 A 優於 C 和 B 優於 C，

但因為文獻中沒有直接比較A 和 B 治療，還是無法得知 A、B 治療哪個較優。這對於醫師在決定給予病人何種治療時會有困難^{3; 4}，因此近年發展出網絡統合分析來同步比較多種治療效果。

網絡統合分析是延伸傳統統合分析發展出的統計方法^{5; 6}。當許多治療同步做比較時，某些治療彼此之間可能缺乏直接比較的證據。儘管沒有文獻有直接比較這些治療，亦可透過與其他治療的比較來間接獲得，因此原本無法直接比較的治療變得能相互比較。例如說，蒐集來的文獻有A 治療和 B 治療的比較，以及 A 治療和C 治療的比較。儘管缺乏 B 和 C 治療的直接比較，但依舊能透過 A、B 治療和A、C 治療的相對效果來間接獲得 B 和 C 治療之間的相對效果。若 B 和 C 治療之間有直接證據，網絡統合分析亦能合併治療的直接證據(直接比較 B、C 治療的結果)與間接證據(透過 A、B 比較和 A、C 比較間接獲得的結果)，來加強統計檢定力。

網絡統合分析所使用的資料，都是透過文獻搜尋、粹取出臨床試驗研究結果來獲得。因此，研究者必須了解，在執行臨床試驗的過程中，每一個環節都可能導致偏差⁷。包含執行試驗前的實驗設計、樣本選擇；執行試驗中缺乏盲性；試

(12)

驗結束後，分析結果受到干擾因子影響。因此，文獻中蒐集來的資料，可能會因為某些原因而產生偏差。有的可以從文獻當中看出來，而有的看起來每個環節都沒有問題，然而得到的結果看起來就是與其他的試驗結果不同。這些或許是潛在地具有偏差的試驗，它們符合研究者納入的標準，而被留在研究中。

由於間接證據是透過合併其他直接證據獲得。因此，當執行網絡統合分析時，納入的試驗若存在偏差，偏差的這些治療做為直接證據時，無可避免地會影響到與其治療相關的估計值。與此同時，做為其他治療之間的間接證據，亦有可能使偏差影響到其他估計值。在不同的網絡結構下，一個估計值的間接證據來源不盡相同，受偏差影響的估計值亦有所不同。間接證據對估計值的影響，會根據網絡結構與治療在網絡中的距離而有差異，估計值受到的影響也會根據治療在網絡中的位置而有方向與程度上的差異。當網絡複雜度低時，有經驗的的研究者可以自行判斷出偏差對整個網絡的影響，但複雜度提高，很難僅靠經驗去推論出受到的影響，因此，本研究希望能釐清，並總結出偏差影響的模式與規則以供參考。

1.2 研究目的

探討偏差在不同網絡結構與不同網絡統合分析模型中，對於估計結果的影響與偏差在網絡模型中傳播的途徑，模擬使用的方法為頻率學派架構(frequentist framework)下的三種模型：

1. 最常使用的Contrast-based 模型：Lu & Ades model

2. Contrast-based 模型加上基底治療效果估計：Baseline model 3. 標準的Arm-based 模型：Arm-based model

第二章會回顧網絡統合分析中的基本假設，以及過去的文獻對於偏差的討論；第三章將針對研究中使用的三種模型做詳細的介紹；第四章呈現模擬的設定與結果；第五章整理模擬結果，討論偏差如何影響估計值，並歸納出一些簡單的規則以供參考。使用的軟體以R 為主，詳細的 code 附在附錄中。

(13)

第二章文獻回顧 2.1 基本假設

模型若違反基本假設，容易使研究者得到錯誤的結果，因此釐清模型假設相當重要。網絡統合分析是由傳統統合分析拓展而來的，因此在傳統統合分析中存在的假設同樣的會延伸到網絡統合分析中。

傳統統合分析中，最重要的是同質性(homogeneity)假設，在不同的試驗下，

兩個相同治療的效果差值變異(variance)不能太大。傳統評估同質性的方法有 Cochran’s Q 檢定和I²判斷⁸，但兩種方法的檢力不高，樣本數不多時精準度會很差⁹。實做時，要判斷是否具備同質性，通常直接以τ²大小判斷。在統合分析中，我們觀察到的變異分成試驗內變異(within-study variance)和試驗間的變異 (between-study variance)，而試驗間的變異就稱為異質性(heterogeneity)，也就是所謂的τ²。若是在研究結果顯示τ²很大，則會違反同質性的假設，不處理這個問題可能會導致研究者得到錯誤的結論。處理的方法可以考慮使用敏感度分析

(sensitivity analysis)和 meta-regression 找出有問題的試驗和潛在的干擾因子 (confounding factor)¹⁰。

2.1.1 相似性(similarity)

延伸到網絡統合分析中，一樣有類似同質性(homogeneity)假設。因為納入模型中的治療超過兩個，同質性假設不足以支持，在網絡統合分析中，則以相似性代替¹¹。研究者需要確認每個試驗的病人都具有可比性，不同試驗下的病人組成、研究設計是否相似。若是治療本來就針對不同的族群而使用，或研究方法差太多，那這些試驗就不應放在一起比較。目前現有的統計方法中，並無用來檢定相似性的方法³，需要研究者依據自身的經驗與研究目的去篩選出相似的試驗。

因此納入的試驗的挑選比實際分析資料還要重要，良好的資料品質得到的結果才令人信服¹²。

根據相似性假設，模型得以運用可交換性(exchangeability)和傳遞性

(14)

(transitivity)性質^{3; 13}。相似性可延伸解釋，同一個試驗內的每個組別，病人特性要相似（包含人口學分布、疾病嚴重程度等等）。因此，理論上不同組別的病人使用相同的治療要能得到類似的結果。而由於具備可比性，相對治療效果在不同的試驗下，同樣兩種治療的差值要差不多。換句話說，每個試驗可以有各自的治療效果，但治療的相對效果要相似，因此治療相對效果可以在不同的試驗彼此交換，這樣的特性稱為可交換性。再將結果進一步解釋，可將直接比較的結果組合成間接比較，而得到傳遞性。以三種治療的網絡來舉例說明，比較A、B 和 C 三種治療時，則每個包含A 和 B 治療的試驗，觀察到的 A 和 B 的治療效果可以不同，但效果差值(d_AB^𝑑𝑖𝑟)理論上要相似；而每個每個包含 A 和 C 治療的試驗，A 和 C 治療效果的差值(d_AC^𝑑𝑖𝑟)也要相似。因此 B 和 C 治療效果的差值(d_BC^𝑖𝑛𝑑)，可以透過 d_AB^𝑑𝑖𝑟和d_AC^𝑑𝑖𝑟來間接獲得，這種特性稱為傳遞性。此時的d_AB^𝑑𝑖𝑟為A 和 B 的相對治療效果直接證據，而d_AC^𝑑𝑖𝑟為A 和 C 的相對治療效果直接證據。同時，d_AB^𝑑𝑖𝑟和d_AC^𝑑𝑖𝑟亦是B 和 C 的相對治療效果間接證據。

2.1.2 不一致性(inconsistency)

網絡統合分析能夠整合網絡中的直接證據與間接證據，直接和間接證據可基於相似性假設獲得。然而，研究中所蒐集來的試驗，就算都是隨機分派試驗 (randomize control trials)，也並非每個都會詳細報告所有可能影響結果的潛在因子，這會導致無法準確的判斷相似性是否成立，而可能使研究者得到偏差的結果。在傳統統合分析中，只存在直接證據，討論異質性的問題即可。但在網絡統合分析中因涉及間接證據，此時變成討論不一致性的問題。

網絡統合分析的模型有一致性(consistency/coherence)假設，即直接證據和間接證劇的結果要一致¹¹。延續前面的例子，若在研究中，有試驗是直接比較B 和 C 治療的，那麼 B 和 C 治療效果的差值(d_BC^𝑑𝑖𝑟)可以直接從觀測值獲得。在一致性假設下，直接和間接證據要相同d_BC^𝑑𝑖𝑟 = d_BC^𝑖𝑛𝑑(= d_AC^𝑑𝑖𝑟− d_AB^𝑑𝑖𝑟)。若是違反相似性假設，可能會出現d_BC^𝑑𝑖𝑟 ≠ d_BC^𝑖𝑛𝑑的情況，稱之為不一致性¹⁴。

(15)

目前網絡統合分析中，主要將不一致性分成design inconsistency、loop inconsistency、side-splitting inconsistency 三種，它們分別對應三種檢定方法^15;

16。檢定沒檢查出不一致性，不代表相似性假設必然成立，可能只是無法檢測到而已。

2.2 兩種隨機效應假設

統合分析中的模型分為固定效應(fixed-effect)與隨機效應(random-effect)模型，兩者在於理論假設上有些許差別。一般來說，納入的試驗都來自不同的母群體，才會考慮使用固定效應模型。實作時，較少碰到這種案例，因此較常使用隨機效應模型將試驗之間的差異納入考慮。針對隨機效應的假設，根據相似的解讀不同，有兩派說法^{17; 18}。

第一種，效果隨機(effect at random)是以傳統統合分析的角度做延伸，以傳統的角度去解讀相似性。此假設下的可交換性與傳遞性皆針對相對效果，因此效果隨機也是針對相對效果做假設。相似性允許一個治療，在不同試驗可以有不同的治療效果，在效果隨機的假設下，將其歸咎到試驗本身的效果，而試驗本身的效果是不可忽略的，會對試驗內的所有治療效果造成固定影響，為了消除試驗的效果，將治療效果相減，達到消去試驗效果的目的，因此相對治療效果理論上要相似，才具備可交換性。

第二種，研究隨機(study at random)是較為新穎的假設，以異於傳統的角度切入。假設隨機分派在試驗的層級(study-level or trial-level)中執行，因此病人是被隨機分派到所有的試驗內，而非在一個試驗內被隨機分派每個治療。在這樣的假設下，治療效果差異都是由隨機誤差造成。因此不具有試驗效果(study effect)，絕對治療效果具有可交換性，能在不同試驗之間交換。而隨機效應也是針對絕對治療效果。

2.3 試驗的偏差

統合分析幫助研究者整合期刊上各個文獻結果。然而，在蒐集的試驗中，可

(16)

能某些結果會異於其他試驗，這樣的試驗可能會導致估計結果出現偏差，不適合納入研究中。

一個試驗可能出現偏差的地方有很多。按照執行的先後順序，可以分為試驗前、試驗中、試驗後三部分⁷。試驗前主要指研究設計與樣本選擇的問題。文獻一般來說都需要報告這些訊息，因此在訂立試驗納入標準時，可排除掉較多問題。比較困難的問題是訂立的條件文獻上沒有報告到，解決方法可以考慮直接寄信詢問該篇文獻的作者。試驗中指資料測量過程中產生的偏差。例如醫生對於治療效果有預期、期待心理，並在已知受試者被分到哪種治療的情況下，對不同治療組的病人測量的細緻程度不同，或是態度影響到受試者心理，而對結果造成影響。或試資料的測量是由不同人測得，測量手法不一致而導致。文獻當中有的會概略提到執行過程是如何排除這些問題，以證明資料的可靠度，然而有些研究本身無可避免地無法處理這些問題，此時需要評估結果高(低)估或無法預期。前兩種可以在篩選文獻的過程中，盡可能的排除有問題或干擾研究目的的試驗結果。

最後，試驗後指資料分析的過程與結果發表時的問題，分析過程中可能用碰到研究無法處理得干擾因子。較為著名的例子是卡介疫苗得效果受到緯度影響，

不同緯度得到的結果有差異性。若納入的研究，有搜集到干擾因子的訊息，可以使用meta-regression 去調整結果。而發表上的問題指研究結果因為某些理由而沒有被發表，從而導致無法被研究納入，原因大致上可分兩種，一種是結果並非研究者希望看到的結果，特別是贊助者不希望看到、會阻礙產品推廣的結果不可能被公開。另一種是結果與其他研究者有差異，甚至可能結論與其他人相反。有此結果的研究若不是大型研究不易被期刊接受，也容易使研究者自行放棄發表。儘管這種偏差有統計方法(例如 Egger’s test)可以檢定，但檢力(power)不足¹⁹。結果通常會搭配漏斗圖(funnel plot)解釋。若是觀察到有這類型的偏差，研究者需要對結果得解讀更為小心謹慎，以免被誤導。

過去，在執行網絡統合分析的過程中，經驗較為豐富的研究者可以從蒐集的

(17)

資料中判斷哪些試驗得結果可能有潛在的問題。當回顧這些資料來源的試驗時，

或許能夠找到原因而排除部分的資料。但亦可能從試驗的研究設計到分析結果，

都無法從文獻上找出問題，沒有合理的理由去解釋。這樣的資料研究者需要注意其對於結果的影響，以往僅能知道有影響。但由於網絡統合分析本身較為複雜，

無法明確預估偏差對於其他估計值的影響有多大。因此這個問題還尚待釐清。

(18)

第三章研究方法

網絡統合分析中，模型依據估計尺度不同被分為Contrast-based 和 Arm-based 模型。在Contrast-based 模型中，較常被使用的模型為 Lu & Ades model。另一種較少用為Contrast-based 模型混合基底治療的模型。而 Arm-based 模型稱為 Arm- based model。本章將介紹研究中所使用的此三類模型。

第一個是目前做網絡統合分析最常被使用的模型，由Lu 和 Ades 在 2006 年提出¹⁴，因此被稱為Lu & Ades model。其方法是將他們 2004 年提出的 k-

comparison version of Smith-Spiegelhalter-Thomas (SST) model 進一步更新而成²⁰。模型主要有兩個特色：估計相對治療效果、基底治療為固定效應。

第二個模型是由Dias 等人在 2013 年提出的模型^{13; 21}，是根據常使用在成本效益分析(cost-effectiveness analysis)的 history natural baseline model 的角度切入，

將傳統Contrast-based 模型以絕對治療效果的方式(Arm-based approach)呈現後，

針對基底治療做不同的假設而成。模型有三個特色：估計相對治療效果、基底治療為隨機效應、基底治療和相對治療效果結合，可以推出每種治療對母群體的絕對治療效果。此模型並未有特定名稱，較常使用Contrast-based plus baseline 模型來稱呼。因此本篇研究中，將此模型簡稱為Baseline model。

第三個模型是Zhang 等人在 2013 年首次提出²²，並於2015 年更新的 Arm- based model¹⁸。其模型架構有別與前兩者，主要特色為：估計絕對治療效果、每個試驗的治療效果都具備可交換性。

以上三種模型將在頻率學派架構下(frequentist framework)執行，由於固定效應模型較少被使用，本研究皆假設隨機效應存在，並以兩階段分析(two-stage analysis)進行估計。

3.1 名詞定義

在介紹模型前，我們先清楚定義在Contrast-based 模型所使用的名詞。

分組

(19)

納入研究的試驗，比較的治療不完全相同，因此根據試驗內的治療將每個試驗分組²³。同一組內的試驗比較的治療要完全相同。以一個簡單的例子來說明分組如何執行。假設A₁、A₂和A₃一個研究納入的治療。只比較A₁和A₂的試驗與只比較A₁、A₂和A₃的試驗分為不同組

S₁ = {只比較A₁和A₂的2-arm試驗}

S₂ = {只比較A₁、A₂和A₃的3-arm試驗}

S₁和S₂為互不交集的兩個集合。| ∙ |為計算集合內元素數的函數，因此|S_𝑔|為第𝑔 組的試驗數目，而∑ |S_𝑔 _𝑔|為研究納入的試驗總數。若此時納入的試驗如表3.1 所示，則分為S₁ = {試驗 1, 試驗 2}、S₂ = {試驗 3}、S₃ = {試驗 4}和S₃ = {試驗 5}

四組。

表3.1 分組範例

試驗治療組別

1 A₁, A₂ 1 2 A₁, A₂ 1 3 A₁, A₂, A₃ 2 4 A₂, A₃ 3 5 A₂, A₄ 4 參考治療(reference treatment)

我們所使用的Contrast-based 模型估計的為相對治療效果，需要選擇一個治療做為估計相對效果的參考物件。模型中作為參考的治療稱為參考治療¹⁶。

基礎參數(basic parameter)與功能參數(functional parameter)

以表3.1 作為例子說明，若選擇以A₁治療作為參考治療，估計的𝑑_1𝑥, 𝑥 = 2,3,4稱為基礎參數。而透過基礎參數間互相加減的線性關係表示的參數，則稱為功能參數¹⁴

𝑑₂₃ = 𝑑₁₃− 𝑑₁₂ 基底治療(baseline treatment)

一個試驗做為參考物件的治療，稱為基底治療¹⁶。原則上，參考治療是基底

(20)

治療的最佳選擇。但一個研究中納入的試驗，不見得會有參考治療。此時勢必要另外選擇一個參考物件，再透過功能參數表示成基礎參數。

給予選擇參考物件的標準，有助於模型的表達與程式的運算。因此先將所有的治療進行排序，再根據排列的順序選擇該試驗中排序最靠前的做為基底治療。

需注意參考治療的排序為第一。以表3.1 為例，若選擇以A₁治療作為參考治療，

則試驗4 和 5 的的相對治療效果將無法直接以一個基礎參數表示。此時我們將治療以A₁, A₂, A₃, A₄的順序排序，則試驗4 和 5 的基底治療皆為A₂。

3.2 Lu & Ades model

假設納入I個試驗比較A₁, A₂, … , A_K共K種治療方式，並以A₁, A₂, … , A_K的順序排序，T_i為在第i個試驗中被比較的治療的集合，將A₁指定為參考治療，A_𝑏(𝑖) = { 第 i 個治療中，排序最前面的治療}為第i個試驗的基底治療^{23; 24}：

𝑔(𝑦̂_i∙k) = θ_i∙k= 𝛽_𝑏(𝑖)+ 𝑈_𝑖∙𝑘δ_{𝑖∙𝑏(𝑖)𝑘} (3.1) 𝑈_𝑖∙𝑘 = {1, 𝑘 ≠ 𝑏(𝑖)

0, 𝑘 = 𝑏(𝑖) (3.2)

𝛿_{𝑖∙𝑏(𝑖)𝑘}~𝑁(𝑑_{𝑏(𝑖)𝑘}, 𝜏²), 𝑑_{𝑏(𝑖)𝑘} = 𝑑_1𝑘− 𝑑_1𝑏(𝑖) , 𝑑₁₁= 0 (3.3) 其中𝑔(∙)為鍊結函數(link function)，根據不同的資料型態給予適合的函數。

𝛽_0𝑖為第i個試驗的基底治療效果。δ_{𝑖∙𝑏(𝑖)𝑘}為第i個試驗中，A_𝑘治療與基底治療(A_𝑏(𝑖)) 的相對治療效果。𝑈_𝑖∙𝑘為第i個試驗的指示函數(indicator function)。

3.2.1 兩階段分析

以依變項(dependent variable)的資料型態為連續型作說明，假設第i個試驗比較A_x、A_y和A_z三種治療(three-arm trial)，且A_b(i) = A_x。第一階段以固定效應模型的結果估計隨機效應²³。首先將絕對治療效果轉換成相對治療效果

∆_𝑖= (∆_{𝑖∙𝑥𝑦}

∆_{𝑖∙𝑥𝑧}) = (y_𝑖∙𝑦− y_𝑖∙𝑥

y_𝑖∙𝑧− y_𝑖∙𝑥) (3.4) 三種以上的治療(multi-arm)算出來的∆_𝒊會是長度為|T_i| − 1的向量，若試驗只比較兩種治療(two-arm trial)，則∆_𝒊將會是純量。∆_{𝑖∙𝑦𝑧}不需要計算，可以透過另外

(21)

兩者組合而來

∆_{𝑖∙𝑦𝑧}= (−1 1)∆_𝒊

一個∆_𝒊對應的𝐗_i則為(|T_i| − 1) × (K − 1)的矩陣或向量(K = 2) 𝐗_i = (𝑿_{𝑖∙𝑥𝑦}

𝑿_{𝑖∙𝑥𝑧}) 生成的模式如表3.2 所示

表3.2 虛擬變數生成模式

試驗治療 X_𝑖∙12 X_𝑖∙13 … X_𝑖∙1𝑥 … X_𝑖∙1𝑦 … X_𝑖∙1𝑧 … X_𝑖∙1𝐾 𝑖 A_x 𝑣𝑠 A_y 𝑿_{𝑖∙𝑥𝑦} 0 0 0 -1 0 1 0 0 0 0

A_x 𝑣𝑠 A_z 𝑿_{𝑖∙𝑥𝑧} 0 0 0 -1 0 0 0 1 0 0 模型假設同一試驗內的治療效果彼此獨立，因此推導出下列式子

𝑉𝑎𝑟(∆_{𝑖∙𝑥𝑦}) = 𝑉𝑎𝑟(y_𝑖∙𝑦 − y_𝑖∙𝑥) = 𝑉𝑎𝑟(y_𝑖∙𝑦) + 𝑉𝑎𝑟(y_𝑖∙𝑥) = 𝑠𝑒_𝑖∙𝑦² + 𝑠𝑒_𝑖∙𝑥² 𝑉𝑎𝑟(∆_{𝑖∙𝑥𝑧}) = 𝑉𝑎𝑟(y_𝑖∙𝑧− y_𝑖∙𝑥) = 𝑉𝑎𝑟(y_𝑖∙𝑧) + 𝑉𝑎𝑟(y_𝑖∙𝑥) = 𝑠𝑒_𝑖∙𝑧² + 𝑠𝑒_𝑖∙𝑥² 𝐶𝑜𝑣(∆_{𝑖∙𝑥𝑦}, ∆_{𝑖∙𝑥𝑧}) = 𝑉𝑎𝑟(y_𝑖∙𝑥) − 𝐶𝑜𝑣(y_𝑖∙𝑥, y_𝑖∙𝑧) − 𝐶𝑜𝑣(y_𝑖∙𝑦, y_𝑖∙𝑥) + 𝐶𝑜𝑣(y_𝑖∙𝑦, y_𝑖∙𝑧)

= 𝑠𝑒_𝑖∙𝑥²

𝑠𝑒_𝑖∙𝑘² 為第i個試驗所報告的A_k治療的標準誤(standard error)。組合起來得到共變異矩陣(covariance matrix)

𝑾_𝑖⁻¹ = 𝑉𝑎𝑟(∆_𝑖) = (𝑠𝑒_𝑖∙𝑥² + 𝑠𝑒_𝑖∙𝑦² 𝑠𝑒_𝑖∙𝑥²

𝑠𝑒_𝑖∙𝑥² 𝑠𝑒_𝑖∙𝑥² + 𝑠𝑒_𝑖∙𝑧² ) (3.5) 同樣地，三種以上的治療會算出的𝑾_𝑖⁻¹矩陣維度為(|T_i| − 1) × (|T_i| − 1)。若試驗只比較兩種治療，則𝑾_𝑖⁻¹將會是一個純量。𝑾_𝑖⁻¹取反矩陣(純量取倒數)則為權重 𝑾_𝑖。

(22)

將所有試驗的∆_𝑖、𝐗_i和𝑾_𝑖⁻¹分別合併成∑^𝐼_𝑖=1(|𝑇_𝑖| − 1)× 1、∑^𝐼_𝑖=1(|𝑇_𝑖| − 1)× (𝐾 − 1)和∑^𝐼_𝑖=1(|𝑇_𝑖| − 1)× ∑^𝐼_𝑖=1(|𝑇_𝑖| − 1)的向量和矩陣

∆= (∆₁^′, … , ∆_𝐼^′)^′, 𝑿 = ( 𝑿₁

⋮ 𝑿_𝐼

) , 𝐖⁻¹= diag(𝑾₁⁻¹, … , 𝑾_𝐼⁻¹)

從固定效應模型獲得參數𝜷_𝑭

∆= 𝑿𝜷_𝑭+ 𝛜, 𝐜𝐨𝐯(𝛜) = 𝐖^−𝟏 (3.6) 𝜷̂_𝑭 = (𝑿^′𝑾𝑿)^−𝟏𝑿^′𝑾∆ (3.7) 根據(3.6)和(3.7)的結果將皮爾森殘差的平方加總，以及計算自由度

Q = (∆ − 𝑿𝜷̂_𝑭)′𝑾(∆ − 𝑿𝜷̂_𝑭) = ∑(∆_𝑖− 𝐗_i𝜷̂_𝑭)^′𝑾_𝑖(∆_𝑖 − 𝐗_i𝜷̂_𝑭)

𝐼

𝑖=1

(3.8)

𝑑𝑓 = (∑ (|𝑇_𝑖| − 1)

𝐼 𝑖=1

) − (𝐾 − 1) (3.9) 異質性的部分，模仿傳統統合分析的估計方式，利用(3.8)和(3.9)估計。由於分母的部分不再是純量，要使用矩陣的方式運算，此外，根據比較的治療不同，

矩陣的維度也不相同，因此先將試驗以3.1 名詞定義節的分組方法，根據比較的治療分成S₁, S₂, … , 𝑆_𝐺組，每組各有𝑁_𝑔 = |𝑆_𝑔|個試驗。根據組別計算各自的比重

𝜏² = max {0,𝑄 − 𝑑𝑓

∑^𝐺_𝑔=1𝐶_𝑔} (3.10)

𝐶_𝑔 = tr {∑ 𝑾_𝑔∙𝑗

𝑁𝑔 𝑗=1

− ∑ 𝑾_𝑔∙𝑗²

𝑁𝑔 𝑗=1

(∑ 𝑾_𝑔∙𝑗

𝑁𝑔 𝑗=1

)

−1

} (3.11)

其中𝑾_𝑔∙𝑗為第𝑔組第𝑗個試驗的權重，計算方式同(3.5)。若𝑁_𝑔 = 1，則𝐶_𝑔 = 0。若 𝑔 = 1,2, … , 𝐺時𝑁_𝑔 = 1，則𝜏² = 0。

將𝜏²和𝑾_𝑖⁻¹根據隨機效應模型的變異數矩陣的結構結合

𝑾^∗_𝑖⁻¹= 𝜏²𝑽_𝑖 + 𝑾_𝑖⁻¹ (3.12) 𝑽_𝑖為Lu & Ades model 中的相關係數矩陣，其中𝑽_𝑖為維度與𝑾_𝑖⁻¹相同、對角線為 1、非對角線為 0.5 的矩陣，設定成這種結構的原因將於 3.2.2 相關係數矩陣小節說明。將全部的𝑾^∗_𝑖⁻¹合併可以得到

(23)

𝐖^∗−1= diag(𝑾^∗₁⁻¹, … , 𝑾^∗_𝐼⁻¹)

接下來第二步驟²³，從固定效應模型獲得參數𝜷_𝑹和其共變異數矩陣

∆= 𝑿𝒅_𝑹+ 𝛜, 𝐜𝐨𝐯(𝛜) = 𝐖^∗−𝟏 (3.13) 𝒅̂_𝑹 = (𝑿^′𝑾^∗𝑿)^−𝟏𝑿^′𝑾^∗∆ 和 𝐶𝑜𝑣(𝒅̂_𝑹) = (𝑿^′𝑾^∗𝑿)^−𝟏 (3.14) 參數只估計以A₁作為參考治療的基礎參數，無法直接取得A_x和A_y(x, y ≠ 1)的相對效果，因此需要透過一個大小為^{𝐾(𝐾−1)}

2 × (𝐾 − 1)的矩陣去轉換。首先先定義 𝟎_𝑛 = (0, … ,0)^′和−𝟏_n= (−1, … , −1)^′為n × 1的矩陣，將兩者以下面的方式與單位矩陣(𝑰_𝑛)結合後，合併成一個轉換矩陣

𝐇_K−1 = 𝐼_𝐾−1, 𝐇_K−2= (−𝟏_K−2 𝑰_𝐾−2)和

𝐇_K−j = (𝟎⏟ _𝐾−𝑗, . . , 𝟎_𝐾−𝑗

𝒋−𝟐

, −𝟏_K−j, 𝑰_𝐾−𝑗)，當2 < j < K時

𝐇 = (𝐇_K−1^′ 𝐇_K−2^′ … 𝐇₂^′ 𝐇₁^′)′ (3.15) 以表3.1 為例，轉換矩陣為

(

1 0 0 0 1 0 0 0 1

−1 1 0

−1 0 1 0 −1 1)

透過(3.15)的結果轉換，可以得到包含功能參數在內的所有參數

𝒅̂_𝑎𝑙𝑙 = 𝐇𝒅̂_𝑹 (3.16) 𝐶𝑜𝑣(𝒅̂_𝑎𝑙𝑙) = 𝐶𝑜𝑣(𝐇𝒅̂_𝑹) = 𝐇𝐶𝑜𝑣(𝒅̂_𝑹)𝐇^′ (3.17)

3.2.2 相關係數矩陣

儘管在模型中並未特別說明𝐶𝑜𝑣(𝛿_{𝑖∙𝑏(𝑖)𝑘}, 𝛿_{𝑖∙𝑏(𝑖)𝑙})的關係，但由於 𝛿_{𝑖∙𝑏(𝑖)𝑘}~𝑁(𝑑_{𝑏(𝑖)𝑘}, 𝜏²)的假設，以模型的角度考慮隨機效應

𝑉𝑎𝑟(𝛿_{𝑖∙𝑥𝑦}) = 𝜏² 和 𝑉𝑎𝑟(𝛿_{𝑖∙𝑥𝑧}) = 𝜏² 同時對𝑉𝑎𝑟(𝛿_{𝑖∙𝑦𝑧})來說，下列運算成立

𝑉𝑎𝑟(𝛿_{𝑖∙𝑦𝑧})

(24)

= 𝑉𝑎𝑟(y_𝑖∙𝑧− y_𝑖∙𝑦) = 𝑉𝑎𝑟 (y_𝑖∙𝑧− 𝑦_𝑖∙𝑥− (y_𝑖∙𝑦− y_𝑖∙𝑥))

= 𝑉𝑎𝑟(y_𝑖∙𝑧− y_𝑖∙𝑥) + 𝑉𝑎𝑟(y_𝑖∙𝑦 − y_𝑖∙𝑥) − 2𝐶𝑜𝑣(y_𝑖∙𝑧− y_𝑖∙𝑥, y_𝑖∙𝑦− y_𝑖∙𝑥)

= 𝑉𝑎𝑟(𝛿_{𝑖∙𝑥𝑧}) + 𝑉𝑎𝑟(𝛿_{𝑖∙𝑥𝑦}) − 2𝐶𝑜𝑣(𝛿_{𝑖∙𝑥𝑧}, 𝛿_{𝑖∙𝑥𝑦})

⇒ 𝜏² = 𝜏² + 𝜏² − 2𝐶𝑜𝑣(𝛿_{𝑖∙𝑥𝑧}, 𝛿_{𝑖∙𝑥𝑦}) 故𝐶𝑜𝑣(𝛿_{𝑖∙𝑥𝑧}, 𝛿_{𝑖∙𝑥𝑦}) =¹

2𝜏²得證，因此在(3.12)中的𝑽_𝑖為此結構

(

1 1/2 ⋯ 1/2 1/2 1 1/2

⋮ ⋱

1/2 1/2 1 )

3.2.3 帽子矩陣(hat matrix)與貢獻圖(contribution plot)

為了能觀察一個網絡中，每個直接比較的相對治療效果是如何影響模型結果，我們將網絡中所有的兩兩比較都做傳統統合分析(pairwise meta-analysis)。模型都假設為隨機效應模型(詳見(3.13))，計算過程使用與 3.2.1 兩階段分析小節的兩段式分析一樣的手法。由於傳統統合分析只做兩個治療的比較，因此實際計算過程更為簡化²⁵。為了便於說明，假設研究僅納入A_𝑤、A_𝑥、A_𝑦和A_𝑧四種治療，

研究中最多有6 個(= 4(4 − 1) 2⁄ )成對比較。定義T_𝑖為第i 個試驗所包含的治療的集合。以一個3-arm 試驗為例計算，若第i個試驗比較A_𝑤、A_𝑥和A_𝑦三種治療，以和(3.4)同樣的方式計算此試驗的所有相對治療效果

(

∆_{𝑖∙𝑤𝑥}^𝑑𝑖𝑟

∆_{𝑖∙𝑤𝑦}^𝑑𝑖𝑟

∆_{𝑖∙𝑥𝑦}^𝑑𝑖𝑟 ) = (

y_𝑖∙𝑥− y_𝑖∙𝑤 y_𝑖∙𝑦− y_𝑖∙𝑤 y_𝑖∙𝑦 − y_𝑖∙𝑧) 一個試驗能夠計算的相對治療效果數量為^|𝑇^𝑖^|(|𝑇^𝑖^|−1)

2 。

在傳統統合分析不需要考慮共變異數，因此分別計算每個直接比較的變異數，計算方式與(3.5)變異數的部分相同

( 𝑊_{𝑖∙𝑤𝑥}⁻¹ 𝑊_{𝑖∙𝑤𝑦}⁻¹ 𝑊_{𝑖∙𝑥𝑦}⁻¹

) = (

𝑉𝑎𝑟(∆_{𝑖∙𝑤𝑥}^𝑑𝑖𝑟 ) 𝑉𝑎𝑟(∆_{𝑖∙𝑤𝑦}^𝑑𝑖𝑟 ) 𝑉𝑎𝑟(∆_{𝑖∙𝑥𝑦}^𝑑𝑖𝑟 )

) = (

𝑠𝑒_𝑖∙𝑤² + 𝑠𝑒_𝑖∙𝑥² 𝑠𝑒_𝑖∙𝑤² + 𝑠𝑒_𝑖∙𝑦² 𝑠𝑒_𝑖∙𝑥² + 𝑠𝑒_𝑖∙𝑦²

)

(25)

取倒數後，𝑊_{𝑖∙𝑤𝑥}、𝑊_{𝑖∙𝑤𝑦}、𝑊_{𝑖∙𝑥𝑦}即為各自的權重。

A_𝑤和A_𝑥治療以傳統統合分析，在固定效應模型(詳見(3.6)和(3.7))下得到的估計值，可以表示成

S = {同時包含𝐴_𝑥治療和𝐴_𝑤治療的所有試驗}

𝑑̂_𝐹^𝑑𝑖𝑟_𝑤𝑥 = ∑ 𝑊_{𝑖∙𝑤𝑥}

𝑖,𝑇_𝑖∈S

∆_{𝑖∙𝑤𝑥}^𝑑𝑖𝑟 ∑ 𝑊_{𝑖∙𝑤𝑥}

𝑖,T_𝑖∈S

⁄ , 𝑓𝑜𝑟 S ≠ ∅ 而皮爾森殘差(詳見(3.8))與自由度(詳見(3.9))則可以表示成

𝑄_𝑤𝑥 = ∑ 𝑊_{𝑖∙𝑤𝑥}

𝑖,T_𝑖∈S

(∆_{𝑖∙𝑤𝑥}^𝑑𝑖𝑟 − 𝑑̂_𝐹^𝑑𝑖𝑟_𝑤𝑥)²和𝑑𝑓_𝑤𝑥 = ∑ 𝐼(T_𝑖 ∈ S)

𝑖

利用皮爾森殘差平方總和、權重與自由度，計算出相對治療效果估計值的隨機效應(詳見(3.10))

𝜏_𝑤𝑥² = max (

0, 𝑄_𝑤𝑥 − 𝑑𝑓_𝑤𝑥

∑_𝑖,T_𝑖_∈S𝑊_{𝑖∙𝑤𝑥}−∑_𝑖,T_𝑖_∈S𝑊_{𝑖∙𝑤𝑥}²

∑_𝑖,T_𝑖_∈S𝑊_{𝑖∙𝑤𝑥})

, 𝑖𝑓 |S| > 1

若|S| = 1，異質性不存在，因此𝜏_𝑤𝑥² = 0。最後將計算估的隨機效應，做為傳統統合分析下的隨機效應模型的參數(詳見(3.12))

𝑊_{𝑖∙𝑤𝑥}^∗−1 = 𝜏_𝑤𝑥² + 𝑊_{𝑖∙𝑤𝑥}⁻¹ 如此一來，就能根據(3.13)和(3.14)估計出

𝑊_𝑤𝑥^∗ = ∑ 𝑊_{𝑖∙𝑤𝑥}^∗

𝑖,T_𝑖∈S

𝑑̂_𝑅^𝑑𝑖𝑟_𝑤𝑥 = ∑ 𝑊_{𝑖∙𝑤𝑥}^∗

𝑖,T_𝑖∈S

∆_{𝑖∙𝑤𝑥}^𝑑𝑖𝑟 ⁄𝑊_𝑤𝑥^∗

以上是將3.2.1 兩階段分析的過程簡化為兩個治療的相對治療效果，重複同樣的過程可以得到所有直接比較的相對治療效果。最後將所有直接比較的結果，

透過𝐙映射到網絡中所有可能存在的成對比較治療中

𝒅̂_𝑅 = 𝒁(𝒁_𝑑𝑖𝑟^′ 𝑾_𝑑𝑖𝑟^∗ 𝒁_𝑑𝑖𝑟)⁻¹𝒁_𝑑𝑖𝑟^′ 𝑾_𝑑𝑖𝑟^∗ 𝒅̂_𝑅^𝑑𝑖𝑟

𝒅̂_𝑅^𝑑𝑖𝑟為所有直接比較的相對治療效果估計值。𝑾_𝑑𝑖𝑟^∗ 為與𝒅̂_𝑅^𝑑𝑖𝑟的位置相對應的相對治療效果估計值變異數矩陣，非對角線皆為0。𝐙矩陣為類似(3.15)，但排列順序

(26)

略有不同，以表3.1 為例

𝒅̂_𝑅^𝑑𝑖𝑟 = (

𝛽̂_𝑅^𝑑𝑖𝑟₁₂ 𝛽̂_𝑅^𝑑𝑖𝑟₁₃ 𝛽̂_𝑅^𝑑𝑖𝑟₂₃ 𝛽̂_𝑅^𝑑𝑖𝑟₂₄)

, 𝑾_𝑑𝑖𝑟^∗ = (

𝑊₁₂^∗ 0 0 0 0 𝑊₁₃^∗ 0 0 0 0 𝑊₂₃^∗ 0 0 0 0 𝑊₂₄^∗

)

𝐙 = 1𝑣𝑠2 1𝑣𝑠3 2𝑣𝑠3 2𝑣𝑠4 1𝑣𝑠4 3𝑣𝑠4(

1 0 0 0 1 0

−1 1 0

−1 0 1 0 0 1 0 −1 1

⏞

1𝑣𝑠2 1𝑣𝑠3 1𝑣𝑠4

)

, 𝒁_𝑑𝑖𝑟 = 1𝑣𝑠2 1𝑣𝑠3 2𝑣𝑠3 2𝑣𝑠4(

1 0 0 0 1 0

−1 1 0

−1 0 1

⏞

1𝑣𝑠2 1𝑣𝑠3 1𝑣𝑠4

)

而帽子矩陣則為

𝐡𝐚𝐭 = 𝒁(𝒁_𝑑𝑖𝑟^′ 𝑾_𝑑𝑖𝑟^∗ 𝒁_𝑑𝑖𝑟)⁻¹𝒁_𝑑𝑖𝑟^′ 𝑾_𝑑𝑖𝑟^∗ = (ℎ𝑎𝑡_𝑖,𝑗)|𝑇_𝑖|(|𝑇_𝑖|−1)

2 ×(|𝑇_𝑖|−1)

而將帽子矩陣每列數值取絕對值後，再換算成列百分比，即為貢獻圖矩陣 𝐜𝐨𝐧 = (con_𝑖,𝑗)|𝑇_𝑖|(|𝑇_𝑖|−1)

2 ×(|𝑇𝑖|−1), con_𝑖,𝑗 = |ℎ𝑎𝑡_𝑖,𝑗|

∑^|𝑇_𝑗=1^𝑖^|−1|ℎ𝑎𝑡_𝑖,𝑗|× 100%

3.3 Baseline model

假設納入I個試驗比較A₁, A₂, … , A_K共K種治療方式，並以A₁, A₂, … , A_K的順序排序，T_i為在第i個試驗中被比較的治療的集合，將A₁指定為參考治療²¹：

𝑔(𝑦̂_i∙k) = θ_i∙k = 𝛽_𝑖+ 𝑈_𝑖∙𝑘δ_𝑖∙1𝑘 (3.18) 𝛽_𝑖~𝑁(𝜇₁, 𝜎₁²) (3.19) 𝑈_𝑖∙𝑘 = {1, 𝑘 ≠ 1

0, 𝑘 = 1, 𝛿_𝑖∙1𝑘~𝑁(𝑑_1𝑘, 𝜏²)

其中𝑔(∙)為鍊結函數(link function)，根據不同的資料型態給予適合的函數。𝛽_𝑖 為第i個試驗的基底治療效果。δ_𝑖∙1𝑘為第i個試驗中，A_𝑘治療與參考治療的相對治療效果。𝑈_𝑖∙𝑘為第i個試驗的指示函數。

(27)

3.3.1 分離式模型(separate model)與補值

不同於Lu & Ades model，模型假設參考治療服從常態分布。本研究分離式模型採取將(3.18)中的參考治療的分布先行估計的方式，也就是先估計如下的模型

𝑔(𝑦̂_i∙1) = θ_i∙1= 𝛽_𝑖 (3.20) 𝛽_𝑖~𝑁(𝜇₁, 𝜎₁²) (3.21) 參數的估計方法，模仿自傳統統合分析估計參數的方式。參考治療效果的平均值以加權平均的方式估計，而變異數以類似τ²的方式估計。

𝜇̂₁^′ = ∑ 𝑤_𝑖 _𝑖𝑦_𝑖∙1

∑ 𝑤_𝑖 _𝑖 若T_i ∋ 𝐴₁ (3.22)

𝜎̂₁² = max {

0,∑ 𝑤_𝑖 _𝑖(𝑦_𝑖∙1− 𝜇̂₁^′)²− 𝑑𝑓

∑ 𝑤_𝑖 _𝑖− (∑ 𝑤_𝑖 _𝑖²

∑ 𝑤_𝑖 _𝑖) }

若T_i ∋ 𝐴₁ (3.23)

其中𝑤_𝑖 = ¹

𝑠𝑒_𝑖∙1² 為試驗𝑖的權重。𝑠𝑒_𝑖∙𝑘² 為第i個試驗所報告的A_k治療的標準誤。自由度 (𝑑𝑓)為∑ 𝐼(T^𝐼_𝑖 _i∋ 𝐴₁)− 1。最後在考慮𝜎̂₁²的情況下，重新估計參考治療效果的平均值

𝜇̂₁ = ∑ 𝑤_𝑖 _𝑖^′𝑦_𝑖∙1

∑ 𝑤_𝑖 _𝑖^′ 若T_i ∋ 𝐴₁ (3.24) 其中𝑤_𝑖^′= ¹

𝑠𝑒_𝑖∙1² +𝜎̂₁²為試驗𝑖的權重。

估計好參考治療的分布後，以表3.1 第 4、5 個試驗的資料為範例來說明補植方式，分析需要的治療效果、標準差和樣本數如表3.3 所示。

(28)

表3.3 表 3.1 第 4、5 個試驗的資料

試驗 A₂治療 𝐬𝐭𝐝_𝟐 𝐧_𝟐 A₃治療 𝐬𝐭𝐝_𝟑 𝐧_𝟑 A₄治療 𝐬𝐭𝐝_𝟒 𝐧_𝟒 4 y_4∙2 std_4∙2 n_4∙2 y_4∙3 std_4∙3 n_4∙3 - - - 5 y_5∙2 std_5∙2 n_5∙2 - - - y_5∙4 std_5∙4 n_5∙4 參考治療效果以平均值補入。標準差的部分直接以其他治療的標準誤，以樣本數為權重作加權平均標準誤補入。由於標準差的部分以標準誤補入，因此樣本數直接補入1 即可。結果如表 3.4 所示。

表3.4 補值後的參考治療

試驗 A₁治療 𝐬𝐭𝐝_𝟏 𝐧_𝟏

4 y_4∙1= 𝜇̂₁

std_4∙1 = se_4∙1 = 𝑠𝑡𝑑_4∙2

√𝑛4∙2

𝑛_2∙2+𝑠𝑡𝑑_4∙3

√𝑛4∙3

𝑛_4∙3 𝑛_4∙2+ 𝑛_4∙3

n_4∙1= 1

5 y_5∙1= 𝜇̂₁

std_5∙1 = se_5∙1 = 𝑠𝑡𝑑_5∙2

√𝑛5∙2

𝑛_5∙2+𝑠𝑡𝑑_5∙4

√𝑛5∙4

𝑛_5∙4 𝑛_5∙2+ 𝑛_5∙4

n_5∙1= 1

使用(3.20)和(3.21)補完值後，將結果代回(3.18)和(3.19)中，再以 3.2.1 兩階段分析的方法進行相對治療效果的估計，最終得到所有參數。

3.4 Arm-based model

假設納入I個試驗比較A₁, A₂, … , A_K共K種治療方式，並以A₁, A₂, … , A_K的順序排序，T_i為在第i個試驗中被比較的治療的集合，將A₁指定為參考治療^{18; 22}：

𝑔(𝑦̂_i∙k) = θ_i∙k = 𝛽_𝑘(𝑖) (3.25) 𝛽_𝑘(𝑖)~𝑁(𝜇_𝑘, 𝜎_𝑘²)且𝑐𝑜𝑣(𝛽_𝑘(𝑖), 𝛽_𝑙(𝑖)) = 0 若𝑘 ≠ 𝑙 (3.26) 其中𝑔(∙)為鍊結函數(link function)，根據不同的資料型態給予適合的函數。

𝛽_𝑘(𝑖)為第i個試驗的A_k治療效果。相關係數的估計在頻率學派的架構下，不容易在每個網絡結構中都使用相同設定去估計。因此我們選擇將相關係數限制為0，也就是假設治療彼此相互獨立。

3.4.1 兩階段分析

Arm-based model 估計絕對治療效果，且根據(3.26)的假設，治療彼此之間互

(29)

相獨立，因此採取(3.22)、(3.23)和(3.24)相同的估計方式獲得 𝜇̂_𝑘^′ = ∑ 𝑤_𝑖 _𝑖∙𝑘𝑦_𝑖∙𝑘

∑ 𝑤_𝑖 _𝑖∙𝑘 且𝑤_𝑖∙𝑘 = 1

𝑠𝑒_𝑖∙𝑘² 若T_i ∋ 𝐴_𝑘

𝜎̂_𝑘² = max {

0,∑ 𝑤_𝑖 _𝑖∙𝑘(𝑦_𝑖∙𝑘− 𝜇̂_𝑘^′)²− 𝑑𝑓_𝑘

∑ 𝑤_𝑖 _𝑖∙𝑘− (∑ 𝑤_𝑖 _𝑖∙𝑘²

∑ 𝑤_𝑖 _𝑖∙𝑘) }

若T_i ∋ 𝐴_𝑘

𝑑𝑓_𝑘 = ∑ 𝐼(T_i ∋ 𝐴_𝑘)

𝐼

𝑖

− 1

𝜇̂_𝑘 =∑ 𝑤_𝑖 _𝑖∙𝑘^′ 𝑦_𝑖∙𝑘

∑ 𝑤_𝑖 _𝑖∙𝑘^′ 且𝑤_𝑖∙𝑘^′ = 1

𝑠𝑒_𝑖∙𝑘² + 𝜎̂_𝑘² 若T_i ∋ 𝐴_𝑘

𝑠𝑒_𝑖∙𝑘² 為第i個試驗所報告的A_k治療的標準誤。估算完的絕對治療效果，最後相減為相對治療效果

𝑑̂_kl= 𝜇̂_𝑙− 𝜇̂_𝑘, 𝑘 ≠ 𝑙 𝑉𝑎𝑟̂ (𝑑̂_kl) = 𝜎̂_𝑘²+ 𝜎̂_𝑙², 𝑘 ≠ 𝑙

3.5 模型比較

在2.2 兩種隨機效應假設小節中有介紹過兩種隨機效應的假設方式，

Contrast-based 模型以效果隨機為主要的假設，而 Arm-based 模型以研究隨機為主要假設。

如圖3.1 所示，Lu & Ades model 做為標準的 Contrast-based 模型，假設為效果隨機。而Baseline model 在效果隨機的基礎上，針對參考治療假設研究隨機，

因此可以估計參考治療的隨機效應。一般在隨機效應的假設上，會使用較強的同質性(homogenous)的假設去簡化模型，也就是假設所有相對治療效果的變異成度相同。雖然異質性(heterogeneity)的假設較弱、較有彈性，但需要估計較多參數

20，且不容易解釋。此外，實際執行也不容意，幾乎沒有人會使用。

而Arm-based model 的所有治療都假設研究隨機，那些沒有被我們觀察到的治療效果為隨機缺失(Missing at random)¹⁸。也就是說，若比較K 種治療，理論上每一個試驗都有全部K 種治療效果，但因為某些原因，部分試驗中的某些治療效

(30)

果遺失了，因此我們只能觀察到目前的資料。

Arm-based model 中，不同治療的隨機效應和不同治療之間的相關性可根據資料狀況做假設¹⁸，以一個比較三種治療的變異數矩陣來舉例：

(

𝜎₁² 𝜌₁₂𝜎₁𝜎₂ 𝜌₁₃𝜎₁𝜎₃ 𝜌₁₂𝜎₁𝜎₂ 𝜎₂² 𝜌₂₃𝜎₂𝜎₃ 𝜌₁₃𝜎₁𝜎₃ 𝜌₂₃𝜎₂𝜎₃ 𝜎₃²

)

假設由強到弱，可分成五種程度。Homogenous perfect: 𝜎₁ = 𝜎₂ = 𝜎₃, 𝜌₁₂= 𝜌₁₃= 𝜌₂₃ = 0；Heterogeneity uncorrelated: 𝜎₁ ≠ 𝜎₂≠ 𝜎₃, 𝜌₁₂ = 𝜌₁₃ = 𝜌₂₃ = 0；

Homogenous exchangeable: 𝜎₁ = 𝜎₂ = 𝜎₃, 𝜌₁₂= 𝜌₁₃= 𝜌₂₃ ≠ 0；Heterogeneity exchangeable:𝜎₁ ≠ 𝜎₂≠ 𝜎₃, 𝜌₁₂ = 𝜌₁₃ = 𝜌₂₃ ≠ 0；Heterogeneity unstructured:𝜎₁ ≠ 𝜎₂ ≠ 𝜎₃, 𝜌₁₂≠ 𝜌₁₃≠ 𝜌₂₃。

部分的學者認為研究隨機的假設會破壞隨機分派試驗的隨機性²⁶，因為每個試驗納入的受試者的族群不完全相同，直接假設它們可交換，顯然有問題。因此 Baseline model 和 Arm-based model 都會破壞隨機性，只有 Lu & Ades model 被認為能夠完整的保存這個性質。

在圖3.2 視覺化三種模型的假設，Lu & Ades model 和 Baseline model 可明顯看出區別。前者的參考治療(A 治療)是固定效應，根據不同的試驗有不同的參考治療效果，因此真正的治療效果不會維持一個水平線；後者參考治療為隨機效應，不同試驗的差異都被當作抽樣誤差，因此真正的治療效果不管在哪個試驗中都一樣。

而圖3.2 中 Arm-based model 與 Baseline model 有些相似。但所有個估計都針對估計絕對治療效果，而非相對治療效果。相關性主要在呈現不同治療間的關係。若為正值代表同一試驗內的A 治療效果越好，B 治療效果也傾向越好；負值代表同一試驗內的A 治療效果越好，B 治療效果傾向越差；0 代表 A 和 B 的治療效果無關。

(31)

圖3.1 網絡統合分析假設

呈現三種不同的模型，假設上的異同之處。Arm-based model 針對治療彼此之間的關係，有五種假設方式。Homogenous perfect 假設治療彼此獨立，且不同治療的隨機效應相同；Heterogeneity uncorrelated 同樣假設治療彼此獨立，但不同治療的隨機效應不同；Homogenous exchangeable 假設治療彼此不獨立、相關係數相同，且不同治療的隨機效應相同；Heterogeneity exchangeable 假設治療彼此不獨立、相關係數相同，但不同治療的隨機效應不同；Heterogeneity

unstructured 假設治療彼此不獨立、相關係數各不相同，而不同治療的隨機效應亦不相同。Contrast-based model 中，Homogenous 假設所有相對治療效果的隨機效應相同；Heterogeneity 假設不同相對治療效果的隨機效應不同。其中以紅色框起來的是本研究中所使用的假設。

(32)

(a) Lu & Ades model (b) Baseline model

(c) Arm-based model 圖3.2 簡易模型示意圖

呈現三種不同的模型的假設。橫軸代表不同的試驗；縱軸代表絕對治療效果；

兩條紅色虛線分別為兩個治療的真正的治療效果；每個點代表一個絕對治療效果，藍色為A 治療，綠色為 B 治療，在同一垂直線上的治療代表來自同一個試驗；右側的分布為模型有估計的隨機效應。其中Lu & Ades model 中的試驗根據A 治療的絕對治療效果重排過。

(33)

第四章模擬

為了模擬在不同的網絡結構下，治療的偏差是如何在影響模型估計，需要設定網絡結構與偏差的位置。考慮到設定納入的治療只有三、四個會過於簡化網絡結構，因此模擬中設定研究納入五種治療。

4.1 模擬情境

在此基礎下，我們篩選出具備代表性的五種網絡結構(詳見圖 4.1)。

(a)Network 1 (b)Network 2

(c)Network 3 (d)Network 4 (e)Network 5 圖4.1 網絡結構圖

每個網絡皆納入5 種治療，點的大小代表使用該種治療的總人數；每條線代表 4 個試驗；紅線代表存在偏差的 4 個試驗。(a)Network 1 為所有治療都僅與治療 C 有直接比較的星狀網絡，共 16 個試驗；(b)Network 2 為結構完整的網絡，共 40 個試驗；(c)Network 3 為一個迴圈與一分支組成的網絡，共 20 個試驗；

(d)Network 4 以 Network 3 為基礎，分支與 B 治療相連，形成第二個迴圈，共 24 個試驗；(e)Network 5 為所有治療形成一個大型迴圈，共 20 個試驗。

網絡統合分析中偏差的傳導模式

國立臺灣大學公共衛生學院流行病與預防醫學研究所 碩士論文

Institute of Epidemiology and Preventive Medicine College of Public Health

National Taiwan University Master Thesis

網絡統合分析中偏差的傳導模式

Bias propagation in network meta-analysis models

李 驊 Hua Li

指導教授：杜裕康 博士 Advisor: Yu-Kang Tu, DDS, Ph.D.

中華民國 107 年 7 月

July 2018

口試委員會審定書

中文摘要

Abstract

Keywords: network meta-analysis, contrast-based model, arm-based model, two-

目錄

表格目錄

圖片目錄

第一章 介紹 1.1 研究背景

1.2 研究目的

第二章 文獻回顧 2.1 基本假設

2.1.1 相似性(similarity)

2.1.2 不一致性(inconsistency)

2.2 兩種隨機效應假設

2.3 試驗的偏差

第三章 研究方法

3.1 名詞定義

3.2 Lu & Ades model

3.2.1 兩階段分析

3.2.2 相關係數矩陣

3.2.3 帽子矩陣(hat matrix)與貢獻圖(contribution plot)

3.3 Baseline model

3.3.1 分離式模型(separate model)與補值

3.4 Arm-based model

3.4.1 兩階段分析

3.5 模型比較

第四章 模擬

4.1 模擬情境

國立臺灣大學公共衛生學院流行病與預防醫學研究所碩士論文

李驊 Hua Li

指導教授：杜裕康博士 Advisor: Yu-Kang Tu, DDS, Ph.D.

第一章介紹 1.1 研究背景

第二章文獻回顧 2.1 基本假設

第三章研究方法

第四章模擬