文獻回顧 - 網絡統合分析中偏差的傳導模式

模型若違反基本假設，容易使研究者得到錯誤的結果，因此釐清模型假設相當重要。網絡統合分析是由傳統統合分析拓展而來的，因此在傳統統合分析中存在的假設同樣的會延伸到網絡統合分析中。

傳統統合分析中，最重要的是同質性(homogeneity)假設，在不同的試驗下，

兩個相同治療的效果差值變異(variance)不能太大。傳統評估同質性的方法有 Cochran’s Q 檢定和I²判斷⁸，但兩種方法的檢力不高，樣本數不多時精準度會很差⁹。實做時，要判斷是否具備同質性，通常直接以τ²大小判斷。在統合分析中，我們觀察到的變異分成試驗內變異(within-study variance)和試驗間的變異 (between-study variance)，而試驗間的變異就稱為異質性(heterogeneity)，也就是所謂的τ²。若是在研究結果顯示τ²很大，則會違反同質性的假設，不處理這個問題可能會導致研究者得到錯誤的結論。處理的方法可以考慮使用敏感度分析

(sensitivity analysis)和 meta-regression 找出有問題的試驗和潛在的干擾因子 (confounding factor)¹⁰。

2.1.1 相似性(similarity)

延伸到網絡統合分析中，一樣有類似同質性(homogeneity)假設。因為納入模型中的治療超過兩個，同質性假設不足以支持，在網絡統合分析中，則以相似性代替¹¹。研究者需要確認每個試驗的病人都具有可比性，不同試驗下的病人組成、研究設計是否相似。若是治療本來就針對不同的族群而使用，或研究方法差太多，那這些試驗就不應放在一起比較。目前現有的統計方法中，並無用來檢定相似性的方法³，需要研究者依據自身的經驗與研究目的去篩選出相似的試驗。

因此納入的試驗的挑選比實際分析資料還要重要，良好的資料品質得到的結果才令人信服¹²。

根據相似性假設，模型得以運用可交換性(exchangeability)和傳遞性

(transitivity)性質^{3; 13}。相似性可延伸解釋，同一個試驗內的每個組別，病人特性要相似（包含人口學分布、疾病嚴重程度等等）。因此，理論上不同組別的病人使用相同的治療要能得到類似的結果。而由於具備可比性，相對治療效果在不同的試驗下，同樣兩種治療的差值要差不多。換句話說，每個試驗可以有各自的治療效果，但治療的相對效果要相似，因此治療相對效果可以在不同的試驗彼此交換，這樣的特性稱為可交換性。再將結果進一步解釋，可將直接比較的結果組合成間接比較，而得到傳遞性。以三種治療的網絡來舉例說明，比較A、B 和 C 三種治療時，則每個包含A 和 B 治療的試驗，觀察到的 A 和 B 的治療效果可以不同，但效果差值(d_AB^𝑑𝑖𝑟)理論上要相似；而每個每個包含 A 和 C 治療的試驗，A 和 C 治療效果的差值(d_AC^𝑑𝑖𝑟)也要相似。因此 B 和 C 治療效果的差值(d_BC^𝑖𝑛𝑑)，可以透過 d_AB^𝑑𝑖𝑟和d_AC^𝑑𝑖𝑟來間接獲得，這種特性稱為傳遞性。此時的d_AB^𝑑𝑖𝑟為A 和 B 的相對治療效果直接證據，而d_AC^𝑑𝑖𝑟為A 和 C 的相對治療效果直接證據。同時，d_AB^𝑑𝑖𝑟和d_AC^𝑑𝑖𝑟亦是B 和 C 的相對治療效果間接證據。

2.1.2 不一致性(inconsistency)

網絡統合分析能夠整合網絡中的直接證據與間接證據，直接和間接證據可基於相似性假設獲得。然而，研究中所蒐集來的試驗，就算都是隨機分派試驗 (randomize control trials)，也並非每個都會詳細報告所有可能影響結果的潛在因子，這會導致無法準確的判斷相似性是否成立，而可能使研究者得到偏差的結果。在傳統統合分析中，只存在直接證據，討論異質性的問題即可。但在網絡統合分析中因涉及間接證據，此時變成討論不一致性的問題。

網絡統合分析的模型有一致性(consistency/coherence)假設，即直接證據和間接證劇的結果要一致¹¹。延續前面的例子，若在研究中，有試驗是直接比較B 和 C 治療的，那麼 B 和 C 治療效果的差值(d_BC^𝑑𝑖𝑟)可以直接從觀測值獲得。在一致性假設下，直接和間接證據要相同d_BC^𝑑𝑖𝑟 = d_BC^𝑖𝑛𝑑(= d_AC^𝑑𝑖𝑟− d_AB^𝑑𝑖𝑟)。若是違反相似性假設，可能會出現d_BC^𝑑𝑖𝑟 ≠ d_BC^𝑖𝑛𝑑的情況，稱之為不一致性¹⁴。

目前網絡統合分析中，主要將不一致性分成design inconsistency、loop inconsistency、side-splitting inconsistency 三種，它們分別對應三種檢定方法^15;

16。檢定沒檢查出不一致性，不代表相似性假設必然成立，可能只是無法檢測到而已。

2.2 兩種隨機效應假設

統合分析中的模型分為固定效應(fixed-effect)與隨機效應(random-effect)模型，兩者在於理論假設上有些許差別。一般來說，納入的試驗都來自不同的母群體，才會考慮使用固定效應模型。實作時，較少碰到這種案例，因此較常使用隨機效應模型將試驗之間的差異納入考慮。針對隨機效應的假設，根據相似的解讀不同，有兩派說法^{17; 18}。

第一種，效果隨機(effect at random)是以傳統統合分析的角度做延伸，以傳統的角度去解讀相似性。此假設下的可交換性與傳遞性皆針對相對效果，因此效果隨機也是針對相對效果做假設。相似性允許一個治療，在不同試驗可以有不同的治療效果，在效果隨機的假設下，將其歸咎到試驗本身的效果，而試驗本身的效果是不可忽略的，會對試驗內的所有治療效果造成固定影響，為了消除試驗的效果，將治療效果相減，達到消去試驗效果的目的，因此相對治療效果理論上要相似，才具備可交換性。

第二種，研究隨機(study at random)是較為新穎的假設，以異於傳統的角度切入。假設隨機分派在試驗的層級(study-level or trial-level)中執行，因此病人是被隨機分派到所有的試驗內，而非在一個試驗內被隨機分派每個治療。在這樣的假設下，治療效果差異都是由隨機誤差造成。因此不具有試驗效果(study effect)，絕對治療效果具有可交換性，能在不同試驗之間交換。而隨機效應也是針對絕對治療效果。

2.3 試驗的偏差

統合分析幫助研究者整合期刊上各個文獻結果。然而，在蒐集的試驗中，可

能某些結果會異於其他試驗，這樣的試驗可能會導致估計結果出現偏差，不適合納入研究中。

一個試驗可能出現偏差的地方有很多。按照執行的先後順序，可以分為試驗前、試驗中、試驗後三部分⁷。試驗前主要指研究設計與樣本選擇的問題。文獻一般來說都需要報告這些訊息，因此在訂立試驗納入標準時，可排除掉較多問題。比較困難的問題是訂立的條件文獻上沒有報告到，解決方法可以考慮直接寄信詢問該篇文獻的作者。試驗中指資料測量過程中產生的偏差。例如醫生對於治療效果有預期、期待心理，並在已知受試者被分到哪種治療的情況下，對不同治療組的病人測量的細緻程度不同，或是態度影響到受試者心理，而對結果造成影響。或試資料的測量是由不同人測得，測量手法不一致而導致。文獻當中有的會概略提到執行過程是如何排除這些問題，以證明資料的可靠度，然而有些研究本身無可避免地無法處理這些問題，此時需要評估結果高(低)估或無法預期。前兩種可以在篩選文獻的過程中，盡可能的排除有問題或干擾研究目的的試驗結果。

最後，試驗後指資料分析的過程與結果發表時的問題，分析過程中可能用碰到研究無法處理得干擾因子。較為著名的例子是卡介疫苗得效果受到緯度影響，

不同緯度得到的結果有差異性。若納入的研究，有搜集到干擾因子的訊息，可以使用meta-regression 去調整結果。而發表上的問題指研究結果因為某些理由而沒有被發表，從而導致無法被研究納入，原因大致上可分兩種，一種是結果並非研究者希望看到的結果，特別是贊助者不希望看到、會阻礙產品推廣的結果不可能被公開。另一種是結果與其他研究者有差異，甚至可能結論與其他人相反。有此結果的研究若不是大型研究不易被期刊接受，也容易使研究者自行放棄發表。儘管這種偏差有統計方法(例如 Egger’s test)可以檢定，但檢力(power)不足¹⁹。結果通常會搭配漏斗圖(funnel plot)解釋。若是觀察到有這類型的偏差，研究者需要對結果得解讀更為小心謹慎，以免被誤導。

過去，在執行網絡統合分析的過程中，經驗較為豐富的研究者可以從蒐集的

資料中判斷哪些試驗得結果可能有潛在的問題。當回顧這些資料來源的試驗時，

或許能夠找到原因而排除部分的資料。但亦可能從試驗的研究設計到分析結果，

都無法從文獻上找出問題，沒有合理的理由去解釋。這樣的資料研究者需要注意其對於結果的影響，以往僅能知道有影響。但由於網絡統合分析本身較為複雜，

無法明確預估偏差對於其他估計值的影響有多大。因此這個問題還尚待釐清。

在文檔中網絡統合分析中偏差的傳導模式 (頁 13-18)