模型若違反基本假設,容易使研究者得到錯誤的結果,因此釐清模型假設相 當重要。網絡統合分析是由傳統統合分析拓展而來的,因此在傳統統合分析中存 在的假設同樣的會延伸到網絡統合分析中。
傳統統合分析中,最重要的是同質性(homogeneity)假設,在不同的試驗下,
兩個相同治療的效果差值變異(variance)不能太大。傳統評估同質性的方法有 Cochran’s Q 檢定和I2判斷8,但兩種方法的檢力不高,樣本數不多時精準度會很 差9。實做時,要判斷是否具備同質性,通常直接以τ2大小判斷。在統合分析 中,我們觀察到的變異分成試驗內變異(within-study variance)和試驗間的變異 (between-study variance),而試驗間的變異就稱為異質性(heterogeneity),也就是所 謂的τ2。若是在研究結果顯示τ2很大,則會違反同質性的假設,不處理這個問題 可能會導致研究者得到錯誤的結論。處理的方法可以考慮使用敏感度分析
(sensitivity analysis)和 meta-regression 找出有問題的試驗和潛在的干擾因子 (confounding factor)10。
2.1.1 相似性(similarity)
延伸到網絡統合分析中,一樣有類似同質性(homogeneity)假設。因為納入模 型中的治療超過兩個,同質性假設不足以支持,在網絡統合分析中,則以相似性 代替11。研究者需要確認每個試驗的病人都具有可比性,不同試驗下的病人組 成、研究設計是否相似。若是治療本來就針對不同的族群而使用,或研究方法差 太多,那這些試驗就不應放在一起比較。目前現有的統計方法中,並無用來檢定 相似性的方法3,需要研究者依據自身的經驗與研究目的去篩選出相似的試驗。
因此納入的試驗的挑選比實際分析資料還要重要,良好的資料品質得到的結果才 令人信服12。
根據相似性假設,模型得以運用可交換性(exchangeability)和傳遞性
(transitivity)性質3; 13。相似性可延伸解釋,同一個試驗內的每個組別,病人特性 要相似(包含人口學分布、疾病嚴重程度等等)。因此,理論上不同組別的病人 使用相同的治療要能得到類似的結果。而由於具備可比性,相對治療效果在不同 的試驗下,同樣兩種治療的差值要差不多。換句話說,每個試驗可以有各自的治 療效果,但治療的相對效果要相似,因此治療相對效果可以在不同的試驗彼此交 換,這樣的特性稱為可交換性。再將結果進一步解釋,可將直接比較的結果組合 成間接比較,而得到傳遞性。以三種治療的網絡來舉例說明,比較A、B 和 C 三 種治療時,則每個包含A 和 B 治療的試驗,觀察到的 A 和 B 的治療效果可以不 同,但效果差值(dAB𝑑𝑖𝑟)理論上要相似;而每個每個包含 A 和 C 治療的試驗,A 和 C 治療效果的差值(dAC𝑑𝑖𝑟)也要相似。因此 B 和 C 治療效果的差值(dBC𝑖𝑛𝑑),可以透過 dAB𝑑𝑖𝑟和dAC𝑑𝑖𝑟來間接獲得,這種特性稱為傳遞性。此時的dAB𝑑𝑖𝑟為A 和 B 的相對治療 效果直接證據,而dAC𝑑𝑖𝑟為A 和 C 的相對治療效果直接證據。同時,dAB𝑑𝑖𝑟和dAC𝑑𝑖𝑟亦 是B 和 C 的相對治療效果間接證據。
2.1.2 不一致性(inconsistency)
網絡統合分析能夠整合網絡中的直接證據與間接證據,直接和間接證據可基 於相似性假設獲得。然而,研究中所蒐集來的試驗,就算都是隨機分派試驗 (randomize control trials),也並非每個都會詳細報告所有可能影響結果的潛在因 子,這會導致無法準確的判斷相似性是否成立,而可能使研究者得到偏差的結 果。在傳統統合分析中,只存在直接證據,討論異質性的問題即可。但在網絡統 合分析中因涉及間接證據,此時變成討論不一致性的問題。
網絡統合分析的模型有一致性(consistency/coherence)假設,即直接證據和間 接證劇的結果要一致11。延續前面的例子,若在研究中,有試驗是直接比較B 和 C 治療的,那麼 B 和 C 治療效果的差值(dBC𝑑𝑖𝑟)可以直接從觀測值獲得。在一致性 假設下,直接和間接證據要相同dBC𝑑𝑖𝑟 = dBC𝑖𝑛𝑑(= dAC𝑑𝑖𝑟− dAB𝑑𝑖𝑟)。若是違反相似性假 設,可能會出現dBC𝑑𝑖𝑟 ≠ dBC𝑖𝑛𝑑的情況,稱之為不一致性14。
目前網絡統合分析中,主要將不一致性分成design inconsistency、loop inconsistency、side-splitting inconsistency 三種,它們分別對應三種檢定方法15;
16。檢定沒檢查出不一致性,不代表相似性假設必然成立,可能只是無法檢測到 而已。
2.2 兩種隨機效應假設
統合分析中的模型分為固定效應(fixed-effect)與隨機效應(random-effect)模 型,兩者在於理論假設上有些許差別。一般來說,納入的試驗都來自不同的母群 體,才會考慮使用固定效應模型。實作時,較少碰到這種案例,因此較常使用隨 機效應模型將試驗之間的差異納入考慮。針對隨機效應的假設,根據相似的解讀 不同,有兩派說法17; 18。
第一種,效果隨機(effect at random)是以傳統統合分析的角度做延伸,以傳統 的角度去解讀相似性。此假設下的可交換性與傳遞性皆針對相對效果,因此效果 隨機也是針對相對效果做假設。相似性允許一個治療,在不同試驗可以有不同的 治療效果,在效果隨機的假設下,將其歸咎到試驗本身的效果,而試驗本身的效 果是不可忽略的,會對試驗內的所有治療效果造成固定影響,為了消除試驗的效 果,將治療效果相減,達到消去試驗效果的目的,因此相對治療效果理論上要相 似,才具備可交換性。
第二種,研究隨機(study at random)是較為新穎的假設,以異於傳統的角度切 入。假設隨機分派在試驗的層級(study-level or trial-level)中執行,因此病人是被隨 機分派到所有的試驗內,而非在一個試驗內被隨機分派每個治療。在這樣的假設 下,治療效果差異都是由隨機誤差造成。因此不具有試驗效果(study effect),絕對 治療效果具有可交換性,能在不同試驗之間交換。而隨機效應也是針對絕對治療 效果。
2.3 試驗的偏差
統合分析幫助研究者整合期刊上各個文獻結果。然而,在蒐集的試驗中,可
能某些結果會異於其他試驗,這樣的試驗可能會導致估計結果出現偏差,不適合 納入研究中。
一個試驗可能出現偏差的地方有很多。按照執行的先後順序,可以分為試驗 前、試驗中、試驗後三部分7。試驗前主要指研究設計與樣本選擇的問題。文獻 一般來說都需要報告這些訊息,因此在訂立試驗納入標準時,可排除掉較多問 題。比較困難的問題是訂立的條件文獻上沒有報告到,解決方法可以考慮直接寄 信詢問該篇文獻的作者。試驗中指資料測量過程中產生的偏差。例如醫生對於治 療效果有預期、期待心理,並在已知受試者被分到哪種治療的情況下,對不同治 療組的病人測量的細緻程度不同,或是態度影響到受試者心理,而對結果造成影 響。或試資料的測量是由不同人測得,測量手法不一致而導致。文獻當中有的會 概略提到執行過程是如何排除這些問題,以證明資料的可靠度,然而有些研究本 身無可避免地無法處理這些問題,此時需要評估結果高(低)估或無法預期。前兩 種可以在篩選文獻的過程中,盡可能的排除有問題或干擾研究目的的試驗結果。
最後,試驗後指資料分析的過程與結果發表時的問題,分析過程中可能用碰 到研究無法處理得干擾因子。較為著名的例子是卡介疫苗得效果受到緯度影響,
不同緯度得到的結果有差異性。若納入的研究,有搜集到干擾因子的訊息,可以 使用meta-regression 去調整結果。而發表上的問題指研究結果因為某些理由而沒 有被發表,從而導致無法被研究納入,原因大致上可分兩種,一種是結果並非研 究者希望看到的結果,特別是贊助者不希望看到、會阻礙產品推廣的結果不可能 被公開。另一種是結果與其他研究者有差異,甚至可能結論與其他人相反。有此 結果的研究若不是大型研究不易被期刊接受,也容易使研究者自行放棄發表。儘 管這種偏差有統計方法(例如 Egger’s test)可以檢定,但檢力(power)不足19。結果 通常會搭配漏斗圖(funnel plot)解釋。若是觀察到有這類型的偏差,研究者需要對 結果得解讀更為小心謹慎,以免被誤導。
過去,在執行網絡統合分析的過程中,經驗較為豐富的研究者可以從蒐集的
資料中判斷哪些試驗得結果可能有潛在的問題。當回顧這些資料來源的試驗時,
或許能夠找到原因而排除部分的資料。但亦可能從試驗的研究設計到分析結果,
都無法從文獻上找出問題,沒有合理的理由去解釋。這樣的資料研究者需要注意 其對於結果的影響,以往僅能知道有影響。但由於網絡統合分析本身較為複雜,
無法明確預估偏差對於其他估計值的影響有多大。因此這個問題還尚待釐清。