第一章 計算臨床試驗樣本數的介紹
1.1 現有方法與文獻的整理
1.1 現有方法與文獻的整理
對於如何計算臨床試驗樣本數的議題,已經有相當多量的文獻發表。大約是 從 1980 年開始,有較多量的相關文獻可供參考。這個議題的發展,到目前為止,
還持續發展中。我們就一些著名的相關期刊(例如 Biometrika, Biometrics, Statistic in Medicine, Controlled Clinical Trials, Life Data Analysis, 和Clinical Trials 等等…),
找出了許多關於如何計算臨床試驗樣本數方法的文章。我們將根據五個面向,對 已經發表文獻裡的方法討論,加以分類。
(1) 比較標的(統計假設檢定的敘述) (2) 考慮臨床試驗過程複雜狀況 (3) 兩組與多組的比較
(4) 對於 proportional hazard 假設 (5) 每組分配的試驗人數是否相同
1.1.1 比較標的(統計假設檢定的敘述)
治療效果的表現,會有不同型式的描述,形成不同的比較標的。在統計分析 時,訂出不同的統計假設檢定的敘述,也就是說不同的虛無假設與對立假設內 容。歸功於統計學的發展,有一些合適的方法可以運用在醫學試驗的分析上。讓 醫學的研究結果,透過統計方法的分析,能夠有更清楚的瞭解。我們把比較標的,
主要分成兩種類型。
(1) 以特定參數做為比較標的,例如說是生命的期望值。Lachin(1981)整理出期 望值、比例和相關性參數的比較下,所需要樣本數的公式。Hauschke et al.(1999) 比較的標地是數據期望值的比值。Schouten(1999)考慮組別分配的樣本數不同 並且變異數不同下,生命期望值的比較。Singer(2001)設想在組別變異數不同 下,檢驗數據期望值的比較。Xiong et al.(2003)則是考慮臨床試驗發生有型二 設限下,以生存時間的期望值做為比較標地。Chu et al.(2006)考慮發生有左 設限(left censoring)下,比較組別試驗者檢測得出數據的期望值。
(2) 以生存曲線,做為比較標地的方法。在倖存資料分析(survival data analysis) 的發展上,生存曲線是最主要的角色。Kaplan and Meier(1958)對於生存曲線,
發明了著名估計方法,幾乎沒有人不知。臨床試驗組別治療效果的比較,常
3
投射以生存曲線的異同當作比較標的。這一類的方法,時常伴隨使用 log-rank 檢定,做為衡量生存曲線異同的判定尺度。舉例說明,Freedman(1982)製作 出以 log-rank 檢定為衡量標準時,所需要樣本數量的查詢表格。
Schoenfeld(1981)考量發生獨立的右設限下,探討了 Log rank 統計量在對立假 設下,近似分配的性質,並且推導出樣本數的計算公式。這一篇文章,成為 很多樣本數計算方法的重要的參考根據。Lakatos(1986,1988)用離散時間型馬 可夫鏈建構臨床試驗過程下,計算出適當的樣本數量。Ahnn and
Anderson(1998)、Jiang et al.(2004)和 Bingbing and Patricia (2006)皆延續了 Lakatos(1988)的方法,用離散時間型馬可夫鏈,建構臨床試驗過程,計算樣 本數量。其它屬於這一類的文獻有 Lachin and Foulkes(1986)、Jung(2002),Halabi and Singh(2004),Barthel al et.(2006)等等…。
生存曲線的比較,可以看成是過程的比較,特定參數的比較,只是點的比較。我 們比較感興趣的是過程的比較。在後面其它面向的分類與討論,我們把焦點放在 生存曲線的比較方法上。
1.1.2 考慮臨床試驗過程的複雜狀況
人,號稱地球最先進的生物,行為是多樣複雜的。可想而知,以人為受試者 的臨床試驗,其過程是複雜的。受試驗者的表現,時常有意外的情況發生。計算 樣本數時,必須盡可能得考慮試驗過程中,可能發生的狀況。試驗者在過程中,
除了可能會發生有興趣觀察的事件外,我們主要探討的其他狀況,有下列兩種情 況:
(1) 右設限(right censoring):在大部份的臨床試驗中,觀察者不能得到一些病人,
完整發生事件的資訊。這些人參與臨床試驗的時間,稱做被設限了
(censored)。如果受試者發生事件的時間,被限制在某種時間之前,這種情況 稱為右設限(right censoring),也稱為型一設限(Type I censoring)。觀察者不能 知道受試者在停止參與治療後,會發生什麼情況。設限的發生不外乎是來自 於試驗為期時間的因素,或者是受試者本身的因素。前者,可稱為行政設限 (administrative censoring)。不管是何種型態的設限,受試者的治療效果的資 訊,在發生設限後,都遺失了。為了維持給定的檢定水準,在考量會發生設 限下,樣本數需要適當得增加。本論文要討論的,是考慮右設限的狀況下,
樣本數的計算。而生存時間與設限時間的關係可以是獨立的和不獨立的。在 第三章的方法中,我們考慮的是獨立的情況。在第四章中,則考慮生存時間 與設限時間不獨立的情況。另外,我們假設,臨床試驗為期兩單位時間。固 定試驗期間下,考量右設限發生,所需要的樣本數量。樣本數增加的方式,
依照演進,主要有下列兩種,
(a) 試驗結束時,估計會有多少比例的受試驗者發生設限,而增補。這是一 個很基本的作法,優點是簡單計算。但是發生設限的時間不一致,這種
4
做法容易增加過多的樣本數。
(b) 依照過程的發展,全盤考量下計算出適當的樣本數。相信這種方式,比 較能避免不必要的增補。大部份的文獻,都是以這種方式,計算樣本數。
目前,所找出的計算臨床試驗樣本數的文獻,對於設限的發生,都假設與生 存時間獨立,也就是假設為獨立設限(independent censoring)。Shih(2002)指出,在 臨床試驗中,會發生非獨立設限(dependent censoring)的情況,需要正視這種情況。
基於還未見到有計算樣本數的文獻,考量非獨立設限(dependent censoring),我們 將嘗試提出一套新方法。
(2) 非遵照者(non-complier):受試驗者,在治療過程中,有可能因為某些原因,
例如 (a) 藥物的副作用。
(b) 生活習慣難以改變。
(c) 沒有充份瞭解藥物的正確使用方式。
(d) 家人的影響。
(e) 受試者後悔。
不能一致得維持分配到的治療方法。在計算樣本數方法的文獻中,對於非 遵照者的行為,大多以轉組來對應。並且原先分配的組別並沒有改變,而 治療效果的表現上會改變,參考的文獻有 Lakatos(1988)、Ahnn and
Anderson(1998)、Jiang et al.(2004)和 Bingbing and Patricia(2006)。對於這一方 面的因素,我們目前還未能有清楚的瞭解。因此,我們先將非遵照者的發 生,當成與生存時間是獨立的情況。
1.1.3 兩組比較與多組比較
臨床試驗的設計中,受試者分成兩組不同治療方式來比較,是最常見到的。
文獻中所找到的方法,大部份是針對於兩組比較的臨床試驗。這一類的文獻眾 多,只列舉一部份,例如 Schoenfeld(1981)、Freedman(1982)、和 Lakatos(1986,1988) 等等…。臨床試驗的設計,有時需要把受試者分成多組來比較。多組比較的樣本 數計算,並非直接把兩組比較的結果,等比例的依照組別數增加。這樣的樣本數 計算,並不能有效得達到檢定品質的要求標準。對於多組比較的樣本數計算方 法,我們也只舉一部份的例子,Ahnn et al. (1995)把 Schoenfeld(1981)推廣到多組比 較。同樣的作者 Ahnn and Anderson (1998),又把 Lakatos(1988)的方法,推廣到多 組比較的臨床試驗。Jung and Hui(2002)把 Ahnn and Anderson (1995)的方法改良,
以不同的方式找到非中心卡方分配參數的計算,使得計算出的樣本數有更接近目 標檢定力。其它的還有 Natarajan et al.(1996)、Halabi and Singh(2004)、和 Barthel et al.(2006)。
5
1.1.4 對於 proportional hazard 假設
計算臨床試驗樣本數的方法中,可以將有無 proportional hazard 假設分類。一 般來說,有 proportional hazard 假設的方法,視臨床試驗為一個穩定的過程。其組 別治療效果的差異,可以用 proportional hazard 來表達。所以這一類型的方法,可 以推導出一個簡單的樣本數計算公式。例如 Schoenfeld(1981)、Freedman(1982)等 等…。如果考慮設限的發生、轉組的情況和不遵照指示的試驗者,視臨床試驗的 過程,是複雜的。試驗者在治療效果的表現上,沒有特別假設 proportional hazard。
這一類的方法有 Lakatos(1988)、Ahnn et al. (1998)和 Barthel et al.(2006)等等…。
1.1.5 每組試驗人數是否相同
文獻中,大部份的方法是考慮組別分配的試驗人數是相同的。但是有一些狀 況下,例如受試驗者可以選擇組別、治療方法的成本不同,形成不同組別有不同 試驗人數的狀況。在考量組別試驗人數不同下,計算樣本數的方法,例如 Schouten(1999)和 Halabi et al.(2004)等等…。在表 1-1,我們列舉一部份的文獻,依 照五個考慮的性質做整理。
表 1-1 計算臨床試驗樣本數方法的性質
作者 年份 設定要項 輸出
Non-equal
location
Non-proportional
hazard
Loss to follow-up Cross- over Multi- arm Sample size Number of
death
L.S. Freedman 1982 V V V V
Schoenfeld and
Richter
1982 V
Schoenfeld 1983 V V V V V
Edward Lakatos 1988 V V V V V
Lachin and Foulkes 1986 V V V
S. Ahnn and S. J.
Anderson
1995,
1998 V
V
V
V
V
V
V
V
V
V
V
Sin-Ho Jung 2002 V
S. Halabi and B.
Singh
2004
Qi Jiang, S.
Snapinn and B.
Iglewicz
2004 V V V V V
A. Latouche, R.
Porcher and S.
Chevret
2004 V V
Halabi S and Singh
B.
2004 V V V V
6
現有的文獻中,設限的發生都是考慮獨立設限,與生存時間無關。現實的情況中,
生存時間跟設限時間不一定是獨立的情況(Lagakos, 1979; Shih, 2002)。我們將在下 一小節中,介紹三個常用來描述生存時間跟設限時間不獨立關係的模型。在第四 章的內容中,會用 Gumber-Barnett copula 來發展樣本數的計算方法。