從費氏臨床試驗談近代生物統計
張憶壽 • 熊 昭
一 . 楔 子
在許多人的觀念中, 凡是與醫學、 藥學、
動物、 植物等有關的隨機現象均在生物統計 (Biostatistics) 的知識範圍之內。 從這個角 度來看, 我們當能理解生物統計給人的拼盤 印象。這情形與理論數學中的主題鮮明, 層次 井然固然不同, 而與統計學中某些分支所表 現的精雕細琢也不甚一樣。 但是這種拼盤印 象似乎逐漸成為過去了。 生物統計學的內容 在過去三、 四十年間有了相當的充實與改變。
這種充實與改變一方面是基於醫藥研究上的 急切需要, 另方面則是由於近代機率論的適 時成長。 而代表這種充實與改變的兩個主要 分支便是存活分析與序列分析。
在本文裡, 我們要先介紹一個著名的費 氏白血病患存活數據, 然後指出要能充分利 用類似這樣的數據而得出科學性結論便是當 代存活分析與序列分析的主要目標。 希望這 個簡單的介紹能夠幫助具有大學乃至高中數 學程度的人士暸解生物統計的要旨。
二 . 費 氏白血病患存活數據
費氏 (Freireich) 等人在 1963 年報告 了一個關於白血病患的存活數據。 這套數據 給許多生物統計學家研究過。 我們現在參考 Andersen, Borgan, Gill & Keiding (1993) 及 Siegmund (1985) 來陳述這套數 據。
當時, 在美國的十一家醫院裡, 有 62 個 患有急性白血病 (acute leukemia) 的病患, 這些病患是在接受類固醇 (prednisone) 治 療後得到部分或完全緩解的小孩。 緩解 (re- mission) 在這是指骨髓中的病況消失。 這 62 個病患接受了一個緩解維持治療方案 (re- mission maintenance therapy)。 它的做法 是這樣的: 以醫院為單位, 把在同一醫院內 的這些病患依照緩解狀況加以配對, 然後在 每一對中隨機抽出一位給他施予 6-MP 治療, 而剩下的一位則給他安慰劑 (placebo)。
下表所列的是 21 個完整配對的緩解時 段數據。 緩解時段 (remission length) 是指 病患配對後 (約為緩解發生時刻) 至白血病復 發時刻的時段長度。 譬如說, 第 5對病患中用 安慰劑的是 8 週後開始復發, 用 6-MP 的是 22 週後復發。
1
對(i) 安 慰 劑 6-MP 勝 負 淨 贏W (i)
1 1 10 1 1
2 22 7 −1 0
3 3 32+ 1 1
4 12 23 1 2
5 8 22 1 3
6 17 6 −1 2
7 2 16 1 3
8 11 34+ 1 4
9 8 32+ 1 5
10 12 25+ 1 6
11 2 11+ 1 7
12 5 20+ 1 8
13 4 19+ 1 9
14 15 6 −1 8
15 8 17+ 1 9
16 23 35+ 1 10
17 5 6 1 11
18 11 13+ 1 12
19 4 9+ 1 13
20 1 6+ 1 14
21 8 10+ 1 15
表一.
表 中 第 一 行 為 對 數, 第 二 行 為 某 對 中 使 用 安 慰 劑 的 病 患 的 緩 解 時 段, 第 三 行 為 使 用6-MP 之 緩解 時 段, (皆 以 週 為 單 位), 第 四 行 為 該 對 勝 負 狀 況, 1表 示6-MP 得 勝, −1表 示 安 慰 劑 得 勝, 第 五 行 為W (i)。 例 如 第7列 說 第7對 病 人 中 使 用 安 慰 劑 的 緩解 期 為2週, 使 用6- MP的 是16週,所 以6-MP得 勝,而 在 第7 對 的 勝負 分 曉 時, 6-MP一 共 淨 贏3分。
基於 人 道 考 量, 這 個 試 驗 是 所 謂 的 序 列 試 驗; 即, 要 在 能看 出6-MP 與 安 慰 劑 之 優 劣 後 儘 早 停 止 試 驗, 以 免 病 患 成 為 劣 等 治 療 法 的 無 謂 犧 牲 品。 因 此, 試 驗 開 始 之 前 便 如 下 規 定: 如 果 一 個 使 用 安 慰 劑 的 病 患 比 他 配 對 的 病 患 早 產 生 復 發 現 象, 則記 安 慰 劑 缺 點 一 次; 反 之, 則 記 6- MP 缺 點 一 次。 而 當 雙 方 缺 點 次 數 的 差 距 大 到 一 個 程度時, 則 即 刻 停 止 試 驗。
由 於 停 止 試 驗 的 時 候, 很 可 能 還 有 病 患 處 於 緩 解 期 間。 對 這 些 病 患, 我 們 沒 法 知 道 他 的 緩 解 時 段 有 多長, 而 僅 知 道 他 在 緩 解 開 始 至 試 驗 結 束 止 的 這 一 時 段 內 沒 有 復 發。
數 據 表 裡 第 3 對 病 患 中 服 用 6-MP 的 那 位 便 是 在 32 週 後, 試 驗 終 止 了, 而 仍處 在 緩 解 期 中 的 一 個 例 子。 這 種 情 形 的 數 據 是 一 種 所 謂 的 設 限 數 據。 如 果 一 個 病 患 因 為 其 他 因 素 在 白 血 病 復 發 前 死 亡, 或 中 途 離 去 而 不 在 試 驗 觀 察 之 中, 則 所 觀 察 到 的 數 據 也 稱 為 設 限 數 據。
三 . 序列分析
我們先引入一些數學符號來描述上述數 據。
令 Yi 是第 i 對病人配成對的時刻 (約 為緩解發生的時刻)。 令 Xi1, Xi2 分別 代表 第 i 對病人中採用 6-MP 與採用安慰劑的緩 解時段。
第二節中所說的停止整個試驗的時間可 以更清楚的敘述如下。
令 Wi(t) 為第 i 對病人在時間 (日 曆) t 時 6-MP 與安慰劑的勝負狀況。 即當 Xi1 ∧ t > Xi2 ∧ t 時, 令 Wi(t) = 1 , 當 Xi1∧ t < Xi2 ∧ t 時, 令 Wi(t) = −1 , 當 Xi1∧ t = Xi2∧ t 時, 令 Wi(t) = 0 。(這裡 a ∧ b 是指 a 與 b 二數中較小的那數)。
令 W (t) =
P
ni=1Wi(t) 。 則 W (t) 代 表了在 t 時刻, 6-MP 比安慰劑多得的點數。這裡 n 為一適當大的數, 大於可能配成的 對數。 令 Ti = Yi+ Xi1 ∧ Xi2 。 令 T(k)
為 {T1, T2, · · · , Tn} 中第 k 小的數。 因此 T(1)≤ T(2)≤ · · · T(n), 而且 {T1, · · · , Tn} = {T(1), · · · , T(n)} 。
由於 W (t) 只在當 t = T(i) 時 才會變動它的值, 令 W(i) ≡ W (T(i)) 。 W(1), W(2),· · · ,W(n)這個有限數列就代表了 6-MP 與安慰劑的勝負記綠。 為了方便, 我們 可以把 (i, W(i)), i = 1, 2 · · · , n 劃在座標平 面上。
當時, Freireich 等人便是預先把座標平 面分成幾個區域, 分別叫 G, G1, G2, G3 (如 圖一), 然後規定好, 一旦有一個 i , 使得 (i, W(i)) 離開 G , 則停止試驗。 用數學符號 來講便是定義 停止時刻
S = inf{i|(i, W(i)) /∈ G}.
停止試驗時, 如果 (i, W(i)) 是在 G1 , 則說 6-MP 較好, 若在 G2 , 則說安慰劑較 好, 若在 G3 , 則說兩者無甚差異。
圖一
這種一邊收集數據, 一邊做統計分析, 然 後再決定是否要繼續收集數據的設計稱為序 列設計 , 相關的分析叫序列分析。 它是當今 統計領域中理論比較豐富的一支。 但是, 在 1960 年代初期它的理論還是相當年輕的。 關 於這裡的情形, 就有許多問題是當時無法回 答的。
Freireich等人所選的這個 G, G1, G2
及 G3 具有下述性質。 令 P = P (Xi1 >
Xi2) 。 如果 P = 0.75 , 則這試驗會有 0.95 的機率說 6-MP 較好, 如果 P = 0.25 , 則 這試驗會有 0.95 的機率說安慰劑較好。
為什麼選用這樣的 {G, G1, G2, G3} 呢? 很自然的, 我們要問, 如果有另外一組 {G′, G′1, G′2, G′3} 也具有上段所說的性質, 我們該選用那一組? 這時侯有一個簡單的選 擇辦法, 即, 看那一組所需的樣本數 S 較少。
用心的讀者不難發現這不是一個容易的問題。
四 . 存活分析
上述判定 6-MP 與安慰劑優劣的辦法只 是許多辦法之一。 它是有些粗糙的, 因為它只 看每一對病人中的相對勝負, 即 Xi1 > Xi2
或 Xi1 < Xi2 , 而沒有把其他的量, 譬如說, Xi1− Xi2 , 考慮進去。
近代存活分析的主要貢獻之一便是提出 了處理這個問題的一個辦法。 下邊我們先介 紹這個辦法, 再提一下它的背景。 為此, 我們 引入隨機過程
Nik(t) = 1[Xik,∞)(t ∧ T ).
這裡 T 是整個臨床試驗停止的時刻。 Nik(t) 記錄了第 i 對第 k 人在 t 時刻是否仍在緩解 期。
假設 Xik 的風險函數 (hazard rate) 是 λik(t) 。 λik(t) 的意思是一個緩解期大 於或等於 t 的人會馬上復發的機率。 假設 λi1(t) = λi2(t) · eθ, 則 θ 便是一個比較 6- MP 與安慰劑優劣的一個指標, 在存活分析 裡, 這叫做相對風險係數 (relative risk co- efficient)。 有的文獻稱之為療效 (treatment effect)。 令
G(θ, t)
=
21
X
i=1 2
X
k=1
Z
t 0 Zik−2
P
k=11(s)(0,Xik]eθZikZik
P
2 k=11(s)(0,Xik]eθZik
!
dNik(s),
其中 Zi1 = 1, Zi2= 0 。
依據數據, 只要知道 θ 的值, 則 G(θ, t) 的值可以明確的算出。 我們要用來估計 θ0 的
估計子 ˆθ 是 G(θ, ∞) = 0 的根。 這個估計 子與 Cox (1972) 所提出的 MPLE 是屬於 同一類型的。 我們趁此把近代存活分析的歷 史背景介紹一下。
上述的估計法是當代醫學統計中的一個 重要進展。 它的理論基礎是隨機積分、 點過程 之鞅論及連續鞅之中央極限定理。 這些東西 是 60 年代至 80 年代機率理論的主要課題之 一。 它是 40 年代 Ito 積分與 Doob 鞅論為 起始之近代機率中的一個主要分支, 而似乎 不是以醫學統計之需要為目標。 但是, 由於它 的適時出現, 使得存活分析得到及時的成長。
這不能不說是一種巧合。 這部分的主要貢獻 者包括 Meyer 等人。 在點過程方面特別有貢 獻的大概是 Jacod。
在以這些機率為基礎來建立存活分析的 第一個重要工作是 Aalen 的博士論文。 目前 的存活分析已經有相當豐富的理論, 而不容 許我們在這做詳盡介紹。 但是, 它的基本想 法很簡單, 以我們這邊的例子來看, 它的意思 是 Cox 所說的“ G(θ0, t) 的期望值是 0 ”。
Cox (1972) 花了相當的篇幅去解釋 G(θ0, t) 的期望值是 0 。 事實上, G(θ0, t) 是一個鞅 (martingale)。 (據說, 當時 Cox 便這樣認 為)。 後來, 在 Aalen 的工作之後, Andersen
& Gill (1982) 利用鞅論證明了當時 Cox 所 提出之 MPLE 確是一個好的估計子。 有興 趣的讀者可以參閱 Andersen, Borgan, Gill
& Keiding (1993), 我們在這部份也有一些 工作, 其中之一便是證明上述之 ˆθ 為 θ0 之最 佳估計子。
總之, 我們可以用 ˆθ 來估計 θ0 。 我們 知道 ˆθ 與 T 有關, T 愈大, 則 ˆθ 愈能精確的
估計 θ0 ; 但是, T 愈大, 使用劣等治療法的 時間愈久。 怎樣的 T 最好? 這又是序列分析 的課題了。
五 . 結語
在第三節、 第四節中我們藉著 Freireich 數據介紹了一點點的序列分析及存活分析的 概念。 這兩門學問都有相當的內容, 一方面它 們成功的扮演了科學之僕的角色, 另方面它 們也造就了自己的理論。 但是, Freireich 的 試驗所能提出的科學結論就只這樣嗎?
Freireich等人的論文中沒有把 Yi 報告 出來, 只報告了 Xik 及 Xik+ 。許多後來的統 計學家便依照這樣的數據提出新的統計方法 去分析 6-MP 的療效。 除了 Sellke & Sieg- mund (1983) 之外, 沒有人從序列分析的觀 點來研究這數據。 在 Sellke & Siegmund 的
工作之後, 許多人瞭解到這工作的困難情形, 也注意到當時 Freireich 沒發表 Yi 是相當 可惜的。 事實上, Sellke & Siegmund 不是 以研究這套數據為目標, 他們是要建立更一 般的序列分析理論。 他們沒有考慮到配對的 設計。 如果把配對的設計考慮進來, 該如何做 呢? 事實上, 這時候比較好做, 最近我們在這 問題上得到了一些結論。
參考文獻
文中所引論文多可在以下兩本書中找到 1. Andersen, P. K., Borgan, φ, Gill, R. D.,
Keiding, N. (1993). Statistical Models Based on Counting Processes. Springer -Verlag.
2. Siegmund, D. O. (1985). Sequential Analysis. Springer-Verlag.
—本文作者任教於中央大學數學系與 中央研究院統計科學研究所—