存活分析在統計上的應用由來已久,主要是應用在生物醫學的檢定上。近年來這個 觀念的研究重心逐漸轉移到各個不同的領域上面,尤其是在社會科學中的居住、遷移和 失業問題皆已廣泛的使用。存活分析是 Cox 在 1972 年首先提出,是一種無母數的分析 方法,不需對自變數做統計機率分配的假設,也不需做母數做統計及檢定,且可以預測 個體失敗時點的機率,以幫助個體的經營者能及早對危險因子設法予以降低或消除。
存活分析通常是用來探討特定的危險因子或變數與存活時間的關連性。它是利用統 計技術與方法,研究某一群或數群在經過一特定時間後,會發生某特定事件之機率的分 析,而此特定時間的長度稱為存活時間;而此特定事件稱為死亡。
在存活分析中最重要的變數為因變數—時間,時間可以為年、季、月、天、甚至是 小時,視其研究範圍而訂,並需依研究的需求,界定其起始與終止時間。本研究依據研 究範圍需要,故選擇以年為時間單位。
存活分析的根本目的在估計存活率,根據這個目的,可以「分析層次」和「分析方 法」二個方向剖析這個領域的想法和作法。依「分析層次」而言,存活分析旨在估計存 活函數,例如一個試驗目的是在比較處理組和對照組的差異,則必須就此二組估計所得 的存活函數再進行比較;在一些更複雜的試驗中,可能同時進行二個使用新藥的處理組 與對照間相互比較,這時分析方法必須對二組以上資料進行比較;最後如考慮某些預後 因子有可能影響處理組和對照組的存活反應差異(如在處理組的公司類別,在對照組的 財務狀況),則將這因子併入分析,確定它們之間的關連及影響力。
依「分析方法」而言,上述各層次的分析方法,均有「無母數統計方法」和「母數 統計方法」發展出來。所謂母數統計方法(parametric statistics)是指分析上述各 層次問題時,在時間點的變化,預先假設符合某一統計分佈(如指數分佈),在這個假 設下,再推估能合理配合現有實際資料的分佈參數,如果兩者間配合良好,則對實際資 料顯示的存活率變化,有了統計上更具體的解釋方式。無母數統計方法是相對於母數統 計方法的一個名詞,他的想法在避開前述母數統計方法的作法,致以每依時間點上冒犯 死亡風險的個體群為分析基礎,或者是沿著時間點累積每一時間的存活訊息,以建立存 活曲線(survival curve),或者沿著時間點累積每一時間點間處理組與對照組間的比 較差異。表 3-1 中列出了存活分析的思維大綱。
表 3-1 存活分析整體思維大綱舉例(資料來源:生物醫學統計概論)
3.2 估計存活函數
存活資料的獲得是由動物或是人體試驗而來。在動物試驗方面,試驗進行的方式通 常是選取一定數目的動物後,在同一時間點依處理組或對照組將動物分組後進行研究。
當動物死亡的個數(或其他有興趣觀察的特徵)到達預先設定的數目,或試驗時間到達 預先設定的終止時刻,此時停止試驗,如果仍有存活個體,予以解剖觀察,故資料中對 死亡個體確知其存活時間,但對試驗終止前仍存活個體,僅知其存活時間大於某一時刻
(即設限資料),這種資料稱作單一式設限資料(singly censored data)。在人體試驗 方面,病人進入試驗療程後,被分派入處理組或對照組,這與前述方式相似,差別在自 一個臨床試驗宣告開始後,每個病人進入試驗的時間點是不同的,故在預先設定的時間 點終止試驗,尚存活個體所呈現的設限存活時間是不等長的,非單一式的,這種資料稱 作漸進式設限資料(progressively censored data)。存活資料除了因實驗終止而產生 設限情形,導致對某些個體存活無法完全觀察,還可能因個體的退出(Withdrawal,如 因對接受的化學治療副作用不願意容忍)或失去聯絡(loss to follow up,如病人遷 居)而使得資料的存活時間亦觀察不完全。這方面的問題或與試驗結果後統計分析有 關,或與臨床試驗過程中副作用的監控有關,以下並不討論。
圖 3-1 與圖 3-2 中列出了單一式設限資料和漸進式設限資料的例子。
分析方法 分析層次
無母數統計 母數統計
估計存活函數
1.無設限資料時作法
2.有設限資料時的 product-limit 作法 3.有設限資料時的生命表作法
4.平均存活期 5.半存活期
1.指數分佈 2. Weibull 分佈 3. gamma 分佈
比較兩組存活資料
1.Gehan 的廣義 Wilcoxon 檢定 2.Cox-Mantel 檢定
3.Mantel-Haenszel 檢定 4.log-rank 檢定
1.在指數分佈假設下 2.在 Weibull 分佈假設 下
3.在 gamma 分佈假設下 比較兩組以上存活
資料
1.Kruskal-Wallis 檢定 2. log-rank 檢定
預後因子 1.Cox 回歸模式 1.回歸分析
3.2.1 連續型與離散型存活分析
存活時間依據不同的定義而有不同的衡量方式,所以其機率分配亦可分為連續型
(continuous)與離散型(discrete)兩類,以下就此兩類予以分別說明:
3.2.1.1 連續型存活分析
物體未能發揮預定機能的狀態,稱之為失效(failure)或死亡(death),此處的 預定機能可為時間,運轉次數,哩程數等方式,但以時間最為常見,而失效發生於
(
t t, + Δt)
的機率稱為失效機率密度函數,通常以 f( )
t 表示,若失效時間T 小於或等於 t的失效機率,即P T(
≤t)
,以F t( )
表示。因此,以S t( )
表示存活度。令T 代表存活時間,T 為一正值連續型隨機變數具有機率密度函數
( ) ( )
0
lim
t
P t T t t f t Δ →+ t
≤ < + Δ
= Δ , o≤ < ∞ (1) t
T 的累積機率密度函數為
( ) ( )
0t( )
F t =P T ≤ =t
∫
f x dx (2)圖3-2 漸進式設限資料
註:1.試驗於第六個月終止。
2.A 於實驗開始進入至終止時間仍存 活,B 於第二個月進入第四個月死亡,C 於第二個月進入至終止時仍存活,D 於第 三個月進入第四個月即死亡
圖 3-1 單一式設限資料
註:1.試驗於第六個月終止。
2.A與C分別在地二和第四個月死亡,B與 D於第六個月仍存活。
T 的存活函數S t