三、 研究方法
3.1 存活分析之原理與特色
存活分析法一開始主要應用於醫學領域,用來分析如癌症病人之存 活時間,比較兩組使用不同藥物病患之存活率,但目前以廣泛發展在各 種領域上,如:違約風險計算、產品功能持續時間…等等。於運輸領域 上,亦可應用於如汽機車使用年限、鋪面養護決策、事故處理時間…等。
存活分析又稱為事件-時間分析(time-event analysis),是用來研究或 分析樣本所觀察到的某一段時間長度之分配的方法,一段時間長度通常 是從一特定事件(event)起始之起始時間點算起, 計算到某一特定事件 發生的時間點為止,在經過此特定時間後,會發生某種特定事件的機率,
通常稱此特定時間為事件時間或存活時間(survival time),若發生特定 事件則稱為失敗(failure)。事件時間之資料常存在於不同領域中,最常 見的為在醫學或流行病學常以死亡、疾病發生、疾病復發代表特定事件;
反之若在特定時間上並未發生特定事件則稱為設限(censored);另外也 出現於工程學中之產品可靠度分析、商業研究中之客戶忠誠度、企業存 活時間、經濟學上之失業時間及再就業時間等等。由上述說明可發現,
存活時間是存活分析中最主要的分析變數,因此定義存活時間時,必須 要有以下三項基本要求:
(1) 明確定義存活時間測量的起點(start time)
(2) 明確定義存活時間測量的終點,亦即失敗事件(event)
(3) 定義存活時間之量測單位
在收集存活時間時,並非所有觀察對象都可以收集到完整的資料,
或追蹤足夠長的時間,針對這些不完整的資料,稱為設限資料,例如:
針對病人進行癌症復發時間之研究,但在實驗結束時,部分觀察對象並 未發生復發的情形,但在研究結束之後仍可能復發。設限資料為存活分 析中考量之關鍵問題,資料對於存活時間僅提供部份資訊,但是透過存 活分析,即可將這些擁有不完整資訊的設限資料有用的部份納入分析,
避免刪除不完整資料時發生的偏誤現象,一般而言產生設限資料的原因 大致包含下列三點,設限資料之示意圖如圖3.1 所示,個體 A、C 及 E 為設限資料之範例,個體B 及 D 為完整資料之範例。
(1) 研究結束時,個體未發生失敗事件。(圖 3.1 之 A 個體)
(2) 研究途中,因為不同原因使得無法繼續追蹤個體。(圖 3.1 之 C 個體) (3) 個體於研究期間內脫離。(圖 3.1 之 E 個體)
圖3. 1 設限資料示意圖
本研究主要透過資料調查方式,了解目前民眾申裝之情形,將失敗 事件定義為已申裝電子收費系統,因此對每一樣本而言,可能產生個體 未發生失敗事件情形之設限資料,民眾於進行調查時未申裝電子收費系 統,因不同原因無法繼續追蹤以及個體離開之情形造成之設限資料,由 於收費方式只有人工及電子收費兩類,並不會產生由於不同原因導致無 法追蹤或離開之情形。
下列根據存活時間所構成之存活函數及危險函數等加以定義,假設T 為某群體中單獨個體之存活時間,其為連續且非負之隨機變數, 為 機率密度函數,則T 之累積分配函數(cumulative distribution function)
之機率模式如式(3.1)所示:
(3.1)
而「個體研究事件存活時間超過某特定時間t 之機率」即為存活函數
(survival function),其機率模式如式(3.2)所示:
(3.2)
存活函數為一單調遞減的函數且 ,存活曲
線下的面積則代表特定事件的平均壽命,如式(3.3)所示:
(3.3)
若對 做一階微分,可獲得當個體以時間為軸演變時,在任何 一個 之時間內,發生死亡機率的大小,以 表示,如式 (3.4)所示:
(3.4)
在存活分析中,上述之概念可用另一方式描述,也就是危險函數
(hazard function)。相對於存活函數觀念,危險函數指的是「個體存活 的時間至少有t ( T t),但個體在下一瞬間(t+△t)立即失敗的風險」,
也就是瞬間失敗率或稱條件失敗率,危險函數亦可透過機率密度函數及 存活函數之計算得到。危險函數如式(3.5)所示:
(3.5)
由式(3.3)可得 ,則式(3.5)可轉換為:
(3.6)
將式(3.6)兩邊同時積分並取指數形式,可得存活函數如式(3.7)所示:
(3.7)
則個體在時間點t 之機率密度函數可得:
(3.8)
一般而言,常見的存活函數推估方法為1958 年由 Kaplan 與 Meier 提出的Product-Limit Estimate(或稱為 Kaplan-Meier Estimate)估計方法,
是屬於無母數(Non- parametric)的統計分析方法。另外,較常見的危險 函數推估方法是為由Cox 於 1972 年所提出的 Cox 等比率風險模型
(Proportional Hazard Model),又稱為 Cox 迴歸模型(Cox’s Regression Model)。此兩種模式將於接下來進行詳細介紹。