二、存活分析（Survival Analysis）

是一組觀測樣本中，事件發生與否的時間縱斷面資料（longitudinal record）。這種資料有兩個主要特性：資料因觀察時間會有所謂的設限（censoring）及隨時間變化的自變項（time- varying explanatory variable），若使用一般複迴歸會造成嚴重的偏誤

（bias）和遺漏許多訊息(Allison，1984)。

存活分析依其性質可分為五種不同層面來區分：

「單一」與

「多重」

單一事件（single event）

有時為研究便利之故，將所有事件視為相同，如死亡事件不再細分。

多重事件（multiple event）

有些研究就有將事件細分的必

重複事件（repeated event）

事件不只發生一次，如結婚、

換工作。

非重複事件（nonrepeated event）

事件只能發生一次，如死亡。

有母數與無

Gompertz distribution。

無母數方法（ nonparametric 式（ proportional hazards model），可以稱為半母數或部分母數模式（ semiparametric or partially parametric）。

離散與連續時間

離散時間（discrete time）

適用於較大的時間單位，如年資料、月資料。

連續時間（continuous time）

如果時間單位很小，資料具有項。根據Paul D. Allison(1984)的定義危險率指「在某一個特定時間、特定個人即將發生事件的機率，且假設個人在那個時間是在風險組合之中」。本研究的危險率是

F( tk ) = P ( T≦t )

S(t)為一遞減的連續函數，為存活函數（survival function），當S(0)=1時，表示個人存活時間超過0之機率，當

^S ( ) ^∞ ⁼ ^lim

_t_→_∞

^S ( ) ^t ⁼ ⁰

，表示個人存活時間為無限大之機率。

相反來說，個體第t_k個時間區間之危險函數（hazard function），其定義如下：

轉換運算後可得

（二）Cox之比例危險模型（Cox Proportional Hazard Model , Cox model）

分析存活時間資料時，除了時間的變數外，常伴隨與存活時間相關的解釋因

忽略時間與設限資料。

其基本定義如下：

假設h（t , X）為具有X =（x1 ,x2 ,… ,xk）共變數向量（covariate vector）的群體之危險函數。h（t ; 0）=h₀（t）為具有X（t）=0即在沒有共變數影響下的危險函數，稱為基準危險函數（baseline hazard function）或者參考組（referent group ）。

因此，Cox模型為：

( ) ⁼ ( ) ^∑

⁼ ^Β

i i ix

h t

X t

h

, ₀ exp ¹ … … … （3.10）

其中h0（t）為無母數的部分，對於所有個體，基準危險函數都相同；若X為連續型資料，代表，在其他條件不變下，增加一單位X，則其相對危險增加exp（β）

倍。若資料為離散型，則在其他條件不變下，具有危險因子X的群體事件的發生率為具有基準危險因子的群體exp（β）倍。該模型因為任何個人的風險相對於任何其他個人的風險而言，是一個固定的比例倍數，故稱為比例危險模式。

此時，對於β的估計則是以比例危險迴歸式（proportional hazard regression）

估計。選擇指數函數的主要理由在於如此可以簡化迴歸係數β的估計，因為在指數分配下的exp（β），其值恆正，而在不包含任何共變數時，其值為零；轉化成近似線性模型也較容易解釋。

（三）參數估計與檢定

1. 部分概似函數（partial likelihood function）

Cox以最大概似函數（maximum likelihood method）作為模型推導的基礎，

提出條件概似函數（conditional likelihood function）來估計模式之參數，隨後Cox 又於1975修改條件概似函數為部分概似函數，使比例危險模式逐漸趨於完備。

假設在n個隨機樣本中，有D個可以明確觀察到存活時間，這D個樣本的存活時

間可表示為t1,t2,… .,t D，則Cox的部分概似函數式如下：大概似值及標準誤（standard error）。

2. 參數向量之檢定

主要是用來檢定模式所校估出來的參數向量β是否等於零的假設檢定，以確定參數所對應之共變數對模式的解釋能力是有貢獻影響的；一般較常使用的方法有三種：

（1）概似比檢定（likelihood ratio test，LR）

Q

LR = 2〔

 

U（β

0）：表示一階導數向量。

I（β

0）：表示訊息矩陣（information matrix）。

（3） Wald檢定法（Wald Test）

Q w=

 

 

^∧

  

^∧

  

∧

β

β COV

_f f

β … … … （3.14）

∧

β ：為Full Model下所求出之最大概似估計值。

∧

 

  COV

^∧

   β

^∧

  

：為最大概似估計量之共變數矩陣。

以上三種檢定統計量皆會趨近於卡方分配（Chi-Square Distribution），在一般情形下，此三種檢定法所得到的結果應相當一致，然而在實際的運算過程中，以概似比檢定（LR）統計量之計算較為簡便，所以應用較為普遍（陳品嘉，1998）。

（四）重複事件之存活分析方法

在本篇研究中，個人使用中醫醫療資源情形可以是重複事件，也就是民眾可能有多次就診的資料（recurrent data）。存活分析模式在處理這些事件資料時，主要有五種最常使用之方法：Andersen and Gill（AG）、Wei ,Lin and Weissdeld

（ WLW ）、 Prentice ,Williams and Peterson, total time （ PWP-CP ）及 gap time

（PWP-GT）、Lee, Wei and Amato（LWA）。

其主要關鍵要素為：

1. 風險間隔（Risk Intervals）

指個體在可能發生一件事件的風險下的時間尺度（time scale），可分為 gap time、total time、counting process。

例如事件A在觀察時間內共發生兩次事件（t1=3 ,t2=7）、最後一次設限

（censoring time =12），可能是研究結束---存活沒有事件發生了、或者死亡、

或者失去追蹤。

Gap time的表示方式是將各前段事件（k-1）與事件k時間點差距重新拉回到時間零點方式來呈現，即（0,3）、（0,4）、（0,5）；Total time是以研究開始時間點到各個事件時間點方式計算，即（0,3）、（0,7）、（0,12）；Counting process 則是認為各事件時間間隔應與前段時間分開獨立計算，即（0,3）、（3,7）、

（7,12）。

2. 風險組合（Risk Set）

即發生事件k可能性的所有個體組合，有三種可能性之風險組合：沒有受限的（unrestricted）、受限制的（restricted）、半受限的（semi- restricted）；

沒有受限制的風險組合是指所有個體的風險都可能影響到在任意事件的風險組合；對於受限的風險組合而言，只有與事件發生數相同之個體才可能影響到風險組合。半受限則利用虛擬的風險間隔來處理不同數目之事件風險組合。

六種常用模式與風險間隔即風險組合之關係如下：

風險組合

Unrestricted Semi-restricted Restricted Gap time 可能的不可能的 PWP-GT Total time LWA WLW 可能的 Counting process AG 可能的 PWP-CP 資料來源：Patrick（2000）

在文檔中以存活分析方法探討中醫醫療利用率; The Utilization Rate of Chinese Medicine in Taiwan : An application of Survival Analysis (頁 32-40)

S ( ) ∞ = lim

S ( ) t = 0

( ) = ( ) ∑

h t

X t

h

Q

 

U（β

I（β

 

 

  

  

β

β COV

β … … … （3.14）

β ：為Full Model下所求出之最大概似估計值。

 

  COV

   β

  

^S ( ) ^∞ ⁼ ^lim

^S ( ) ^t ⁼ ⁰

( ) ⁼ ( ) ^∑