第二章 介紹利用馬可夫鏈計算臨床試驗樣本數的方法------Lakatos 的方法以及
2.2 兩組比較的方法( Lakatos, 1986,1988)
2.2.3 用離散時間型馬可夫鏈描述臨床試驗過程,得到計算樣本數的公
( )
( )
β α
β α
α α
μ
μ
μ μ μ
μ μ
Z Z Z Z
L Z P
Z L P
C L P
S S S
+
=
−
− =
∴
⎟⎟⎠
⎜⎜ ⎞
⎝
⎛ −
− >
=
>
=
∈
2 1
1 2
1 1 1 2
1 2 1
1
1 1
可以得到,
β
μ 1 = Z α 2 + Z . (2.6)
經過以上的說明,得到一個小結論。在任意的對立假設下,給定顯著水準
( )
α以及檢定力
(
1−β)
,要找適當樣本數的最低門檻時,可以先令 log-rank 統計量的 漸近分配為期望值是μ ,變異數是1的常態分配。並且,1 μ 的選取由顯著水準1( )
α 、檢定力(
1−β)
和生存函數差異的正負方向來決定。在下一小節中,要說明 Lakatos(1986,1988)如何利用離散時間型馬可夫鏈,描述複雜的臨床試驗過程,並 且可以將 log-rank 統計量的近似期望值化成是狀態機率向量的序列與試驗期間估 計死亡總數的函數。把這個結果與μ 令成相等,可以先解出試驗期間估計的死1 亡總數。2.2.3 用離散時間型馬可夫鏈描述臨床試驗過程,得到計算樣本數的公式
狀態的集合(space of states),轉移機率矩陣(transition probabilities matrix),初始 機率向量(initial probabilities vector),是利用離散時間型馬可夫鏈來描述臨床試驗
14
過程裡的組成元素。馬可夫鏈基本的性質,就是所謂的馬可夫特性(Markov property)。這個性質簡單得說,現在的狀態,只跟前一個狀態有關,跟更早的歷 程無關。考慮臨床試驗的過程,保有這個特性,可以用馬可夫鏈來描述。
建構模型的首先步驟,是考慮在臨床試驗過程中,會隨機進入的狀態集合。
在 Lakatos(1988)方法中,考慮每位受試者在試驗過程中,主要可能發生的四種狀 態,
(1) 發病死亡的狀態,用代號e表示。
(2) 失去追蹤的狀態,用代號l表示。
(3) 在對照組進行試驗的狀態,用代號Tr1表示。
(4) 在實驗組進行的狀態,用代號Tr2表示。
令S是四種狀態所成的集合,所以S =
{
e,l,Tr1,Tr2}
。可以參考圖 2-2,說明四種 狀態的聯絡情況。圖 2-2 圖形是四種狀態的連絡示意圖,其中狀態l和狀態e是吸入型狀態(absorbing state),表示 一但進入就不會再改變,狀態Tr1和狀態Tr2是允許互換。
說明完有那些狀態,以及狀態之間的連絡關係後,接下來的步驟是要找到轉 移機率矩陣。因為有四種狀態,所以轉移機率矩陣會是一個4× 的矩陣。這個矩4 陣描述的是,現有狀態在下一個時間點會進入每一種狀態的機率值。如果這個矩 陣不隨時間改變,稱這個馬可夫鏈具有穩定性(stationary 或 homogenous)。第i−1個 時間點到第 i 個時間點的轉移機率矩陣,表示為,
⎥⎥
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢⎢
⎢
⎣
⎡
= Γ
2 2 1 2 2 2
2 1 1 1 1 1
2 1
2 1
Tr Tr Tr Tr l Tr e Tr
Tr Tr Tr Tr l Tr e Tr
lTr lTr
ll le
eTr eTr
el ee
p p
p p
p p
p p
p p
p p
p p
p p
. (2.7)
矩陣裡的每一個元素值,表示一種機率值,所以都大於等於0,小於等於1。代 表的意思方面,隨意拿pTrl
1 來說。指的是在此刻,處於狀態Tr1的條件下,在下
Tr1 Tr2
l e
15
一個時間,會在狀態l的機率。其它的元素,可以類推。因為狀態l和狀態e是吸 入型狀態,所以可以得到更進一步的型式為,
⎥⎥
⎥⎥
⎥
⎦
⎤
⎢⎢
⎢⎢
⎢
⎣
⎡
= Γ
2 2 1 2 2 2
2 1 1 1 1 1
0 0
1 0
0 0
0 1
Tr Tr Tr Tr l Tr e Tr
Tr Tr Tr Tr l Tr e Tr
p p
p p
p p
p
p . (2.8)
另外第 i 個時間點的狀態機率向量為,
1
[
1,1 2,1 3,1 4,1]
Tr i Tr
i Tr
i Tr
i Tr
i d d d d
D = ,
2
[
1,2 2,2 3,2 4,2]
Tr i Tr
i Tr
i Tr
i Tr
i d d d d
D = .
向量裡的元素值,也是機率值。在這理要強調的是,DiTr1意思是說,受試者初始 的狀態是Tr ,在時間 i 的狀態機率向量。用下列的關係式子,可以得到前後時間i 的狀態機率向量的關係。
DiTrj =DiTr−1jΓ , j=1,2. (2.9) 意思是說狀態機率向量只要乘上轉移機率矩陣,就可以得到下一個時間點的狀態 機率向量。臨床試驗一開始,實驗組的受試者是一定會在實驗組進行試驗,對照 組的受試者一定在試驗組進行試驗,所以可以設定試驗者的初始狀態機率向量如 下,
D0Tr1 =
[
0 0 1 0]
,D0Tr2 =
[
0 0 0 1]
.實際轉移機率矩陣的元素值,在 Lakatos(1988)的方法中,從領先試驗(pilot study)的資訊而來。假設可以獲得的資訊有一年時的死亡率,失去追蹤的比率,
和換組的比率,由這些資訊可先找出一年時間的轉移機率矩陣Γ1。只有一年時間 的轉移機率矩陣,如何去呈現這一年內的過程?在這個方法中,先把一年分成 M 等分,去找到小時段的轉移機率矩陣Γ∗,並且要滿足,
( )
Γ∗ M ≈Γ1. (2.10) 意思是說小時段的轉移機率矩陣Γ∗,經過 M 次轉換後,累計的結果會是一年的 轉移機率矩陣Γ1。Lakatos 的取法是將Γ∗非對角線元素,用Γ1的非對角線元素做 轉換後取代。轉換的意思是,任取一個Γ1的非對角線的元素,稱作 x ,轉換如16
有了以上的參數定義,log-rank 近似期望值可以表示成下列的式子(Freedman, 1982),
17
18
如果將(2.18)的結果,代入(2.17),可以得到,
19
是介紹 Lakatos(1988)如何用離散時間型馬可夫鏈描述臨床試驗過程,並且計算滿 足統計假設檢定要求條件下的適當樣本數。臨床試驗不一定只有兩組試驗做比 較,在下一節中,要介紹 Ahnn and Anderson(1998)方法,將 Lakatos(1988)的方法,
推廣到多組比較的臨床試驗,所需要的適當樣本數。
20
2.3 多組比較的推廣(Ahnn and Anderson, 1998)
本節的內容在介紹 Ahnn and Anderson(1998)方法,將 Lakatos(1988)的方法,推 廣到多組的比較。考慮一個臨床試驗,總共有N個病人,被隨機分配到k個不同 的組別
(
Tr1,Tr2,L,Trk)
,接受不同的治療方式。假設在試驗期間,可以觀察到d個 在不同時間的死亡人數,而且d個不同時間的關係是t1<t2 <L<td。M 是組別jlTr 在時間j t ,發生死亡的個數。l N 是組別jl Tr 在時間j t 之前,面對死亡(at risk)l 的人數。N 是每一組在時間l t 之前,面對死亡的總人數。可以在每一個死亡發l 生的時後,把人數的情況,整理成下列的表格,
表 2-2 在第l個死亡發生時,k組試驗組
(
Tr1,Tr2,L,Trk)
的人數情況。令S 和j V 為, jp
∑
= ⎟⎟
⎠
⎜⎜ ⎞
⎝
⎛ −
= d
l l
jl jl
j N
M N S
1
,
⎟⎟
⎠
⎜⎜ ⎞
⎝
⎛ −
⎟⎟⎠
⎜⎜ ⎞
⎝
=
∑
⎛= l
ql jp d
l l
jl
jp N
N N
V N δ
1
.
其中δjp =0,如果 j≠ ;p δjp =1,如果 j= 。並且令 X 和p V 為,
(
S S Sk)
TX = 2, 3,L, ,
⎥⎥
⎥⎥
⎦
⎤
⎢⎢
⎢⎢
⎣
⎡
=
kk k
k
k k
V V
V
V V
V
V V
V V
L M O M M
L L
3 2
3 33
32
2 23
22
.
為了要比較 K 組的生存函數,仍然以 log-rank test 做為衡量的尺度,可以列出多 維度的 log-rank 統計量如下,
治療組別 Tr1 Tr2 … Tr k 總數
死亡數目 M1l M2l … M kl 1 面對死亡數目 N1l N2l … N kl N l
21
LS = XTV−1X. (2.26) 根據 Andersen et al.(1993),在虛無假設下,log-rank 統計量的漸近分配是自由度為
−1
K 的卡方分配(χk2−1 distribution)。在對立假設下,Log-rank 統計量會趨近於自 由度是
(
k−1)
的非中心卡方分配(non-central χ2 distribution),非中心參數(non-centrality parameter)是τ 。在前一節中有提到過,Schoenfeld(1981)有推導出,
在對立假設下,兩組比較的 log-rank 統計量的漸近分配。
Ahnn(1998)的方法是,仿照 Lakatos(1988)方法推導過程,在對立假設下,找 出了多組比較的 log-rank 統計量漸近分配的漸近非中心參數τ 。在每一特定的對 立假設下,樣本數越大,非中心參數τ 也會越大。可以參考圖 2-3,觀察非中心 卡方分配的機率密度的圖形,固定自由度下,非中心參數τ 越大,右尾巴的比例 越多。
圖 2-3 四條卡方分配的曲線。固定 d.f.為2,實線非中心參數是0,虛線的非中心參數是1,點 線的非中心參數為2,點虛線的非中心參數是3。
因此,可以知道,在對立假設固定下,樣本數越大,log-rank 統計量漸近分配的 非中心參數τ 越大。給定顯著水準α 下,樣本數越多,檢定力越高。所以,可以 先選定非中心參數τ 的值,而這個值能夠讓檢定力達到
(
1−β)
的要求。相同於前 一節的過程,藉由離散時間型馬可夫鏈描述多組比較的臨床試驗過程,找到近似 的非中心參數τ ,可以化成死亡總數和狀態機率向量序列的函數。而狀態機率向 量序列,由先驗資訊中和特定的對立假設,是已知的。所以兩方面得出的非中心 參數τ ,指定為相同,可以求得死亡總數的估算。舉例來說,考慮一個有三組比較的臨床試驗,用 log-rank 檢定做為衡量尺 度,如果顯著水準定為α =0.05,檢定力設定是1−β =0.9。可以利用統計軟體,
找到適當的非中心參數τ 。讓假設檢定的,在固定對立假設敘述下,達到設定的 水準。參考圖 2-4,利用統計語言 R,找到當非中心參數τ =12.65的時候,達到 要求的檢定力水準。
22
圖 2-4 較細的曲線是自由度為 2 的卡方分配,較粗的曲線,是非中心參數為τ =12.65的非中 心卡方分布的機率密度曲線,自由度為 2。圖形中還標示了型 I 誤差與型 II 誤差的位置,
其中α =0.05 β =0.1。
接下來要說明的是,利用離散時間型馬可夫鏈的模型,計算 log-rank 統計量漸近 分配的非中心參數τ 。如果試驗分成 M 等份,d 是第i 個期間,死亡的數目。i
jip
N
是第 j 個試驗組,在第 i 個期間的第 p 個死亡前,面對死亡的人數。
jip
λ 是第 j 個
試驗組,在第 i 個期間的第 p 個死亡前的風險(hazard)。定義
jip
φ 、θ 如下, jip
∑
= ≠= k
j r
r ri
ji ji
p p
p N
N
, 1
φ ,
⎥⎥
⎦
⎤
⎢⎢
⎣
=⎡
∑
∑
≠
=
≠
= k
j r
r ri
k j r
r ri ri
ji ji
p p p p p
N N
, 1 ,
1 λ
θ λ .
由 Ahnn et al.(1995),非中心參數τ 可以用下列的式子計算出來,
τ =E
( )
XT V−1E( )
X . (2.27) 其中,23
24
參考 2.2.2 小節的介紹,用離散時間型的馬可夫鏈,描述多組比較的臨床試 驗。其詳細的建構過程,不再多加敘述,在這裡僅列出狀態機率向量序列。假設 可以把試驗分成 M 等份,可以得到狀態機率向量,
[
j j j]
j Tr
i k Tr
i Tr
i Tr
i d d d
D = 1, 2, L +2, .
其中 j=1,2,L,k,i=1,2,L,M。可以利用狀態機率向量序列,估算出φ、θ、ρ, 因為與 2.2.3 節的計算的方式相同,在此不再敘述一次。相同地,得到的結果是,
可以把 log-rank 統計量的近似期望值,寫成一個狀態機率向量序列的函數乘上死 亡的總數d。
由以上兩方面對於 log-rank 統計量的期望值討論,如果把兩點的結果,令成 相等,就能先解出死亡總數d。由狀態機率向量序列,可以得到每組試驗,在試 驗結束時累計的死亡率
(
pTr,pTr , ,pTrk)
2
1 L 。最後,用下列的計算式子,可以得到
需要的樣本數n,
∑
== k
j pTrk
n kd
1
. (2.29)
如果一個多組比較的臨床試驗,以生存函數,作為治療效果的表現。為了比較各 試驗組的生存函數,以 log-rank test 為衡量異同的尺度。如果試驗前可以有取樣 數達到n以上的數量,預計能夠達到顯著水準是α ,並且檢定力達到
(
1−β)
的檢 定假設水準。25
第三章 利用連續時間型馬可夫鏈(continuous time Markov Chain)計算臨床試驗樣本數
在本章中,我們將利用連續時間型馬可夫鏈,來計算臨床試驗樣本數,以改 善 Lakatos(1988)和其系列方法中計算過程的不盡完善之處。本章的第 3.1 節,會 說明用連續時間型馬可夫鏈,計算臨床試驗樣本數的動機和計算所需要的符號定 義。在第 3.2 節裡,會說明運用連續時間型馬可夫鏈,建構兩組比較的臨床試驗 過程,以計算出樣本數,與 Lakatos(1988)的方法對照。第 3.3 節是說明用連續時 間型馬可夫鏈建構多組比較的臨床試驗過程,來樣本數的計算過程,對照於 Ahnn and Anderson(1998)的方法。
3.1 動機、符號定義以及基本假設
在這一節中,將分成三小節討論。第 3.1.1 小節中,我們將敘述用連續時間 型馬可夫鏈描述臨床試驗過程的動機所在。在第 3.1.2 小節中,將定義需要使用
在這一節中,將分成三小節討論。第 3.1.1 小節中,我們將敘述用連續時間 型馬可夫鏈描述臨床試驗過程的動機所在。在第 3.1.2 小節中,將定義需要使用