第三章 利用連續時間型馬可夫鏈(continuous time Markov Chain)計算臨床試驗樣
3.2 計算兩組比較的臨床試驗樣本數
本節主要是介紹如何用連續時間型馬可夫鏈描述兩組比較的臨床試驗,以計 算所需要的樣本數大小。可以與 2.2 節的內容,作一番對照。本節內容分成兩小 節,第 3.2.1 節介紹轉移率矩陣 Q (transition rate matrix),如何從給定的一單位時 間轉移矩陣,計算得出。並且如何計算試驗期間內,任意時間的轉移機率矩陣。
第 3.2.2 節的內容是,進一步計算樣本數的公式。
3.2.1 轉移率矩陣 Q 與轉移機率矩陣Γ t
用連續時間型馬可夫鏈描述臨床試驗過程,主要需要兩大要件,有轉移率矩 陣 Q 和任意時間的轉移機率矩陣Γ 。有了兩大要件,就能計算出試驗期間內,任t 意時間的狀態機率向量,來描述臨床式驗過程。接下來,依序說明兩大要件的計 算方法。
29
(1) 計算轉移率矩陣 Q
已知一單位時間的轉移機率矩陣Γ1,如何算出轉移率矩陣 Q ?轉移率矩陣 Q 假設不會隨時間變化,也就是說我們先用齊一的連續時間型馬可夫鏈過程,來當 作試驗過程的近似表現。根據定理(1.2),一單位時間的轉移機率矩陣Γ1和轉移率 矩陣 Q 會有下列式子的關係,
1 1
= ×
Γ eQ . (3.1) 可以把式子(3.1),做下列的計算,
Q=log
( )
Γ1 . (3.2) 將轉移率矩陣 Q,對於單位矩陣附近的泰勒展開式,可以得到 Q 很精確的逼近,( )
Γ −Ι +K− Ι
− Γ
= 2
) ( 1 2
Q 1 (3.3) 這個方式的逼近,保有轉移率矩陣 Q 的基本性質如下,
(a.) 非對角線元素值大於等於0,對角線元素小於等於0 。 (b.)
∑
4= =1 0
j qij 對於每一列的元素(element)加總,總合會是0 。 (c.)
∑
≠
−
=
j i
ii
ij q
q 對於每一列元素,在對角線元素之值,會是同一列非對角線元
素和的值取負號。
(2) 計算轉移機率矩陣Γ t
時間為 t 的轉移機率矩陣,與式子(3.1)相同得,根據定理(1.2),可以用下列的方 式計算出,
Γt =eQ×t. (3.4) 根據矩陣的泰勒展開式,可以找到在時間 t 的轉移機率矩陣Γ 逼近 t
( ) ( )
+L +
+ + Ι
= 2! 3!
3
2 Qt
Qt Qt
eQt (3.5)
在 Ross(1996)的書中,式子(3.5)有適當的計算方法,如下列式子,
( )
nn
Qt Qt n
e = Ι+
∞
lim→ . (3.6) 如果n取夠大,我們可以用上式的結果得到Γ 的良好逼近。書上建議讓t n=2k, 然後照下列的方法相乘,
30
( ) ( ) ( )
( ) ( ) ( )
(
Qt n) (
Qt n) (
Qt n)
kn Qt n
Qt n
Qt
n Qt n
Qt n
Qt
k
k 2 2
2
2 2
2
2
1 1
2 1
+ Ι
= +
Ι
∗ +
Ι
+ Ι
= +
Ι
∗ +
Ι
+ Ι
= +
Ι
∗ +
Ι
−
−
M
因此,我們可以找到 t 時間的轉移機率矩陣Γ 。再利用下列的式子,算出時間t 的t 狀態機率向量,
DtTri =D0TriΓt. (3.7)
意思是說,在時間為0的時後,分配為Tr 組的試驗者,在時間為 t 時後的狀態機i 率向量,是初始的狀態機率向量乘上時間 t 的轉移機率矩陣。利用式子(3.7),可 以得出在試驗期間,任意時間點的狀態機率向量。
假設狀態機率向量可以微分,可以得到下列的式子,
(
D e)
Qt
D Tr Qt Tr
t i
i
= 0
∂
∂ . (3.8) 當Δ→0,可以推得下列的式子,
D D DTreQtQ
Tr t Tr
t i
i i
= 0
Δ
Δ −
+ . (3.9)
如果上述的式子,兩邊同乘Δ,可以進一步得到很短間隔時間,狀態機率向量的
差異,
DtTr+iΔ −DtTri =ΔD0TrieQtQ. (3.10) 在下一小節的內容中,會用到式子(3.10),在這裡先預告。
3.2.2 計算樣本數
我們將仿照第 2.2 節計算兩組比較臨床試驗樣本數的過程,改以連續時間型 馬可夫鏈模型,進行臨床試驗樣本數的計算。回憶第 2.2 節的內容,計算樣本數,
需要先做 log-rank 統計量期望值的計算。在本單元裡,經過一系列的推導過程,
可以把 log-rank 統計量的期望值,寫成積分的型式。根據第 2.2 節的計算過程,
我們要利用任何時間 t 的狀態機率向量,先計算出試驗期間內,任意時間的三種 參數值。包含有:
(1) t 時間的死亡量佔臨床試驗結束時總死亡量的比率ρt。 (2) t 時間兩組試驗組面對風險的人數比φt。
(3) t 時間兩組試驗組的風險率比θt。
31
32
而式子(3.17)等號右邊的分子方面,由式子(3.16)可以得到,
1 1,1
33
接下來,我們將用上述的結果,推導 log-rank 統計量的期望值。由式子(2.14),知 道 log-rank 統計量的近似期望值可以寫成下列的形式,
以式子(3.12)的結果,代入式子(3.21),
可以由式子(3.11)、(3.15)和(3.20)算出任意時間 t 的參數值,代入式子(3.23)。我們 用以上的結果,整理成一個定理。
34
(式子中的參數,可以由式子(3.11)~(3.20)計算得出)
回憶第 2.2 節的最後一部份的內容,介紹計算樣本數的最後步驟。相同的原理,
35
2
1 2
2 Tr N PTr N P
d = × + × . (3.25)
其中P 、Tr1
Tr2
P ,可以由時間為T 時的兩組試驗組的狀態機率向量中,第一個元素
得知,符號為d1Tr,T1和d1Tr,T2。所以取樣總數N,最後可由下列的式子算出,
N =2d
(
PTr1 +PTr2)
. (3.26) 以上是如何用連續時間型馬可夫鏈,來計算兩組比較臨床試驗樣本數的所有過 程。我們將在第 5.1 節中,介紹用此方法的模擬計算結果。接下來要介紹的是,用連續時間型馬可夫鏈建構臨床試驗下,計算多組比較的臨床試驗樣本數。