用離散時間型馬可夫鏈描述臨床試驗過程，得到計算樣本數的公

第二章介紹利用馬可夫鏈計算臨床試驗樣本數的方法------Lakatos 的方法以及

2.2 兩組比較的方法( Lakatos, 1986,1988)

2.2.3 用離散時間型馬可夫鏈描述臨床試驗過程，得到計算樣本數的公

( )

β α

α α

μ μ μ

μ μ

Z Z Z Z

L Z P

Z L P

C L P

S S S

−

− =

∴

⎟⎟⎠

⎜⎜ ⎞

⎝

⎛ −

− >

∈

2 1

1 2

1 1 1 2

1 2 1

1 1

可以得到，

μ ₁ = Z α ₂ + Z . (2.6)

經過以上的說明，得到一個小結論。在任意的對立假設下，給定顯著水準

( )

以及檢定力

(

1−β

)

，要找適當樣本數的最低門檻時，可以先令 log-rank 統計量的漸近分配為期望值是μ ，變異數是1的常態分配。並且，₁ μ 的選取由顯著水準₁

( )

α 、檢定力

(

1−β

)

和生存函數差異的正負方向來決定。在下一小節中，要說明 Lakatos(1986,1988)如何利用離散時間型馬可夫鏈，描述複雜的臨床試驗過程，並且可以將 log-rank 統計量的近似期望值化成是狀態機率向量的序列與試驗期間估計死亡總數的函數。把這個結果與μ 令成相等，可以先解出試驗期間估計的死₁ 亡總數。

2.2.3 用離散時間型馬可夫鏈描述臨床試驗過程，得到計算樣本數的公式

狀態的集合(space of states)，轉移機率矩陣(transition probabilities matrix)，初始機率向量(initial probabilities vector)，是利用離散時間型馬可夫鏈來描述臨床試驗

過程裡的組成元素。馬可夫鏈基本的性質，就是所謂的馬可夫特性(Markov property)。這個性質簡單得說，現在的狀態，只跟前一個狀態有關，跟更早的歷程無關。考慮臨床試驗的過程，保有這個特性，可以用馬可夫鏈來描述。

建構模型的首先步驟，是考慮在臨床試驗過程中，會隨機進入的狀態集合。

在 Lakatos(1988)方法中，考慮每位受試者在試驗過程中，主要可能發生的四種狀態，

(1) 發病死亡的狀態，用代號e表示。

(2) 失去追蹤的狀態，用代號l表示。

(3) 在對照組進行試驗的狀態，用代號Tr₁表示。

(4) 在實驗組進行的狀態，用代號Tr₂表示。

令S是四種狀態所成的集合，所以S =

{

e,l,Tr1,Tr2

}

。可以參考圖 2-2，說明四種狀態的聯絡情況。

圖 2-2 圖形是四種狀態的連絡示意圖，其中狀態l和狀態e是吸入型狀態(absorbing state)，表示一但進入就不會再改變，狀態Tr₁和狀態Tr₂是允許互換。

說明完有那些狀態，以及狀態之間的連絡關係後，接下來的步驟是要找到轉移機率矩陣。因為有四種狀態，所以轉移機率矩陣會是一個4× 的矩陣。這個矩4 陣描述的是，現有狀態在下一個時間點會進入每一種狀態的機率值。如果這個矩陣不隨時間改變，稱這個馬可夫鏈具有穩定性(stationary 或 homogenous)。第i−1個 時間點到第 i 個時間點的轉移機率矩陣，表示為，

⎥⎥

⎥

⎦

⎤

⎢⎢

⎢

⎣

⎡

= Γ

2 2 1 2 2 2

2 1 1 1 1 1

2 1

Tr Tr Tr Tr l Tr e Tr

lTr lTr

ll le

eTr eTr

el ee

p p

. (2.7)

矩陣裡的每一個元素值，表示一種機率值，所以都大於等於0，小於等於1。代表的意思方面，隨意拿p_Tr_l

1 來說。指的是在此刻，處於狀態Tr₁的條件下，在下

Tr1 Tr2

l e

一個時間，會在狀態l的機率。其它的元素，可以類推。因為狀態l和狀態e是吸入型狀態，所以可以得到更進一步的型式為，

⎥⎥

⎥

⎦

⎤

⎢⎢

⎢

⎣

⎡

= Γ

2 2 1 2 2 2

2 1 1 1 1 1

0 0

1 0

0 0

0 1

Tr Tr Tr Tr l Tr e Tr

p p

p . (2.8)

另外第 i 個時間點的狀態機率向量為，

[

1,¹ 2,¹ 3,¹ 4,¹

]

Tr i Tr

i Tr

i d d d d

D = ,

[

1,² 2,² 3,² 4,²

]

Tr i Tr

i Tr

i d d d d

D = .

向量裡的元素值，也是機率值。在這理要強調的是，D_i^Tr¹意思是說，受試者初始的狀態是Tr ，在時間 i 的狀態機率向量。用下列的關係式子，可以得到前後時間_i 的狀態機率向量的關係。

D_i^Tr^j =D_i^Tr₋₁^jΓ ， j=1,2. (2.9) 意思是說狀態機率向量只要乘上轉移機率矩陣，就可以得到下一個時間點的狀態機率向量。臨床試驗一開始，實驗組的受試者是一定會在實驗組進行試驗，對照組的受試者一定在試驗組進行試驗，所以可以設定試驗者的初始狀態機率向量如下，

D₀^Tr¹ =

[

0 0 1 0

]

D₀^Tr² =

[

0 0 0 1

]

實際轉移機率矩陣的元素值，在 Lakatos(1988)的方法中，從領先試驗(pilot study)的資訊而來。假設可以獲得的資訊有一年時的死亡率，失去追蹤的比率，

和換組的比率，由這些資訊可先找出一年時間的轉移機率矩陣Γ₁。只有一年時間 的轉移機率矩陣，如何去呈現這一年內的過程？在這個方法中，先把一年分成 M 等分，去找到小時段的轉移機率矩陣Γ_∗，並且要滿足，

( )

Γ_∗ ^M ≈Γ1. (2.10) 意思是說小時段的轉移機率矩陣Γ_∗，經過 M 次轉換後，累計的結果會是一年的 轉移機率矩陣Γ₁。Lakatos 的取法是將Γ_∗非對角線元素，用Γ₁的非對角線元素做轉換後取代。轉換的意思是，任取一個Γ₁的非對角線的元素，稱作 x ，轉換如

有了以上的參數定義，log-rank 近似期望值可以表示成下列的式子(Freedman, 1982)，

如果將(2.18)的結果，代入(2.17)，可以得到，

是介紹 Lakatos(1988)如何用離散時間型馬可夫鏈描述臨床試驗過程，並且計算滿足統計假設檢定要求條件下的適當樣本數。臨床試驗不一定只有兩組試驗做比較，在下一節中，要介紹 Ahnn and Anderson(1998)方法，將 Lakatos(1988)的方法，

推廣到多組比較的臨床試驗，所需要的適當樣本數。

2.3 多組比較的推廣(Ahnn and Anderson, 1998)

本節的內容在介紹 Ahnn and Anderson(1998)方法，將 Lakatos(1988)的方法，推廣到多組的比較。考慮一個臨床試驗，總共有N個病人，被隨機分配到k個不同的組別

(

Tr₁,Tr₂,L,Trk

)

，接受不同的治療方式。假設在試驗期間，可以觀察到d個在不同時間的死亡人數，而且d個不同時間的關係是t1<t2 <L<t_d。M 是組別_jl

Tr 在時間j t ，發生死亡的個數。_l N 是組別_jl Tr 在時間_j t 之前，面對死亡(at risk)_l 的人數。N 是每一組在時間_l t 之前，面對死亡的總人數。可以在每一個死亡發_l 生的時後，把人數的情況，整理成下列的表格，

表 2-2 在第l個死亡發生時，k組試驗組

(

Tr₁,Tr₂,L,Trk

)

^{的人數情況。}

令S 和_j V 為， _jp

∑

= ⎟⎟

⎠

⎜⎜ ⎞

⎝

⎛ −

= ^d

l l

jl jl

j N

M N S

_⎟⎟

⎠

⎜⎜ ⎞

⎝

⎛ −

⎟⎟⎠

⎜⎜ ⎞

⎝

∑

⎛

= l

ql jp d

l l

jp N

N N

V N δ

其中δ_jp =0，如果 j≠ ；p δ_jp =1，如果 j= 。並且令 X 和p V 為，

(

S S Sk

)

X = ₂, ₃,L, ,

⎥⎥

⎦

⎤

⎢⎢

⎣

⎡

kk k

k k

V V

L M O M M

L L

3 2

3 33

2 23

為了要比較 K 組的生存函數，仍然以 log-rank test 做為衡量的尺度，可以列出多 維度的 log-rank 統計量如下，

治療組別 Tr₁ Tr₂ … Tr _k 總數

死亡數目 M₁l M₂_l … M kl 1 面對死亡數目 N₁_l N₂_l … N _kl N _l

L_S = X^TV⁻¹X. (2.26) 根據 Andersen et al.(1993)，在虛無假設下，log-rank 統計量的漸近分配是自由度為

−1

K 的卡方分配(χ_k²₋₁ distribution)。在對立假設下，Log-rank 統計量會趨近於自由度是

(

k−1

)

的非中心卡方分配(non-central χ² distribution)，非中心參數

(non-centrality parameter)是τ 。在前一節中有提到過，Schoenfeld(1981)有推導出，

在對立假設下，兩組比較的 log-rank 統計量的漸近分配。

Ahnn(1998)的方法是，仿照 Lakatos(1988)方法推導過程，在對立假設下，找出了多組比較的 log-rank 統計量漸近分配的漸近非中心參數τ 。在每一特定的對立假設下，樣本數越大，非中心參數τ 也會越大。可以參考圖 2-3，觀察非中心卡方分配的機率密度的圖形，固定自由度下，非中心參數τ 越大，右尾巴的比例越多。

圖 2-3 四條卡方分配的曲線。固定 d.f.為2，實線非中心參數是0，虛線的非中心參數是1，點線的非中心參數為2，點虛線的非中心參數是3。

因此，可以知道，在對立假設固定下，樣本數越大，log-rank 統計量漸近分配的非中心參數τ 越大。給定顯著水準α 下，樣本數越多，檢定力越高。所以，可以先選定非中心參數τ 的值，而這個值能夠讓檢定力達到

(

1−β

)

的要求。相同於前一節的過程，藉由離散時間型馬可夫鏈描述多組比較的臨床試驗過程，找到近似的非中心參數τ ，可以化成死亡總數和狀態機率向量序列的函數。而狀態機率向量序列，由先驗資訊中和特定的對立假設，是已知的。所以兩方面得出的非中心參數τ ，指定為相同，可以求得死亡總數的估算。

舉例來說，考慮一個有三組比較的臨床試驗，用 log-rank 檢定做為衡量尺度，如果顯著水準定為α =0.05，檢定力設定是1−β =0.9。可以利用統計軟體，

找到適當的非中心參數τ 。讓假設檢定的，在固定對立假設敘述下，達到設定的水準。參考圖 2-4，利用統計語言 R，找到當非中心參數τ =12.65的時候，達到要求的檢定力水準。

圖 2-4 較細的曲線是自由度為 2 的卡方分配，較粗的曲線，是非中心參數為τ =12.65的非中心卡方分布的機率密度曲線，自由度為 2。圖形中還標示了型 I 誤差與型 II 誤差的位置，

其中α =0.05 β =0.1。

接下來要說明的是，利用離散時間型馬可夫鏈的模型，計算 log-rank 統計量漸近分配的非中心參數τ 。如果試驗分成 M 等份，d 是第i 個期間，死亡的數目。_i

jip

是第 j 個試驗組，在第 i 個期間的第 p 個死亡前，面對死亡的人數。

jip

λ 是第 j 個

試驗組，在第 i 個期間的第 p 個死亡前的風險(hazard)。定義

jip

φ 、θ 如下， jip

∑

= ≠

= _k

j r

r ri

ji ji

p p

p N

, 1

φ ,

⎥⎥

⎦

⎤

⎢⎢

⎣

=⎡

∑

≠

= k

j r

r ri

k j r

r ri ri

ji ji

p p p p p

N N

, 1 ,

1 λ

θ λ .

由 Ahnn et al.(1995)，非中心參數τ 可以用下列的式子計算出來，

^τ ⁼^E

( )

^X^T ^V⁻¹^E

( )

^X . (2.27) 其中，

參考 2.2.2 小節的介紹，用離散時間型的馬可夫鏈，描述多組比較的臨床試驗。其詳細的建構過程，不再多加敘述，在這裡僅列出狀態機率向量序列。假設 可以把試驗分成 M 等份，可以得到狀態機率向量，

[

^j ^j ^j

]

j Tr

i k Tr

i Tr

i d d d

D = ₁_, ₂_, L ₊₂_, .

其中 j=1,2,L,k，i=1,2,L,M。可以利用狀態機率向量序列，估算出φ、θ、ρ，因為與 2.2.3 節的計算的方式相同，在此不再敘述一次。相同地，得到的結果是，

可以把 log-rank 統計量的近似期望值，寫成一個狀態機率向量序列的函數乘上死亡的總數d。

由以上兩方面對於 log-rank 統計量的期望值討論，如果把兩點的結果，令成相等，就能先解出死亡總數d。由狀態機率向量序列，可以得到每組試驗，在試驗結束時累計的死亡率

(

pTr,pTr , ,pTr_k

)

1 L 。最後，用下列的計算式子，可以得到

需要的樣本數n，

∑

= _k

j pTr_k

n kd

. (2.29)

如果一個多組比較的臨床試驗，以生存函數，作為治療效果的表現。為了比較各試驗組的生存函數，以 log-rank test 為衡量異同的尺度。如果試驗前可以有取樣數達到n以上的數量，預計能夠達到顯著水準是α ，並且檢定力達到

(

1−β

)

的檢定假設水準。

第三章利用連續時間型馬可夫鏈(continuous time Markov Chain)計算臨床試驗樣本數

在本章中，我們將利用連續時間型馬可夫鏈，來計算臨床試驗樣本數，以改善 Lakatos(1988)和其系列方法中計算過程的不盡完善之處。本章的第 3.1 節，會說明用連續時間型馬可夫鏈，計算臨床試驗樣本數的動機和計算所需要的符號定義。在第 3.2 節裡，會說明運用連續時間型馬可夫鏈，建構兩組比較的臨床試驗過程，以計算出樣本數，與 Lakatos(1988)的方法對照。第 3.3 節是說明用連續時間型馬可夫鏈建構多組比較的臨床試驗過程，來樣本數的計算過程，對照於 Ahnn and Anderson(1998)的方法。

3.1 動機、符號定義以及基本假設

在這一節中，將分成三小節討論。第 3.1.1 小節中，我們將敘述用連續時間型馬可夫鏈描述臨床試驗過程的動機所在。在第 3.1.2 小節中，將定義需要使用

在文檔中發生非獨立右設限下臨床試驗樣本數的計算 (頁 24-0)

用離散時間型馬可夫鏈描述臨床試驗過程，得到計算樣本數的公

第二章 介紹利用馬可夫鏈計算臨床試驗樣本數的方法------Lakatos 的方法以及

2.2 兩組比較的方法( Lakatos, 1986,1988)

2.2.3 用離散時間型馬可夫鏈描述臨床試驗過程，得到計算樣本數的公

( )

( )

( )

(

)

( )

(

)

{

}

Tr1 Tr2

l e

[

]

[

]

[

]

[

]

( )

(

)

(

)

∑

∑

(

)

(

)

(

)

∑

∑

∑

( )

( )

[

]

(

)

∑

(

)

第三章 利用連續時間型馬可夫鏈(continuous time Markov Chain)計算臨床試驗樣本數

第二章介紹利用馬可夫鏈計算臨床試驗樣本數的方法------Lakatos 的方法以及

第三章利用連續時間型馬可夫鏈(continuous time Markov Chain)計算臨床試驗樣本數