• 沒有找到結果。

Waller and Lawson’s Score Test

第二章 文獻探討

第二節 焦點檢定方法介紹

2. Waller and Lawson’s Score Test

Test、Bithell’s Linear Risk Score Test、Lawson’s Directional Score Test、Stone’s Pmax and MLR test 及 Tango’s Extended Score Test。

(二)焦點檢定方法

1. Bithell’ s Linear Risk Score Test

Bithell (1995)假設各區塊的相對風險已知,基於式(4)的對立假設,藉由 Neyman Pearson Lemma 得出的最強力檢定(Most Powerful Test):

否顯著。Bithell 比較 LRS(1∕rank)、LRS(1∕distance)及 Stone 的檢定方法,發現以 距離排序(Rank)倒數做為曝露函數時具有較小的 p-value,並以 LRS 檢定兒童白 血病與核能設施間是否有顯著關係時,發現其中兩個地區的檢定結果為顯著。

2. Waller and Lawson’ s Score Test

Waller and Lawson (1995)考慮對立假設為式(7)的情況下以 Locally Most Powerful Test,在假設 ε→0 的情況下,經由 Taylor Theorem,所得到的檢定統計

函數的資訊時,Waller and Lawson 建議選擇距離的倒數來作為曝露函數,並在模 擬中發現以距離倒數代替的 Score Test 比 Stone 的 Pmax 具有更好的檢定力,然 而如同 Bithell 的檢定方法一樣,如果以不同距離函數做為曝露函數時,會造成 多重檢定的問題。

3. Stone’ s Test

Stone (1988)所提出的檢定方法,由於統計量中使用了常見的標準死亡率 (Standard Mortality Ratio)或標準發生率(Standard Incidence Ratio)而受到許多注 意。Stone 以 Maximum Likelihood Ratio Test(MLR)的方法,基於式(3)的對立假設 下,以 Pool-Adjacent Violators Algorithm 找出各個區塊的 Maximum Likelihood Estimator(MLE),在本文中將此檢定方法以 MLR 表示,檢定統計量表示如下:

對風險的 MLE,本文將此檢定方法以 Pmax(Poisson Maximum)表示,統計量則如 下表示: 與成人白血病、Michelozzi et al. (2002)檢驗無線電輸送台與成人、孩童白血病等。

4. Tango Extended Score Test

Tango (1995, 2002)基於 Score Test 的方法,將曝露函數設定為:

Tango (2002)在模擬中比較 Extended Score Test 與 MLR 發現 Extended Score Test 具有較好的檢定力。

5. Kulldorff’ s spatial scan test

局部檢定方法也可以用於檢測特定位置是否 Kulldorff and Nagarwalla (1995) 發展了空間檢測的統計方法(spatial scan statistics),此檢測方法融合 Openshaw’ s

Geographical Analysis Machine (GAM)與 Turnbull’ s Cluster Evaluation Permutation Procedure (CEPP)兩種方法的優點,檢定方法的統計量表示如下:

) )

式的不同,藉由前一節敘述的 Additive Excess Risk Model,本文考慮三種與距離 有 關 的 曝 露 函 數 , 第 一 個 設 定 曝 露 函 數 為 階 梯 函 數 的 熱 點 群 聚 (Hot Spot Clustering)模型函數如下:

)

降群聚(Linear Decline Clustering),函數表示如下:

) Clustering),函數表示如下:

)

Relative Risk

Exponential Decline s=1 Linear Decline Hot Spot

0 2 4 6 8

1.01.21.41.61.82.0

三種群聚模型函數 半徑=4 相對風險=2

與中心距離

Relative Risk

Exponential Decline s=1 Linear Decline Hot Spot

圖 2-1、相對風險為 2 之下的三種曝露風險曲線

由於上述三種曝露函數只考慮距離的影響,三種群聚的形狀皆為圓形,但實 際上群聚通常並非圓形,舉例來說,污染物質的擴散除了距離因素外,也可能受 到方向性因素的影響,例如風向、河流流向等,在這裡本文考慮第四種曝露函數,

Direction-Distance Clustering, a1=5, a2=1, direction=0

x

註:Point Source 位於(10.499,10.498)

第四節 局部檢定與焦點檢定

局部檢定與焦點檢定的差別在於曝露函數的設定,局部檢定假設曝露函數是 為階梯函數,而焦點檢定則依群聚型態的不同而有不同設定。由先前的介紹中可 以得知局部檢定方法同樣可以應用於檢定污染源周圍是否有群聚的發生,例如使 用 Kulldorff 的 spatial scan test 或是 Besag and Newell (1991)的檢定方法檢測特定 位置周圍群聚是否發生,對於檢定已知位置周圍是否發生群聚的問題來說,曝露 函數的設定是否重要?下列在不考慮方向性因素的情況下,將模擬前一節所介紹 的三種群聚模型,並假設曝露函數已知的理想條件下,在檢定已知位置時,以檢

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

15

定力做為基準,比較焦點檢定方法 Waller and Lawson 的 Score Test (1995)與局部 檢定方法 KN test。

首先介紹模擬資料的設定,為了模擬上的方便將研究區域設定為 20×20 個單 位正方形所組成的方形研究區域,相鄰區塊間的距離為 1 單位長,總共 400 個區 塊,舉例來說,將此研究區域以座標平面表示,研究區域的 X 座標由 0 到 20,

Y 座標由 0 到 20,每一區塊的座標以區塊內中心點座標表示,離原點最近的區 塊座標為(0.5, 0.5),最遠區塊的座標則為(19.5, 19.5),設定每一區塊具有相同的 人口數一萬人,為了使各區塊與群聚中心距離唯一,將群聚中心放置於座標 (10.5001, 10.5002) ; 事 件 發 生 率 (Incidence Rate) 為 萬 分 之 五 , 各 區 人 口 數 (Population)皆為一萬人。熱點及線性曝露函數半徑參數 r 設定為 2,指數曝露函 數參數 s 設定為 1。設定污染源的 RR 由 1 到 3,間隔 0.1;在顯著水準為 0.05,

模擬次數 1,000 次。

1.5 2.0 2.5 3.0

0.91.01.11.21.31.41.5

焦點檢定與局部檢定的檢定力比值

RR

Ratio

Hot Spot Linear Exponential

1.5 2.0 2.5 3.0

0.00.20.40.60.81.0

焦點檢定的檢定力

RR

Power

Hot Spot Linear Exponential

圖 2-3、三種群聚型態-Score Test 與 KN Test 的檢定力比值 註:KN 參數設定 0.03

由圖 2-3 的模擬結果,當曝露函數與實際群聚型態相符合的情況下,焦點檢

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

16

定方法 ST 在檢定力高於局部檢定方法 KN,顯示曝露函數的設定使得焦點檢定 在檢測上更具優勢。局部檢定的檢定力較差的原因在於 KN 對於半徑內的每個區 塊給予相同權重,當群聚為線性及指數遞降群聚時,容易因為群聚邊緣 RR 較小 的影響,使得檢定結果並不顯著,而 ST 則依曝露函數的設定給予每個區塊適當 的權重,比較不容易受到 RR 較小區塊的影響。

由模擬中可以得知檢定污染源周圍是否有群聚的發生時,依據不同的群聚型 態設定合適的曝露函數將使檢定結果更為可信,但實際上曝露函數或是相關的群 聚資訊經常不易取得,本文將在下一個章節中,討論曝露函數未知的情境下,比 較本章第二節所介紹的焦點檢定方法,並與局部檢定方法做一個更詳細的比較,

以找出不同狀況下合適的檢定方法。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

17

第三章 模擬比較焦點檢定方法 第一節 模擬背景介紹

本文的問題在於如何檢測一個特定的位置周圍是否有較高的疾病發生率,藉 由群聚分析方法中的局部檢定與焦點檢定方法,可以用來檢測一個固定位置周圍 是否發生群聚現象。兩種檢定方法的差異在於群聚的假設,局部檢定假設某一區 的相對風險較高,而焦點檢定除了假設相對風險較高之外,相對風險會因為地點 的不同而出現變化,像是距離污染源位置愈遠相對風險愈低。前一章的模擬結果 中,發現使焦點檢定的檢定力比局部檢定高,原因在於焦點檢定對群聚模型的假 設。

影響檢定結果的因素由統計量來看可以分為三類,一類是群聚因素,例如群 聚形狀或是前一章所介紹的三種下降型態,第二類則是影響發生事件數期望值的 背景因素,例如發生率、人口數等,第三類則是檢測位置。一般來說,通常不易 取得群聚模型資訊,在此狀況下,該使用哪一種焦點檢定方法?同時焦點檢定方 法在檢定力上是否仍高於局部檢定?除此之外,是否可以應用焦點檢定方法檢測 出群聚中相對風險較高的區塊?

在本章第二節中將討論背景因素變動下,比較檢定方法的檢定力。在第三節 中將模擬群聚因素變動時,比較檢定方法的檢定力,並與第二節的結果對比,以 此判別對檢定方法影響重要的因素。第四節中將模擬檢測位置對檢定力的影響,

並試著將檢定方法用於檢測相對風險最高位置。第五節則是本章的結論及建議。

第二節 背景因素

由於在模擬時,每個區塊的期望發生事件數是以研究區域的平均事件數估 計,影響期望發生事件數的相關因素同時也會影響檢定結果,在本文中影響期望 發生事件數的因素分為三類,分別為「事件發生率」、「人口數」及「研究區域」

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

18

三種。這一節中將模擬「事件發生率」、「人口數」及「研究區域」三種背景因素 變動時,對檢定方法檢定力的影響。

在本章中設定模擬的研究區域設定為 20×20 個單位正方形所組成的方形研究 區域,相鄰區塊之間的距離為 1 單位長,總共 400 個區塊,舉例來說,將此研究 區域以座標平面表示,研究區域的 X 座標由 0 到 20,Y 座標由 0 到 20,每一區 塊的座標以區塊內中心點座標表示,離原點最近的區塊座標為(0.5, 0.5),最遠的 區塊座標則為(19.5, 19.5),設定每一區塊具有相同的人口數一萬人,為了使各區 塊與群聚中心距離唯一,將群聚中心放置於座標(10.4999, 10.4998);事件發生率 (Incidence Rate)為萬分之五,各區人口數(Population)皆為一萬人。在這一節的模 擬過程中發現 LRS 與 ST 的模擬結果幾乎完全相同,所以在這一節將以 ST 表示 此兩種檢定方法的模擬結果,後續將再對這兩種檢定方法做更進一步的討論。

(一) 事件發生率

設定事件發生率由 0.0003 變動到 0.003,間隔 0.0002。在模擬過程中,由於 三種群聚模型皆有相同的模擬結果,這裡以指數群聚模型為例,設定模型參數 s 為 1,模型參數 RR 為 2,模擬次數 1000 次,顯著水準 0.05。

0.0005 0.0010 0.0015 0.0020 0.0025 0.0030

0.00.20.40.60.81.0

變動發生率

Incidence Rate

Power

ST EST MLR Pmax KN

圖 3-1、事件發生率變動對檢定力的影響

註:ST 假設已知群聚模型。EST 參數 λ 範圍為 0.5 到 12,間隔 0.1。MLR 使用 Bithell 的建議,

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

19

限制相對風險的估計至少大於等於 1。KN 參數設定為 0.3。

(二) 區塊人口數

在相同的研究區域設定下,變動每個區塊的人口數由 5,000 人到 30,000 人,

間隔 5000。在模擬過程中,由於三種群聚模型皆有相同的模擬結果,這裡以指 數群聚模型為例,設定模型參數 s 為 1。模型參數 RR 為 2。模擬次數 1000 次。

顯著水準 0.05。

10000 20000 30000 40000 50000

0.00.20.40.60.81.0

變動各區塊人口數

Population

Power

ST EST MLR Pmax KN

圖 3-2、人口數變動對檢定力的影響

註:ST 假設已知群聚模型。EST 參數 λ 範圍為 0.5 到 12,間隔 0.1。MLR 使用 Bithell 的建議,

限制相對風險的估計至少大於等於 1。KN 參數設定為 0.3。

由模擬結果可以得知當「區塊人口數」、「事件發生率」上升時,期望發生事 件數同時上升,表示如果發生群聚,愈高期望發生事件數,也代表發生事件數增 加的愈高,所以五種檢定方法的檢定力皆有明顯的增加。但是在檢定方法的比較 上卻不因「區塊人口數」、「事件發生率」的增減而有明顯的區別。一般在使用檢 測方法時,「區塊人口數」、「事件發生率」並非使用時能夠設定的因素,下列將 討論使用檢定方法時,選取研究區域大小與檢定力的關係。

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

20

(三) 研究區域

由於本文是以研究區域的資料估計發生事件數期望值,當研究區域的大小變 動時,可能會影響期望值的估計,進而對檢定結果造成影響。下列模擬將變動方

由於本文是以研究區域的資料估計發生事件數期望值,當研究區域的大小變 動時,可能會影響期望值的估計,進而對檢定結果造成影響。下列模擬將變動方

相關文件