的討論中,此訊息往往較不受研究者重視。隨著地理資訊系統(Geographic Information System, GIS)及空間統計(Spatial Statistics)的蓬勃發展,流行病學結合 空間上的分析越來越普遍,而檢測某些地區是否有較高的疾病發生率,亦即群集 (Cluster)現象,是空間統計在流行病學上主要的應用之一。
Kulldorff and Nagarwalla (1995)的 SaTScan 及 Tango and Takahashi (2005)的 FlexScan 為目前空間統計檢測群集的主要方式。SaTScan 採用圓形窗格堆疊的方 式搭配概似函數的想法找出顯著的區塊,在檢定力上比過去方法有效,但在群集 形狀上以圓形及橢圓形偵測效果較佳。FlexScan 以相鄰區為連結決定區塊並搭配 概似函數的想法找出顯著的區塊,所以在檢定非圓形群集上較具彈性,但計算上 較為耗時。這些方法被除了被應用在流行病上,亦在人文、地質、生態、天文、
地震等等,例如:以流行病學而言,空間中的群集可以代表某些疾病發生率較高 的地區,醫療資源及預防措施應該往這些相對風險(Relative Risk)較高的區塊集中;
以政治版圖來看,若某一政黨得票率在某些地區較高,敵對政黨就必須在這些區
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
2
相鄰區塊的距離為一單位長,共有 400 個區塊,每一個區塊具有相同的人口數一 萬人,所以總人口為 400 萬人。並以普瓦松隨機生成觀察值(λ=10* Relative Risk),
並使用 R 套件中 SpatialEpi 模擬 1000 次。從圖 1-1 可以看出一次性偵測在相對 風險較小群集過於保守。
圖 1-1、Kulldorff 兩個群集偵測結果示意圖
註 1:左圖為原始設定群集示意圖;右圖為模擬 1000 次 kulldorff 偵測結果示意圖
目前對於多重群集的檢測方式主要有兩種方式,第一種為上面提到的一次性 偵測,比較疑似群集之內外相對風險,同時檢視所有疑似群集;另外還有一種一 次性偵測,乃透過外部資訊得知群集數目,在檢定時便同時考慮群集個數,所以 在偵測時相對風險較小群集不會受到其他發生率較高群集的影響;第二種為逐次 分析,亦即考慮顯著群集存在下檢測其它群集,偵測上亦能排除顯著群集的影響。
所以在多重群集的存在下,如何正確檢測出所有顯著群集,為目前多重群集偵測 主要研究的目標。
第二節 研究目的
在上一節研究動機提到,目前在多重群集的偵測上,以一次性偵測及逐次分 析為主。一次性偵測若在得知群集個數下,透過修改 Scan Statistic,確實能避免
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
3
風險較小群集受到其他發生率較高群集的影響,然而在大多數的情況下,無法得 知準確的群集數目,此時利用一次性偵測同時比較所有疑似群集的內外風險,相 對風險較小群集會受到其他發生率較高群集的影響,在檢測上會過於保守。
以降低顯著群集影響的方向思考,此問題類似於矩陣在尋找特徵值的過程中,
透過 Power Method 找到最大特徵值後,如何尋找其他特徵值。此問題可以藉由 特徵值平移的概念,降低較大特徵值的影響後,重新尋找新的特徵值,新的特徵 值加上原始平移量及為原始特徵值(Lloyd et al., 1997)。若仿照尋找特徵值的概念,
在檢定的過程中,將最顯著的群集移除資料,減少對其他群集在偵測時的影響,
對新的研究區域檢測以尋找其他的群集,此概念即為逐次分析。
本文主要以多重群集偵測為研究目標,以 Kulldorff and Nagarwalla (1995)的 SaTScan 作為檢測群集的方式,並配合逐次分析的方式修正群集偵測方法。雖然 Zhang et al. (2010)有提出類似的想法,但主要是針對方法的比較及對於群集檢定 力的改善,這一部分說明在第二章文獻探討的部分會有更詳細的說明。除此之外,
本文亦提供逐次分析在方法上的限制及特點並配合電腦模擬測試逐次群集分析 的改進效果,也進一步分析臺灣地區的癌症死亡率,並比較偵測結果的差異。
‧
群集類型的分類,並且詳細介紹常用的偵測方法 SaTScan;第二節則介紹多重群 集的處理方法,並討論方法適用時機。第一節 群集檢測方法
在檢測群集的問題上,Marshall (1991)指出兩個主要的議題,第一項為研究 區域中是否存在不尋常高的事件數,第二項則是研究區域中是否發生群集及發生 的位置。一般而言,群集檢測方法依目的的不同可分為總體檢定(Global Test)、
局部檢定(Local Test)及焦點檢定(Focused Test)。
(一) 總體檢定
總體檢定是指在不考慮群集位置的狀況下,檢定整體研究區域是否有群集的 傾向。而使用空間自相關(Spatial Autocorrelation)的量度以檢驗空間單元與其相鄰 的空間單元的屬性間是否具相似性是較為典型的做法。 (Cliff and Ord, 1981)。此方法除了可應用在連續型資料亦可應用在離散型資料,
在使用上較為廣泛。
但此方法在研究區域中人口密度有異質性(Non-homogenuous)時,Moran I 判