• 沒有找到結果。

空間群集偵測在空間統計上,廣泛的被應用在各領域,而Kulldorff and Nagarwalla (1995)的 SaTScan 及Tango and Takahashi (2005)的 FlexScan 是最常被 使用的群集偵測方法。多數的群集偵測方法採取一次性偵測,比較疑似群集之內 外相對風險,同時檢視所有疑似群集,如果研究目標為找出最顯著群集,如此確 實可提高計算效率。然而,如果目標在於找出所有顯著群集,相對風險較小群集 會受到其他發生率較高群集的影響,在檢測結果上會較保守。所以在多重群集的 檢測上亦有學者提出不同的偵測的方式如Li et al. (2011)提出新的 Spatial Scan Statistic 及 Zhang et al. (2010)的 Sequential method。

本文以檢測所有群集為目標,並以 Kulldorff and Nagarwalla (1995)SaTScan 作為檢測群集的主要方式,並比較群集占研究區域面積比例、群集相對風險及群 結果會優於一次性偵測,在 Power 上可以改善 10%~15%,Error Rate 可以改善 3%~10%;若檢測的群集相對風險在 1.2 以下,即便透過逐次分析亦無法得到有 效改善;若檢測的群集相對風險在 1.6 以上,一次性偵測在群集檢測結果上,受 多重群集影響不大。以「多」個群集的角度來看,逐次分析透過移除顯著群集減 少對檢測的群集在偵測上的影響,一旦執行次數很多時,移除過多區塊將導致研 究區域破碎,對下一個群集在偵測時,探索區域方向會受到限制,偵測結果可能

分析的效果,與 Kulldorff and Nagarwalla (1995)的 SaTScan比較台灣整體、女性、

男性的癌症標準化死亡率。透過逐次分析與一次性偵測,兩者皆發現台灣整體、

女性及男性群集分佈達研究區域 30%~50%,某些區塊無法透過一次性偵測檢測 出來,亦被逐次分析偵測到。另外,群集範圍皆涵蓋台灣本島邊緣,可能產生邊 緣效果,且群集相對風險皆不高,容易涵蓋過多 False Positive,所以在檢測結果 上可能會與實際結果產生偏差。

第二節 討論及建議

在Zhang et al. (2010)提出 Sequential method 修正多重群集的偵測,實證分析 結果上,對於對風險較低的群集,透過逐次分析可以讓 P-value回到正常值,與 Bonferroni 修正,也可嘗試逐次分析中 Repeated Significance Test (Armitage et al., 1969)或-spending Function (DeMets and Lan, 1994),依照檢定次數(或是顯著群 聚數)調整顯著水準。

以 Kulldorff and Nagarwalla (1995)的 SaTScan 而言,透過逐次分析檢測出相 對風險較高(RR=1.6 以上)的群集,產生誤判的可能性較小,通常會發生誤判的情

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

37

形可能來自於相對風險較小的群集。在統計學上對於多重檢定,最常採取的作法 是降低每次檢測時的顯著水準,但由於在 SaTScan 在檢測群集過程中,相對風險 較小的群集乃透過增加群集範圍達到檢定顯著,通常檢定顯著後 P-value 都很小,

只降低顯著水準效果可能不明顯,若有充分資訊(如疾病傳染的範圍),較可以避 免對相對風險較小的群集產生誤判。但若沒有充分的事前資訊,在縮減探索區域 範圍必須要特別小心。

關於 SaTScan 檢測出的群集相對風險偏低時會涵蓋過多 False Positive 的問 題,除了可以透過縮減探索區域範圍外,過去亦有學者提出可以使用 Permutation test 的方式做調整。若使用逐次分析搭配縮減探索區域及Permutation test 或許可 以達到不錯效果,但可以預期加入 Permutation test 後,逐次分析耗費的時間會很 大。

以氣喘罹病率、台灣藍綠政治版圖為例,多重群集存在的可能性便很高,研 究者未來在探討這些議題上,若目標在於找出所有顯著群集,方法的使用上便可 以考慮使用逐次分析,探討空間群集時,便可避免相對風險較小群集受到其他發 生率較高群集的影響。

過去在空間群集檢測上,大多在單一群集下討論,從群集相對風險到群集形 狀不同下的檢測結果都有學者探討。在多重群集的空間檢測尚存在很多問題,如 逐次分析在群集形狀上的差異對檢測結果影響程度、移除區塊面積的限制及如何 降低顯著水準,這些在空間群集檢測上有待各位學者討論研究。

Auchincloss, A.H., Gebreab, S.Y., Mair, C. and Diez Roux, A.V. (2012). A Review of Spatial Methods in Epidemiology, 2000–2010, Annual Review of Public Health, 33:107–22

Bithell J.F. (1995). The choice of test for detecting raised disease risk near a point source, Statistics in Medicine 14:2309–2322.

Cliff, A. and Ord, J.K. (1981). Spatial Processes: Model and Applications, London:

Pion.

Cucala, L. (2009). A flexible spatial scan test for case event data, Computational Statistics and Data Analysis 53: 2843–2850.

Demattei, C., Molinari, N. and Daures, J.P. (2007). Arbitrarily shaped multiple spatial cluster detection for case event data, Computational Statistics and Data Analysis 51:3931–3945.

DeMets, DL and Lan, KKG (1994). Interim analysis: The alpha spending function approach. Statistics in Medicine, 13:1341-1352

Diggle, P.J. (1990). A point process modelling approach to raised incidence of a rare phenomenon in the vicinity of a prespecified point, Journal of the Royal Statistical Society 153:349-362.

Diggle, P.J. and Rowlinson, B.S. (1994). A conditional approach to point process modeling of elevated risk, Journal of the Royal Statistical Society

157:433-440.

Fairbanks, K. and Madsen, R. (1982). P values for tests using a repeated significance test design, Biometrilca, 69, 1, pp. 69-74

Jackson, M.C., Huang, L., Luo, J., Hachey, M. and Feuer, E. (2009). Comparison of

tests for spatial heterogeneity on data with global clustering patterns and outliers, International Journal of Health Geographics 8:55.

Kulldorff M. and Nagarwalla, N. (1995). Spatial disease clusters: detection and inference, Statistics in Medicine 14: 799–810.

Kulldorff, M., Huang, L., Pickle, L. and Duczmal, L. (2006). An elliptic spatial scan statistic, Statistics in Medicine 25: 3929–3943.

Kulldorff, M., Tango, T. and Park, P.J. (2003). Power comparisons for disease clustering tests, Computational Statistics and Data Analysis 42: 665–684.

Li, X-Z, Wang, J-F, Yang, W-Z, Li, Z-J and Lai, S-J. (2010). A spatial scan statistic for multiple clusters, Mathematical Biosciences, 233: 135–142.

Lilienfeld, D.E. and Stolley, P.D. (1994). Foundations of Epidemiology (3rd Ed.).

Oxford University Press

Lloyd, .N, Trefethen and David, .Bau, III. (1997). Numerical Linear Algebra, SIAM Song, C. and Kulldorff, M. (2003). Power evaluation of disease clustering tests,

International Journal of Health Geographics 2.

Song, C. and Kulldorff, M. (2005). Tango's maximized excess events test with

different weights, International Journal of Health Geographics Dec 15: 4:32.

Stone R.A. (1988). Investigations of excess environmental risks around putative sources: statistical problems and a proposed test, Statistics in Medicine 7:649–660.

Tango, T. (1995). A class of tests for detecting general and focused clustering of rare diseases, Statistics in Medicine 14: 2323-2334.

Tango, T. (2000). A test for spatial disease clustering adjusted for multiple testing, Statistics in Medicine 19:191-204.

Tango, T. and Takahashi, K. (2005). A flexibly shaped spatial scan statistic for detecting clusters, International Journal of Health Geographics 4.

‧ 國

立 政 治 大 學

N a tio na

l C h engchi U ni ve rs it y

40

Waldhor T. (1996). The spatial autocorrelation coefficient Moran's I under heteroscedasticity, Statistics in Medicine 15(7-9):887-892.

Wan, Y., Pei, T., Zhou, C., Jiang Y., Qu, C. and Qiao, Y. (2012). ACOMCD: A

multiple cluster detection algorithm based on the spatial scan statistic and ant colony optimization, Computational Statistics and Data Analysis 56:283–296.

Zhang, Z., Assunção, R. and Kulldorff, M. (2010). Spatial scan statistics adjusted for multiple clusters, Journal of Probability and Statistics Article ID: 642379.

王泰期, 2006。 疾病群集檢測方法及檢定力比較,政治大學碩士論文 蔡承庭, 2011。 焦點檢定方法比較,政治大學碩士論文

相關文件