• 沒有找到結果。

使用時間序列資料探勘演算法識別環境因素對癲癇抽搐之影響

N/A
N/A
Protected

Academic year: 2021

Share "使用時間序列資料探勘演算法識別環境因素對癲癇抽搐之影響"

Copied!
76
0
0

加載中.... (立即查看全文)

全文

(1)國 立 高 雄 應 用 科 技 大 學 資 訊 工 程 系 碩 士 班 碩 士 論 文 使用時間序列資料探勘演算法識別環境因素對癲 癇抽搐之影響. Using Methods of Time Series Data Mining to Recognize the Influences of Environmental Factors on Epileptic Seizures 研究生:林哲男 指導教授:楊孟翰 博士. 中華民國. 一○六 年. 七. 月.

(2) 使用時間序列資料探勘演算法識別環境因素對癲癇抽搐之影響 Using Methods of Time Series Data Mining to Recognize the Influences of Environmental Factors on Epileptic Seizures. 研究生:林哲男 指導教授:楊孟翰 博士. 國 立高雄應用科技大學. 資訊工程系碩士班 碩士論文. A Thesis Submitted to Institute of Computer Science and Information Engineering National Kaohsiung University of Applied Sciences in Partial Fulfillment of the Requirements for the Degree of Master of Engineering in Computer Science and Information Engineering. July 2017 Kaohsiung, Taiwan, Republic of China 中華民國 一 ○六 年 七 月.

(3) 使用時間序列資料探勘演算法識別環境因素對癲癇抽搐之影響 學生:林哲男. 指導教授:楊孟翰 博士. 國 立 高 雄 應 用 科 技 大 學 資 訊 工 程系 碩 士 班 摘 要 本論文研究之目的主要探討氣候是否為觸發癲癇的重要誘因。癲癇 (epilepsy) 是一種腦神經系統疾病,其明確的病理成因目前仍不十分清楚,據估計全世界約有 5,000 萬人罹患過癲癇,使它成為全球最普遍的神經系統疾病之一。另一方面,環 境對生物體的影響一直是科學探討的重點問題,目前有許多研究使用時間序列資 料探勘演算法,觀察環境變化對生物體的顯著影響,例如氣候變化就是數種不同疾 病的重要誘因。據此脈絡,本論文嘗試使用時間序列資料探勘的概念,驗證環境因 子是否為癲癇的一種誘因。 本論文的分析資料源自緊急醫療照護系統(EMS)的救護車派遣紀錄,包含 2007 年至 2013 年、出勤之急救人員撰寫的救護資料。從中選取呼救原因為癲癇抽搐的 紀錄。另外,透過開放的申請服務,自中央氣象局取得氣象觀察數據資料。對癲癇 的原始數據前置處理之後,使用時間序列資料探勘的各種統計檢定來驗證資料的 可靠度,也就是各觀察數值並非雜訊資料。接著,採用兩種時間序列分析方法: EEMD (Ensemble. Empirical. Mode Decomposition) 與 FGD. (Fourier-Gauss ia n. decomposition),探勘癲癇的季節好發趨勢。然後使用標準分數(z-score)對季節好發 趨勢進行探勘與驗證。最後,運用相關性係數 (Correlation Coefficient) 探究哪些氣 象項目能夠誘發癲癇、或著影響其他氣象項目與癲癇之關聯性。 分析結果顯示,癲癇的救護紀錄逐年逐月分布資料,均通過 KolmogorovSmirnov test、Box-Ljung test、Shapiro-Wilk test 等統計檢定,驗證了來源資料之可 靠性。因為標準分數(z-score)分別在 1 月(1.548) 和 7 月(-1.726)達到統計顯著差 異,得知癲癇發病高峰與低谷分別位在冬季與夏季。而 EEMD 和 FGD 探勘得到相 同之季節好發趨勢,均顯現癲癇的記錄次數在 1 月顯著增加。台灣屬於島嶼型氣 i.

(4) 候,在春、秋季節的溫度差異較不顯著,但在冬、夏季節溫差相對較大,因此溫度 變化可能是觸發癲癇的因素之一。最後,相關性分析的結果,癲癇與逐月平均最高 溫度顯現負相關(相關係數 = -0.210; P-value = 0.055)、與逐月平均最高氣壓則呈 現正相關(相關係數 = 0.217; P-value = 0.047) 。檢視 EEMD 和 FGD 的分析結果, 發現月平均最高溫度之高峰在夏季、月平均最高氣壓之高峰在冬季,配合癲癇在冬 季的發病高峰,均和相關性分析的結果吻合。然而,在進階的分群分析,發現癲癇 的季節好發趨勢,以及與氣溫之相關性,主要源自男性患者群組。此外,在台南的 女性患者群組,並未發現顯著的季節好發趨勢與氣溫之關聯性。而在 10 歲以下的 男性患者群組、以及在台中 31~50 歲的男性患者群組,分別顯現癲癇發作與各氣 象項目之相關性。綜上所述,環境因素可能是癲癇的一種重要誘發因子;期盼本論 文探勘所得癲癇的流行病學特徵有助該疾病的預防治療。而環境誘因與癲癇抽搐 之關聯的病理機制,則有待進階研究予以發掘。 關鍵字:相關度;EEMD;環境因子;癲癇抽搐;FGD;統計檢定. ii.

(5) Using Methods of Time Series Data Mining to Recognize the Influences of Environmental Factors on Epileptic Seizures Student:LIN, JHE-NAN. Advisors:Dr.Meng-Han Yang. Institute of Computer Science Information Engineering National Kaohsiung University of Applied Sciences ABSTRACT This research attempts to investigate whether environmental factors are important triggers for epileptic seizures. Epilepsy is a neurological disease whose exact pathologica l mechanism still remains unknown. Approximately 50 million people worldwide have epilepsy, making it one of the most common neurological diseases globally. On the other hand, the influence of the environment on the biologic entities is a central problem for scientific investigation. Using methods belonging to time series data mining, numerous studies have observed that environmental changes affect the biologic entities significantly, such as climatic variations were important triggers for distinct illnesses. Accordingly, this research attempted to verify whether environmental factors are inducers for epilepsy adopting the concept of time series data mining. The database used in this research includes data acquired from the emergency medical service (EMS) system. The EMS data contains the ambulance paper sheets recorded by emergency medical technicians during the period between 2007 and 2013. The study group comprised cases where ambulance services were requested for epileptic seizure emergencies. On the other hand, the meteorological data are monitored and maintained by the Central Weather Bureau, ROC, and are made available as an application service for citizens. After pre-processing the raw data of epileptic seizure emergency cases, various statistical testing methods of time series data mining were used to verify the reliability of the analyzed data, i.e., whether the observation values correspond to the white noise. Two algorithms for analyzing time series data, the ensemble. empirical. mode. decomposition. (EEMD). and. the. Fourier-Gauss ia n. decomposition (FGD), were employed respectively to explore the seasonal incidence iii.

(6) patterns of epilepsy. The statistical z-score measure was utilized to mine and validate the incidence patterns, too. Finally, adopting the idea of correlation coefficient, the climatic factors that trigger epileptic seizures or influence the associations between epilepsy and other meteorological items, were investigated. The monthly distribution of the EMS records for epileptic seizures have been analyzed using the Kolmogorov-Smirnov test, Box-Ljung test, and Shapiro-Wilk test. The collected information of these tests have verified the reliability of the data source. The seasonal peak and valley of epilepsy seemed to be in summer and winter, as the difference represented by the statistical z-score was significant in January (1.548) and July (−1.726), respectively. The observations were consistent with the surveys using EEMD and FGD, both of which also identified the significant increments of counts for epilepsy in January. As Taiwan has an insular climate, the temperature difference between winter and summer is significant despite the variations in spring and autumn. Therefore, changes in temperature might be one of the important triggering factors of epileptic seizures. Epilepsy showed a negative correlation with the monthly average maximum temperature (correlation coefficient = -0.210; P-value = 0.055) and a positive correlation with the monthly average maximum pressure (correlation coefficient = 0.217; P-value = 0.047). Inspecting the analysis results of the EEMD and FGD methods respectively, we found that the monthly average maximum temperature peaked in summer, and the monthly average maximum pressure peaked in winter. Therefore, the peak incidence of epilepsy in winter was consistent with the results of the correlation measure. Nevertheless, in the advanced stratification analysis, characteristics from male epilepsy patients mainly contributed to the seasonal incidence patterns as well as the association with ambient temperature. Furthermore, in the group of female patients from Tainan, neither the significant seasonal incidence patterns nor the association with ambient temperature have been found. Significant associations between epilepsy incidence and various meteorological items existed especially in the group of male patients with ages ≦ 10 years old, and in the group of male patients from Taichung with ages between 31 and 50 years old. In summary, environmental factors might be important predisposing factors for epilepsy. It is expected that the mined epidemiological properties of epilepsy would be helpful to the management of this disease. Further studies are required to delineate the pathological mechanisms underlying the association between environmental factors and epileptic seizures. Keywords:correlation measure; EEMD; environmental factor; epileptic seizure; iv.

(7) FGD; statistical test. v.

(8) 誌. 謝. 兩年的碩士學業期間屆以期滿,在這我要非常感謝我的指導教授楊孟翰,在就 學期間細心的指導我進行研究,也讓我學習了很多關於資料探勘與機器學習方面 的技術,本論文的研製中遇到相當多問題也是有老師的幫助才能一一進行解決,且 在論文修改上也是有老師幫我找出許多錯誤與給予我許多意見,這些都對我有相 當大的幫助;此外,也相當感謝口試委員:林威成教授、張學偉教授、鐘文鈺教授、 張雲龍教授給予有關論文修改的許多建議。 最後也感謝同實驗室的同學與學弟們在學期間的許多幫助,最終,也要感謝我 的家人,由於他們經濟上的支援才能使我無後顧之憂的完成學業。. vi.

(9) 目. 錄. 中文摘要 ............................................................................................................................i 英文摘要 .......................................................................................................................... iii 誌. 謝 ............................................................................................................................ vi. 目 錄 ........................................................................................................................... vii 表 目 錄 .......................................................................................................................... ix 圖 目 錄 ...........................................................................................................................x 第一章、 緒論 ................................................................................................................ 1 1.1 研究背景 ........................................................................................................... 1 1.1.1 癲癇背景 ........................................................................................................ 1 1.1.2 環境因素對生物體之影響 ............................................................................. 2 1.1.3 時間序列分析 ................................................................................................ 3 1.2 研究動機與目的 ............................................................................................... 4 1.3 論文架構 ........................................................................................................... 4 第二章、研究方法 .......................................................................................................... 5 2.1 資料來源 ........................................................................................................... 5 2.2 前置處理與研究設計 ....................................................................................... 6 2.3 統計檢定 ........................................................................................................... 8 2.3.1 Kolmogorov-Smirnov 檢驗 ............................................................................. 8 2.3.2 Box-Ljung 檢驗 .............................................................................................. 8 2.3.3 Shapiro-Wilk 檢驗........................................................................................... 8 2.3.4 正規化(標準化)............................................................................................... 9 2.3.5 卡方檢定 ......................................................................................................... 9 2.4 相關係數與偏相關係數 ..................................................................................11 2.4.1 相關係數 ........................................................................................................11 2.4.2 偏相關係數 ....................................................................................................11 2.5 FGD 與 EEMD ................................................................................................. 13 2.5.1 傅立葉高斯分解(FGD)................................................................................. 13 2.5.2 總體型經驗模態分解法(EEMD) ................................................................. 14 第三章、實驗結果 ........................................................................................................ 16 3.1 實驗資料 ......................................................................................................... 16 3.2 正規化與驗證資料 ......................................................................................... 18 3.3 季節好發趨勢 ................................................................................................. 19 vii.

(10) 3.3.1 標準分數結果 .............................................................................................. 19 3.3.2 傅立葉高斯分解(FGD)結果........................................................................ 20 3.3.3 總體型經驗模態分解法(EEMD)結果 ........................................................ 28 3.4 相關係數結果 ................................................................................................. 32 3.5 四都分群分析 ................................................................................................. 43 第四章、結論 ................................................................................................................ 57 4.1 分析結果 ......................................................................................................... 57 4.2 未來研究方向 .................................................................................................. 57 參考文獻 ........................................................................................................................ 59 附錄 ................................................................................................................................ 64. viii.

(11) 表 目 錄 表 2-4-1-1 相關性強度 ...................................................................................................11 表 3-1-1 全國各月份癲癇人數結構.............................................................................. 16 表 3-1-2 全國癲癇人數結構.......................................................................................... 17 表 3-2-1 統計檢定驗證.................................................................................................. 18 表 3-3-1-1 標準分數分析 .............................................................................................. 19 表 3-3-2-1 高雄 FGD 長期趨勢的鋒值時點 ................................................................ 27 表 3-3-3-1 癲癇各地區 EEMD 波鋒的季節分佈(月) .................................................. 29 表 3-4-1 各地區癲癇人數與氣候變因之相關性分析.................................................. 32 表 3-4-2 癲癇與最高氣壓之偏相關分析...................................................................... 35 表 3-4-3 癲癇與平均氣溫之偏相關分析...................................................................... 37 表 3-4-4 癲癇與最高氣溫之偏相關分析...................................................................... 39 表 3-4-5 癲癇與最低氣溫之偏相關分析...................................................................... 41 表 3-5-1 全國癲癇人數年齡與性別分佈...................................................................... 43 表 3-5-2 標準分數在四都的性別/季節分佈(月) .......................................................... 43 表 3-5-3 四都 FGD 長期趨勢的鋒值時點.................................................................... 44 表 3-5-4 四都 EEMD 波峰的性別/季節分佈(月)......................................................... 44 表 3-5-5 四都癲癇性別與氣候變因之相關性分析...................................................... 46 表 3-5-6 四都性別與控制最低濕度之偏相關性分析.................................................. 47 表 3-5-7 四都各年齡層人數.......................................................................................... 47 表 3-5-8 標準分數在四都的性別與年齡層/季節分佈(月) .......................................... 48 表 3-5-9 各年齡層 FGD 長期趨勢鋒值時點................................................................ 49 表 3-5-10 四都 EEMD 波峰次數加總的季節分佈(月)................................................ 49 表 3-5-11 四都年齡層與氣候變因之相關性分析........................................................ 50 表 3-5-12 四都年齡層與控制平均氣溫之偏相關分析................................................ 53 表 3-5-13 四都癲癇之相關性分析................................................................................ 56. ix.

(12) 圖 目 錄. 圖 2-2-1 資料前置處理流程............................................................................................ 6 圖 2-2-2 研究流程............................................................................................................ 7 圖 3-3-2-1 高雄癲癇人數 .............................................................................................. 21 圖 3-3-2-2 癲癇人數長期趨勢 ...................................................................................... 21 圖 3-3-2-3 最高氣壓 ...................................................................................................... 22 圖 3-3-2-4 最高氣壓長期趨勢 ...................................................................................... 22 圖 3-3-2-5 平均氣溫 ...................................................................................................... 23 圖 3-3-2-6 平均氣溫長期趨勢 ...................................................................................... 23 圖 3-3-2-7 最高氣溫 ...................................................................................................... 24 圖 3-3-2-8 最高氣溫長期趨勢 ...................................................................................... 24 圖 3-3-2-9 最低氣溫 ...................................................................................................... 25 圖 3-3-2-10 最低氣溫長期趨勢 .................................................................................... 25 圖 3-3-2-11 最低濕度..................................................................................................... 26 圖 3-3-2-12 最低濕度長期趨勢 .................................................................................... 26 圖 3-3-3-1 高雄癲癇 EEMD 分析 ................................................................................. 28 圖 3-3-3-2 高雄氣候變因 EEMD 分析 ......................................................................... 30 圖 3-3-3-3 氣候變因 EEMD 峰值次數 ......................................................................... 31 圖 3-5-1 四都性別 EEMD 分析 .................................................................................... 45. x.

(13) 第一章、 緒論 1.1 研究背景 近年來,因科技的發達與醫療技術的進步,許多疾病對人類已較難產生危害, 但在腦神經與中樞神經等神經疾病上,仍進展緩慢,而大多神經類疾病中又以癲癇、 阿茲海默症與帕金森氏症為主要罹患疾病,近年來有許多研究指出,氣候在頭痛、 中風與其他神經疾病中是一種相當重要的誘發變因 [1,2]。 氣候最初定義,是一種持續性的平均天氣狀況 [3],如今氣候中已包含溫度、 濕度、氣壓、風力、降水量、日照等多種氣象要素,這些氣候因素常受地理、環境、 緯度等諸多因素影響,更因地球自轉而有晝夜與季節性變化,氣候更在生物圈中扮 演著相當重要的角色,只要有些許改變都對人類物種與生物體造成重大影響;氣候 是一種連續性、時間性與季節性的時間序列資料,故欲挖掘當中隱含的訊息則需使 用「時間序列分析」處理。 時間序列分析(time series analysis)源自於資料探勘中的一種模式(model),藉由 運用歷史數據經統計分析,預測出未來趨勢,以提供決策分析使用,現已應用於金 融、生物醫學、計算機科學與地球科學等領域上。由於時間序列數據存在著規律性 與不規律性的變動,且時間序列數據具有高維度、大數據、連續性等特性 [4],觀 察值大小則是影響各種變化的不同因素在同一時刻發生作用的綜合結果,從結果 來看可分為以下四種類型:長期趨勢(trend)、循環變動(cyclical fluctuation)、季節變 動(seasonal fluctuation)、不規則變動(irregular fluctuation) [5],從這四種類型結果中 觀察出規律性則可幫助研究分析。 1.1.1 癲癇背景 癲癇(epilepsy)是一種慢性且非傳染性疾病,發作主要症狀為大腦中 同步神經 元出現過度異常活動引起的短暫症狀,發作時的特徵大多為抽搐現象故統稱為癲 癇 [6],抽搐時間有長有短,短則短暫無感覺型抽搐,長則能達數小時型抽搐。 癲癇發作的身體特徵與症狀因類型而有所不同,抽搐類型主要可分為痙攣性 (60%)與非痙攣性(40%) [7],痙攣性抽搐又分為局灶性抽搐(33%)與 全 身 性抽搐 (67%)。 局灶性抽搐通常由經由某些感覺或經歷後發生,抽搐會先從某一特定肌肉 群開始,之後擴展至鄰近肌肉群,形成局部抽搐,或是產生無自覺性動作 [8],且 局灶性抽搐可能會發展為全身性抽搐。全身性抽搐可分為六種主要類型:強直-陣 攣性、強直性、陣攣性、肌痙攣性、失神性及失張性發作,這些發作後都發生意識 缺失,且沒有事前預警,強直-陣攣性發作時會先由四肢開始收縮,收縮後伴隨四 肢抖動與背部拱起;陣攣性會使肌肉不斷收縮,之後四肢出現同時抖動;肌痙攣性會 1.

(14) 引起數個局部或全身性的肌肉痙攣 [9];失神性表現方式很輕微,為轉頭或眨眼等輕. 微動作 [10];失張性會使肌肉短暫失去活動,而非痙攣性抽搐表現方式通常為暫 時性的意識水平下降 [11]。 大多狀況下遺傳學認為癲癇為遺傳性、先天性或發展障礙這些因素綜合作用 下形成 [12],雖然大多數癲癇是由於多種基因與環境因素相互作用,但也有些是 由於單基因缺陷而形成 [13]。基因的遺傳涉及相當多因素,其中包含離子通道、 酶、GABA(γ-氨基丁酸)和 G 蛋白偶聯受體,這些相當多不確定因素都使的無法了 解癲癇的確切機制。 癲癇也可能是由其它疾病產生的併發症狀,如腫瘤、中風、頭部創傷、過去發 生中樞神經系統感染與出生時腦部受損,這些大腦受傷使得腦電波產生改變而誘 發癲癇,但也有證據表明當阿爾茨海默症、多發性硬化症、結節性硬化與自身免疫 性腦炎症這些疾病損害血腦屏障(BBB)後會提高罹患癲癇與乳糜瀉與麩質 過敏症 的風險 [14,15,16],慢性服用酒精也會增加癲癇風險,開發中國家的營養不良也 是常見的危險因素 [17]。 第一次癲癇發作大多不需要治療,除非有出現特殊問題或是癲癇持續超過數 分鐘現象,才需要進行醫學治療,目前癲癇有很多治療藥物,大多主要治療藥物為 抗驚厥藥物,這些藥物主要功能是透過抑制神經元在癲癇發作時出現過度興奮現 象,從而影響癲癇發作,而若要進一步控制癲癇,則需要對涉及癲癇發作的腦區域 進行手術切除或斷除,但手術具有相當高風險與倂發症影響且無法徹底根治。 1.1.2 環境因素對生物體之影響 環境因素(environmental factor)這一詞擁有很多含義,取決於針對的主題不同 而有所差異,如:商業、科學、人類行為、地理現象等;在科學時,當面對不同生物 與非生物時,環境因素則代表對生物體與非生物體產生變化的因素,其中包含生活 方式、文化、飲食、地形、氣候、陽光......等等。 而在生物體中,個體發育受許多環境因素影響,而影響結果形成的表型性狀被 視為生物體的任何可定義與可測量的表徵,如體重、身體、頭髮、瞳孔顏色等。而 在疾病中,除了單基因遺傳疾病之外,環境因素可能決定了罹患所有遺傳與非遺傳 疾病發展,且罹患疾病的過程被視為遺傳與環境因素的結合 [18],目前已有諸多 研究驗證環境因素中某些特定因素與疾病發生的關聯,如維持良好生活作息、減少 酒精攝取與禁止吸菸能降低罹患癌症風險 [19],或是硝酸鹽可能是增加阿茲海默 症、帕金森氏症與糖尿病等疾病誘發風險的環境因素 [20],自閉症也被認為與環 境因素的降雨有關 [21]。 2.

(15) 1.1.3 時間序列分析 時間序列(Time series)是一種依照時間順序排列的數據集合,時間序列數據的 主要性質為:大數據、高維度,且時間序列的特點在於其數值的連續性,故在各種 研究中時間序列總被視為一個整體來進行處理,至於在時間序列中如何影響其表 示方式與型態,則是透過降低原始數據維度,即數據點的數量來進行處理 [22]。 至於要如何對時間序列數據表示出來,常見的方法有以下幾種: (1)使用不同的相似 度測量方法來進行比較 [23];(2)使用固定長度的區塊來將時間序列分割成子序列, 然侯由原始數據的原始形狀表示;(3)或是將數據可視化,透過使用集群或日曆等 工具來將原始數據相互間隔,或用螺旋工具將時間序列分別映射成環;這些方法均 有助於應用在挖掘數據,或用在模式與聚類的發現分析上。 時間序列資料探勘(Time series data mining),則是從原始數據或是時間序列數 據中挖掘隱藏在其中的訊息或知識。至於時間序列領域的數據如何進行分類,則有 許多人有不同看法,Yang 等人提出透過固定某一部分時間序列數據來取代原始數 據,這項技術改進了數據中指標與精確度 [24];而 Li 等人則採用分割的概念,透 過開發出基於最近鄰居(1-NN)的半監督學習方法,來進行處理 ECG(心電圖)類型的 數據 [25]。另一方面,規則挖掘在資料挖掘領域上也是相當經典的課題,規則挖掘 主要用於將股票、金融業的時間序列數據轉換成符號字串 [26],而目前時間序列 數據的聚類大都透過非監督學習的時間序列所組成,其中時間序列聚類的方法主 要分為三種,第一種是透過時間鄰近方法直接作用於原始時間序列數據上,第二種 則是將原始時間序列數據轉換成低維度的特徵向量方式,最後一種則是認為時間 序列是基於某種模型而生成的分布 [27]。 而在時間序列資料探勘中,模式則被視為最常見的挖掘方法,目前在許多領域 上皆有使用,如:在金融時間序數據中,模式利用關聯式分析來解決其中問題,或 是在地球科學的領域中,利用其技術進行挖掘,並用來檢測氣候中有何變化,或在 進行地震或核爆的識別 [28],與農業的乾旱、風速預測等各種領域上;而這些使用 不同測量方法的聚類模式也會互相比較彼此的效能,藉此相互改進出更經典的聚 類模式。. 3.

(16) 1.2 研究動機與目的 癲癇(epilepsy),是一種長期性腦神經系統疾病,以癲癇抽搐發作為特徵 [29], 患者分布全年齡層,目前全世界約有 5000 萬人曾罹患過癲癇 [30],當癲癇發病時, 患者的大腦皮層神經細胞會產生過度與異常的活動,並產生局部或全身性的抽搐 與僵直,輕者無法控制自己的行動,嚴重者甚至會導致死亡;且每 100 人中就有 510%的人都曾在 80 歲前發生過一次癲癇 [31],當中又有 40-50%的人會發病二次 以上 [32],這顯示出癲癇的高罹患率與高復發性,使它成為全球最普遍的腦神經 系統疾病之一。 癲癇無法徹底治癒,僅能以藥物控制,雖然近七成的癲癇病例都可靠藥物控制 [33],但因未能找出詳細的發病機制與觸發誘因 [34],患者間發病前也無共通徵兆, 這都使得患者長期受該疾病折磨,生活在無法預期何時會發病中。是故,找出該疾 病發病誘因應有助於研究此疾病之發病機制。 目前大多研究癲癇之誘因,多集中在探討環境因素中的磁場與光線的改變能 否誘發癲癇 [35,36],但其多數結果仍無法確切的證實發病成因為何,只能確認某 些因素可能會誘發,而環境因素的氣候對誘發不同類型神經疾病也已被證實 [1, 2];有鑑於此,筆者欲透過分析環境因素中的氣候是否有存在誘發癲癇之可能 [37], 並尋找當中的可能誘發變因,與癲癇是否會因季節性而有不同的好發趨勢。 1.3 論文架構 本論文內容編排如下,第二章為來源資料介紹,資料使用前的前置處理流程與研究 處理流程設計,並介紹本論文中主要使用的重點模型和相關統計模型介紹;第三章 則是使用各種統計與時間序列模型的實驗結果,並探討分析癲癇與氣候變因之間 相關與否,且藉由分群分佈實驗來分析不同地區的癲癇患者的年齡層與性別族群 與氣候間有無相關;最後第四章則進行總結,分析第三章的實驗結果,並提出癲癇 誘因之可能假設與探討癲癇是否有季節好發趨勢,最後提出未來相關研究方向與 能改進的地方。. 4.

(17) 第二章、研究方法 2.1 資料來源 癲癇資料來源來自緊急醫療照護系統(EMS)中救護車出勤紀錄,原始數據是由 救護車中隨行救護人員以紙張記錄,記錄中含有案號、序號、急救日期、患者年齡、 患者性別、出勤單位、出勤單位名稱、出勤通知時間、到達現場時間、離開現場時 間、送達醫院時間、離開醫院時間、返隊待命時間、空跑原因、求救原因、病患主 訴、到院前死亡可能原因、送達醫院、送達醫院名稱、送達醫院原因、CPR 現場時 間、救護車上急救處理時間、受傷部位 0、受傷部位 1、受傷部位 2、受傷部位 3、 受傷部位 4、發生地點、急救處置、生命徵象紀錄、救護紀錄耗材記錄、過去病史 紀錄等共三十二項,資料起始紀錄日期為 2007/1/1 至 2013/12/31 為止,共七年資 料量,資料以逐日紀錄,總計 5,441,588 筆資料,為全台各地區救護車出勤紀錄; 由於癲癇當出現發病症狀是非常即時,在台灣通常會透過呼叫救護車做緊急醫療 並送往醫院,而非自行就醫,故採用該紀錄資料。 因氣候紀錄需要專業測站與器材並即時記錄,而台灣中央氣象局內已有相關 紀錄結果並提供給相關民眾下載使用,故氣候資料使用中央氣象局紀錄資料,其項 目為下列十三項:累積降水量、平均風速、平均風向、平均氣溫、最高氣溫、最低 氣溫、平均測站氣壓、最高測站氣壓、最低測站氣壓、平均相對濕度、最大相對濕 度、最小相對濕度、累積日照時數,資料起始紀錄日期為 2000 年 1 月至 2014 年 12 月為止,資料以逐月紀錄,為各月份含二十筆記錄資料之平均值,為與癲癇資 料相同故使用其中 2007 年 1 月至 2013 年 12 月,共七年資料量,總計 84 個月; 且只有架設測站地區才有紀錄資料,其架設地區為:基隆、台北、新北、新竹、台 中、南投、嘉義、台南、高雄、屏東、宜蘭、花蓮、台東,共十三個測站地區資料。. 5.

(18) 2.2 前置處理與研究設計 2007 至 2013 年救護車出勤紀錄中,共有 5,441,588 筆資料,經過圖 2-2-1 資 料篩選流程取得癲癇資料。因救護車並非每次出勤皆能載到病患,常有救護車出勤 後再報案地點因各種原因而未能載送到病患,這些數據約佔總資料量 1/5,是非常 大的資料量,故須去除。空跑原因項目中代碼分許多種,其中代碼為 Null 代表救 護車並非空車返回,而是有接送到病患,經過去除其它非 Null 資料,資 料剩餘 4,341,742 筆。 為取得確切的癲癇發病人數,在求救原因項目中找到癲癇求救代碼 A120,經 去除其餘非癲癇求救原因項目,剩餘 80,554 筆癲癇求救資料。為了之後與氣候資 料做比較,將發生在不同求救地區進行分類,並依照發生日期之月份做統計紀錄, 另外又依據性別不同區分男女資料,獲得男性共 54,519 筆、女性 25,357 筆、Null 性別 678 筆。 獲得之中央氣象局氣候資料以逐月紀錄,該紀錄為各月中擁有二十天以上有 效資料之平均值,資料中在某些月份因資料不完整而有缺漏,為了資料的完整性, 將資料缺漏部分,以該年所有月份加總之平均值填補。. 圖 2-2-1 資料前置處理流程 6.

(19) 研究流程如圖 2-2-2 所示,為了驗證資料的可靠度,將已經過月份正規化的逐 月紀錄資料,利用 Kolmogorov-Smirnov test、Box-Ljung test、Shapiro-Wilk test 等 統計方法來驗證資料來源的可靠度,之後使用卡方檢定來確認資料間是否具有顯 著差異,並在經由標準分數方法來確認在時會出現顯著差異;經由以上之方法可驗 證資料在各月份是具有顯著差異性,並非是無意義的雜訊資料。 由於癲癇與氣候是使用不同單位紀錄之數據,故將癲癇與氣候資料經由正規 化(z-score)處理,而處理後資料,經由時間序列分析,找出當中是否存在季節性 差異與長期趨勢;另一方面,將癲癇與氣候正規化後的資料進行資料探勘,當中 使用相關係數與偏相關係數,來探勘癲癇與氣候變因間相關性,並以此相關性進 行分析,而分析後氣候變因中若有與癲癇有顯著相關,則抓取這些氣候變因並使 用時間序列分析氣候變因的分布狀況,而這些結果經過統整後,進行分析,最後 用來判斷癲癇與氣候間是否存在誘發變因。. 圖 2-2-2 研究流程 7.

(20) 2.3 統計檢定 由於時間序列演算法中無法用統計檢定來証明抓取得頻率或模式具有意義, 故透過使用不同的統計檢定來驗證癲癇資料的可靠度,使用的統計檢定如下: 2.3.1 Kolmogorov-Smirnov 檢驗 柯爾莫哥洛夫-斯米爾諾夫檢驗(Kolmogorov-Smirnov test)[38],是一種基 於累計分布函數的統計檢定,常用於檢驗兩個樣本的分布是否不同或一個經驗分 布與另一個理想分布是否不同,以此驗證實驗數據是否具有可靠度,若結果通過 統計顯著,則表示兩者間並非相同。 其計算公式(1)如下: 𝑫𝒏,𝒎 = 𝐬𝐮𝐩|𝑭𝟏,𝒏 (𝒙) − 𝑭𝟐,𝒎 (𝒙)|. (1). 𝑭𝟏,𝒏 :經驗分佈第一樣本 𝑭𝟐,𝒎 :經驗分佈第二樣本 Sup:極大值函數 2.3.2 Box-Ljung 檢驗 Box-Ljung test [39],常用於判斷序列總體的相關性或者說隨機性是否存在, 或示檢驗某個時間段內的一段觀測值是不是隨機獨立的觀測值,若結果通過統計 顯著,則表示拒絕虛無假設 [40],此數據具有一定隨機性與獨立性。 其計算公式(2)如下: 𝒉. 𝑸 = 𝒏 (𝒏 + 𝟐) ∑ 𝒌=𝟏. 𝝆 ̂𝟐𝒌 𝒏−𝒌. (2). n:是樣本量 𝜌̂𝑘:是 k 的樣本自相關 h:待測試的滯後數 2.3.3 Shapiro-Wilk 檢驗 Shapiro-Wilk test [41],是一種類似線性回歸的方法,將數值經過排序後,檢 驗其回歸曲線的殘差,並檢驗數據是否符合常態分布,若結果通過統計顯著,則 表示拒絕虛無假設,即數據不符合常態分布,數據並非是白噪音。 其計算公式(3)如下:. 8.

(21) 𝟐. (∑𝒏 𝒂 𝒙 ( ) ) 𝑾 = 𝒏𝒊=𝟏 𝒊 𝒊 𝟐 ∑𝒊=𝟏(𝒙𝒊 − 𝒙 ). (3). ̅:樣本均值 𝒙 2.3.4 正規化(標準化) 正規化(標準化),是一種統計上常用的方法,常用於消除不同屬性與樣本間單 位的差異或消除內部構成不同所造成對結果影響,透過按照某個統一的標準來進 行修正,使處理後的數據精度、屬性、層次關係、完整性與邏輯性保持一致 [42, 43],本研究使用以下兩種正規化: 1. 天數正規化: 由於每年每月天數不同,而且有閏年之分別,為了避免因為天數的不同,而造 成計算與比較上出現誤差,故使用天數正規化,以每月 30 天為基準,將各月中未 滿 30 天與超過 30 天之癲癇人數,處理為 30 天之人數。 其計算公式(4)如下: (癲癇人數/非 30 天天數)*30. (4). 2. 標準分數: 標準分數(z-score) [44],是以數值平均分散程度來量測的一種概念,並以標準 差來表示一個分數在整體中所處的相對位置,而越大或越小的標準差,代表與大部 分的數值差異性較大,而越接近 0 的標準差,則代表該數值越接近平均值,資料差 異不大。 且標準分數也可用於判斷資料經正規化後是否具差異性,並以 95%與 5%常態 分布來看,透過比較正規化後的標準分數,其值超過 1.645 與- 1.645 的標準分數, 則代表其值在該資料中與其它觀察值有相當大差異性。 其計算公式(5)如下: 𝒛=. 𝒙−𝝁 ,其中 σ ≠ 0 𝝈. (5). x:需要被標準化的原始分數 𝜇:母體的平均值 σ:母體的標準差 2.3.5 卡方檢定 卡方檢定(chi-square test) [45]是一種利用虛無假設來判斷有無顯著差異的統計 檢定,常用於分析資料比例或次數上是否具有某些特性。卡方檢定有許多不同用 法,常使用的有「適配度檢定」(Test of Goodness-of-Fit)與「獨立性檢定」(The 9.

(22) Chi-Squared Test of Independence)等。 適配度檢定常用來驗證一組觀察值的次數分配是否異於理論上的分配,而獨 立性檢定則用來驗證不同觀察值之間是否相互獨立,本研究採用獨立性檢定來觀 察本研究數據是否在各月份之間具有差異性。 計算公式(6)如下: 2. 𝑋 =∑. (𝐴 − 𝐸 )2 𝐸. 𝑘. =∑ 𝑖 =1. (𝐴𝑖 − 𝐸𝑖 )2 𝐸𝑖. 𝑘. =∑. (𝐴𝑖 − 𝑛𝑝𝑖 )2. 𝑖=1. 𝑛𝑝𝑖. ,i = (1,2,3 … , k) (6). A:母體的觀察值 E:母體的期望值 𝑋 2 :卡方值 利用樣本統計量來估算出母體的參數,在樣本中獨立或能自由變化的數據個 數稱為該統計量的自由度。而經過上列公式計算後獲得之卡方值𝑋 2 ,利用其結果 計算後獲得自由度,並透過查詢卡方分布表的方法,得到與自由度相對應的卡方分 布臨界值 P-value,並將信賴度 95%與其相對應 P-value 0.05 設為閥值,故當 P-value 小於 0.05 時,則代表觀察值與期望值差異太大,故拒絕虛無假設,表示資料之間 具有顯著差異。. 10.

(23) 2.4 相關係數與偏相關係數 本論文中,為了要判斷癲癇與各種氣候變數之間的相關性程度,故採用相關係 數(correlation coefficient)與偏相關係數(Partial correlation coefficient)進行分析。 2.4.1 相關係數 相 關 係 數 全 名 為 皮 爾 遜 積 矩 相 關 係 數 (Pearson product-moment correlation coefficient) [46]。 其計算公式(7)如下: r=. ∑(𝑋𝑖− 𝑋̅) ∙ (𝑌𝑖− 𝑌̅). (7) √∑(𝑋𝑖 − 𝑋̅)2 ∙ √∑ (𝑌𝑖 − 𝑌̅)2 𝑋𝑖 − 𝑋̅:樣本𝑋𝑖 離均值X的距離 𝑌𝑖 − 𝑌̅:樣本𝑌𝑖 離均值Y的距離 給定含 n個值的變量 X的樣本數據{𝑥 1 , … , 𝑥 𝑛 }與另一變量 Y 的數據 {𝑦1 , … , 𝑦𝑛 }, 透過計算兩變量之間共變異數與標準差的商,來呈現變數之間相關密切程度的統 計指標。 相關係數的係數範圍為 1 到-1,相關強度大小如表(X),係數值越接近 1 則代 表兩者之間為強的正相關,反之係數值越接近-1 則代表兩者之間為強的負相關, 若係數值越接近 0 則代表兩者之間接近無相關性,具體強度如表 2-4-1-1。 表 2-4-1-1 相關性強度 正相關 負相關 無相關 0.0 ~ 0.09 −0.09 ~ 0.0 弱相關 0.1 ~ 0.3 −0.3 ~ −0.1 中相關 0.3 ~ 0.5 −0.5 ~ −0.3 強相關 0.5 ~ 1.0 −1.0 ~ −0.5 資料來源: Wiki 皮爾遜積差相關係數(https://goo.gl/rrJ6qe) 2.4.2 偏相關係數 因相關係數是單研究兩變數之間相互影響的程度,當中並未考慮其它氣候的 影響,但氣候之間卻是一種容易互相影響的變因,為了確認能否藉由控制氣候變因, 來影響相關係數結果,並探討氣候間有哪些能提高相關係數與統計顯著性,故採用 偏相關係數進行驗證。 偏相關係數(Partial correlation coefficient),是一種為了能反映出因變數與應變 數相互之間的關聯性,並在控制其他變數影響的條件下,去除被控制的隨機變數影 11.

(24) 響,並計算相關係數結果的統計方法 [47,48]。 其公式(8)如下: 𝑟𝑥𝑦.1 =. 𝑟𝑥𝑦 − 𝑟𝑦1 ∗ 𝑟𝑥1 2 √1 − 𝑟 2 √1 − 𝑟𝑦1 𝑥1. 𝑟𝑥𝑦.1 :x、y 變數在同時排除控制變數 1 的影響後,x、y 變項之間的偏相關 𝑟𝑥𝑦 : x、y 變數的積差相關 𝑟𝑦 :y 變數和控制變數 1 的積差相關 𝑟𝑥 :x 變數和控制變數 1 的積差相關. 12. (8).

(25) 2.5 FGD 與 EEMD 為了找出癲癇的發病頻率與模式,故使用傅立葉高斯分解(Fourier-Gaussian decomposition, FGD) 與 總 體 型 經 驗 模 態 分 解 (Ensemble Empirical Mode Decomposition, EEMD)兩種不同類型的演算法來找出當中的規律。 2.5.1 傅立葉高斯分解(FGD) FGD 是由陳品良(2014)所提出,是一種利用高斯函數,來找出具有規律與數學 意義的資料型態,藉由使用該演算法,有助於研究疾病的週期與規律。 該演算法可分為兩個階段,在第一階段時,利用傅立葉變換來分析時域信號中 主要組成的頻率,而第二階段,則利用不同周期的高斯函數,對時域信號中主要組 成頻率建立模型 [49]。 其詳細 FGD 處理流程如下: 1. 第一階段,先給定原始時序列資料𝑥 (𝑡),令𝑥 𝑜 , 𝑥 1 , 𝑥 𝑜 , … , 𝑥 𝑛−1 為均勻時 間間隔的樣本,並將輸入訊號使用傅立葉變換後,獲得離散頻率分量𝑧𝑜 , 𝑧1 , 𝑧𝑜 , … , 𝑧𝑛−1 ,由於𝑧𝑜 沒有頻率成分,故在之後將𝑧𝑜 = 0。為了識別信號中主要頻 率分量,如果子序列|𝑧𝑗 |, … , |𝑧𝑘 |在範圍內含有局部最大值,即|𝑧𝑗 | < |𝑧𝑗+1 | … < |𝑧ℎ |與| 𝑧ℎ | > |𝑧ℎ+1 | > ⋯ |𝑧𝑘 |, h > j , h < k,且該頻率尖峰幅度超過設定閥值,則將 該頻率分量定義為主要頻率分量,並將位於𝑧1的主要頻率定義為信號的一般趨勢 分量,而後把其中頻率最短時間最長排除出之後分析。 2. 第二階段,將第一階段識別出來的各個主要頻率時域波形透過一組週期性 高斯函數來組合並進行建模,之後透過刪除頻率比|𝑧ℎ |短的影響,來應對於| 𝑧ℎ |的 主要頻率分量,並將這些較短的信號經逆傅立葉變換後輸入回原始時序列資料, 得到新的時域信號𝑥 ′ (𝑡)其中包含𝑥 ′ 0 , 𝑥 ′1 , … , 𝑥 ′ 𝑛−1 ,之後在進行分析前會先去除 𝑧1,但在不同階段時,組合信號𝑥 ′ (𝑡)可能包含具相同頻率|𝑧ℎ |的週期性分量,並 使用一組周期性高斯函數來將這些週期性分量建模,而這週期性高斯函數公式(9) 如下: ∑𝑚 𝑞=1 𝑊𝑞. ∙. 1 √2𝜋∙𝜎𝑞. 𝑒𝑥𝑝 (−. (𝑡 −(𝑐 𝑞+𝑞𝑝)) 2𝜎𝑞2. 2. ). (9). m:是使用高斯函數的數量 p:是 |𝑧ℎ |對應的週期 𝑤𝑞 、𝑐𝑞、𝜎𝑞:為重量、中心、標準差的高斯函數 之後透過優化演算法 RAME 找出最佳參數集,使𝑥(𝑡)和𝑥 ′ (𝑡)之間的均方差最小 化,由此獲得周期性高斯函數來進行判斷分析 [49]。 13.

(26) 2.5.2 總體型經驗模態分解法(EEMD) 另一方面,除了使用傅立葉高斯分解來取得長期趨勢與周期頻率,還可透過提 取資料本身非雜訊的訊號 來進 行分析 ,故 採用經 驗 模 態 分 解 (Empirical Mode Decomposition, EMD) [50]改良後的總體型經驗模態分解(Ensemble Empirical Mode Decomposition, EEMD) [51]來提取資料中非雜訊訊號進行分析。 EMD 是由 Norden E. Huang (1998)所提出,是一種噪音輔助分析數據的方法, 能夠將一個信號拆解成數個本質模態函數(intrinsic mode functions, IMF) [52],並透 過將 IMF 投射到座標圖上的位置,藉此作為權重各個 IMF 的有效性,分別出何者 含有較多的目標訊息量,何者含有較多的雜訊,但通常不能夠將訊號與雜訊徹底分 開來,在每一個輸出的軌道之中,或多或少都參雜著一些雜訊,並且在 EMD 的過 程中,會有混模問題 [53]產生;混模問題就是在同一個 IMF 裡會有不同尺度的訊 號混雜,或是同一尺度的訊號出現在不同的 IMF 裡。混模問題的發生是因為某些 系統訊號發生間斷性訊號 (intermittence),間斷性訊號會使 EMD 無法正確分解出 同一尺度的訊號。此外,混模問題更會造成 IMF 失去物理意義。 EEMD 也是由 Norden E. Huang (2009)針對混模現象所提出加以改進的處理方 法,由於自然中常見的雜訊都是白噪音,故 EEMD 透過添加滿足高斯過程的有限 但非極小振幅的白噪音至原訊號,再對訊號作 EMD,並重覆做以上兩個步驟若干 次後得到若干組 IMF,最後將各自的 IMF 取平均來抵銷雜訊造成的影響 [54]。 其詳細 EEMD 的處理流程說明如下: 1. 給定原始時序列資料𝑥 0 (𝑡)。 2. 總體樣本處理迴路:i=1~m,其中 m 為總體樣本數。 (1) 以滿足高斯分布的亂數函數產生與取樣點數相同的亂數值以建立第 i 次 的要添加雜訊時序列𝑤𝑖 (𝑡)。 (2) 建立𝑥 𝑖 (𝑡) = 𝑥 0 (𝑡) + 𝑤𝑖 (𝑡)。 (3) 使用 EMD 的過程,分離每一個𝑥 𝑖 (𝑡)以便得到每一個 IMF ,即𝑥 𝑖 (𝑡) = ∑𝑛𝑗=1 𝐻𝑖𝑗 (𝑡) + 𝑟1 ,而 n 是 IMF 的個數。 3. 最後所謂的“真實的”IMF 可以從各個測試樣本所得的相對應的 IMF 的平均 𝑚 值,即𝐻𝑗 (𝑡) = ∑𝑚 [54]。 𝑖 =1 𝐻𝑖𝑗 ( 𝑡) /𝑚,j=1~(n+1),其中𝐻 𝑛+1 ( 𝑡) = ∑𝑖 =1 𝑟𝑖( 𝑡) /𝑚 但 EEMD 找出的各個 IMF 訊號為時間序列中隱含的不同訊號,是以會在各不 同 IMF 上有單位的差距。 本質模態函數(IMF)指的是任何一個資料,若能滿足下列兩個條件即可稱作本 質模態函數: 1. 局部極大值(local maxima)以及局部極小值(local minima)的數目之和必須與 零交越點(zero crossing)的數目相等或是最多只能差 1,也就是說一個極值後面必需 14.

(27) 馬上接一個零交越點。 2. 在任何時間點,局部最大值所定義的上包絡線(upper envelope)與局部極小 值所定義的下包絡線,取平均要接近為零 [52]。. 15.

(28) 第三章、實驗結果 本章介紹本研究之實驗結果,3.1 節為使用的癲癇患者各月份結構與在各地 區癲癇患者分佈,3.2 節為驗證研究數據之可靠度與是否非雜訊並確認是否在各 月份之間存在差異性,3.3 節為探查癲癇的季節模式,當中細分小節為使用標準 分數、FGD、EEMD,3.4 節為使用相關係數與偏相關係數對癲癇與氣候進行探 勘,3.5 節為將分群計算後的患者使用 3.3 節與 3.4 節方法分析。 3.1 實驗資料 經由第三章描述前置處理後未經月份正規化後的癲癇人數結構如表 3-1-1、31-2 所示,由表 3-1-1 中觀察,癲癇發病人數在各月份所佔的百分比相較下較無特 別差異,在表 3-1-2 各城市中患者人數前五名城市為:新北(15.65%)、桃園(11.12%)、 台中(13.90%)、台南(8.56%)、高雄(13.93%),但因氣候資料只含有十三個地區,故 其餘桃園、苗栗、彰化、雲林、澎湖、金門等地區資料不使用;而新北地區在 2013 年紀錄中只有 16 人,與前幾年相比差異太多,可能是資料來源紀錄時有遺漏,故 在新北市資料與氣候變因進行分析時,只取用新北的 2007 年至 2012 年間的數據, 其餘地區則取用 2007 年至 2013 年間的數據。 表 3-1-1 全國各月份癲癇人數結構 2007. 2008. 2009. 2010. 2011. 2012. 2013. 總人數. 百分比. 一月. 890. 1,000. 1,096. 1,059. 1,228. 1,281. 998. 7,552. 9.38%. 二月. 851. 993. 861. 1,039. 1,172. 1,010. 969. 6,895. 8.56%. 三月. 844. 841. 938. 951. 1,108. 1,112. 887. 6,681. 8.29%. 四月. 767. 856. 888. 943. 1,089. 1,052. 946. 6,541. 8.12%. 五月. 753. 903. 864. 972. 1,065. 1,118. 893. 6,568. 8.15%. 六月. 784. 799. 817. 973. 994. 1,061. 891. 6,319. 7.84%. 七月. 825. 843. 839. 1,004. 1,053. 1,034. 925. 6,523. 8.10%. 八月. 796. 824. 907. 1,017. 1,048. 1,081. 889. 6,562. 8.15%. 九月. 801. 823. 836. 1,105. 1,019. 965. 940. 6,489. 8.06%. 十月. 825. 835. 921. 1,057. 1,151. 1,137. 959. 6,884. 8.55%. 十一月. 795. 824. 973. 961. 964. 1,030. 935. 6,482. 8.05%. 十二月. 849. 918. 953. 1,108. 1,115. 1,130. 986. 7,059. 8.76%. 9,780. 10,459. 10,893. 12,189. 13,006. 13,011. 11,216. 80,554. 100%. 月份. 年份. 合計. 16.

(29) 表 3-1-2 全國癲癇人數結構 2007. 2008. 2009. 2010. 2011. 2012. 2013. 總人數. 百分比. 基隆. 199. 207. 201. 174. 190. 204. 171. 1,346. 1.67%. 新北. 1,972. 2,007. 2,091. 2,255. 2,226. 2,039. 16. 12,606. 15.65%. 桃園. 1,040. 1,119. 1,125. 1,304. 1,407. 1,469. 1,494. 8,958. 11.12%. 新竹. 534. 561. 593. 623. 767. 746. 758. 4,582. 5.69%. 苗栗. 197. 216. 227. 320. 343. 354. 322. 1,979. 2.46%. 台中. 1,252. 1,403. 1,486. 1,647. 1,775. 1,791. 1,844. 11,198. 13.90%. 彰化. 426. 488. 506. 615. 623. 674. 760. 4,092. 5.08%. 南投. 205. 240. 264. 278. 363. 341. 329. 2,020. 2.51%. 雲林. 261. 263. 262. 335. 333. 354. 353. 2,161. 2.68%. 嘉義. 376. 331. 411. 467. 473. 448. 435. 2,941. 3.65%. 台南. 814. 907. 849. 995. 1,042. 1,084. 1,201. 6,892. 8.56%. 高雄. 1,344. 1,419. 1,448. 1,744. 1,815. 1,728. 1,721. 11,219. 13.93%. 屏東. 346. 389. 454. 457. 521. 506. 579. 3,252. 4.04%. 宜蘭. 214. 283. 284. 248. 308. 355. 368. 2,060. 2.56%. 花蓮. 323. 316. 387. 377. 443. 447. 442. 2,735. 3.40%. 台東. 203. 226. 205. 224. 286. 333. 296. 1,773. 2.20%. 澎湖. 43. 48. 53. 65. 57. 75. 75. 416. 0.52%. 金門. 31. 36. 47. 61. 34. 63. 52. 324. 0.40%. 合計. 9,780. 10,459. 10,893. 12,189. 13,006. 13,011. 11,216. 80,554. 100%. 月份. 年份. *後面分群使用之地區以粗體標記。. 17.

(30) 3.2 正規化與驗證資料 將以整理後資料經由第二章實驗流程所示,將癲癇資料經月份正規化後,並使 用 K-S、Box-Ljung、Shapiro-Wilk 與卡方檢定等統計檢定進行驗證,其結果如表 32-1 所示,若 P-value 小於 0.05 則代表拒絕虛無假設並通過統計顯著標準,並用粗 體標紀。Kolmogorov-Smirnov 檢定用於分析不同地區的癲癇與其給定的另一常態 分佈是否來自同源,若拒絕虛無假設則代表不同地區的癲癇紀錄與其常態分佈不 同;Box-Ljung 檢定用於分析不同地區的癲癇紀錄其殘差項的自相關,若拒絕虛無 假設則代表不同地區的癲癇紀錄具有自相關;Shapiro-Wilk 檢定則用於分析不同地 區的癲癇的殘差排列後是否為常態分佈,若拒絕虛無假設則代表不同地區的癲癇 並非常態分佈,且 Shapiro-Wilk 與 K-S 在檢定的對象有所不同,Shapiro-Wilk 大多 適用於分析樣本數≦50,K-S 則相反;而卡方檢定中則以跨年份的方式取得各月份 癲癇的跨年總和與其平均,以此計算在去除年份影響的各月份之間是否有明顯的 差異,若拒絕虛無假設則代表癲癇在各月份之間是具有顯著差異,表 3-2-1 中各地 區的 P-value 大多小於或接近 0.05,這驗證癲癇具有差異性與可靠性,在 K-S test 較難通過顯著門檻,依據 K-S test 的公式(公式 1),可能因為癲癇人數資料具備 潛在規律周期(圖 3-3-2-1 為例),加上本研究進行統計檢定之前,對原始資料使 用 z-score 標準化以去除變數單位之影響,導致 K-S test 較困難通過統計顯著門檻。 表 3-2-1 統計檢定驗證 地區 統計方法 Kolmogorov-Smirnov Box-Ljung Shapiro-Wilk 卡方檢定 基隆 新北. 0.46 0.006. 0.051 < 0.001. 0.130 < 0.001. 0.073 < 0.001. 新竹. 0.72. < 0.001. 0.037. 0.012. 台中 南投. 0.268 0.064. < 0.001 < 0.001. 0.038 0.027. < 0.001 0.003. 嘉義. 0.267. < 0.001. 0.019. 0.019. 台南 高雄. 0.194 0.594. < 0.001 < 0.001. 0.372 0.316. < 0.001 < 0.001. 屏東 宜蘭. 0.042 0.267. < 0.001 < 0.001. 0.055 0.091. 0.100 0.072. 花蓮. 0.268. < 0.001. 0.279. 0.080. 台東 總人數. 0.721 0.268. < 0.001 < 0.001. 0.167 0.046. 0.146 < 0.001. *通過統計門檻 0.05 以粗體標記。 18.

(31) 3.3 季節好發趨勢 使用標準分數、FGD、EEMD 等方法找出癲癇與氣候的季節好發趨勢分別列 於 3.3.1~3.3.4 節中。 3.3.1 標準分數結果 月份 地區. 基隆. 新北. 表 3-3-1-1 標準分數分析 新竹 台中 南投. 一月. 1.548. 2.277. 1.411. 1.151. 1.601. 0.968. 0.971. 2.017. 二月. 1.447. 1.752. 0.592. 2.110. 1.543. 1.149. 1.200. 1.693. 三月. -0.160 -0.336. -0.808 0.117. -0.701 -0.705. 0.301 -0.243. -1.103 0.572. -0.115 -0.161. 0.143 0.511. -0.758 -0.788. 六月. 0.053 0.326. -0.152 -0.174. -1.003 -1.364. -0.153 -0.614. -0.124 0.090. -1.891 -0.116. -0.354 -2.275. -0.852 -0.788. 七月. -1.726. -0.423. -1.003. -1.326. -1.616. -0.115. 0.498. -1.101. 八月 九月. -0.231 -1.512. -0.570 -0.233. -0.164 -0.012. -0.985 0.070. -1.010 -0.680. 0.275 -1.773. -1.087 -0.686. 0.052 -0.031. 十月. -0.445. -0.277. 0.373. -1.175. 0.622. 0.752. 0.735. 0.037. 十 一月. 0.841 0.196. -1.109 -0.401. 0.890 1.682. 0.128 0.735. 0.042 0.063. -0.116 1.142. -0.344 0.687. -0.031 0.551. 四月 五月. 十 二月. 嘉義. 台南. 高雄. *通過統計門檻±1.645(代表 10%顯著水準)以粗體標記。 月份 地區. 屏東. 表 3-3-1-1 標準分數分析(續) 宜蘭 花蓮 台東 總人數. 一月. -0.204. 1.675. -0.114. 1.572. 1.935. 二月. 1.781 -0.818. 0.664 -1.257. 1.285 0.591. 1.226 -0.231. 1.950 -0.431. 五月. 1.102 -1.573. 0.106 -1.199. -0.196 -0.164. 0.234 -0.699. -0.219 -0.738. 六月. -1.142. -0.667. -0.404. -1.077. -0.843. 七月 八月. 0.504 -0.063. 0.123 -0.912. -0.013 -1.876. -0.365 0.370. -0.861 -0.755. 九月. 1.004. -0.370. 0.792. -1.077. -0.365. 十月 十 一月. 0.504 -0.606. 0.238 -0.191. -0.517 -1.133. 0.570 -1.560. 0.120 -0.388. 十 二月. -0.488. 1.790. 1.749. 1.038. 0.596. 三月 四月. *通過統計門檻±1.645(代表 10%顯著水準)以粗體標記。 19.

(32) 經確認來源資料可靠度後,依照流程將已經月份規化後資料進行標準分數運 算,並依照 2.3.4 節將其值超過正負 1.645 以粗體標紀,其結果如表 3-3-1-1 所示, 可發現在不分地區一月、二月、六月、七月與其它月份結果具有差異性。 3.3.2 傅立葉高斯分解(FGD)結果 並如流程圖 2-2-2 所示,先將癲癇數據進行傅立葉高斯分解運算,以此得出癲 癇波鋒與周期。以下使用高雄做說明: 圖 3-3-2-1、3、5、7、9、11 中藍色線代表癲癇人數的原數值,而圖 3-3-2-2、 4、6、8、10、12 為 FGD 計算結果,其中 gaussians comp0 (橘色)、gaussians comp1 (青色)、gaussians comp2 (紫色)分別表示不同大小的長期趨勢線與峰值月份, gaussians combine (綠色)則為這三種長期趨勢線組合結果;統計使用不同月數為週 期的長期趨勢組合結果中,發現大多數地區的癲癇人數若使用以每十二個月為一 週期的長期趨勢,會出現與原數據相近之頻率與規律,並且峰值月份均會出現在一 月。 並由 3.4 節相關係數與偏相關係數結果可知,癲癇發病人數與最高氣壓、最高 氣溫、平均氣溫、最低氣溫這四種氣候變因有較高相關,最低濕度則能控制這些氣 候變因,故使用 FGD 分析這幾種氣候變因,表 3-3-2-1 為高雄地區的這五種氣候 變因結果,表中週期選用長期趨勢週期為 12 個月或最接近 12 個月之 FGD 結果, 可發現最高氣溫、平均氣溫、最低氣溫峰值均常出現月份為七月與八月,最高氣壓 峰值常出現於一月,最低濕度則常出現六月至八月間。. 20.

(33) 圖 3-3-2-1 高雄癲癇人數. 圖 3-3-2-2 癲癇人數長期趨勢 21.

(34) 圖 3-3-2-3 最高氣壓. 圖 3-3-2-4 最高氣壓長期趨勢 22.

(35) 圖 3-3-2-5 平均氣溫. 圖 3-3-2-6 平均氣溫長期趨勢 23.

(36) 圖 3-3-2-7 最高氣溫. 圖 3-3-2-8 最高氣溫長期趨勢 24.

(37) 圖 3-3-2-9 最低氣溫. 圖 3-3-2-10 最低氣溫長期趨勢 25.

(38) 圖 3-3-2-11 最低濕度. 圖 3-3-2-12 最低濕度長期趨勢 26.

(39) 峰值月份 (週期) 基隆. 表 3-3-2-1 高雄 FGD 長期趨勢的鋒值時點 癲癇 最高氣壓 最高氣溫 平均氣溫 最低氣溫 最低濕度 1 月(12). 7 月(12). 7 月(12). 8 月(12). 9 月(12). 台北. 10 月(14) 同新北. 1 月(12). 7 月(12). 7 月(12). 8 月(12). 12 月(12). 新北 新竹. 1 月(12) 1 月(12). 1 月(12) 1 月(12). 7 月(12) 8 月(12). 8 月(12) 8 月(12). 8 月(12) 8 月(12). 9 月(12) 7 月(12). 台中. 2 月(12). 1 月(12). 7 月(12). 7 月(12). 8 月(12). 8 月(12). 南投 嘉義. 1 月(12) 1 月(12). 1 月(12) 1 月(12). 8 月(12) 7 月(12). 8 月(12) 7 月(12). 8 月(12) 7 月(12). 6 月(12) 8 月(12). 台南 高雄. 2 月(12) 1 月(12). 1 月(12) 1 月(12). 7 月(12) 7 月(12). 7 月(12) 7 月(12). 8 月(12) 7 月(12). 8 月(12) 8 月(12). 屏東. 11 月(8). 1 月(12). 7 月(12). 7 月(12). 8 月(12). 8 月(12). 宜蘭 花蓮. 1 月(12) 2 月(10). 1 月(12) 2 月(12). 7 月(12) 7 月(12). 7 月(12) 7 月(12). 8 月(12) 8 月(12). 6 月(12) 7 月(12). 台東. 2 月(10). 1 月(12). 8 月(12). 7 月(12). 8 月(12). 7 月(12). *週期以月為單位. 27.

(40) 3.3.3 總體型經驗模態分解法(EEMD)結果 同傅立葉高斯分解,以下使用高雄做說明:. *在 IMF2 與 IMF3 出現較具規律性訊號。 圖 3-3-3-1 高雄癲癇 EEMD 分析 28.

(41) 經由 EEMD 提取當中的不同 IMF 訊號,這都使各個 IMF 會在單位上有很大 的差異,由圖 3-3-3-1 可發現癲癇在 IMF2、IMF3 時會出現較具規律之頻率,在 IMF3 可發現具有明顯之規律性故選用之,透過紀錄癲癇各地區出現峰值月份紀 錄於表 3-3-3-1,由表 3-3-3-1 中結果可發現癲癇在一月、二月會出現最多波峰次 數,而其它月份則較少;若使用季節進行區分,則癲癇在冬季(十二月至二月)會 出現顯著高峰。 並由 3.4 節相關係數與偏相關係數結果可知,癲癇發病人數與最高氣壓、最 高氣溫、平均氣溫、最低氣溫這四種氣候變因有較高相關,控制最低濕度則能影 響這些氣候變因,故將這五種氣候變因進行 EEMD 運算,由圖 3-3-3-2 可發現運 算後的這些氣候變因在 IMF2 時出現明顯規律性,故記錄使用 IMF2 的各地峰值 於圖 3-3-3-2。 由圖 3-3-3-3 可發現,EEMD 結果則與 FGD 結果差異不大,最高氣壓、最高 氣溫、平均氣溫、最低氣溫峰值皆在七月、八月,最高氣壓出現在一月,最低濕 度則是七月。 表 3-3-3-1 癲癇各地區 EEMD 波鋒的季節分佈(月) 基 新 新 臺 南 嘉 臺 高 屏 宜 花. 臺. 隆. 北. 竹. 中. 投. 義. 南. 雄. 東. 蘭. 蓮. 東. 一月. 2. 3. 0. 1. 1. 2. 1. 3. 0. 1. 0. 2. 16. 二月. 2. 1. 0. 4. 3. 3. 4. 0. 1. 0. 1. 1. 20. 三月 四月. 1 0. 1 0. 1 1. 2 0. 1 1. 0 1. 0 0. 3 0. 0 0. 3 0. 1 1. 1 0. 14 4. 五月 六月. 0 0. 0 0. 0 0. 0 0. 0 0. 0 0. 0 0. 0 0. 0 0. 0 0. 0 0. 0 0. 0 0. 七月. 0. 0. 0. 0. 0. 0. 0. 1. 2. 0. 1. 1. 5. 八月 九月. 0 0. 0 0. 0 0. 0 0. 0 0. 0 0. 0 0. 0 0. 1 0. 0 0. 0 1. 1 0. 2 1. 十月. 1. 0. 0. 0. 0. 0. 0. 0. 0. 0. 1. 0. 2. 十一月 十二月. 0 0. 0 1. 1 4. 0 1. 0 1. 0 1. 1 1. 1 1. 0 0. 1 1. 0 0. 1 0. 5 11. 地區 月份. 29. 加總.

(42) 圖 3-3-3-2 高雄氣候變因 EEMD 分析 30.

(43) *最高氣壓鋒值出現次數最多在 1 月,最高氣溫、最低氣溫、平均氣溫鋒值出現 在 7 月 8 月間,最低濕度則在 1 月與七月均有出現但在 7 月 8 月間較多。 圖 3-3-3-3 氣候變因 EEMD 峰值次數. 31.

(44) 3.4 相關係數結果 氣候變因. 降雨 風速 風向. 表 3-4-1 各地區癲癇人數與氣候變因之相關性分析 地區 基隆 台北 新北 新竹 台中 南投 係數. -0.145. -0.133 -0.180 -0.206 -0.118 -0.134. P-value 0.026. 0.223. 0.266. 0.101. 0.060. 係數. 0.213. 0.051. 0.068. 0.214. -0.266 -0.248 0.187. P-value 0.051. 0.672. 0.570. 0.050. 0.014. 係數. 0.242. -0.185 -0.063. P-value 0.092. 0.283 0.023. 0.225 0.089. -0.061 -0.229 -0.146 -0.065 0.023. 0.600. 0.609. 0.036. 0.186. 0.558. 0.838. 0.251. 0.251. 0.306. 0.242. 0.205. 0.197. 0.033. 0.034. 0.005. 0.027. 0.062. 0.072. 0.236 0.046. 0.236 0.046. 0.281 0.010. 0.196 0.074. 0.226 0.039. 0.237 0.030. 0.172. 0.105. 0.099. 0.230. 0.237. 0.179. 0.095. P-value 0.118. 0.381. 0.406. 0.036. 0.030. 0.103. 0.390. 平均氣壓 係數. 0.206. P-value 0.06 最高氣壓 係數. 0.217 P-value 0.047. 最低氣壓 係數 平均氣溫 係數. -0.277 -0.342. P-value 0.011 最高氣溫 係數 最低氣溫 係數. 0.003. -0.210 -0.341. P-value 0.055. 0.003. -0.244 -0.287. P-value 0.025. -0.341 -0.282 -0.291 -0.297 -0.293 0.003. 0.009. 0.007. 0.006. 0.007. -0.331 -0.283 -0.287 -0.274 -0.312 0.005. 0.009. 0.008. 0.011. 0.004. -0.293 -0.225 -0.215 -0.234 -0.221. 0.014. 0.012. 0.040. 0.050. 0.428. 0.328. 0.277. -0.124 -0.017 0.025. <0.001 0.005. 0.011. 0.262. 0.228. 0.346. 0.039. 0.141. -0.266 -0.028 0.114. P-value 0.037. 0.003. 0.745. 0.199. 0.014. 0.108. 0.060. 0.107. -0.127 0.058. -0.063. P-value 0.975 0.368 係數 -0.267 -0.328. 0.618. 0.333. 0.250. 0.568. P-value 0.014. 0.005. 平均濕度 係數. 0.273. P-value 0.012 最高濕度 係數 最低濕度 係數 日照. 嘉義. 0.004. 0.005. 0.032 0.879 0.797 0.602. 0.043 0.821 0.304. -0.325 -0.207 -0.143 -0.124 -0.192 0.059. 0.194. 0.261. 0.080. *通過統計門檻 0.05 以粗體標記,通過數最多的幾個氣候變因以粗體標記。. 32.

(45) 氣候變因. 表 3-4-1 各地區癲癇人數與氣候變因之相關性分析(續) 地區 台南 高雄 屏東 宜蘭 花蓮 台東 通過數. 降雨. 係數. -0.180 -0.096 0.029. P-value 0.101 風速. 係數. 0.385. 0.790. -0.048 -0.047 0.085. P-value 0.664. 0.997. 0.147. 1/13. 0.832. -0.119 -0.101 -0.131 3/13 0.360. 0.235. -0.086 0.140. 0.035. 0.256. 0.263. 0.437. 0.202. 0.755. 0.019. 0.305 0.005. 0.073 0.510. 0.222 0.042. 0.126 0.252. 0.116 0.294. 7/13. 0.242. 0.276. 0.058. 0.196. 0.109. 0.137. 8/13. P-value 0.026 最低氣壓 係數 0.161. 0.011. 0.599. 0.073. 0.322. 0.215. 0.186. 0.000. 0.172. 0.089. 0.097. P-value 0.143. 0.090. 0.999. 0.117. 0.420. 0.381. 係數. -0.115 0.123. P-value 0.300 平均氣壓 係數. 0.273 P-value 0.012. 最高氣壓 係數. 平均氣溫 係數. 2/13. 2/13. -0.277 -0.320 -0.078 -0.221 -0.224 -0.205 11/13. P-value 0.011 最高氣溫 係數. 0.443. -0.160 0.023. 0.282. 風向. 0.670. 0.000. 0.003. 0.480. 0.043. 0.041. 0.062. -0.314 -0.349 -0.125 -0.212 -0.220 -0.167 9/13. P-value 0.004 0.001 0.258 0.053 0.044 0.129 最低氣溫 係數 -0.259 -0.274 -0.067 -0.170 -0.159 -0.171 9/13 P-value 0.017. 0.012. 0.544. 0.121. 0.148. -0.021 -0.205 0.024 P-value 0.851 0.060 0.831. 0.182 0.098. -0.224 -0.022 5/13 0.041 0.842. -0.048 -0.300 0.079. 0.230. -0.297 -0.143 6/13. P-value 0.662 0.005 0.474 最低濕度 係數 -0.093 -0.068 0.163. 0.035. 0.006. 0.194. -0.056 0.010. 0.019. 0.613. 0.866. 平均濕度 係數 最高濕度 係數. P-value 0.403 日照. 係數. 0.540. 0.139. 0.928. 0.119. 0/13. -0.191 -0.225 -0.147 -0.216 -0.156 -0.188 5/13. P-value 0.083. 0.040. 0.182. 0.048. 0.157. 0.087. *通過統計門檻 0.05 以粗體標記,通過數為該氣候通過統計門檻地區數。. 33.

(46) 如研究流程圖 2-2-2 所示,使用的氣候變因為累積降水量、平均風速、平均風 向、平均氣溫、最高氣溫、最低氣溫、平均測站氣壓、最高測站氣壓、最低測站氣 壓、平均相對濕度、最大相對濕度、最小相對濕度、累積日照時數,將月份正規化 後癲癇資料與不同氣候變因先經標準分數正規化處理後,在由相關係數計算癲癇 與氣候變因相關性程度,結果如表 3-4-1 所示,通過數欄位為十三個地區中能通過 各氣候變因的統計顯著地區總和,其中最高氣壓、平均氣溫、最高氣溫、最低氣溫 這四種氣候變因在與各城市癲癇人數進行相關係數運算時,當中的大多城市皆能 通過統計顯著門檻(P-value <0.05),其餘氣候變因則較少通過。 之後使用偏相關係數分別控制不同的氣候變因,每次在與一種氣候變因相關 計算時,藉由只控制一種不同的其餘十二種氣候變因,來確認在不同氣候變因的影 響下是否會影響癲癇與不同氣候變因間相關性,例如:在表 3-4-2 中,癲癇與最高氣 壓進行相關性計算,共同控制變數為降雨之氣候變因,在基隆地區會算得結果係數 = 0.168(with P-value = 0.129)。偏相關結果如表 3-4-2~表 3-4-5,附表只採用癲癇與 最高氣壓、平均氣溫、最高氣溫、最低氣溫等四種氣候變因相關計算時控制不同氣 候變因之結果,其餘氣候變因結果,因能通過統計顯著標準(P-value <0.05)數目過 於稀少,故不取用。 最後由相關性與偏相關性計算中可發現,若是癲癇與最高氣壓、最高氣溫、 最低氣溫、平均氣溫其中任一種氣候變因運算,則能通過大多地區的統計顯著標 準;且當控制的氣候變因為最低濕度時,則在大多地區相關性係數與統計顯著性 會些許提高。以高雄為例,在相關計算中癲癇與最高氣壓(係數 = 0.276;P-value = 0.011)、最高氣溫(係數 = -0.349;P-value = 0.001) 、最低氣溫(係數 = -0.274; P-value = 0.012) 、平均氣溫(係數 = -0.320;P-value = 0.003),而在控制最低濕度 的偏相關計算時癲癇與最高氣壓(係數 = 0.308;P-value = 0.005)、最高氣溫(係數 = -0.381;P-value = <0.001)、最低氣溫(係數 = -0.318;P-value = 0.003)、平均氣 溫(係數 = -0.371;P-value = 0.001)。 但在相關係數結果中,最低濕度在各地區均未能通過統計顯著標準,這表示 癲癇發病人數與最低濕度並無相關性,可透過去除最低濕度的影響卻反而能影響 氣溫變因,增加些許與癲癇相關性,故依此判斷最低濕度很可能是影響氣候中氣 溫的重要變數。 此外,與 3.5 節中所使用的四個地區癲癇患者互相驗證,新北、台中、台南、 高雄這四個地區在與最高氣壓、平均氣溫、最高氣溫、最低氣溫這四種氣候變因相 關性均通過統計顯著標準,證實其中影響 3.5 節的結果確實是因性別或年齡集群分 佈不同所致。. 34.

(47) 控制變因. 表 3-4-2 癲癇與最高氣壓之偏相關分析 地區 基隆 台北 新北 新竹 台中 南投. 嘉義. 降雨. 係數. 0.168. 0.190. 0.199. 0.231. 0.095. 0.195. 0.197. 0.113. 0.096. 0.035. 0.392. 0.077. 0.074. 風速. P-value 0.129 係數 0.122. 0.244. 0.230. 0.192. 0.346. 0.137. 0.219. 0.040. 0.054. 0.083. 0.001. 0.217. 0.047. 風向. P-value 0.273 係數 0.158. 0.233. 0.232. 0.179. 0.182. 0.218. 0.236. P-value 0.154. 0.051. 0.052. 0.106. 0.099. 0.048. 0.032. 平均氣壓. 係數. -0.025 -0.022 -0.061 -0.137 0.098. 0.176. 0.837. 0.854. 0.584. 0.216. 0.377. 0.112. 最高氣壓. P-value 0.532 係數 NA. NA. NA. NA. NA. NA. NA. P-value NA. NA. NA. NA. NA. NA. NA. 係數. 0.140. 0.229. 0.234. 0.172. 0.046. 0.153. 0.242. P-value 0.207. 0.055. 0.049. 0.120. 0.679. 0.167. 0.028. 最低氣壓 平均氣溫 最高氣溫. 係數. 0.070. -0.121 -0.242 -0.227 0.053. P-value 0.275. 0.042. 係數. -0.127 -0.086 0.071. -0.101 0.028. -0.063. 0.292. 0.362. 0.802. 0.572. -0.020 0.050. 0.086. 0.073. P-value 0.513 最低氣溫 平均濕度 最高濕度. 係數. 0.473. 0.632 0.523. -0.016 -0.076 -0.078 0.192. 0.071. 0.618. 0.327. P-value 0.889. 0.531. 0.515. 0.083. 0.857. 0.652. 0.438. 係數. 0.131. 0.076. 0.128. 0.219. 0.176. 0.263. 0.240. P-value 0.237. 0.531. 0.287. 0.046. 0.111. 0.016. 0.029. 係數. 0.131. 0.198. 0.246. 0.255. 0.157. 0.225. 0.213. P-value 0.236. 0.098. 0.039. 0.020. 0.156. 0.041. 0.054. 0.218. 0.243. 0.243. 0.311. 0.151. 0.328. 0.241. P-value 0.048. 0.041. 0.042. 0.004. 0.172. 0.002. 0.028. 係數. 0.018. 0.039. 0.017. 0.195. 0.203. 0.316. 0.191. P-value 0.875. 0.747. 0.891. 0.078. 0.066. 0.004. 0.084. 最低濕度 係數 日照. 0.057. -0.199 -0.055 -0.109. * NA: not available;因為與該氣候變數運算所以無該結果值,通過統計門檻 0.05 以粗體標記,能最有效提高 P-value 與係數的氣候變因以粗體標記。. 35.

(48) 控制變因. 降雨 風速 風向. 表 3-4-2 癲癇與最高氣壓之偏相關分析(續) 地區 台南 高雄 屏東 宜蘭 花蓮 台東 係數. 0.170. 0.268. 0.095. 0.199. 0.056. 0.178. P-value 0.125. 0.014. 0.393. 0.072. 0.614. 0.107. 係數. 0.336. 0.272. -0.006 0.162. 0.185. 0.196. P-value 0.002. 0.013. 0.954. 0.143. 0.095. 0.075. 係數. 0.221. 0.260. 0.010. 0.148. 0.162. 0.057. P-value 0.045. 0.018. 0.930. 0.182. 0.142. 0.610. 平均氣壓. 係數. 最高氣壓. 係數. 最低氣壓 平均氣溫. -0.075 -0.064 -0.040 -0.070 -0.048 0.093 P-value 0.498 0.565 0.720 0.528 0.669 0.405 NA. NA. NA. NA. NA. P-value NA 係數 0.185. NA. NA. NA. NA. NA. 0.208. 0.080. 0.117. 0.070. 0.097. P-value 0.094. 0.059. 0.470. 0.293. 0.531. 0.382. 係數. NA. -0.034 -0.045 -0.031 -0.030 -0.266 -0.139. P-value 0.759. 0.689. 0.781. 0.787. 0.015. 0.209. 最高氣溫. 係數. 0.441. 最低氣溫. P-value 0.670 0.529 係數 -0.001 0.061. -0.007 0.102. -0.095 -0.053. P-value 0.991. 0.581. 0.950. 0.359. 0.393. 0.637. 平均濕度. 係數. 0.247 P-value 0.024. 0.189 0.087. 0.122 0.273. 0.207 0.061. 0.001 0.994. 0.161 0.146. 最高濕度. 係數. 0.240. 0.141. 0.113. 0.217. 0.130. 0.098. P-value 0.029 最低濕度 係數 0.228. 0.205. 0.307. 0.048. 0.241. 0.377. 0.308. 0.120. 0.189. 0.128. 0.154. P-value 0.038. 0.005. 0.278. 0.087. 0.247. 0.165. 係數. 0.206. 0.219. 0.017. 0.046. -0.019 -0.008. P-value 0.061. 0.047. 0.880. 0.680. 0.868. 日照. -0.048 -0.070 -0.086 0.012 0.917. -0.177 0.020 0.109. 0.860. 0.946. * NA: not available;因為與該氣候變數運算所以無該結果值,通過統計門檻 0.05 以粗體標記,能最有效提高 P-value 與係數的氣候變因以粗體標記。. 36.

(49) 控制變因. 表 3-4-3 癲癇與平均氣溫之偏相關分析 地區 基隆 台北 新北 新竹 台中 南投. 嘉義. 降雨. 係數. 風速. P-value 0.037 0.008 0.007 0.028 0.045 係數 -0.207 -0.354 -0.338 -0.200 -0.449. 0.017. 風向. P-value 0.061 0.002 0.004 0.069 <0.001 0.037 係數 -0.226 -0.350 -0.348 -0.181 -0.278 -0.296 P-value 0.040. -0.230 -0.313 -0.316 -0.241 -0.221. 0.003. 0.003. 0.102. -0.279. -0.263. 0.011. 0.016. -0.229. -0.262 -0.297. 0.011. 0.007. 0.006. -0.190. -0.243. -0.333. 平均氣壓. 係數. 0.027. 0.002. 最高氣壓. P-value 0.022 0.004 0.006 0.818 0.085 係數 -0.214 -0.346 -0.335 -0.060 -0.293. -0.206. -0.207. P-value 0.053. 0.062. 0.060. -0.242. -0.325. 最低氣壓 平均氣溫 最高氣溫. 係數. -0.251 -0.335 -0.322 0.026. 0.001. 0.122. 0.104. 0.028. 0.003. 係數. NA. NA. NA. NA. NA. NA. NA. P-value NA. NA. NA. NA. NA. NA. NA. -0.121. -0.018. 0.276. 0.873. -0.243. -0.295. 0.027. 0.007. -0.342. -0.294. 0.002. 0.007. -0.298. -0.272. 0.006. 0.013. -0.407. -0.306. 係數. -0.205 -0.075 -0.100 -0.042 -0.064. 係數 係數 係數. 最低濕度 係數. 0.405. 0.703. 0.564. 0.020. 0.049. 0.025. 0.003. -0.179 -0.158 -0.216 -0.184 -0.283 0.187. 0.070. 0.096. 0.010. -0.196 -0.295 -0.377 -0.248 -0.277 0.012. 0.001. 0.024. 0.011. -0.279 -0.350 -0.353 -0.316 -0.267. P-value 0.011 係數. 0.532. -0.163 -0.276 -0.235 -0.246 -0.321. P-value 0.075. 日照. 0.007. 0.001. P-value 0.105 最高濕度. 0.593. P-value 0.043. P-value 0.141 平均濕度. 0.004. -0.223 -0.388 -0.388 -0.171 -0.180. P-value 0.063 最低氣溫. 0.003. 0.003. 0.003. 0.004. 0.014. -0.107 -0.160 -0.151 -0.199 -0.279. P-value 0.337. 0.182. 0.209. 0.072. 0.011. <0.001 0.005 -0.345. -0.237. 0.001. 0.031. * NA: not available;因為與該氣候變數運算所以無該結果值,通過統計門檻 0.05 以粗體標記,能最有效提高 P-value 與係數的氣候變因以粗體標記。. 37.

數據

圖 3-3-2-1 高雄癲癇人數
圖 3-3-2-3 最高氣壓
圖 3-3-2-5 平均氣溫
圖 3-3-2-7 最高氣溫
+7

參考文獻

Outline

相關文件

By University students of the Chung Hua University for objects, to make use of the descriptive statistics, the reliability analysis, and the factor analysis, considers the

Furthermore, in order to achieve the best utilization of the budget of individual department/institute, this study also performs data mining on the book borrowing data

本論文之目的,便是以 The Up-to-date Patterns Mining 演算法為基礎以及導 入 WDPA 演算法的平行分散技術,藉由 WDPA

資料探勘 ( Data Mining )

由於資料探勘 Apriori 演算法具有探勘資訊關聯性之特性,因此文具申請資 訊分析系統將所有文具申請之歷史資訊載入系統,利用

介面最佳化之資料探勘模組是利用 Apriori 演算法探勘出操作者操作介面之 關聯式法則,而後以法則的型態儲存於介面最佳化知識庫中。當有

中華大學應用數學研究所 研 究 生:黃仁性 敬啟 指導教授:楊錦章 教授 中華民國九十六年..

Henton, Mary.(1996).Adventure in the classroom: Using adventure to strengthen learning and build a community of life-long learners:Active learning; Adventure games; Creative