報告題名:
緊迫叮人-登革熱疫情之探討
A Study of Dengue Fever Epidemic
作者:何承縈、許筱涵、楊珺婷 系級:統計二乙
學號:D0635976、D0636269、D0680670 開課老師:劉峰旗 助理教授
課程名稱:統計計算 開課系所:統計學系
開課學年: 107 學年度 第 二 學期
中文摘要
登革熱是大家耳熟能詳的傳染病,從小時候就不時能夠在課本看見它,但在生 活中我們對此並沒有太大的防範意識。近年來,我們居住的城市-台中,爆發出多 起登革熱的確診病例,因此引發我們對這個主題的動機,想透過統計分析方法來 研究哪些因素會造成登革熱疫情加重。
我們使用 R 軟體作為工具,以回歸分析來探討聖嬰年與非聖嬰年的月均溫與 該月登革熱病例數的關係; 以獨立樣本t檢定探討降雨量與登革病例數的關係;先 以t檢定探討是否南亞的人數逐年增加,再以迴歸分析探討東南亞旅遊人數與登 革熱病例數的關係
我們用簡單線性迴歸來分析台北、新北及桃園三個地區在聖嬰年與反聖嬰年的 比較,我們發現在北部地區的反聖嬰年月均溫與登革熱病例數相較而言是比較有 關係的。以獨立樣本t檢定探討降雨量與登革病例數結果,發現相關性不高,我 們猜測平均雨量與病例數之間可能有延遲因素,因此出現誤差。最後我們探討出 東南亞旅遊人數與登革熱病例數是有關係的,隨東南亞旅遊人數增加,病例數也 呈現成長。
關鍵字:
降雨量、登革熱、聖嬰現象、獨立樣本t檢定、迴歸分析- 2 -
Abstract
Dengue fever is an infectious disease that everyone is familiar with. From time to time, I can see it in textbooks, but in life we don't have much awareness. In recent years, many of the confirmed cases of dengue fever have occurred in the city where we live, Taichung. This has triggered our motivation for this topic. We want to use statistical analysis methods to study which factors will cause the dengue fever to worsen.
We use R software as a tool to analyze the relationship between the monthly mean temperature of the holy and non-Holy infant years and the number of dengue cases in the month by regression analysis; to investigate the relationship between rainfall and the number of dengue cases by independent sample t test; Use t to check whether the number of people in South Asia is increasing year by year, and then use regression analysis to explore the relationship between the number of tourists in Southeast Asia and the number of cases of dengue fever.
We used simple linear regression to analyze the comparison between the three years of Taipei, New Taipei and Taoyuan in the Year of the Infant and the Year of Anti-Sacred Infant. We found that the average monthly temperature of anti-Holy infants in the northern region was compared with the number of dengue cases. related. The results of rainfall and dengue cases were investigated by independent sample t. It was found that the correlation was not high. We suspected that there might be a delay between the average rainfall and the number of cases, so there was an error. Finally, we explored that the number of tourists in Southeast Asia is related to the number of dengue cases.
As the number of tourists in Southeast Asia increases, the number of cases also grows.
Keyword:Rainfall, dengue fever, El Niño, independent sample t test, regression analysis
目錄
摘要...1
Abstract...2
目錄...3
第一章、 序論...4
第一節、 研究動機...4
第二節、 研究目的...4
第二章、 研究背景及登革熱基本介紹...5
第一節、 研究背景...5
第二節、 登革熱基本介紹...5
第三章、 研究分析方法...7
第一節、 資料蒐集...7
第二節、 探討北部聖嬰年與非聖嬰年的月均溫與該月登革熱病例數的關係 12 第三節、 探討降雨量與登革病例數的關係...12
第四節、 探討境外移入人數與登革熱病例數的關係...13
第四章、 結果分析與應用價值...14
第一節、 台北、新北、桃園區聖嬰年與反聖嬰年登革熱病例數的關聯(簡單 線性迴歸分析)...14
第二節、 全國平均降雨量高與平均降雨量低登革熱病例數的關聯(t檢定).21 第三節、 東南亞旅遊人數增加與登革熱病例數的關聯(t檢定、迴歸分析).22 第五章、 結論與討論...26
第一節、 結論...26
第二節、 討論...26
參考文獻與資料來源...27
4
第一章、 序論
第一節、 研究動機
登革熱是大家耳熟能詳的傳染病,從小時候就不時能夠在課本看見它,但在
生活中我們對此並沒有太大的防範意識,然而現今醫療進步,然而登革熱遍及全 球110國,每年約20,000人會因此死亡。該病由病毒引起,蚊子傳播,被歸類於 被忽視熱帶病之一,如 2015 年南台灣爆發登革熱疫情,就有超過四萬人染病、
200多人死亡,因為初始反應並不明顯,所以國人容易忽視,是潛藏於生活中的 一大危機。
近年來,我們居住的城市-台中,爆發出多起登革熱的確診病例,台灣其他地
區也有登革熱的疫情發生,因此引發我們對這個主題的動機,想透過統計分析方 法來研究哪些因素會造成登革熱疫情加重,而透過新聞與一些研究,我們整理出 三個可能影響登革熱加重的變數,暖化、水災和境外移入,來驗證他們是否會與 登革熱有關,對登革熱的發生率是否有影響。
第二節、 研究目的
在台灣登革熱並沒有專屬的疫苗或藥品,因此防範多於治療,然而我們透過
一些報導與研究表示台灣登革熱疫情的最大挑戰,疾病管制署監測資料顯示,今 年(2019年)截至 3月11日國內共計78例登革熱境外移入病例,為 10年同期最 高,其中自印尼境外移入之病例數為 22 例。近四年境外移入登革熱約有 8-31%
感染地為印尼。並且,中興大學昆蟲學系教授杜武俊就提出警訊,登革熱疫情已 經出現南北逆轉現象,以去年為例,南高屏病例數不到 30例,多達200 餘例全 集中北部及中部,全台都有風險。
因為登革熱與我們所學已產生很多變化,於是我們以登革熱作為主題,想探
討影響登革熱發生變異的原因,了解什麼原因導致登革熱病例數增長,以下我們 採用三項變數來進行我們的研究:台北、新北、桃園區聖嬰年與反聖嬰年、全國 平均降雨量與東南亞旅遊人數,去觀察各變數與登革熱的相關性。
第二章、 研究背景及 登革熱 基本介紹
第一節、 研究背景
登革熱這個詞大家都不陌生,近年來更是疫情不斷,全國各地都有病媒蚊的
蹤跡,2019 年全國 本土 病例 達 29,921 例,台南 市佔 21,874 例、高雄 市佔
7,521 例、 屏東 縣佔 151 例 ,雖然衛生局極力地在宣導如何防範病媒蚊,但還
是無法完全的鏟除,因此除了了解如何預防病媒蚊孳生,我們想更進一步的去探 討是甚麼因素影響了病媒蚊的增長,導致得登革熱的機率增加。
第二節、 登革熱基本介紹
登革熱,是一種登革病毒引起的急性傳染病,需具有感染力之病媒蚊叮咬,
人不會直接傳染給人。主要集中在熱帶、亞熱帶等有埃及斑蚊和白線斑蚊分布的 國家。
圖一、埃及斑蚊及白線斑蚊樣貌圖
如果感染過其中一型,就會對該型病毒終生免疫,對於其他型則有短暫的
免疫力,但未來仍可能再感染其他型病毒。潛伏期約為3至8天(最長可達14 天)。
一般人感染登革熱,會有高燒、全身酸痛等症狀,由於類似感冒,經常會
被忽略。典型登革熱除了有突發性的高燒(≧38℃),且還會有肌肉、骨頭關節的 劇痛、轉動眼球或按住眼球時,前額及後眼窩會感覺特別的痛,所以常常會聽 到老一輩的人會提到「斷骨熱」或「天狗熱」,其實指的就是登革熱。
此外,登革熱有時候,也會伴隨皮膚出疹的情形(先發生於胸部及軀幹,而
6
後擴散至四肢和臉部),而像這樣的皮疹,常會令人感到無比的搔癢跟疼痛,也 是跟一般的感冒及過敏不同的地方。
然而,若是先後感染不同型別之登革病毒,有更高機率可能成為「登革出
血熱」,登革熱出血熱除上述典型登革熱症狀外,另會有明顯的出血傾向,如果 沒有及時就醫或治療,死亡率可以高達50%。
目前沒有特效藥物可治療登革熱,所以感染登革熱的患者,一定要聽從醫
師的囑咐,多休息、多喝水、適時服用退燒藥,通常在感染後兩週左右就可自 行痊癒。此外,對於較嚴重的患者,一般會採「支持性療法」,就是提供患者 抗生素,或是注入營養液等藥物治療,藉這種方式來協助感染登革熱的患者恢 復體力或增強抵抗力。
為了避免蚊蟲孳生,澈底落實「巡、倒、清、刷」四步驟,仔細巡檢居家
室內、外可能積水的容器,將積水倒掉,留下的器具也都應該澈底清潔,去除 斑蚊蟲卵,收拾或倒置勿再積水養蚊。
第三章、 研究分析方法
第一節、 資料蒐集
我們從交通部中央氣象局的網站搜尋到過去聖嬰現象與反聖嬰現象發生的
年份資料,並從中選擇出近幾年發生聖嬰現象與反聖嬰現象的年份,聖嬰年我
們取2014~2016年,反聖嬰年則取2017~2018年。
圖二、聖嬰海溫指標註的時序圖,紅色及藍色區域分別代表聖嬰及反聖嬰事
觀測的地區我們從北部地區中選出台北區、新北區及桃園區,作為我們的觀
測站。而各測站的比較基準,我們蒐集交通部中央氣象局網站中各地去每月月均 溫的資料,並將位於台北區、新北區及桃園區的各個測站月均溫取平均,作為該 區月均溫。
表一、2014~2018年台北區月均溫
月份 2014 2015 2016 2017 2018
1月 13.00 12.70 12.83 14.47 13.27
2月 13.10 13.87 12.17 13.20 12.23
3月 15.30 15.80 15.27 14.90 16.70
4月 18.93 19.33 20.90 18.97 19.57
5月 22.03 22.87 23.43 22.03 24.13
6月 24.60 26.30 25.73 24.70 24.67
7月 26.60 26.27 26.53 26.33 26.07
8月 26.27 25.10 26.10 26.93 25.50
8
9月 25.77 23.87 24.20 25.63 24.33
10月 20.73 21.43 23.37 21.67 19.47
11月 18.60 19.80 18.90 18.97 19.00
12月 12.50 15.13 16.20 13.90 16.00
表二、2014~2018年新北區月均溫
月份 2014 2015 2016 2017 2018
1月 16.20 16.05 15.95 17.75 16.60
2月 15.85 16.65 14.65 16.35 14.90
3月 18.40 18.30 16.65 17.60 19.85
4月 22.20 22.20 23.10 22.00 23.15
5月 24.85 25.65 26.35 25.55 27.60
6月 27.75 29.50 28.55 27.55 28.15
7月 30.00 29.50 29.55 29.65 29.00
8月 29.50 28.30 29.35 30.50 29.00
9月 29.25 27.00 27.35 28.95 27.40
10月 24.15 24.95 26.50 25.15 22.60
11月 21.70 23.25 22.10 22.05 22.20
12月 15.90 18.65 19.60 17.55 18.85
表三、2014~2018年桃園區月均溫
月份 2014 2015 2016 2017 2018
1月 15.50 15.60 15.70 17.50 15.90
2月 15.20 15.80 14.30 15.90 14.20
3月 17.40 17.70 13.60 17.40 19.00
4月 21.50 21.50 22.60 21.90 22.60
5月 24.40 25.10 26.20 25.30 26.70
6月 27.50 28.90 28.70 27.60 27.40
7月 29.80 29.10 29.60 29.80 29.30
8月 29.30 28.00 29.10 29.90 28.70
9月 28.90 26.60 27.40 28.70 27.40
10月 24.10 24.70 26.30 25.20 23.10
11月 21.40 22.80 21.90 21.50 21.80
12月 15.90 18.40 19.30 17.20 18.50
北部地區患有登革熱的人數,我們從傳染病統計資料查詢系統中選取 2014 年~2018年這段時間中,台北、新竹及桃園有通報衛生署的登革熱病例數作為各 區病例數。
表四、2014~2018年台北區通報病例數
月份 2014年 2015年 2016年 2017年 2018年
1月 8 8 22 12 6
2月 3 5 15 12 18
3月 8 12 6 8 7
4月 6 4 13 13 17
5月 14 10 13 19 14
6月 12 18 14 13 25
7月 19 12 22 18 14
8月 14 22 28 26 67
9月 22 193 17 16 64
10月 30 111 13 19 33
11月 17 51 25 16 13
12月 16 48 21 13 16
表五、2014~2018年新北區通報病例數
月份 2014年 2015年 2016年 2017年 2018年
1月 2 7 16 8 7
2月 7 9 11 9 9
3月 4 13 14 12 8
4月 7 9 21 12 14
5月 11 17 27 16 16
6月 17 15 35 20 18
7月 16 13 31 28 68
8月 23 68 31 30 192
9月 24 192 31 21 154
10月 30 110 26 31 53
11月 27 66 10 20 42
12月 18 38 18 13 22
10
表六、2014~2018年桃園區通報病例數
月份 2014年 2015年 2016年 2017年 2018年
1月 3 1 12 4 3
2月 5 2 10 4 2
3月 5 5 6 10 5
4月 7 4 6 11 6
5月 5 9 12 8 7
6月 6 8 11 9 6
7月 15 5 20 12 16
8月 15 22 21 13 43
9月 7 104 15 15 55
10月 15 72 11 19 19
11月 3 41 8 13 9
12月 7 21 7 5 14
首先在登革熱病例數方面,我們由傳染病統計資料系統裡整理出2016年到
2018年每月的全國病例數與2006年到2018年的境外移入年病例數。資料如下 表X與表Y所示。
表七、2016年到2018年全國月病例數
2016病例數 2017病例數 2018病例數
1月 391 30 5
2月 37 22 16
3月 16 13 5
4月 22 11 16
5月 23 13 23
6月 23 22 34
7月 42 49 42
8月 74 56 124
9月 21 33 108
10月 44 47 66
11月 27 25 49
12月 24 22 45
表八、2006年到2018年全國年境外移入病例 西元年 境外病例數
2006年 109
2007年 176
2008年 226
2009年 204
2010年 304
2011年 157
2012年 207
2013年 264
2014年 240
2015年 365
2016年 363
2017年 333
2018年 350
在雨量方面,我們由交通部中央氣象局的每月氣象整理出2016年到2018 年全國的月雨量,並且算出平均雨量為200毫米,以此為標準,超過200毫米 即為雨量多的月份,反之則為雨量少。資料如下表X表示。
表九、2016年到2018年全國月雨量
月份 2016降雨量 2017降雨量 2018降雨量
1月 247.22 49.38 215.13
2月 98.70 76.00 98.56
3月 201.28 97.68 54.81
4月 181.54 128.19 60.35
5月 129.11 159.11 57.13
6月 291.79 541.51 272.99
7月 214.45 274.65 212.32
8月 187.77 137.40 504.94
9月 611.20 155.66 246.27
10月 347.97 368.05 145.52
11月 185.72 172.83 117.97
12月 61.04 138.42 165.06
12
在境外移入方面,由於東南亞為登革熱傳播主要地區,所以我們由交通部 觀光局的出國目的地人數統計整理出全國2006年到2018年出境東南亞的人 數,由圖所示,2011年起有明顯增加,因此以此為分界線,來探討。資料如下 表十表示。
表十、2006~2018年東南亞境外移入人口數 西元年 東南亞境外移入人口
2006年 1115126
2007年 1136435
2008年 1088023
2009年 959550
2010年 1210988
2011年 1387320
2012年 1336784
2013年 1479844
2014年 1353336
2015年 1653613
2016年 1744585
2017年 1938622
2018年 2191405
第二節、 探討北部聖嬰年與非聖嬰年的月均溫與該月登革熱通報病例數的關係
由於北部聖嬰年與非聖嬰年的月均溫與該月登革熱通報病例數兩者皆為計
量資料,我們使用簡單線性的迴歸分析,了解月均溫與該月登革熱通報病例數 間的相關程度。
簡單線性的迴歸模型: Ŷ=β0+β1X1,而此模型中的應變數X為月均溫,自變
數Y為該月登革熱通報病例數。
第三節、 探討降雨量與登革病例數的關係
在探討雨量與登革熱病例數的關係上,我們將資料分成雨量高與與量低兩
類,虛無假設設為雨量高時的病例數減掉雨量低時的病例數小於等於零,對立
假設設為雨量高時的病例數減掉雨量低時的病例數大於零,並利用雙獨立樣本t 檢定做檢測,來探討雨量比較高時,登革熱病例數會比較高。
第四節、 探討境外人數與境外移入登革熱病例數的關係
在探討境外移入人數與境外移入登革熱病例數的關係上,我們分成兩個部
分進行。
第一部分,我們先將資料分成2011年以前去東南亞的旅遊人數與2011年 以後的去東南亞的旅遊人數兩類,虛無假設設為2011年以後去東南亞的旅遊人 數減掉2011年以前去東南亞的旅遊人數小於等於零,對立假設設為2011年以 後去東南亞的旅遊人數減掉2011年以前去東南亞的旅遊人數大於零,並利用獨 立樣本T檢定做檢測,來瞭解2011年後去東南亞旅遊的人數增加。
第二部分,我們使用迴歸分析來瞭解去東南亞的旅遊人數與境外移入登革 熱病例數兩者的相關性程度。本文以簡單線性迴歸模型 Ŷ=β0+β1X1+ε 進行兩 者關係的探討,其中應變數(Y)設定為境外移入登革熱病例數,自變數(X1)為去 東南亞的旅遊人數。
14
第四章、 結果分析與應用價值
第一節、 北部聖嬰年與非聖嬰年的月均溫與該月登革熱病例數的關係(簡單線 性迴歸分析)
本研究是用簡單線性迴歸分析來探討台北區、新北區和桃園區分別在聖嬰
年與反聖嬰年時的月均溫與該月登革熱通報病例數關係。
(一) 台北區聖嬰年月均溫與該月登革熱通報病例數的關係
H
0: β
0= 0 H
0: β
1= 0
表十一、台北區聖嬰年月均溫與該月登革熱通報病例數之迴歸係數估計
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.3338 24.0442 0.014 0.989
temperature 1.1853 1.1584 1.023 0.313
假設顯著水準α=0.05,台北區聖嬰年的月均溫與登革熱病例數估計出的迴
歸方程式為Ŷ= 0.3338+1.1853X。
我們做了兩個假設檢定,首先是截距的H0是β0=0,截距的p-value是
0.989>α=0.05,所以不拒絕H0,代表截距可能等於0;第二個斜率的假設檢定
為H0是β1=0,斜率的p-value是0.313>α=0.05,也不拒絕H0,代表斜率可能
等於0。
表十二、台北區聖嬰年月均溫與該月登革熱通報病例數的解釋能力
R-squared Adjusted R-squared
0.02987 0.00134
我們計算出台北區聖嬰年的R-square是0.0299,只有百分之2,代表台北
區聖嬰年月均溫與登革熱病例數並沒有顯著關係。
此迴歸分析所使用之 R程式碼如下:
setwd('D:')
data <- read.csv("taipei.csv",header = T) attach(data)
head(data)
plot(number,temperature)
abline(lm(number~temperature),col='blue')
slm.model <- lm(number~temperature,data = data,x=T) summary(slm.model)
(二) 台北區反聖嬰年月均溫與該月登革熱通報病例數的關係
H
0: β
0= 0 H
0: β
1= 0
表十三、台北區反聖嬰年月均溫與該月登革熱通報病例數之迴歸係數估計
Estimate Std. Error t value Pr(>|t|)
(Intercept) -8.0441 12.3024 -0.654 0.5200
temperature 1.3925 0.5952 2.340 0.0288
假設顯著水準α=0.05,台北區反聖嬰年的月均溫與登革熱病例數估計出的
迴歸方程式為Ŷ= -8.0441+1.3925X
我們做了兩個假設檢定,首先是截距的H0是β0=0,截距的p-value是
0.5200>α=0.05,所以不拒絕H0,代表截距可能等於0;第二個斜率的假設檢定
為H0是β1=0,斜率的p-value是0.0288<α=0.05,是拒絕H0,代表斜率可能不
等於0。
表十四、台北區反聖嬰年月均溫與該月登革熱通報病例數的解釋能力
R-squared Adjusted R-squared
0.1992 0.1628
我們計算出台北區反聖嬰年的R-square是0.1992,將近百分之20,代表台
北區反聖嬰年月均溫與登革熱病例數是有關係的。
16
此迴歸分析所使用之 R程式碼如下:
setwd('D:')
data <- read.csv("taipei_.csv",header = T) attach(data)
head(data)
plot(number,temperature)
abline(lm(number~temperature),col='blue')
slm.model <- lm(number~temperature,data = data,x=T) summary(slm.model)
圖三、台北區在聖嬰年及反聖嬰年月均溫與病例數的散佈圖
藍色那條線就是我們估計出來的迴歸方程式,橫軸是月均溫,縱軸是病例數,
從兩者的斜率可以看出台北區反聖嬰年的病例數與月均溫比較有關係。
(三) 新北區聖嬰年月均溫與該月登革熱通報病例數的關係
H
0: β
0= 0 H
0: β
1= 0
表十五、新北區聖嬰年月均溫與該月登革熱通報病例數之迴歸係數估計
Estimate Std. Error t value Pr(>|t|)
(Intercept) -19.031 26.394 -0.721 0.476
temperature 2.034 1.111 1.830 0.076
假設顯著水準α=0.05,新北區聖嬰年的月均溫與登革熱病例數估計出的迴
歸方程式為Ŷ= -19.031+2.034X。
我們做了兩個假設檢定,首先是截距的H0是β0=0,截距的p-value是
0.476>α=0.05,所以不拒絕H0,代表截距可能等於0;第二個斜率的H0是
β1=0,斜率的p-value是0.076>α=0.05,也不拒絕H0,代表斜率可能等於0。
表十六、新北區聖嬰年月均溫與該月登革熱通報病例數
R-squared Adjusted R-squared
0.0897 0.06293
我們計算出新北區聖嬰年的R-square是0.0897,只有百分之9,代表新北
區聖嬰年月均溫與登革熱病例數沒有顯著關係。
此迴歸分析所使用之 R程式碼如下:
setwd('D:')
data <- read.csv("new_taipei_city.csv",header = T) attach(data)
head(data)
plot(number,temperature)
abline(lm(number~temperature),col='blue')
slm.model <- lm(number~temperature,data = data,x=T) summary(slm.model)
(四) 新北區聖反嬰年月均溫與該月登革熱通報病例數的關係
H
0: β
0= 0 H
0: β
1= 0
表十七、新北區聖反嬰年月均溫與該月登革熱通報病例數之迴歸係數估計
Estimate Std. Error t value Pr(>|t|)
(Intercept) -60.082 41.671 -1.442 0.1634
temperature 4.045 1.748 2.314 0.0304
假設顯著水準α=0.05,新北區反聖嬰年的月均溫與登革熱病例數估計出的
迴歸方程式為Ŷ= -60.082+4.045X。
我們做了兩個假設檢定,首先是截距的H0是β0=0,截距的p-value是
0.1634 >α=0.05,所以不拒絕H0,代表截距可能等於0;第二個斜率的H0是
β1=0,斜率的p-value是0.0304<α=0.05,是拒絕H0,代表斜率可能不等於0。
18
表十八、新北區聖反嬰年月均溫與該月登革熱通報病例數的解釋能力
R-squared Adjusted R-squared
0.157 0.1592
我們計算出新北區反聖嬰年的R-square是0.1957,將近百分之20,代表新
北區反聖嬰年月均溫與登革熱病例數是有關係的。
此迴歸分析所使用之 R程式碼如下:
setwd('D:')
data <- read.csv("new_taipei_city_.csv",header = T) attach(data)
head(data)
plot(number,temperature)
abline(lm(number~temperature),col='blue')
slm.model <- lm(number~temperature,data = data,x=T) summary(slm.model)
圖四、新北區在聖嬰年及反聖嬰年月均溫與病例數的散佈圖 藍色的線就是我們估計出來的迴歸方程式,橫軸是月均溫,縱軸是病例 數,從兩者的斜率可以看出新北區反聖嬰年的病例數與月均溫比較有關係。
(五) 桃園區聖嬰年月均溫與該月登革熱通報病例數的關係
H
0: β
0= 0 H
0: β
1= 0
表十九、桃園區聖嬰年月均溫與該月登革熱通報病例數之迴歸係數估計
Estimate Std. Error t value Pr(>|t|)
(Intercept) -7.8397 14.3960 -0.545 0.590
temperature 0.9859 0.6158 1.601 0.119
假設顯著水準α=0.05,桃園區聖嬰年的月均溫與登革熱病例數估計出的迴
歸方程式為Ŷ= -7.8397+0.9859X。
我們做了兩個假設檢定,首先是截距的H0是β0=0,截距的p-value是
0.590 >α=0.05,所以不拒絕H0,代表截距可能等於0;第二個斜率的H0是
β1=0,斜率的p-value是0.119>α=0.05,也不拒絕H0,代表斜率可能等於0。
表二十、桃園區聖嬰年月均溫與該月登革熱通報病例數的解釋能力
R-squared Adjusted R-squared
0.07011 0.04276
我們計算出新北區聖嬰年的R-square是0.0701,只有百分之7,代表桃園 區聖嬰年月均溫與登革熱病例數沒有顯著關係。
此迴歸分析所使用之 R程式碼如下:
setwd('D:')
data <- read.csv("taoyuan.csv",header = T) attach(data)
head(data)
plot(number,temperature)
abline(lm(number~temperature),col='blue')
slm.model <- lm(number~temperature,data = data,x=T) summary(slm.model)
20
(六) 桃園區反聖嬰年月均溫與該月登革熱通報病例數的關係
H
0: β
0= 0 H
0: β
1= 0
表二十一、桃園區反聖嬰年月均溫與該月登革熱通報病例數的迴歸係數估計
Estimate Std. Error t value Pr(>|t|)
(Intercept) -13.8484 10.6067 -1.306 0.2052
temperature 1.1590 0.4503 2.574 0.0173
假設顯著水準α=0.05,桃園區反聖嬰年的月均溫與登革熱病例數估計出的
迴歸方程式為Ŷ=-13.8484+1.159X。
我們做了兩個假設檢定,首先是截距的H0是β0=0,截距的p-value是
0.2052>α=0.05,所以不拒絕H0,代表截距可能等於0;第二個斜率的H0是
β1=0,斜率的p-value是0.0173<α=0.05,是拒絕H0,代表斜率可能不等於0。
表二十二、桃園區反聖嬰年月均溫與該月登革熱通報病例數的解釋能力
R-squared Adjusted R-squared
0.2314 0.1965
我們計算出桃園區反聖嬰年的R-square是0.2314,將近百分之23,代表桃
園區反聖嬰年月均溫與登革熱病例數是有關係的。
此迴歸分析所使用之 R程式碼如下:
setwd('D:')
data <- read.csv("taoyuan_.csv",header = T) attach(data)
head(data)
plot(number,temperature)
abline(lm(number~temperature),col='blue')
slm.model <- lm(number~temperature,data = data,x=T) summary(slm.model)
圖五、桃園區在聖嬰年及反聖嬰年月均溫與病例數的散佈圖
藍色的線就是我們估計出來的迴歸方程式,橫軸是月均溫,縱軸是病例
數,從兩者的斜率可以看出桃園區反聖嬰年的病例數與月均溫比較有關係。
第二節、 全國平均降雨量高與平均降雨量低登革熱病例數的關聯(t檢定) 本文為了探討雨量對登革熱病例數的影響,利用2016年到2018年得每月 雨量算出平均,以此作為標準,來分辨雨量高與雨量低的月份。
=200
透過假設檢定方式來檢測在雨量高與雨量低的情況下,登革熱病例數的差 異。本研究以雙獨立樣本t檢定來進行雨量高低情況下與登革熱病例數的關 係,此假設檢定之虛無假設與對立假設如下:
H
0:雨量高時的病例數 -雨量低時的病例數 ≤ 0 H
1:雨量高時的病例數 -雨量低時的病例數 > 0
由表X分析結果可知,t檢定的結果顯示p-value=0.0801>α=0.05,表示沒 有足夠證據可拒絕虛無假設H0,可知在雨量高低不同的情況下,登革熱病例數 沒有顯著差異。
三年降雨量樣本數據 36個月
22
表二十三、雨量高低下的登革熱病例數差異獨立樣本t檢定 獨立樣本t檢定
t 自由度 顯著性(單尾)
1.4859 13.56 0.0801
獨立樣本 t檢定所使用之 R 程式碼如下:
setwd('D:')
test <- read.csv('rainy.csv',header=T,sep=',') head(test)
attach(test) var.test(high,low)
t.test(high,low, alternative='greater', var.equal=F)
因為沒有顯著差異,因此我們做了與量與病例數的折線圖,如圖六表示,
我們發現平均雨量與病例數之間可能有延遲因素,因此出現誤差。
圖六、平均雨量與病例數折線圖
第三節、 東南旅遊人數增加與登革熱病例數的關聯(t檢定、迴歸分析)
本文以t檢定與回歸分析來探討東南亞旅遊人數與登革熱病例數的關係。
我們先透過假設檢定來檢測2011年前與2011年後到東南亞的旅遊人數有 明顯差異。本研究以獨立樣本t檢定來檢定兩者之間的關係,此假設檢定之虛 無假設與對立假設如下:
H
0:100 年後東南亞旅遊人數 - 100 年前東南亞旅遊人數 ≤ 0 H
1:100 年後東南亞旅遊人數 - 100 年後東南亞旅遊人數 > 0
由表X分析結果可知,t檢定的結果顯示p-value=0.04483<α=0.05,表示有 足夠證據可拒絕虛無假設H0,可知2011年之後東南亞旅遊人數與2011年前有 明顯的差異,2011後去東南亞旅遊人數明顯增多。
表二十四、2011年前與2011年後到東南亞的旅遊人數差異獨立樣本t檢定 獨立樣獨立樣本t檢定定
t 自由度 顯著性(單尾)
1.861 11 0.04483
獨立樣本 t檢定所使用之 R 程式碼如下:
setwd('D:')
test <- read.csv('beside.csv',header=T,sep=',') head(test)
attach(test)
var.test(behind100, before100)
t.test(behind100, before100, alternative='greater',var.equal=T)
根據上述結果,我們以2011年作為分界點,來探討去東南亞旅遊人數多與 否會影響登革熱境外移入病例數。首先,以兩者散布圖來觀察,如圖七,可看 出兩者之間呈現出正向關係,因此,將進一步以迴歸模式來探討兩者之間的線 性關係。
H
0: β
0= 0 H
0: β
1= 0
表二十四、東南亞旅遊人數對登革熱境外移入病例數之迴歸係數估計 Estimate Std. Error t value Pr(>|t|)
(Intercept) 16.3912 6.813e+01 0.089 0.93107
temperature 0.7053 4.628e-05 3.741 0.00326
假設顯著水準α=0.05,東南亞旅遊人數與境外病例數估計出的迴歸方程
Ŷ=16.3912+0.7053X。
24
我們做了兩個假設檢定,首先是截距的H0是β0=0,截距的p-value是
0.93107>α=0.05,所以不拒絕H0,代表截距可能等於0,第二個斜率的假設檢
定為H0是β1=0,斜率的p-value是0.00326<α=0.05,拒絕H0,代表斜率可能
不等於0。
圖七、東南亞旅遊人數與境外病例數散佈圖
本文以簡單線性迴歸模式進行探討,以東南亞旅遊人數做為解釋變數,登 革熱境外移入病例為應變數。首先,以迴歸分析的結果來觀察東南亞旅遊人數 對於登革熱境外移入病例的解釋能力,由 R 平方值可觀察解釋變數的解釋能 力,R 平方值越接近 1 會代表解釋變數對應變數的解釋能力越好。由表x可 知,以東南亞旅遊人數做為解釋變數來解釋登革熱境外移入病例的 R 平方值有 0.56,表示有 56%的解釋能力,即東南亞旅遊人數能解釋登革熱境外移入病例 的變異之比例約為六成,顯示東南亞旅遊人數具有一定程度的解釋能力。
表二十五、東南亞旅遊人數對登革熱境外移入病例數的解釋能力
模型 R R平方 調成後R平方 估計的標準誤
1 0.75 0.56 0.52 58.13
計值皆達顯著,顯示東南亞旅遊人數對登革熱境外移入病例具有顯著關係 存在,其迴歸關係可表示為:革熱境外移入病例Ŷ=16.3912+0.7053X東南亞旅 遊人數。因為東南亞旅遊人數的係數(斜率)估計值為正的,所以代表當東南亞旅 遊人數增加時,登革熱境外移入病例也會跟著增加。
此迴歸分析所使用之 R程式碼如下:
setwd('D:')
test <- read.csv('play.csv',header=T,sep=',') head(test)
attach(test)
plot(test$o,test$p)
abline(lm(test$o~test$p),col="red") slm.model=lm(test$o~test$p,data=test) slm.model
summary(slm.model)
26
第五章、 結論與討論
第一節、 結論
在這次的報告中,我們有關登革熱疫情的資料、數據來源大多來自於衛生
福利部疾病管制局。而分析方法,使用了迴歸分析,了解月均溫與該月登革熱 通報病例數間的相關程度;利用雙獨立樣本t檢定做檢測,來探討雨量比較高 時,是否登革熱病例數會比較高;利用獨立樣本t檢定和迴歸分析在,探討境 外移入人數與境外移入登革熱病例數的關係。
使用了迴歸分析,擷取三個城市來做月均溫與該月登革熱通報病例數關係
分析,分別是桃園、新北、台北,發現在聖嬰年時,三座城市的月均溫與登革 熱病例數並沒有顯著關係,相反的在反聖嬰年時有關係的。
利用雙獨立樣本t檢定做檢測,發現在雨量高與雨量低時和病例數並沒有
顯著差異,推斷可能有延遲因數,因此出現誤差。
利用獨立樣本t檢定和回歸分析中,數據顯示,東南亞旅遊人數對登革熱
境外移入病例具有顯著關係存在,因為東南亞旅遊人數的係數(斜率)估計值為正 的,所以代表當東南亞旅遊人數增加時,登革熱境外移入病例也會跟著增加。
第二節、 討論
根據分析結果顯示,月均溫和去東南亞旅遊的人數跟登革熱的病例數都有
些許關係,所以可推斷溫度會對病媒蚊的生長產生影響,而去東南亞旅遊的人 數增加,可能會將病原帶回台灣,導致在東南亞旅遊人數增加的時期,得到登 革熱的人數明顯的增加。
而令我們最意想不到的是,在雨量高低不同的情況下,登革熱病例數沒有
顯著差異,由平均雨量與病例數折線圖來看,我們推斷或許有延遲因數,例 如;病媒蚊的生長時間和傳播病原的時間等。
參考文獻與資料來源
1.登革熱介紹。上網時間:2019年9月15日,取自:
https://health.tainan.gov.tw/dengue/page.asp?orcaid=%7B2EAA00E6-470E-47F9- 9DEE-8B2DD2112C85%7D
2.交通部中央氣象局。上網時間:2019年9月15日,取自:
https://app.cwb.gov.tw/web/climate_info/climate_knowledge/knowledge_2/knowledg e_2_3.html
3.交通部中央氣象局。上網時間:2019年9月15日,取自:
https://www.cwb.gov.tw/V7/climate/monthlyData/mD.htm
4.傳染病統計資料查詢系統。上網時間:2019年9月15日,取自:
https://nidss.cdc.gov.tw/ch/NIDSS_Diagram.aspx?dc=1&dt=4&disease=061&positio n=2
5.傳染病統計資料查詢系統。上網時間:2019年9月15日,取自:
https://nidss.cdc.gov.tw/ch/NIDSS_DiseaseMap.aspx?dc=1&dt=4&disease=061
6.強化區域合作疾管署與印尼共同推動登革熱防治計劃。上網時間:2019年9
月15日,取自:https://www.taiwannews.com.tw/ch/news/3657799
7.2018近6年中華民國國民出國目的地人數統計。上網時間:2019年9月15
日,取自:
https://admin.taiwan.net.tw/FileUploadCategoryListC003330.aspx?CategoryID=e0fde ea6-1df9-4454-829f-510504a3b9e9&appname=FileUploadCategoryListC003330