從數據認識 2019 冠狀病毒病疫 情
高中數學科必修部分:統計的應用
教育局課程發展處
1
認識本地疫情
我們若希望對本地新型冠狀病毒病疫情有更深入的 認識,探討各年齡組別感染病毒的情況,我們該如 何著手?
在開始尋找相關數據和作出分析前,提醒同學們
◦ 應從可靠來源尋找數據(例如相關政府部門網頁 )
◦ 抱持小心、嚴謹的態度分析數據,避免主觀、失實的
結論
認識本地疫情
我們若希望對本地新型冠狀病毒病疫情有更深入的 認識,探討各年齡組別感染病毒的情況,我們該如 何著手?
可靠的數據的來源:
◦ 例如政府部門的數據,政府的「資料一線通」網頁提 供衛生署的 2019 冠狀病毒病數據(除數據準確可靠 外,亦提供 CSV 檔,可利用試算表軟件開啟分析)。
https://data.gov.hk/tc-data/dataset/hk-dh-chpsebcddr-nov el-infectious-agent
3
活動一:利用資訊科技分析確診者年齡
先從上頁「資料一線通 : 2019 冠狀病毒病的數據」網址下 載最新「本港疑似 / 確診 2019 冠狀病毒的個案詳情」的 數據。在這活動同學們將使用試算表分析數據並完成下表
。
確診個案 男性 女性 整體人數
年齡
分佈域 平均數 眾數 中位數 上四分位數 下四分位數
以下步驟示範如何整理有關男性確診者的數據。
5
步驟 2 :從「常用」 選「排序與篩選」 選「篩選」
步驟 1 :從「資料一線通 : 2019 冠狀病毒病的數據」的網址下載最新數據。
步驟 3 :先按下「性別」 旁的箭號,只選「男」並按「確定」,然後按 下「確診 / 疑似個案」 旁的箭號,只選「確診」並按「確定」 ,可得出 只包括男性確診者的資料。工作表下方顯示有「 599 筆記錄」,即男性 確診人數為 599 。 ( 截至 2020 年 6 月 16 日的數據 )
7
步驟 4 :用滑鼠點選第一項年齡資料〈即 E2 儲存格〉,然後同時按下 三個鍵「 Shif 」、「 Ctrl 」及下箭咀 ,即可選取所有男性確診者的年齡 數據,按下「 Ctrl 」及「 C 」把資料複製 。
步驟 5 :按下「工作表 1 」旁的「加號」以建立新的工作表
。
步驟 6 :點選「工作表 2 」的 A1 儲存格,然後按下
「 Ctrl 」及「 V 」把全部男性確診者的年齡數據複製到
「工作表 2 」的欄 A 〈如右圖所示〉。
確診個案 男性
人數 599
年齡
分佈域 平均數 眾數 中位數 上四分位數 下四分位數
然後,我們會利用不同函數以求得下表各數值。
9
步驟 7a :在欄 C 輸入相關資料,在欄 D 相應儲存格輸入不同公式。
由於這活動涉及大量數據,因此建議運用資訊
科技計算各統計量,同學們可集中分析結果。
步驟 7b :在欄 C 輸入相關資料,在欄 D 相應儲存格輸入不同公式。
11
步驟 7c :在欄 C 輸入相關資料,在欄 D 相應儲存格輸入不同公式。
活動一:利用資訊科技分析確診者年齡
確診個案 男性 女性 整體
人數 599
年齡
分佈域 93
平均數 37.1
眾數 20
中位數 35
上四分位數 51
下四分位數 22
a) 試參考以上步驟,找出女性及整體的相應數據,完成下 表。
b) 試以箱型圖分別表示男性、女性和整體確診個案
的年齡。並比較三者的分佈。
13
參考答案如下(以截至 2020 年 6 月 16 日的數據計算而 得)
確診個案 男性 女性 整體
人數 599 513 1112
年齡
分佈域 93 95 96
平均數 * 37.1 38.2 37.6
眾數 20 20 20
中位數 35 34 35
上四分位數 51 52 52
下四分位數 22 23 22
*準確至三位有效數字
觀察箱型圖,我們發現男性確診者、女性確診者和整體確診者的年齡分佈非常相似。
男性、女性和整體確診者的年齡 ( 截至 2020 年 6 月 16 日的數據 )
我們可以利用 GeoGebra 軟件,輸入以下指令以繪畫所需的箱型圖
。
BoxPlot 指令為「 BoxPlot(50, 5, 0, 22, 35, 51, 93)」,當中 7 個數字的 意思依次序為:箱型圖位置的高低
,箱型圖的闊度,最小值,下四分 位數,中位數,上四分位數和最大 值。
15
活動二:比較不同年齡組別的情況
觀察與猜想
觀察上表和箱型圖,有同學發現不論是男性、女性或整體,
有 25% 的數據集中於二十多歲至三十多歲之間,而年齡眾
數均為二十歲。這些結果是否顯示二十多歲的年齡組別較其
他年齡組別更普遍地感染 2019 冠狀病毒病?
活動二:比較不同年齡組別的情況
分析
要知道猜想是否正確,我們要留意由於各年齡組別的人數本身 已有差異,因此我們還需要各年齡組別總人數的數據,才可以 進一步了解哪個年齡組別的人士較普遍感染 2019 冠狀病毒病
。
2018 年年中按年齡及性別劃分的香港人口
圖表來源 : 「政府統計處 : 統計與生 活」
17
年齡組別 0-14 15-24 25-34 35-44 45-54 55-64 65+ 總人數 男性
女性 整體
活動二:比較不同年齡組別的情況
a) 利用活動一「本港疑似 / 確診 2019 冠狀病毒的個案詳
情」的數據,完成下表。
活動二:比較不同年齡組別的情況
本港 2019 冠狀病毒病確診個案的年齡分佈 ( 截至 2020 年 6 月 16 日的數據 )
你懂得利用試算表求以上數 據嗎?
年齡組別 0-14 15-24 25-34 35-44 45-54 55-64 65+ 總人數 男性 24 165 105 111 63 88 43 599 女性 17 128 114 76 56 76 46 513 整體 41 293 219 187 119 164 89 1112
19
活動二:比較不同年齡組別的情況
b) 試從政府統計處網頁找出「按年齡組別劃分的人口」數 據,分析哪個年齡組別的人士較普遍感染 2019 新型冠 狀病毒病。
還記得我們要從可靠來源獲取數據嗎?
政府統計處:
https://www.censtatd.gov.hk/hkstat/hk
if/index_tc.jsp
從試算表的計算結果得知,不同年齡組別的確診人數佔該組別總人數 的百分比介乎 0.004% 至 0.047% 不等。其中,男性和女性確診百分 比最高的年齡組別皆為 15-24 歲,而確診百分比最低的年齡組別皆為
年齡組別 0-14 15-24 25-34 35-44 45-54 55-64 65+
男 性
確診人數 24 165 105 111 63 88 43
總人數 450 700 350 600 454 000 465 200 497 000 589 400 616 100
百分比 0.005% 0.047% 0.023% 0.024% 0.013% 0.015% 0.007%
女 性
確診人數 17 128 114 76 56 76 46
總人數 424 200 348 500 594 800 712 600 665 100 633 300 705 900
百分比 0.004% 0.037% 0.019% 0.011% 0.008% 0.012% 0.007%
整 體
確診人數 41 293 219 187 119 164 89
總人數 874 900 699 100 1 048 800 1 177 800 1 162 100 1 222 700 1 322 000
百分比 0.005% 0.042% 0.021% 0.016% 0.010% 0.013% 0.007%
21