第二章 文獻回顧
第四節 過去時間數列分析法於其他傳染病之文獻結果
時間數列分析應用於傳染病之流行病學,有逐漸上升與多元化運用的趨勢,包括流 行性出血熱(Epidemic Hemorrhagic Fever)、急性病毒性肝炎、腸病毒感染併發重症、
嚴重急性呼吸道症候群(SARS)、類流感等傳染病,顯示時間數列分析對於傳染病的觀 察、分析與預測有所助益,相關文獻摘要如下述:
賴錦皇、邵文逸與張玉坤(2004)針對台灣地區類流行性感冒流行趨勢,建構
SARIMA(1,1,0)(1,1,0)52模型最適合類流感之時間數列資料,比起三角函數模型具有較小
平均平方誤差(MSE)、平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)等誤 差值。顯示以SARIMA模型建立類流感流行趨勢之預測模型,可提供給防疫單位了解類 流感之趨勢及監測。
有關於中國之SARS疫情,于桂榮與張建華(2005)運用時間數列分析法建立預測 模型,觀測北京市2003年4月27日至同年5月28日「國家疾病報告管理系統」之SARS 通 報 病 例 數 、 治 癒 出 院 人 數 通 報 病 例 數 及 疑 似 病 例 通 報 病 例 數 , 建 立 ARMAV
(Autoregressive moving average vector)模型,進行未來疫情擴散的預測,發現此模型在 新增SARS病例與SARS疑似病例之預測是可行的。
熊昭(2005)以台灣地區1999年至2004年類流感與腸病毒資料建立預測模型,使 用季節性自我相關整合移動平均模型(Seasonal ARIMA Model),並且對模型進行估計 與檢定。類流感通報病例數數列與氣溫數列之轉換函數模型,經由離群值調整(outlier adjustment)後之結果顯示,上一週週均溫與上兩週週均溫對類流感通報病例數有顯著性 之影響,亦即溫度愈低,類流感通報個案數呈現愈多的趨勢。另外針對腸病毒通報病例,
台北市及台中市之腸病毒平均通報數與平均溫度沒有相當的正比關係,因此以轉換函數 模型( Transfer Function Model )來分析資料較不理想。
27
吳家兵、葉臨湘與尤爾科(2006)以1986年至2002年中國東風汽車公司疾病控制 所之法定傳染病發病人數之月資料分析,以ARIMA模型建模並預測2003年發病率,發 現模型預測值的動態趨勢與實際值大致相同,模型對未來的情況呈現良好的追蹤與預 測。2003年各月的實際發病率雖然與預測值不完全一樣,但各月實際值都落入預測值的 可信賴區間。
金必紅等人(2008)利用時間數列分析之指數平滑法,研究1990年至2006年上海 市急性病毒性肝炎,以年發病率為觀察指標,研究發現時間數列模型平穩性好,其預測 2007 至 2010 年上海市病毒性肝炎發病率之結果顯示,若無外來影響情況下,發病率將 持續走低,並控制在30/10萬左右,2007年上海市病毒性肝炎發病率值計為24.09/10萬,
與預測值30.7/10萬比較,誤差為-6.61/10萬,相對誤差為-27.44%。
施惠蘭(2008)則是利用行政院衛生署疾病管制局之法定傳染病通報系統數據中,
腸病毒感染併發重症資料庫,由北而南分為五區,包括台北區、北區、中區、南區、高 屏區,利用時間數列分析交叉相關(Cross Correlation)分析,觀察1999年1月至2008 年12月腸病毒病例數之月資料,五區建構之最適模型:台北區和北區為AR(1)模型,中 區、南區和高屏區為 AR(2)模型,顯示其以非常低階的時間數列 AR 模型,描述腸病毒 疫情之擴散行為,且非常趨近其物理現象。
流行性出血熱,又稱為腎綜合症出血熱(hemorrhagic fever with renal syndrome),主 要是由老鼠所傳播的漢他病毒,一種感染致病的人畜共通傳染病,臨床上以發熱、出血、
腎臟損害為主要特徵,由於病情嚴重且死亡率高,一直都是中國大陸重要傳染病,例如 福建省以時間數列分析2004-2007年流行性出血熱每月發病數,建立季節分解(seasonal decomposition)模型,研究結果發現,福建省流行性出血熱的月發病數有明顯的季節性 因子存在,同時發病數總體呈現上升趨勢,且2005年呈現相對流行高峰(李宏等,2009);
28
江蘇省以 1980-2000 年間腎綜合症出血熱每月發病數資料,考慮其季節性與週期性,而
建立 ARIMA 季節性相乘模型,發現預測值與實際值基本吻合,對於短期預測來說,模
型參數的決定使用最大概似法效果好,對於中長期預測使用最小平方法計算結果較好(彭 志行等,2008)。
在公共衛生領域裡,傳染病會受到許多因素的影響,且影響因素間又存在著複雜的 關聯性,單純以因果模型難以說明,而且傳染病通常也具有長期趨勢、季節性、週期性 等特性,數據間存有相依關聯之特性,因此,綜合上述文獻,對於傳染病趨勢特性分析,
運用時間數列分析是一種有效的方法。
29 表 2-2 其他傳染病時間數列分析之文獻比較
作者(年代) 資料來源 衡量方法 觀察期間 觀察指標 結果 賴錦皇、邵文逸、
張玉坤
(2004)
衛生署疾病 管制局定點 醫師通報資 料庫
SARIMA模 型、三角函數 模型
1999年第1 週至2004年 第44週
定點醫師類流感 資料、氣象資料
1. 歷年自第48週開始增加,至12 月進入高峰,一般持續至第七週。
2. SARIMA(1,1,1)(1,1,0)52模型為最 佳配適模型。
3. 各區之溫度平均每增加攝氏一 度,則通報病例數會減少約0.35個,平 均溫度此一變相達統計上之顯著意義。
4. 預測指標:MSE=29.54,
MAE=4.08,MAPE*100=19.80。
熊昭
(2005)
衛生署疾病 管制局定點 醫師通報資 料
SARIMA模 型、轉換函數 模型
1999年第1 週至2005年 第46週
類流感與腸病 毒、平均溫、最 高溫、最低溫、
累積降雨量
1. SARIMA模型較能符合腸病毒
及類流感之時間數列資料。
2. 類流感通報病例數數列與氣溫 數列結果顯示,上一週週均溫與上兩週 週均溫對類流感通報病例數有顯著性之 影響,亦即溫度愈低,類流感通報個案 數呈現愈多的趨勢。
3. 腸病毒通報病例,台北市及台中 市之腸病毒平均通報數與平均溫度沒有 相當的正比關係,因此以轉換函數模型 ( Transfer Function Model ) 來分析資料 較不理想。
30
作者(年代) 資料來源 衡量方法 觀察期間 觀察指標 結果 于桂榮、張建華
(2005)
中國國家疾 病報告管理 系統
ARMAV模型 2003年4月 27日至5月 28日
北京市SARS病 例報告數、治癒 出院人數報告 數、疑似病例報 告數
1. 模型(11)可提供較準確的預測結 果。
2. 對2003年5月28日北京市新增 SARS病例與SARS疑似病例的多維預 測模型是可行的。
吳家兵、葉臨湘、
尤爾科
(2006)
中國東風汽 車公司疾病 控制所
ARIMA模型 1986-2003年 法定傳染病發病 數
以1986-2002年間的月資料分析與建模,並
預測2003年發病率,結果發現發病率的實際 值雖然與預測值不完全一樣,但都落入預測 值的信賴區間。
金必紅等人
(2008)
上海市急性 病毒性肝炎 總疫情資料
指數平滑法 1990-2006年 急性病毒性肝炎 年發病率
1. 2007-2010年病毒性肝炎未來預測:2007 年發病率為30.70/10萬、2008年發病率 為27.35/10萬、2009年發病率為24.01/10 萬、2010年發病率為20.66/10萬。
2. 2007年上海市病毒性肝炎實際報告發病 率為24.09/10萬,誤差為-6.61/10萬,相 對誤差為-27.44%。
3. 時間數列模型平穩性好。
施惠蘭
(2008)
行政院衛生 署疾病管制 局之法定傳 染病通報系 統
時間數列分析 交叉相關
(Cross Correlation)分 析
1999年1月 至2008年12 月
腸病毒感染併發 重症病例數之月 資料
五區建構之最適模型:台北區和北區為AR(1) 模型,中區、南區和高屏區為AR(2)模型,
顯示其以非常低階的時間數列-AR模型描述 腸病毒疫情之擴散行為且非常趨近其物理現 象。
31
作者(年代) 資料來源 衡量方法 觀察期間 觀察指標 結果 彭志行等人
(2008)
江蘇省疾病 管制中心
ARIMA相乘 季節性模型
1980-2000年 江蘇省腎綜合症 出血熱(又稱流 行性出血熱)
1. 考慮其季節性與週期性,以1980-2000 年發病資料建立ARIMA相乘季節性模 型,發現預測值與實際值基本穩合 2. 對於短期預測來說,模型參數的決定使
用最大概似法效果好,對於中長期預測 則使用最小平方法計算結果較好。
李宏、洪榮濤、黃 文龍、謝忠杭、章 燦民
(2009)
中國疾病預 防控制疾病 監測信息報 告管理系統
季節分解
(seasonal decomposition
)模型
2004-2007年 福建省流行性出 血熱月發病率
福建省流行性出血熱按月分佈的發病數有明 顯的季節性因子存在,同時發病數總體呈現 上升趨勢且2005年呈現相對流行高峰。
備註:平均平方誤差(Mean Square Error, MSE),平均絕對誤差(Mean Absolute Error, MAE),平均絕對百分比誤差(MAPE, Mean Absolute Percentage Error)。
資料來源:自行整理
32