報告題名:台北地區臭氧總量預測分析
作者:康勤儒、吳懿倢、蔡苓筠、林予婷、曾譯賢 系級:統計學系 三年乙班 學號:D9645405、D9659802、D9639229、D9789692、D9639471 開課老師:陳婉淑 教授 課程名稱:統計預測方法 開課系所:統計學系 開課學年:九十八學年度 第二學期簽署文件
本期末報告是由 康勤儒、吳懿倢、蔡苓筠、林予婷、曾譯賢 共 5 人 所共同撰寫。 我們充分瞭解如果違反以下三點事項;稱之違反學術倫理。 1.剽竊網路上的結果或報告。 2.捏造或篡改數據。 3.重覆使用其他課程提交的報告。 我們願意緊守學術倫理,若經檢舉有發現以上事項;我們願意接受 一切後果,包括最後成績評量為不及格。 成員親筆簽名:中文摘要
臭氧層(Ozone Layer)為地球的保護膜,可以保護地球上的生命體 不受紫外線的傷害。而臭氧的減少不只會對人體造成損傷,更會破壞 自然生態的平衡,所以,臭氧洞的出現及臭氧層日漸稀薄的問題不再 只是科學家的研究對象,更是與我們有切身相關的環保議題!管制氟 氯碳化物使用之國際公約「蒙特婁破壞臭氧層物質管制議定書」規定 在 1996 年前完全停止生產氟氯碳化物,全球非第五條約國(包括台灣) 均不得生產、進口此類物質。因此我們想藉由此報告了解禁用氟氯碳 化物後對於台北上空臭氧量有無影響,並且應用所學的統計預測方法 加以適當分析,預測未來一年的臭氧量,可做為之後因應對策的參考。 本研究報告所使用的資料為月資料,並保留最後 12 筆做預測。首 先,判斷原始時間序列圖之變異數及平均數是否平穩,再運用時間序 列迴歸、ARIMA、指數平滑法及分解法四種方法配適模型,最後將配適 模型之預測值及先前保留的 12 筆資料做比較,依據 MAE、MSE、MPE 及 MAPE 四個準則選出最佳模型。我們的最佳模型為時間序列迴歸。 本研究報告的預測期間在西元 1999 年 1 月至 2009 年 12 月,此時 臭氧層破壞速度已減慢,在加上台灣的地理位置在北半球,而不是在 北極或南極,原本的影響就很小,故台北上空臭氧總量並無太大變化。 關鍵字: ARIMA、分解法、臭氧總量、統計預測、指數平滑法、時間序列迴歸目 次
第一章 緒 論...08 第一節 研究動 機...08 第二節 研究目 的...08 第三節 研究背 景...08 第四節 資料敘 述...09 第五節 研究方 法...09 第二章 預測與分 析...10第一節 時間序列迴歸(Time Series Regression)...11 第二節
第四節 分解法(Decomposition Methods)...24 第五節 最佳模 型...31 第三章 結論與建 議...32 第一節 結 論...32 第二節 建 議...32 參考文 獻...33 會議紀 錄...34
圖目錄
【圖 1】原始資料的時間序列圖...10【圖 2】Seasonal Dummy + AR(1) 的預測圖...14
【圖 3】ARIMA(0,1,0)s 的 ACF 及 PACF...17
【圖 5】ARIMA(3,0,0)(1,1,0)s NOINT 的 White Noise
及 Unit Root...18
【圖 6】ARIMA(3,0,0)(1,1,0)s NOINT 的預測圖...20
【圖 7】Additive Holt-Winters model 的預測圖...23
【圖 8】Trend-Cycle 因素及原始資料的時間序列圖...25 【圖 9】Seasonal 因素的時間序列預測圖...25 【圖 10】Irregular 因素的時間序列圖...26 【圖 11】Deseasonalized 因素及原始資料的時間序列圖...26 【圖 12】Trend-Cycle 因素及其預測值的時間序列圖...27 【圖 13】Additive Model 的實際值及預測圖的時間序列圖...27
【圖 14】Additive Model + AR(2)的預測圖...30
表目錄
【表 1】Time Series Regression 的 DW 檢定表...12【表 2】Time Series Regression 原始的自我相關表...12
【表 5】Seasonal Dummy + AR(1) 的預測表現...15
【表 6】ARIMA(4,0,0)(1,1,0)s NOINT 的參數估計表...17
【表 7】Ljung-Box 檢定...19
【表 8】ARIMA(3,0,0)(1,1,0)s NOINT 的參數估計表...19
【表 9】ARIMA(3,0,0)(1,1,0)s NOINT 的預測表現...20
【表 10】Additive Holt-Winters model 的參數估計表...22
【表 11】Additive Holt-Winters model 的預測表現...23
【表 12】Additive Model 的 DW 檢定表...28 【表 13】Additive Model 原始的自我相關表...28 【表 14】Additive Model 修正的自我相關表...28 【表 15】Additive Model 最終的自我相關表...28 【表 16】Additive Model 的參數估計表...29 【表 17】Additive Model 自我相關的參數估計表...29
【表 18】Additive Model + AR(2)的預測表現...30
第一章 緒論
第一節 研究動機
臭氧層(Ozone Layer)可以吸收波長 230 至 350 Å (埃)的紫外線, 成為地球上的一層保護膜,保護地球上生命體不受到紫外線的傷害。 臭氧的減少對於居住在地球上的生命體有著重大影響,失去臭氧
動物免疫系統受抑制,植物生長遲滯,農作物減產,破壞自然生態的 平衡,由兩極所照進來的紫外線變多,造成溫度上升,冰山融化,使 得地球的海平面上升等不良影響。 雖然臭氧洞出現的地方是在遙遠的南極,但其實世界各地大氣中 的臭氧都已日漸稀薄。從皮膚癌到汽車冷媒,臭氧洞不再只是科學家 的研究對象,或是報紙上的新聞事件,而是與每個人都有切身關係的 環保議題!
第二節 研究目的
1987 年 9 月 16 日,由全世界二十六個國家共同簽署「蒙特婁破 壞臭氧層物質管制議定書(Montreal Protocol on Substances thatDepletethe Ozone Layer)」,管制氟氯碳化物使用之國際公約,於 1989
年 1 月起正式生效。蒙特婁議定書規定在 1996 年前完全停止生產氟 氯碳化物,全球非第五條約國(包括台灣)均不得生產、進口此類物質。 我們想藉由此報告了解禁用氟氯碳化物對於台北上空臭氧量有無 影響,並且應用所學的統計預測方法加以適當分析,預測未來一年的 臭氧量,可做為之後因應對策的參考。
第三節 研究背景
1973 年,美國化學家馬里奧·莫利納(José Mario Molina-Pasquel Henríquez)首次警告地球上的臭氧層已受到損害,但此說法並未得到 各國政府重視。1974 年,莫利納和其他科學家宣布使用氟氯碳化物 (CFCs)對臭氧層有不良影響,他們號召全面禁止繼續排放氟氯碳化物 到大氣中,但許多科學家和生產廠商都懷疑他們的說法,因而一直無 法達成共識以開始行動。直到 1976 年美國國家科學院出版了一個有關 這個問題的評論報告,管制氟氯碳化物行動才得以開始。 根據調查顯示,自 1978 年開始的十年內,全球各緯度平流層的臭 氧含量降低約 1.2%至 10%不等,南極上空則是臭氧被破壞最嚴重的地 區,甚至在春季期間更會出現所謂的「臭氧洞」。 基於繼續使用氯氟碳化物等化學物質,將導致地球臭氧層被破壞 之共識,1987 年 9 月 16 日於加拿大蒙特婁市舉行國際會議,由全世 界二十六個國家共同簽署「蒙特婁破壞臭氧層物質管制議定書
(Montreal Protocol on Substances that Depletethe Ozone Layer)」,管制氟氯碳化物使用之國際公約,於 1989 年 1 月起正式生 效。
定書內容作了大幅之修正,其中最為重要者即為擴大列管物質,增加 氯氟碳化物-13 等 10 種,四氯化碳及三氯乙烷,計 12 種化學物質, 並加速管制時程,提前於 2000 年完全禁用氟氯碳化物、海龍及四氯化 碳。 1992 年 11 月在丹麥哥本哈根召開之第四次締約國大會,決議將 氟氯碳化物禁產時程提前於 1996 年 1 月起實施,而消費量除必要用途 外應減為零。 目前全球臭氧層削減率正以每年 2%至 3%的速度在進行,如果任其 發展,在二十一世紀末,平流層臭氧含量將降至目前的一半以上。
第四節 資料敘述
此筆資料記錄每月台北上空臭氧總量,單位為 D.U. (Dobson Unit)。分析時間為西元 1999 年 1 月至 2009 年 12 月,共 132 筆觀察 值,保留最後 12 筆做預測。資料來源為中央氣象局,若想獲得更詳細 之相關資料,可參考中央氣象局統計資料專區 http://www.cwb.gov.tw/V6/statistics/oZone/oZone_01.htm。第五節 研究方法
在此報中我們用了四種方法分析台北上空臭氧總量,分別為時間序列 迴歸(Time Series Regression)、ARIMA、指數平滑法(Exponential Smoothing)及分解法(Decomposition Methods)。第二章 預測與分析
本章先就原始資料的時間序列圖作判斷,看其變異數(波動)和平均 數(趨勢)是否為平穩,再分別利用時間序列迴歸、ARIMA、指數平滑 法及分解法等方法做預測分析,最後依據其分析結果的 MAE、MSE、MPE 及 MAPE 選擇出最佳模型。【圖 1】原始資料的時間序列圖
由【圖 1】可以看出台北上空臭氧總量的變異數(波動)及平均數(趨 勢)大致為平穩。而高峰期約在四月到六月,十一月至一月則是台北 上空臭氧總量較低的時期,故可以知道此數據具有季節性變化。
第一節 時間序列迴歸(Time Series Regression)
一、方法說明
時間序列迴歸與線性迴歸類似,都是以解釋變數解釋預測變數。
在配適模型前需先判斷變異數是否為平穩,若變異數不平穩則需 對原始資料做轉換以達變異數平穩,變異數平穩後即配適模型。 配適模型時判斷原始資料的時間序列圖,若有趨勢(平均數不平 穩)則配適 Linear Trend。而資料若是季節性的則要使用 Seasonal Dummies。 在配適模型後需以 Durbin-Watson(DW)檢定是否有自我相關, 若存在自我相關則以 AR 模型作修正。 二、預設模型 由【圖 1】可以看出台北上空臭氧總量的變異數為平穩,故不需做轉 換。而其資料為季節性且平均數大致平穩,故配適 Seasonal Dummies 模型,其預設模型為: 三、診斷分析 我們以 DW 檢定是否存在自我相關。
【表 1】Time Series Regression 的 DW 檢定表
【表 2】Time Series Regression 原始的自我相關表
由【表 1】及【表 2】都可以看出有正自我相關,因此要以 AR(1)模型 做修正。 四、修正模型 DW 檢定發現有正自我相關,所以將模型修正為 Seasonal Dummies + AR(1)模型,其模型為: 五、修正後診斷 經過 AR(1)修正後,由【表 3】可以看出已無自我相關存在。
【表 3】Time Series Regression 修正的自我相關表
六、參數估計
模型修正後,將【表 4】的參數估計值帶入 Seasonal Dummies + AR(1) 模型,其估計式為:
【表 4】Seasonal Dummy + AR(1) 的參數估計表
六、預測表現
我們用修正後模型 Seasonal Dummy + AR(1)的預測值、95%信賴區間 的上下限和保留的最後十二筆觀測值畫出預測圖,並計算出其 MAE、
MSE、MPE 以及 MAPE,以看其預測表現,分別為【圖 2】及【表 5】。
第二節 ARIMA
一、方法說明 使用 ARIMA 之前必須先判斷變異數是否為平穩,如果變異數不平 穩,需先對資料做轉換,若是平穩則不需轉換。 再來是判斷平均數是否為平穩。可由原始資料的時間序列圖做判 斷。如果原始的時間序列圖有一趨勢,表示平均數不平穩,則要做一 次差分。若資料有季節性,也就是 ACF 圖會呈現波浪狀,則作季節差 分。然後判斷 ACF 及 PACF。若 ACF 為 cuts off after lag q 則配適 MA(q),PACF 為 cuts off after lag p 則配適 AR(p)。
模型配適後檢查 ACF 及 PACF 圖,皆需在兩倍配標準差之內,代表 資料之間已無自我相關。而 White Noise Tests 需為不顯著,表示殘 差是 white noise。Unit Root Tests 需為顯著,代表模式已達平穩。 Ljung-Box 檢定需為不顯著,代表殘差項沒有自我關係存自在。參數 估計檢定也需顯著,這樣才代表模型合適。 最後,要檢查模型的平穩及可逆條件皆須符合規定。另外,要注 意的是在配適模型時不要過度配適,也就是模型的參數要越少越好, 才符合精簡原則。 二、預設模型 由【圖 1】可看出變異數平穩,而平均數大致平穩且資料為季節性的, 故不需做轉換及一次差分,但要做季節差分。
【圖 3】ARIMA(0,1,0)s 的 ACF 及 PACF
【圖 3】為季節差分後的 ACF 及 PACF,可看出 PACF 為 cuts off after lag 4,且 lag 12 突出,故配適模型 AR(4)(12)模型。其模型為:
三、參數估計
【表 6】ARIMA(4,0,0)(1,1,0)s NOINT 的參數估計表
【表 6】為 ARIMA(4,0,0)(1,1,0)s NOINT 的參數估計表,其中 Lag 4 不 顯 著 , 故 將 模 型 修 正 為 ARIMA(3,0,0)(1,1,0)s NOINT :
四、診斷分析
模型修正為 ARIMA(3,0,0)(1,1,0)s NOINT 後檢查其 ACF 及 PACF、 White Noise 及 Unit Root 和 Ljung-Box,分別為【圖 4】、【圖 5】及 【表 7】。
【圖 5】ARIMA(3,0,0)(1,1,0)s NOINT 的 White Noise 及 Unit Root 【表 7】Ljung-Box 檢定 由【圖 4】、【圖 5】及【表 7】可以知道模型 ARIMA(3,0,0)(1,1,0)s NOINT 大致上是合適的,但不夠完美。 五、最終模型 雖然模型 ARIMA(3,0,0)(1,1,0)s NOINT 不夠完美,卻是其他所配適過 的 ARIMA 模型中最合適的,故參照【表 8】將最終模型寫出為:
【表 8】ARIMA(3,0,0)(1,1,0)s NOINT 的參數估計表 六、平穩及可逆條件 0.27293+0.28396+0.19468-0.66334=0.088223 < 1 → stationarity 七、預測表現 利用 ARIMA(3,0,0)(1,1,0)s NOINT 模型的預測值、95%信賴區間的上 下限以及保留的最後十二筆觀測值畫出預測圖,並計算其 MAE、MSE、 MPE 及 MAEP,以觀測期預測表現。分別為【圖 6】及【表 9】。
【圖 6】ARIMA(3,0,0)(1,1,0)s NOINT 的預測圖
【表 9】ARIMA(3,0,0)(1,1,0)s NOINT 的預測表現
第三節 指數平滑法(Exponential Smoothing)
沒有依據任何正式的統計模型。此種方法的概念為對時間序列作加權 平均,權數的多寡則取決於時間點的遠近,越接近現在的時間點其權 數越重,時間點越遠則權數越輕。按照原始資料的時間序列圖可判斷 其所需使用的模型,大致可分為:
1.Simple exponential smoothing (no trend, but the level of the time series may change over time).
2.Holt's model (with trend).
3.Additive Holt-Winters model (with trend and constant seasonal variation).
4.Multiplicative Holt-Winters model (with trend and increasing seasonal variation) 而實務上我們大多使用第三種及第四種模型,其判斷方法為變異數, 若是變異數平穩使用第三種,不平穩則使用第四種模型。 二、預設模型 由【圖 1】可以看出台北上空臭氧總量為季節性資料,而其變異數為 一常數(亦即變異數平穩),故預設模型為 Additive Holt-Winters model。 三、參數估計
【表 10】Additive Holt-Winters model 的參數估計表 由【表 10】可以知道模型中的權重分別為: 水準:0.47905 趨勢:0.00100 季節:0.00100 因此我們可將估計值代入模型為:
我們把用指數平滑法所預測出來的預測值、95%預測區間的上下限,以 及所保留的最後十二筆資料畫成預測圖,並計算出 MAE、MSE、MPE 及 MAPE,分別為【圖 7】及【表 11】
【圖 7】Additive Holt-Winters model 的預測圖
【表 11】Additive Holt-Winters model 的預測表現
一、方法說明
分解法將資料分解成趨勢(Trend)、季節(Seasonal)、循環(Cycle)
以及非規律的變化(Irregular)來分析。由於這四個因素之間大致上 為獨立,故其模型可說是這四種因素的相加或相乘。 而判斷相加或相乘的關鍵就在於變異數。如果變異數平穩則使用 加法模型,如果變異數不平穩則使用乘法模型。模型分別如下: 二、預設模型 由【圖 1】可以看出台北上空臭氧總量的變異數平穩,故我們使用加 法模型。其中因為平均數平穩,所以趨勢項中沒有斜率項。預設模型 為: 三、預測分析
首先利用 Centred 12 MA(Moving Average)計算出趨勢-循環因素, 圖形為【圖 8】。由【圖 8】我們可以發現台北上空臭氧總量的趨勢不 明顯,循環因素明顯。
【圖 8】Trend-Cycle 因素及原始資料的時間序列圖
接著將原始資料中的趨勢-循環因素去除後,剩下季節及非規律變化, 其圖型分別為【圖 9】及【圖 10】。
【圖 10】Irregular 因素的時間序列圖
然後將原始資料中的季節因素去除後,就可得到去季節因素,其圖形 為【圖 11】。
再利用去季節因素作時間序列迴歸模型,其預測值就是趨勢-循環因素 的預測值,其圖形為【圖 12】。
【圖 12】Trend-Cycle 因素及其預測值的時間序列圖
最後把趨勢-循環因素加上季節因素,就會是此模式的預測了。【圖 13】
【圖 13】Additive Model 的實際值及預測圖的時間序列圖 四、診斷分析 在利用去季節因素作迴歸模型時,我們利用 DW 檢定其自我相關,檢定 結果為【表 12】及【表 13】。 【表 12】Additive Model 的 DW 檢定表 【表 13】Additive Model 原始的自我相關表 其結果都顯示有自我相關,故以 AR(1)修正,修正後為【表 14】。 【表 14】Additive Model 修正的自我相關表 修正後顯示還有自我相關存在,故以 AR(2)再在修正,修正後為【表 15】。 【表 15】Additive Model 最終的自我相關表
五、參數估計 DW 檢定後將參數帶入模型,根據【表 16】及【表 17】,其模型為 Additive Model + AR(2): 【表 16】Additive Model 的參數估計表 【表 17】Additive Model 的自我相關參數估計表 六、預測表現 我們用加法模型所預測出來的預測值、95%預測區間的上下限,以及所 保留的最後十二筆資料畫成預測圖,並計算出 MAE、MSE、MPE 及 MAPE, 分別為【圖 14】及【表 18】
【圖 14】Additive Model + AR(2)的預測圖
第五節 最佳模型
MAE、MSE、MPE 及 MAPE 的值要越小越好。其中 MAPE 的值在五以內代 表模型配適佳,十以內代表模型配適不錯,十以上則代表模式配適不 好。
【表 19】預測表現比較表
在研究中,我們使用時間序列迴歸、ARIMA、指數平滑法及分解法四種 方法分析台北地區臭氧總量。依照四種分析法的分析結果【表 19】顯 示,時間序列迴歸分析所做出來的 MAE、MSE 及 MAPE 效果較好,而 MPE 則是 ARIMA 方法所配適的模型效果較佳,於是選擇時間序列迴歸作為 最佳配適模型。其模型為:
第三章 結論與建議
第一節 結論
由原始時間序列圖可知,台北地區臭氧總量並沒有隨著時間增加 而變化(趨勢平穩),只有季節變化。 根據科學家研究報告可知,地球各地臭氧層密度大不相同,在赤道 附近最厚,兩極最薄,且臭氧的減少對於地球南北極影響最劇烈,所 以地球各地出現臭氧洞的地方都在南、北極。 在西元 2003 年 8 月 3 日,科學家宣佈停止生產氟氯碳化物(CFC) 生效,三顆衛星和三個地面測試站都認為臭氧層破壞速度在近十年(西 元 1993 年至 2003 年)減慢很多。 本研究報告的預測期間在西元 1999 年 1 月至 2009 年 12 月,此時 臭氧層破壞速度已減慢,再加上台灣的地理位置在北半球,而不是在 北極或南極,原本的影響就很小,故臭氧層的減少在台灣並無太大改 變。第二節 建議
雖然臭氧層的減少對於南北極的影響較台灣大,而氟氯碳化物的禁 用對台灣的影響也不明顯,但是我們不能因此而否定禁用氟氯碳化物的 行動所帶來的效用。 所以為了愛護地球,我們仍要繼續遵守禁用氟氯碳化物的規定,讓 臭氧層總量維持在一定的程度,否則,失去臭氧層的保護,將使地球生 物圈暴露於更多的輻射線下。參考文獻
Forecasting, Time Series, and Regression, 4th
edition, 2005, by Bowerman, O'Connell, and Koehler.
蒙特婁議定書-維基百科 http://zh.wikipedia.org/zh-tw/%E8%92%99%E7%89%B9%E5%88%A9%E7 %88%BE%E8%AD%B0%E5%AE%9A%E6%9B%B8 臭氧層-維基百科 http://zh.wikipedia.org/zh/%E8%87%AD%E6%B0%A7%E5%B1%A4 馬里奧·莫利納-維基百科 http://zh.wikipedia.org/zh-tw/%E9%A9%AC%E9%87%8C%E5%A5%A5%C2 %B7%E8%8E%AB%E5%88%A9%E7%BA%B3 彰化縣北斗國小網頁教材-環境保護(作者陳文瑛) http://www.bdes.chc.edu.tw/bdes/sahwe/new_page_10.htm
會議紀錄
第一次會議紀錄 時間:5/25(二) 20:00 地點:福星女宿學習中心 出席組員:康勤儒、吳懿倢、蔡苓筠、林予婷、曾譯賢 主旨:決定初次報告繳交所用的數據及模型配適 內容:在開會前由組長康勤儒決定,各個組員在開會時須繳交一份數 據並配適其模型,再由大家票選出我們初次報告要用的數據及所配適 的模型。大家所找的數據分別為: 康勤儒是分析中央氣象局南區服務氣後統計 吳懿倢是分析能源部門自用的統計 蔡苓筠是分析能源總需要-國內消費 林予婷是分析中央氣象局臭氧總量觀測資料 曾譯賢是分析電力消費 最後決定以林予婷的中央氣象局臭氧總量觀測資料數據做分析,分析 方法為 Exponential Smoothing。 第二次會議紀錄 時間:6/1(二) 19:30 地點:福星女宿學習中心 出席組員:康勤儒、吳懿倢、蔡苓筠、林予婷、曾譯賢 主旨:配適二次報告所要求的三個模型內容:組長康勤儒要求大家在開會前先對 Time Series Regression 及 ARIMA 做配適,在開會時比較大家所配適的模型有無不同,並選出最 好的模型加以整理及修改。 第三次會議紀錄 時間:6/6(日) 21:00 地點:福星女宿學習中心 出席組員:康勤儒、吳懿倢、蔡苓筠、林予婷、曾譯賢 主旨:配適分解法及整理報告的其他內容 內容:討論分解法的配適方法及過程,並將大家對報告其他內容所做
第三次會議紀錄 時間:6/9(三) 22:00 地點:福星女宿學習中心 出席組員:康勤儒、吳懿倢、蔡苓筠、林予婷、曾譯賢 主旨:上台報告前的演練及熟析 內容:將報告的所有內容再做檢視以便修改,以及討論還有問題或不 熟析之處,最後確認沒問題後印下 WORD 及 PPT 檔。