第二章 研究主體
第五節 ARIMA之介入分析
移動平均法(moving average)係以過去資料為依據,將最近 N 期資料之算術 平均數值,做為下一期之預測值,在部分自我相關函數(Partial
Autocorrelation Function, PACF)中,時間序列為不平穩,即下降緩慢時所配 適模型。自我迴歸(AutoRegressive)在自我相關函數(Autocorrelation
Function, ACF)中,時間序列為不平穩,即下降緩慢時所配適模型。在 ACF 與 PACF 時間序列皆不平時,則可配適 ARMA(AutoRegressive And Moving Average) 模型。當時間序列平均數不平穩時,則可使用一階差分(Integrated)使平均數達 到平穩;但是當平均數呈季節變動不平穩時,則可使用季節差分。所以 ARIMA 為 AR 模式、差分與 MA 模式的組合模式。而介入分析是用來分析某一件事或政策(稱 之介入因子)對於時間數列模型之影響。
介入分析的步驟:
1. 對介入時間點前之數列,進行 ARMA 模型配適。
2. 將介入因子的時間,以虛擬變數(dummy variable)方式建立新變數(介入變 數)。
3. 重新進行模型配適及參數估計。
4. 解釋介入因子的係數對數列的影響。
時間序列經常受到特殊的外部事件影響,譬如主要公司;自然災害;政治或經濟 政策主動性或變動;技術變動;停工鬥爭;推銷活動;做廣告等等。這些外部事 件共同地為人所知作為干預,所謂的干預影響變數預測,這樣干預為人所知,我 們也許或希望評估這些外部事件的作用或合併干預我們的時間數列模型可能改 進參量估計或展望。介入分析又稱干預分析(或衝擊分析)。使用特殊類型的虛擬 變數,所謂的階梯函數和衝擊函數,建立干預模式。Box 和 Tiao(1975 年)提供 了一個程序,分析時間序列的存在已知的外部事件。這一程序已成為被稱為干預
(或影響)分析。在他們的方法,時間序列為代表的是兩個截然不同的部分組成:
一個潛在的干擾來說,和一套干預對系列。
在唯一干預情況下, 干預模型的形式是
t t
t
I N
B C B
Y
= + +) (
) ( δ ω
I 是一個二元向量指標(即是一種向量假設值為 0 或 1 )定義時期的干預。
t) (
) (
B B
δω 是一個表徵的影響的干預
) ω(
我們假設 可能仿照作為 ARIMA 過程中所界定的。在案件有沒有外源的事件,
階梯函數(Step Function)
時間序列受到外在干預,但是干預一時間為衝擊而後是
衝擊函數(Pulse Function)
⎩⎨
一、 分析原始資料
Z
50 60 70 80 90 100 110 120
TI ME
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140 150 160 170 180 190 200 210 220 230
圖 二-14 ARIMA 之介入分析-原始時間序列圖
上圖二-14為原始時間序列圖,在畫線部分分別為第 153 筆及第 172 筆資料,
經我們調查,在這兩個時間點分別為 2001 年 9 月受到納莉颱風侵台影響,以及 2003 年 4 月到 7 月受到 SARS 疫情影響,所以才會導致搭乘火車的人數驟減,故 將這兩個影響點加入模型。
二、 判斷是否需要做差分
圖 二-15 ARIMA 之介入分析-原始 ACF、PACF 圖
由圖二-15之 ACF 圖可以看出,相關係數的數值是下降的速度非常的緩慢。
因此我們可以知道此資料之平均數呈現一個不平穩的序列。由於 ACF 圖其震幅 下降的速度非常緩慢,所以判斷資料需要做差分轉換,進一步的從 ACF 圖可以 看到,殘差在 Lag12、Lag24、Lag36…的部分皆有著特別突出的現象,明顯的此 筆資料隨著時間的進行有擺盪的現象,所以判斷此筆資料需要做季節差分;我們 嘗試對資料做一階差分與季節差分,並且互相比較,發現做季節差分比做一階差 分收斂較快;但同時做一階差分與季節差分,卻又過度差分,所以,綜合以上判 斷結果認為對資料做季節差分最為適當。
三、 季節差分
圖 二-16 ARIMA 之介入分析-季節差分後之 ACF、PACF 圖
從圖二-16可以看出,經過季節差分之後,ACF 圖除了 Lag1 到 Lag4、Lag12 有很明顯的超出兩倍標準差以外,其餘殘差的值都有在兩倍標準差以內,而 PACF 圖較 ACF 圖有明顯截斷且在 Lag1 、Lag8、 Lag12、 Lag13、 Lag24 處有很明顯 的超出兩倍標準差以外,其餘殘差的值也都有在兩倍標準差以內,因此利用這些 特徵來選擇配適模型的參數;在配適模型的過程中,不能將全部的參數都配適到 模型中,一定要符合節約參數原則,用最少的參數來配適模型,才能配適出最佳 模型。
四、 配適模型
從圖二-17配適最終模型的樣本 ACF 圖和 PACF 圖可以看出,殘差皆在兩倍 標準差內,表示配適模型後的殘差皆無自我相關,故此模型為適當模型。
Autocorrelation Check of Residuals To
Lag
Chi-
Square DF Pr >
ChiSq Autocorrelations
6 8.27 3 0.0407 -0.058 -0.058 0.144 0.051 -0.062 0.078 12 13.81 9 0.1292 0.104 0.014 0.034 0.076 0.086 0.021 18 16.77 15 0.3325 0.045 0.026 0.084 -0.041 -0.025 -0.038 24 20.25 21 0.5054 -0.029 -0.019 -0.028 0.081 -0.013 -0.08 30 22.15 27 0.7299 0.051 -0.014 -0.054 0.005 0.008 -0.047 36 25.75 33 0.8114 -0.048 0.032 0.04 -0.029 0.045 0.083
表 二-13 ARIMA 之介入分析-Q 統計量
根據表二-13的Q統計量可以得知,P值皆大於顯著水準α=0.05,所以拒絕虛 無假設,在Lag6 的虛無假設為ρ1=ρ2=…=ρ6 、Lag12 的虛無假設為ρ1=ρ2=…
=ρ12、…以下虛無假設類推,經以上檢定此模型為適當模型。
六、 檢測模型中的參數是否適合
Maximum Likelihood Estimation Parameter Estimate Standard
Error t Value Approx
Pr > |t| Lag Variable Shift MU 2.26311 0.6449 3.51 0.0004 0 Y 0 MA1,1 0.6937 0.05631 12.32 <.0001 1 Y 0 MA2,1 0.8847 0.0723 12.24 <.0001 12 Y 0 AR1,1 0.97921 0.01922 50.94 <.0001 1 Y 0 NUM1 -32.4602 3.73941 -8.68 <.0001 0 p1 0 DEN1,1 0.5372 0.08717 6.16 <.0001 1 p1 0
NUM2 -24.6234 3.44796 -7.14 <.0001 0 P2 0 DEN1,1 0.79356 0.06214 12.77 <.0001 1 P2 0
表 二-14 ARIMA 之介入分析-參數估計表
從表二-14可看出參數估計的P值皆小於顯著水準α=0.05,因此我們拒絕其虛 無假設,即參數顯著,應當留在模型裡。綜合以上的結果可推知,我們所配適的 模式ARIMA(1,0,1)(0,1,1)S再加入介入分析為一個合適的模型,而參數估計值如下:
79356
日期 實際值 預測值 95%信賴區 間下限
95%信賴區 間上限
實際值與預 測值之差 07 年 03 月 104.000 100.888 92.5101 109.265 3.112 07 年 04 月 97.670 101.851 93.139 110.564 -4.181 07 年 05 月 98.080 97.216 88.1944 106.238 0.864 07 年 06 月 96.360 96.022 86.7129 105.33 0.338 07 年 07 月 107.940 107.007 97.4318 116.583 0.933 07 年 08 月 99.510 107.442 97.6169 117.267 -7.932 07 年 09 月 99.900 101.102 91.0442 111.16 -1.202 07 年 10 月 97.420 102.333 92.0558 112.609 -4.913 07 年 11 月 97.030 98.208 87.7255 108.69 -1.178 07 年 12 月 103.330 103.690 93.0151 114.366 -0.36 08 年 01 月 100.450 102.330 91.4732 113.188 -1.88 08 年 02 月 93.240 100.889 89.8595 111.918 -7.649
表 二-15 ARIMA 之介入分析-實際值與預測值的差
由圖二-18和表二-15我們可以看出,實際值和預測值的差距皆非常的小;因 此,我們可以說我們所選定的模型其預測能力相當的不錯。