第二章 研究方法
第四節 ARIMA 分析法
一、何謂ARIMA
ARIMA模型全稱為自迴歸移動平均模型 Autoregressive Integrated Moving Average Model ,是由博克思 Box 和詹金斯
Jenkins 於70年代初提出的時間序列預測法,所以又稱為博克 思-詹金斯法或box‐jenkins模型。
ARIMA模型的基本思想,是將預測對象隨時間推移而形 成的數據序列,視為一個隨機序列,用一定的數學模型來近似 描述這個序列。此模型一旦被識別後就可以從時間序列的過去 值及現在值來預測未來值。
其中ARIMA p,d,q 稱為差分自迴歸移動平均模型,
AR p 是自迴歸模型 autoregressive model , 其意義簡單來說 就是現在的某一變數值,和同一變數過去p期的變數值有關,p 為自迴歸項;MA q 為移動平均 moving average ,其意義簡單 來說就是現在的和過去幾個q期的隨機項,q為移動平均項數有 關;d則是時間序列成為平穩時所做的差分次數。
ARIMA p ,q 模式敘述如下:
Z δ Z Z Z a θ a θ a θ a
二、模型的配適
圖2‐4.1 原始時間序列圖
首先用肉眼觀察原始資料的時間序列圖,判斷資料是否平穩,
由圖 2‐4.1 可以得知,時間序列的波動不一致,變異會隨著時間的 增加而增加,表示此變異數不為常數,即變異數不平穩。且資料呈 現逐漸上升的趨勢,代表平均數不平穩。因此,必須透過轉換和差 分加以改善,使其平穩。
圖2‐4.2 原始時間序列的 ACF 及 PACF
原始資料的 ACF 及 PACF 圖亦可用來判別資料是否平穩。當 ACF 圖呈現下降非常緩慢 dies down slowly 的狀態時,表示此序列平均 數不平穩,需做差分加以改善。
由圖 2‐4.2 可得知 ACF 圖呈現下降緩慢 dies down slowly 的狀 態,得知資料不平穩,因此我們做一次差分加以調整。
圖2‐4.3 square root 轉換且加入一次差分的 ACF 及 PACF
經由圖2‐4.3 的 ACF 可看出,殘差在 lag12 和 lag24 這兩處特別 凸出,超過兩倍標準差的範圍許多,表示此資料呈現季節性波動,必 須對此資料做季節差分來解決此不平穩因素。
解決所有不平穩因素後,接著配適適當的模型,ARIMA 預測方法 的配適規則如下:
當ACF 為 dies down 且 PACF 呈現 cuts off 時,配適 AR p 。 當ACF 為 cuts off 且 PACF 呈現 dies down 時,配適 MA q 。 當ACF 以及 PACF 皆為 dies down 時,則配適 ARMA p , q 。
圖2‐4.4 轉換後且加入非季節差分及季節差分的 ACF 及 PACF
由圖 2‐4.4 我們判斷 ACF 是 cuts off 而 PACF 為 dies down 所以 我們配適模型 MA q 。又由圖 2‐4.4 的 ACF 得知 lag1 及 lag12 凸出 兩倍標準差特別的多,因此我們加入這兩項加以配適 q 1 12 。
圖2‐4.5 我們的模型的 ACF 及 PACF
經過開根號轉換並且配適ARIMA 0,1,1 0,1,1 s NOINT 的模型 後,由圖 2‐4.5 的 ACF 及 PACF 可看出,殘差都在兩倍標準差之內,
表示此模型的配適是合適的。
接著診斷配適的模型之殘差。若殘差具有單根,即表示此模型不 平穩,會隨著時間的改變而改變,這樣的模型並不是一個好的配適。
一個好的配適模型,其殘差值會落在兩倍標準差以內。且殘差的平均 為零,變異數為常數,彼此之間不具有相互關係,也就是符合白噪音,
並且不存在單根,這才是一個好的配式。因此我們對此模型的殘差做 白噪音及單根的檢定,診斷此模型的殘差,確定所配適的模型是否恰 當。
☉白噪音之檢定:
H :white noise 殘差符合白噪音 H :no white noise 殘差不符合白噪音
決策規則:
P‐value大於0.05,則不拒絕 H ,符合白噪音,表模型配適合適。
P‐value小於0.05,則拒絕 H ,不符合白噪音,表模型配適不合適。
☉單根之檢定:
H :有單根 (時間序列不平穩) H :沒有單根 (時間序列平穩)
決策規則:
P‐value大於0.05,則不拒絕 H ,表示有單根,模型配適不合適。
P‐value小於0.05,則拒絕 H ,表示沒有單根,模型配適合適。
假設檢定:
假設檢定:
圖2‐4.6 我們的模型的殘差檢定
由圖2‐4.6 的 White Noise Test 知,所有的 lag 都大於顯著水準 α 0.05,不拒絕H ,表示殘差項具有 White Noise 現象。又由圖 2‐4.6 的Unit Root Test 得知,所有的 lag 皆小於顯著水準 α 0.05,拒絕 H , 表示時間序列已為平穩狀態。由上之檢定得知,我們所配適的模型 Sqrt ARIMA 0,1,1 0,1,1 s NOINT 是合適的。
由於我們利用時間序列迴歸法及分解法進行預測時,預測結果總 是高估,大部分的實際值都不在預測區間內。因此我們對2008 年 5 月進行介入分析,加入介入分析後使兩種預測方法的預測表現都變得 更好。而我們對此筆資料利用ARIMA 預測方法預測的結果,實際值 大部分就都落在預測區間內,進一步進行介入分析的預測結果並沒有 特別好,表現不佳,因此我們不對ARIMA 做介入分析。
表2‐4.1 我們的模型的參數估計
Model parameter Estimate Std. Error T Prob | T | MA factor 1 lag 1 0.4074 0.0657 6.2018 .0001 MA factor 2 lag 12 0.792 0.0711 11.1346 .0001
Model Variance sigma squared 1764 . . .
由表2‐4.1 可得到各個參數估計值,且知兩個參數估計值的
P‐value 皆小於顯著水準 α 0.05,表示參數顯著,都應被留在模型中。
總括上述結果可得知,我們所配適的Sqrt ARIMA 0,1,1 0,1,1 s NOINT 模型是合適的。將表 2‐4.1 的參數估計值帶入模型中得到我們 的 ARIMA 預測方程式如下:
1‐B 1‐B y 1 0.40740B 1 0.79200B a σ 1764
圖2‐4.7 我們的模型的好壞判斷
由圖2‐4.7 得到 R‐square 等於 0.981,可知此模型對此筆資料具 有 98.1%的解釋能力。
為了瞭解我們所做的模型之估計是否適當,我們保留了最後的 12筆真實數據,做為和未來一年預測的比較用。我們將這12筆數據 的實際值、估計值和95%的上、下界預測區間做成表格 表2‐4.2 ,再 將這四種值畫成預測曲線圖。
表2‐4.2 ARIMA 的實際值及預測值
日期 實際值 預測值 95%預測信賴上界 95%預測信賴下界
2009/1/1 7715603 8429039 8911983 7956118 2009/2/1 7930365 7535787 8067818 7017300 2009/3/1 8501703 8433194 9065411 7818042 2009/4/1 8808304 8324023 9014840 7653792 2009/5/1 9135677 8828554 9598996 8082218 2009/6/1 9541611 8860019 9687129 8060536 2009/7/1 9936410 9003797 9889884 8148856 2009/8/1 9697328 9208308 10154380 8296903 2009/9/1 9771000 8997576 9980164 8053174 2009/10/1 9779946 8713556 9725269 7743550 2009/11/1 9026592 8539571 9583615 7540754 2009/12/1 9698809 8398532 9474503 7371309
圖2‐4.8 ARIMA 的估計值、實際值和 95%的上下界預測區間的預測圖