ARIMA 分析法

第二章研究方法

第四節 ARIMA 分析法

一、何謂ARIMA

ARIMA模型全稱為自迴歸移動平均模型 Autoregressive Integrated Moving Average Model ，是由博克思 Box 和詹金斯

Jenkins 於70年代初提出的時間序列預測法，所以又稱為博克思-詹金斯法或box‐jenkins模型。

ARIMA模型的基本思想，是將預測對象隨時間推移而形成的數據序列，視為一個隨機序列，用一定的數學模型來近似描述這個序列。此模型一旦被識別後就可以從時間序列的過去值及現在值來預測未來值。

其中ARIMA p，d，q 稱為差分自迴歸移動平均模型，

AR p 是自迴歸模型 autoregressive model ，其意義簡單來說就是現在的某一變數值，和同一變數過去p期的變數值有關，p 為自迴歸項；MA q 為移動平均 moving average ^，其意義簡單來說就是現在的和過去幾個q期的隨機項，q為移動平均項數有關；d則是時間序列成為平穩時所做的差分次數。

ARIMA p ,q 模式敘述如下：

Z δ Z Z Z a θ a θ a θ a

二、模型的配適

圖2‐4.1 原始時間序列圖

首先用肉眼觀察原始資料的時間序列圖，判斷資料是否平穩，

由圖 2‐4.1 可以得知，時間序列的波動不一致，變異會隨著時間的增加而增加，表示此變異數不為常數，即變異數不平穩。且資料呈現逐漸上升的趨勢，代表平均數不平穩。因此，必須透過轉換和差分加以改善，使其平穩。

圖2‐4.2 原始時間序列的 ACF 及 PACF

原始資料的 ACF 及 PACF 圖亦可用來判別資料是否平穩。當 ACF 圖呈現下降非常緩慢 dies down slowly 的狀態時，表示此序列平均數不平穩，需做差分加以改善。

由圖 2‐4.2 可得知 ACF 圖呈現下降緩慢 dies down slowly 的狀態，得知資料不平穩，因此我們做一次差分加以調整。

圖2‐4.3 square root 轉換且加入一次差分的 ACF 及 PACF

經由圖2‐4.3 的 ACF 可看出，殘差在 lag12 和 lag24 這兩處特別凸出，超過兩倍標準差的範圍許多，表示此資料呈現季節性波動，必須對此資料做季節差分來解決此不平穩因素。

解決所有不平穩因素後，接著配適適當的模型，ARIMA 預測方法的配適規則如下：

當ACF 為 dies down 且 PACF 呈現 cuts off 時，配適 AR p 。當ACF 為 cuts off 且 PACF 呈現 dies down 時，配適 MA q 。當ACF 以及 PACF 皆為 dies down 時，則配適 ARMA p , q 。

圖2‐4.4 轉換後且加入非季節差分及季節差分的 ACF 及 PACF

由圖 2‐4.4 我們判斷 ACF 是 cuts off 而 PACF 為 dies down 所以我們配適模型 MA q 。又由圖 2‐4.4 的 ACF 得知 lag1 及 lag12 凸出兩倍標準差特別的多，因此我們加入這兩項加以配適 q 1 12 。

圖2‐4.5 我們的模型的 ACF 及 PACF

經過開根號轉換並且配適ARIMA 0,1,1 0,1,1 s NOINT 的模型後，由圖 2‐4.5 的 ACF 及 PACF 可看出，殘差都在兩倍標準差之內，

表示此模型的配適是合適的。

接著診斷配適的模型之殘差。若殘差具有單根，即表示此模型不平穩，會隨著時間的改變而改變，這樣的模型並不是一個好的配適。

一個好的配適模型，其殘差值會落在兩倍標準差以內。且殘差的平均為零，變異數為常數，彼此之間不具有相互關係，也就是符合白噪音，

並且不存在單根，這才是一個好的配式。因此我們對此模型的殘差做白噪音及單根的檢定，診斷此模型的殘差，確定所配適的模型是否恰當。

☉白噪音之檢定：

H ：white noise 殘差符合白噪音 H ：no white noise 殘差不符合白噪音

決策規則：

P‐value大於0.05，則不拒絕 H ，符合白噪音，表模型配適合適。

P‐value小於0.05，則拒絕 H ，不符合白噪音，表模型配適不合適。

☉單根之檢定：

H ：有單根 (時間序列不平穩) H ：沒有單根 (時間序列平穩)

決策規則：

P‐value大於0.05，則不拒絕 H ，表示有單根，模型配適不合適。

P‐value小於0.05，則拒絕 H ，表示沒有單根，模型配適合適。

假設檢定：

圖2‐4.6 我們的模型的殘差檢定

由圖2‐4.6 的 White Noise Test 知，所有的 lag 都大於顯著水準 α 0.05，不拒絕H ，表示殘差項具有 White Noise 現象。又由圖 2‐4.6 的Unit Root Test 得知，所有的 lag 皆小於顯著水準 α 0.05，拒絕 H ，表示時間序列已為平穩狀態。由上之檢定得知，我們所配適的模型 Sqrt ARIMA 0,1,1 0,1,1 s NOINT 是合適的。

由於我們利用時間序列迴歸法及分解法進行預測時，預測結果總是高估，大部分的實際值都不在預測區間內。因此我們對2008 年 5 月進行介入分析，加入介入分析後使兩種預測方法的預測表現都變得更好。而我們對此筆資料利用ARIMA 預測方法預測的結果，實際值大部分就都落在預測區間內，進一步進行介入分析的預測結果並沒有特別好，表現不佳，因此我們不對ARIMA 做介入分析。

表2‐4.1 我們的模型的參數估計

Model parameter Estimate Std. Error T Prob | T | MA factor 1 lag 1 0.4074 0.0657 6.2018 .0001 MA factor 2 lag 12 0.792 0.0711 11.1346 .0001

Model Variance sigma squared 1764 . . .

由表2‐4.1 可得到各個參數估計值，且知兩個參數估計值的

P‐value 皆小於顯著水準 α 0.05，表示參數顯著，都應被留在模型中。

總括上述結果可得知，我們所配適的Sqrt ARIMA 0,1,1 0,1,1 s NOINT 模型是合適的。將表 2‐4.1 的參數估計值帶入模型中得到我們的 ARIMA 預測方程式如下：

1‐B 1‐B y 1 0.40740B 1 0.79200B a σ 1764

圖2‐4.7 我們的模型的好壞判斷

由圖2‐4.7 得到 R‐square 等於 0.981，可知此模型對此筆資料具有 98.1%的解釋能力。

為了瞭解我們所做的模型之估計是否適當，我們保留了最後的 12筆真實數據，做為和未來一年預測的比較用。我們將這12筆數據的實際值、估計值和95%的上、下界預測區間做成表格表2‐4.2 ，再將這四種值畫成預測曲線圖。

表2‐4.2 ARIMA 的實際值及預測值

日期實際值預測值 95%預測信賴上界 95%預測信賴下界

2009/1/1 7715603 8429039 8911983 7956118 2009/2/1 7930365 7535787 8067818 7017300 2009/3/1 8501703 8433194 9065411 7818042 2009/4/1 8808304 8324023 9014840 7653792 2009/5/1 9135677 8828554 9598996 8082218 2009/6/1 9541611 8860019 9687129 8060536 2009/7/1 9936410 9003797 9889884 8148856 2009/8/1 9697328 9208308 10154380 8296903 2009/9/1 9771000 8997576 9980164 8053174 2009/10/1 9779946 8713556 9725269 7743550 2009/11/1 9026592 8539571 9583615 7540754 2009/12/1 9698809 8398532 9474503 7371309

圖2‐4.8 ARIMA 的估計值、實際值和 95%的上下界預測區間的預測圖

在文檔中國內能源消費-能源用 (頁 28-36)

第二章 研究方法

第四節 ARIMA 分析法

第二章研究方法