Box-Jenkins ARIMA 模式的建構步驟

1970 年Box 與Jenkins 提出進階的建模技術，主要分成四個步驟[7]:

1. 模式的暫定 (Model Identification) 2. 參數的估計 (Parameter Estimation) 3. 診斷檢定 (Diagnostic Checking) 4. 預測 (Forecasting)

茲分述如下：

1. 模式的暫定 (Model Identification)

Box and Jenkins 提供模式暫定步驟的檢定準則：

(1)時間數列繪圖觀察 (Time plot) ：畫出時間數列圖，並觀察其趨勢等特徵，

初步檢查資料是否包含異常值或有資料錯誤情形，觀察此資料是否受到結構性變化影響。

(2)自我相關函數 (ACF: Autocorrelation Function ) ：判定原數列為平穩型 ( stationary ) 或非平穩型數列 ( nonstationary )，若數列為非平穩型，其ACF 會維持許多期的相關，且ACF 的值通常是很緩慢的遞減到0 ( die-out )。

(3)差分（Differencing）：即是判定ARIMA ( p,d,q ) 模式中d 的階數。

(4)ACF 和PACF：判定 p 及 q 的階數，當一數列已為平穩型或差分後成為平穩型，可利用自我相關函數(ACF)及偏自我相關函數(PACF)作為判定 p 及 q 階數的工具，判斷之標準如下表所示：

表3-1：AR 和MA 中p 與q 值的判定

Model ACF PACF

AR(p) 呈“指數遞減“或正負相間遞減的形式(die down)

p 期後”截斷”

(cuts off after lag p) MA(q) q 期後”截斷”

(cuts off after lag q)

呈“指數遞減”或正負相間遞減的形式(die down)

＊表中“截斷”的意義為樣本的ACF 與PACF 只有少數幾階的顯著。

2. 參數的估計 (Parameter Estimation)

當模式暫定完後，接著進行參數估計的工作，ARIMA 參數估計方法有二種，一種為最小平方法，一種為最大概似法。所謂最小平方法是計算求得參數的實際值與估計值間之差的平方和為最小，但由於真正的參數值無法得知，所以當樣本數較小時(n＜70)，大多數都利用此法來計算，可得到最佳或最有效的估計值。當樣本數較大時(n＞＝70)，較適用也常用最大概似法(Likelihood Method)，此方法的推導與最小平方法極類似，是求取估計值使得模型的概似函數得到極大值，當此法應用到時間數列時，根據其對初始殘差項不同的處理方式，常用的方法包含以下兩種：

(1)條件概似法(Conditional Likelihood Method)：

令 a0 = a-1 = … .=a1-q = 0

(2)正確概似法(Exact Likelihood Method)：

由資料一同估計a0， a-1，… ，a1-q 與參數。

3. 診斷檢定 (Diagnostic Checking)

模式的檢定在建立模式的過程中，可幫助吾人尋找修正模式的方向、額外得到無法由模式解釋的資訊。主要的工作是在檢定誤差項 at 數列是否符合常態分配且互相獨立的假設，亦即是否為 iid (independent and identical distribution)，也就是假設為 ’白噪音’ (white noise)數列。若檢定的結果為否，則表示此模式不適合且必須加以修正；若檢定的結果為是，則表示此模型的殘差數列應為互相獨立的常態分配，其平均數為 0，變異數為一定值。

檢定的方式有許多種，最簡單的就是畫出殘差項的時間數列圖，和偵測殘差數列的ACF，倘若殘差為白噪音數列，則顯示數列並沒有任何顯著的自我相關，另一個檢定殘差為 Q 統計量檢定（Q statistics Ljung & Box, 1978），也就是當n 很大時，Q 統計量會服從自由度k-p-q 的卡方χ2 分配，統計量表示如下：

(3.34)

式中n 是ˆ at 之實際個數，k 為計算殘差自我相關值個數，p 和q 為模式的

參數個數。

最後還要注意的一點就是參數模式的精簡原則(Principle of

Parsimony)，意即所用到的參數越少越好。如果通過上述標準之檢驗，就可以利用此模型來進行後續的預測，否則必須放棄此模型，重新回到第一階段的模型暫定步驟，反覆進行，直到模型配適為止。

4. 預測(Forecasting)

一旦找到配適的模式後，就可以利用此模式進行預測，而預測誤差的大小，就是判斷最佳預測模式的重要準則，一般的取決標準可用平均絕對百分誤差（MAPE）或根均方誤差（RMSE）等統計量來衡量預測準確性，本研究中主要採用 MAPE 作為預測精確度的判斷依據。

(1)平均絕對百分誤差(MAPE 定義第

l

期之預測誤差為：

, Mean Absolute Percentage Error)

為預測起始點，Y^t+l為 t+

l

期之實際值，Y^t(l )為以 t 為起始點第

l

期之

(2)根均方誤差（RMSE , Root Mean Square Percentage Error）

定義第

l

期之預測誤差為：

t 為預測起始點，Yt+l為 t+

l

期之實際值，Y t(l )為以 t 為起始點第

l

期之

測期的 RMSE:

一般根據 MAPE 之大小，將模式預測之能力分成四個等級：

< 10 高精確度預測 t

預測值，預測到第 n 期的 MAPE:

預值，預測到第 n

10 ~ 20 良好的預測 20 ~50 合理的預測

> 50 不正確的預測

Box & Jenkins 在1970 年代把模式建構步驟的四個階段修正得非常有系統，下圖即為本研究所欲採用模式建立之流程圖：

圖3-12 運用Box and Jenkins 模式建立的流程圖 [7]

資料輸入

判斷是否為平穩數列?

進行差分選擇d, D階數

計算ACF, PACF 決定(p, q) (P, Q)

估計暫定模型的參數

使用配適之模型進行預測數列繪圖觀察

進行殘差檢定

模型是否適當?

否

否是

是模

型的暫定

參數估計

診斷檢定

預測

在文檔中一、研究主題 (頁 21-25)