1970 年Box 與Jenkins 提出進階的建模技術,主要分成四個步驟[7]:
1. 模式的暫定 (Model Identification) 2. 參數的估計 (Parameter Estimation) 3. 診斷檢定 (Diagnostic Checking) 4. 預測 (Forecasting)
茲分述如下:
1. 模式的暫定 (Model Identification)
Box and Jenkins 提供模式暫定步驟的檢定準則:
(1)時間數列繪圖觀察 (Time plot) :畫出時間數列圖,並觀察其趨勢等特徵,
初步檢查資料是否包含異常值或有資料錯誤情形,觀察此資料是否受到結 構性變化影響。
(2)自我相關函數 (ACF: Autocorrelation Function ) :判定原數列為平穩型 ( stationary ) 或非平穩型數列 ( nonstationary ),若數列為非平穩型,其ACF 會維持許多期的相關,且ACF 的值通常是很緩慢的遞減到0 ( die-out )。
(3)差分(Differencing):即是判定ARIMA ( p,d,q ) 模式中d 的階數。
(4)ACF 和PACF:判定 p 及 q 的階數,當一數列已為平穩型或差分後成為 平穩型,可利用自我相關函數(ACF)及偏自我相關函數(PACF)作為判定 p 及 q 階數的工具,判斷之標準如下表所示:
表3-1:AR 和MA 中p 與q 值的判定
Model ACF PACF
AR(p) 呈“指數遞減“或正負相間 遞減的形式(die down)
p 期後”截斷”
(cuts off after lag p) MA(q) q 期後”截斷”
(cuts off after lag q)
呈“指數遞減”或正負相間遞 減的形式(die down)
*表中“截斷”的意義為樣本的ACF 與PACF 只有少數幾階的顯著。
2. 參數的估計 (Parameter Estimation)
當模式暫定完後,接著進行參數估計的工作,ARIMA 參數估計方法有 二種,一種為最小平方法,一種為最大概似法。所謂最小平方法是計算求 得參數的實際值與估計值間之差的平方和為最小,但由於真正的參數值無 法得知,所以當樣本數較小時(n<70),大多數都利用此法來計算,可得到 最佳或最有效的估計值。當樣本數較大時(n>=70),較適用也常用最大概 似法(Likelihood Method),此方法的推導與最小平方法極類似,是求取估計 值使得模型的概似函數得到極大值,當此法應用到時間數列時,根據其對 初始殘差項不同的處理方式,常用的方法包含以下兩種:
(1)條件概似法(Conditional Likelihood Method):
令 a0 = a-1 = … .=a1-q = 0
(2)正確概似法(Exact Likelihood Method):
由資料一同估計a0, a-1,… ,a1-q 與參數。
3. 診斷檢定 (Diagnostic Checking)
模式的檢定在建立模式的過程中,可幫助吾人尋找修正模式的方向、額 外得到無法由模式解釋的資訊。主要的工作是在檢定誤差項 at 數列是否符 合常態分配且互相獨立的假設,亦即是否為 iid (independent and identical distribution),也就是假設為 ’白噪音’ (white noise)數列。若檢定的結果為 否,則表示此模式不適合且必須加以修正;若檢定的結果為是,則表示此 模型的殘差數列應為互相獨立的常態分配,其平均數為 0,變異數為一定值。
檢定的方式有許多種,最簡單的就是畫出殘差項的時間數列圖,和偵測殘 差數列的ACF,倘若殘差為白噪音數列,則顯示數列並沒有任何顯著的自 我相關,另一個檢定殘差為 Q 統計量檢定(Q statistics Ljung & Box, 1978),也就是當n 很大時,Q 統計量會服從自由度k-p-q 的卡方χ2 分 配,統計量表示如下:
(3.34)
式中n 是ˆ at 之實際個數,k 為計算殘差自我相關值個數,p 和q 為模式的
參數個數。
最後還要注意的一點就是參數模式的精簡原則(Principle of
Parsimony),意即所用到的參數越少越好。如果通過上述標準之檢驗,就可 以利用此模型來進行後續的預測,否則必須放棄此模型,重新回到第一階 段的模型暫定步驟,反覆進行,直到模型配適為止。
4. 預測(Forecasting)
一旦找到配適的模式後,就可以利用此模式進行預測,而預測誤差的大 小,就是判斷最佳預測模式的重要準則,一般的取決標準可用平均絕對百 分誤差(MAPE)或根均方誤差(RMSE)等統計量來衡量預測準確性,本 研究中主要採用 MAPE 作為預測精確度的判斷依據。
(1)平均絕對百分誤差(MAPE 定義第
l
期之預測誤差為:, Mean Absolute Percentage Error)
為預測起始點,Yt+l為 t+
l
期之實際值,Y t(l )為以 t 為起始點第l
期之(2)根均方誤差(RMSE , Root Mean Square Percentage Error)
定義第
l
期之預測誤差為:t 為預測起始點,Yt+l為 t+
l
期之實際值,Y t(l )為以 t 為起始點第l
期之測 期的 RMSE:
一般根據 MAPE 之大小,將模式預測之能力分成四個等級:
< 10 高精確度預測 t
預測值,預測到第 n 期的 MAPE:
預 值,預測到第 n
10 ~ 20 良好的預測 20 ~50 合理的預測
> 50 不正確的預測
Box & Jenkins 在1970 年代把模式建構步驟的四個階段修正得非常有 系統,下圖即為本研究所欲採用模式建立之流程圖:
圖3-12 運用Box and Jenkins 模式建立的流程圖 [7]
資料輸入
判斷是否為 平穩數列?
進行差分 選擇d, D階數
計算ACF, PACF 決定(p, q) (P, Q)
估計暫定模型的參數
使用配適之模型進行預測 數列繪圖觀察
進行殘差檢定
模型是否 適當?
否
否 是
是 模
型 的 暫 定
參 數 估 計
診 斷 檢 定
預 測