• 沒有找到結果。

Box-Jenkins ARIMA 模式的建構步驟

在文檔中 一、 研究主題 (頁 21-25)

1970 年Box 與Jenkins 提出進階的建模技術,主要分成四個步驟[7]:

1. 模式的暫定 (Model Identification) 2. 參數的估計 (Parameter Estimation) 3. 診斷檢定 (Diagnostic Checking) 4. 預測 (Forecasting)

茲分述如下:

1. 模式的暫定 (Model Identification)

Box and Jenkins 提供模式暫定步驟的檢定準則:

(1)時間數列繪圖觀察 (Time plot) :畫出時間數列圖,並觀察其趨勢等特徵,

初步檢查資料是否包含異常值或有資料錯誤情形,觀察此資料是否受到結 構性變化影響。

(2)自我相關函數 (ACF: Autocorrelation Function ) :判定原數列為平穩型 ( stationary ) 或非平穩型數列 ( nonstationary ),若數列為非平穩型,其ACF 會維持許多期的相關,且ACF 的值通常是很緩慢的遞減到0 ( die-out )。

(3)差分(Differencing):即是判定ARIMA ( p,d,q ) 模式中d 的階數。

(4)ACF 和PACF:判定 p 及 q 的階數,當一數列已為平穩型或差分後成為 平穩型,可利用自我相關函數(ACF)及偏自我相關函數(PACF)作為判定 p 及 q 階數的工具,判斷之標準如下表所示:

表3-1:AR 和MA 中p 與q 值的判定

Model ACF PACF

AR(p) 呈“指數遞減“或正負相間 遞減的形式(die down)

p 期後”截斷”

(cuts off after lag p) MA(q) q 期後”截斷”

(cuts off after lag q)

呈“指數遞減”或正負相間遞 減的形式(die down)

*表中“截斷”的意義為樣本的ACF 與PACF 只有少數幾階的顯著。

2. 參數的估計 (Parameter Estimation)

當模式暫定完後,接著進行參數估計的工作,ARIMA 參數估計方法有 二種,一種為最小平方法,一種為最大概似法。所謂最小平方法是計算求 得參數的實際值與估計值間之差的平方和為最小,但由於真正的參數值無 法得知,所以當樣本數較小時(n<70),大多數都利用此法來計算,可得到 最佳或最有效的估計值。當樣本數較大時(n>=70),較適用也常用最大概 似法(Likelihood Method),此方法的推導與最小平方法極類似,是求取估計 值使得模型的概似函數得到極大值,當此法應用到時間數列時,根據其對 初始殘差項不同的處理方式,常用的方法包含以下兩種:

(1)條件概似法(Conditional Likelihood Method):

令 a0 = a-1 = … .=a1-q = 0

(2)正確概似法(Exact Likelihood Method):

由資料一同估計a0, a-1,… ,a1-q 與參數。

3. 診斷檢定 (Diagnostic Checking)

模式的檢定在建立模式的過程中,可幫助吾人尋找修正模式的方向、額 外得到無法由模式解釋的資訊。主要的工作是在檢定誤差項 at 數列是否符 合常態分配且互相獨立的假設,亦即是否為 iid (independent and identical distribution),也就是假設為 ’白噪音’ (white noise)數列。若檢定的結果為 否,則表示此模式不適合且必須加以修正;若檢定的結果為是,則表示此 模型的殘差數列應為互相獨立的常態分配,其平均數為 0,變異數為一定值。

檢定的方式有許多種,最簡單的就是畫出殘差項的時間數列圖,和偵測殘 差數列的ACF,倘若殘差為白噪音數列,則顯示數列並沒有任何顯著的自 我相關,另一個檢定殘差為 Q 統計量檢定(Q statistics Ljung & Box, 1978),也就是當n 很大時,Q 統計量會服從自由度k-p-q 的卡方χ2 分 配,統計量表示如下:

(3.34)

式中n 是ˆ at 之實際個數,k 為計算殘差自我相關值個數,p 和q 為模式的

參數個數。

最後還要注意的一點就是參數模式的精簡原則(Principle of

Parsimony),意即所用到的參數越少越好。如果通過上述標準之檢驗,就可 以利用此模型來進行後續的預測,否則必須放棄此模型,重新回到第一階 段的模型暫定步驟,反覆進行,直到模型配適為止。

4. 預測(Forecasting)

一旦找到配適的模式後,就可以利用此模式進行預測,而預測誤差的大 小,就是判斷最佳預測模式的重要準則,一般的取決標準可用平均絕對百 分誤差(MAPE)或根均方誤差(RMSE)等統計量來衡量預測準確性,本 研究中主要採用 MAPE 作為預測精確度的判斷依據。

(1)平均絕對百分誤差(MAPE 定義第

l

期之預測誤差為:

, Mean Absolute Percentage Error)

為預測起始點,Yt+l為 t+

l

期之實際值,Y t(l )為以 t 為起始點第

l

期之

(2)根均方誤差(RMSE , Root Mean Square Percentage Error)

定義第

l

期之預測誤差為:

t 為預測起始點,Yt+l為 t+

l

期之實際值,Y t(l )為以 t 為起始點第

l

期之

測 期的 RMSE:

一般根據 MAPE 之大小,將模式預測之能力分成四個等級:

< 10 高精確度預測 t

預測值,預測到第 n 期的 MAPE:

預 值,預測到第 n

10 ~ 20 良好的預測 20 ~50 合理的預測

> 50 不正確的預測

Box & Jenkins 在1970 年代把模式建構步驟的四個階段修正得非常有 系統,下圖即為本研究所欲採用模式建立之流程圖:

圖3-12 運用Box and Jenkins 模式建立的流程圖 [7]

資料輸入

判斷是否為 平穩數列?

進行差分 選擇d, D階數

計算ACF, PACF 決定(p, q) (P, Q)

估計暫定模型的參數

使用配適之模型進行預測 數列繪圖觀察

進行殘差檢定

模型是否 適當?

否 是

是 模

型 的 暫 定

參 數 估 計

診 斷 檢 定

預 測

在文檔中 一、 研究主題 (頁 21-25)

相關文件