第三章 研究方法
3.4 衡量模型的預測表現
本節介紹預測誤差作為衡量模型預測表現的指標。下列為計算模型預測誤 差的步驟與算法︰
一. 給定預測值為從某一個時間序列模型的預測︰
𝐸(𝑦𝑡+𝑘) = [1 0 ⋯ 0]Φ𝑘𝑌𝑡
二. 定義預測損失(Forecasting Errors)為預測值與實際值之間的差異︰
𝑒𝑡+𝑘,𝑡 = 𝑦𝑡+𝑘− 𝐸(𝑦𝑡+𝑘)
三. 定義預測損失函數為𝐿(𝑒𝑡+𝑘,𝑡),依照計算方法區分為下列三種函數形式︰
𝐿(𝑒𝑡+𝑘,𝑡) = {
(𝑒𝑡+𝑘,𝑡)2 二次函數法
|𝑒𝑡+𝑘,𝑡| 絕對函數法 𝑢(𝑒𝑡+𝑘,𝑡) 效用函數法
四. 預期預測損失函數為𝐸[𝐿(𝑒𝑡+𝑘,𝑡)],依照函數形式區分如下︰
A. 採用二次函數法計算的預期預測損失函數稱為均方差(MSE)和均方差 平方根(RMSE)︰
𝑀𝑆𝐸 = 𝐸[𝐿(𝑒𝑡+𝑘,𝑡)] = 𝐸 [(𝑒𝑡+𝑘,𝑡)2]
𝑅𝑀𝑆𝐸 = √𝐸[𝐿(𝑒𝑡+𝑘,𝑡)] = √𝐸 [(𝑒𝑡+𝑘,𝑡)2]
B. 採用絕對函數法計算的預期預測損失函數稱為絕對均差(MAE)︰
𝑀𝐴𝐸 = 𝐸[𝐿(𝑒𝑡+𝑘,𝑡)] = 𝐸[|𝑒𝑡+𝑘,𝑡|]
假設有兩個時間序列模型A 與模型 B,可以分別計算出預期預測損失為 𝐸[𝐿(𝑒𝑡+𝑘,𝑡𝐴 )]與𝐸[𝐿(𝑒𝑡+𝑘,𝑡𝐵 )]。當模型預測損失越低,則該模型的預測準確度越 高,例如當𝐸[𝐿(𝑒𝑡+𝑘,𝑡𝐴 )] < 𝐸[𝐿(𝑒𝑡+𝑘,𝑡𝐵 )]時,則稱模型 A 相較於模型 B 具有較高 的預測準確度。一般而言最常使用的為均方差(MSE),故本文使用二次函數 法,也就是當𝑀𝑆𝐸𝐴 < 𝑀𝑆𝐸𝐵時,則稱模型A 相較於模型 B 具有較高的預測準確 度。
15
3.4.1 樣本外預測
在使用DM 檢定之前,需要先透過樣本外預測來重新分配樣本資料。樣本 外預測的操作方法為依照研究者選取的預測期數,將原始資料拆解成「樣本 內」與「樣本外」兩個部分,利用樣本內資料(拆解後的已知資料)在實證模型 中估計出預測值,再對比樣本外資料(拆解後假裝成的未知資料)計算出預測誤 差,藉此評估模型的預測準確度。樣本外預測有兩項優點,一方面可以提升研 究的速度,研究者不必確實地等待到預測時間發生就能透過實際資料來檢驗預 測成效,另一方面可以增加研究的嚴謹程度,避免模型出現過度配適(Over Fit) 的現象。
本文的原始資料共有256 筆月資料,將資料依照 5 年、10 年、15 年的期 間,分別選取60 筆、120 筆、180 筆月資料作為樣本外資料。扣除選取的資料 後,剩餘的資料則作為樣本內資料。由於模型設定1、3、6、12 個月的預測期 數,故樣本外資料的筆數會受到模型設定的預測期數影響,而分別再減少1、
3、6、12 筆資料。
16
3.4.2 Diebold–Mariano 檢定
本文採用DM 檢定來比較隨機漫步模型、加入央行干預的隨機漫步模型、
17
Diebold–Mariano(1995)提出 DM 統計量,其作為評估兩種模型之間的預測 準確度是否具有統計顯著性,說明如下︰
𝐷𝑀 = 𝑑̅
√ 𝐺̂ 𝑇 − 1
~𝑡(𝑇 − 1),
𝐺̂ = 𝛾̂(0) + 2 ∑ 𝛾̂(𝑗)
𝑚
𝑗=1
,
其中𝛾̂(𝑗)為𝑗階自我共變異數,𝛾(𝑗) = 𝐶𝑜𝑣(𝑑𝑡, 𝑑𝑡−𝑗)的一致性估計式5。 當樣本很大時,DM 統計量的極限分配為標準常態分配。
𝐷𝑀→ 𝑁(0,1) 𝑑
陳旭昇(2013)在《時間序列分析》提到務實做法為將𝑑𝑡對常數項做簡單迴 歸,利用Newey and West(1987)提出的 HAC 標準差所得到的 t 統計量,即為 DM 統計量。
本研究使用eviews 軟體計算 DM 統計量,其算式如下︰
𝐷𝑀𝑠𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑐 = 𝑑̅
√𝑉(𝑑) 𝑇
~𝑁(0, 1),
其中𝑉(𝑑)為𝑑的變異數。
5