• 沒有找到結果。

第三章 研究方法

3.4 衡量模型的預測表現

本節介紹預測誤差作為衡量模型預測表現的指標。下列為計算模型預測誤 差的步驟與算法︰

一. 給定預測值為從某一個時間序列模型的預測︰

𝐸(𝑦𝑡+𝑘) = [1 0 ⋯ 0]Φ𝑘𝑌𝑡

二. 定義預測損失(Forecasting Errors)為預測值與實際值之間的差異︰

𝑒𝑡+𝑘,𝑡 = 𝑦𝑡+𝑘− 𝐸(𝑦𝑡+𝑘)

三. 定義預測損失函數為𝐿(𝑒𝑡+𝑘,𝑡),依照計算方法區分為下列三種函數形式︰

𝐿(𝑒𝑡+𝑘,𝑡) = {

(𝑒𝑡+𝑘,𝑡)2 二次函數法

|𝑒𝑡+𝑘,𝑡| 絕對函數法 𝑢(𝑒𝑡+𝑘,𝑡) 效用函數法

四. 預期預測損失函數為𝐸[𝐿(𝑒𝑡+𝑘,𝑡)],依照函數形式區分如下︰

A. 採用二次函數法計算的預期預測損失函數稱為均方差(MSE)和均方差 平方根(RMSE)︰

𝑀𝑆𝐸 = 𝐸[𝐿(𝑒𝑡+𝑘,𝑡)] = 𝐸 [(𝑒𝑡+𝑘,𝑡)2]

𝑅𝑀𝑆𝐸 = √𝐸[𝐿(𝑒𝑡+𝑘,𝑡)] = √𝐸 [(𝑒𝑡+𝑘,𝑡)2]

B. 採用絕對函數法計算的預期預測損失函數稱為絕對均差(MAE)︰

𝑀𝐴𝐸 = 𝐸[𝐿(𝑒𝑡+𝑘,𝑡)] = 𝐸[|𝑒𝑡+𝑘,𝑡|]

假設有兩個時間序列模型A 與模型 B,可以分別計算出預期預測損失為 𝐸[𝐿(𝑒𝑡+𝑘,𝑡𝐴 )]與𝐸[𝐿(𝑒𝑡+𝑘,𝑡𝐵 )]。當模型預測損失越低,則該模型的預測準確度越 高,例如當𝐸[𝐿(𝑒𝑡+𝑘,𝑡𝐴 )] < 𝐸[𝐿(𝑒𝑡+𝑘,𝑡𝐵 )]時,則稱模型 A 相較於模型 B 具有較高 的預測準確度。一般而言最常使用的為均方差(MSE),故本文使用二次函數 法,也就是當𝑀𝑆𝐸𝐴 < 𝑀𝑆𝐸𝐵時,則稱模型A 相較於模型 B 具有較高的預測準確 度。

15

3.4.1 樣本外預測

在使用DM 檢定之前,需要先透過樣本外預測來重新分配樣本資料。樣本 外預測的操作方法為依照研究者選取的預測期數,將原始資料拆解成「樣本 內」與「樣本外」兩個部分,利用樣本內資料(拆解後的已知資料)在實證模型 中估計出預測值,再對比樣本外資料(拆解後假裝成的未知資料)計算出預測誤 差,藉此評估模型的預測準確度。樣本外預測有兩項優點,一方面可以提升研 究的速度,研究者不必確實地等待到預測時間發生就能透過實際資料來檢驗預 測成效,另一方面可以增加研究的嚴謹程度,避免模型出現過度配適(Over Fit) 的現象。

本文的原始資料共有256 筆月資料,將資料依照 5 年、10 年、15 年的期 間,分別選取60 筆、120 筆、180 筆月資料作為樣本外資料。扣除選取的資料 後,剩餘的資料則作為樣本內資料。由於模型設定1、3、6、12 個月的預測期 數,故樣本外資料的筆數會受到模型設定的預測期數影響,而分別再減少1、

3、6、12 筆資料。

16

3.4.2 Diebold–Mariano 檢定

本文採用DM 檢定來比較隨機漫步模型、加入央行干預的隨機漫步模型、

17

Diebold–Mariano(1995)提出 DM 統計量,其作為評估兩種模型之間的預測 準確度是否具有統計顯著性,說明如下︰

𝐷𝑀 = 𝑑̅

√ 𝐺̂ 𝑇 − 1

~𝑡(𝑇 − 1),

𝐺̂ = 𝛾̂(0) + 2 ∑ 𝛾̂(𝑗)

𝑚

𝑗=1

,

其中𝛾̂(𝑗)為𝑗階自我共變異數,𝛾(𝑗) = 𝐶𝑜𝑣(𝑑𝑡, 𝑑𝑡−𝑗)的一致性估計式5。 當樣本很大時,DM 統計量的極限分配為標準常態分配。

𝐷𝑀→ 𝑁(0,1) 𝑑

陳旭昇(2013)在《時間序列分析》提到務實做法為將𝑑𝑡對常數項做簡單迴 歸,利用Newey and West(1987)提出的 HAC 標準差所得到的 t 統計量,即為 DM 統計量。

本研究使用eviews 軟體計算 DM 統計量,其算式如下︰

𝐷𝑀𝑠𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑐 = 𝑑̅

√𝑉(𝑑) 𝑇

~𝑁(0, 1),

其中𝑉(𝑑)為𝑑的變異數。

5

由於一致性估計式具有大樣本性質,因此當樣本增加時,估計值會趨近於母體參數真值的機

率提高。

18

相關文件