衡量模型的預測表現

第三章研究方法

3.4 衡量模型的預測表現

本節介紹預測誤差作為衡量模型預測表現的指標。下列為計算模型預測誤差的步驟與算法︰

一. 給定預測值為從某一個時間序列模型的預測︰

𝐸(𝑦_𝑡+𝑘) = [1 0 ⋯ 0]Φ^𝑘𝑌_𝑡

二. 定義預測損失(Forecasting Errors)為預測值與實際值之間的差異︰

𝑒_{𝑡+𝑘,𝑡} = 𝑦_𝑡+𝑘− 𝐸(𝑦_𝑡+𝑘)

三. 定義預測損失函數為𝐿(𝑒_{𝑡+𝑘,𝑡})，依照計算方法區分為下列三種函數形式︰

𝐿(𝑒_{𝑡+𝑘,𝑡}) = {

(𝑒_{𝑡+𝑘,𝑡})² 二次函數法

|𝑒_{𝑡+𝑘,𝑡}| 絕對函數法 𝑢(𝑒_{𝑡+𝑘,𝑡}) 效用函數法

四. 預期預測損失函數為𝐸[𝐿(𝑒_{𝑡+𝑘,𝑡})]，依照函數形式區分如下︰

A. 採用二次函數法計算的預期預測損失函數稱為均方差(MSE)和均方差平方根(RMSE)︰

𝑀𝑆𝐸 = 𝐸[𝐿(𝑒_{𝑡+𝑘,𝑡})] = 𝐸 [(𝑒_{𝑡+𝑘,𝑡})²]

𝑅𝑀𝑆𝐸 = √𝐸[𝐿(𝑒_{𝑡+𝑘,𝑡})] = √𝐸 [(𝑒_{𝑡+𝑘,𝑡})²]

B. 採用絕對函數法計算的預期預測損失函數稱為絕對均差(MAE)︰

𝑀𝐴𝐸 = 𝐸[𝐿(𝑒_{𝑡+𝑘,𝑡})] = 𝐸[|𝑒_{𝑡+𝑘,𝑡}|]

假設有兩個時間序列模型A 與模型 B，可以分別計算出預期預測損失為 𝐸[𝐿(𝑒_{𝑡+𝑘,𝑡}^𝐴 )]與𝐸[𝐿(𝑒_{𝑡+𝑘,𝑡}^𝐵 )]。當模型預測損失越低，則該模型的預測準確度越高，例如當𝐸[𝐿(𝑒_{𝑡+𝑘,𝑡}^𝐴 )] < 𝐸[𝐿(𝑒_{𝑡+𝑘,𝑡}^𝐵 )]時，則稱模型 A 相較於模型 B 具有較高的預測準確度。一般而言最常使用的為均方差(MSE)，故本文使用二次函數法，也就是當𝑀𝑆𝐸_𝐴 < 𝑀𝑆𝐸_𝐵時，則稱模型A 相較於模型 B 具有較高的預測準確度。

15

3.4.1 樣本外預測

在使用DM 檢定之前，需要先透過樣本外預測來重新分配樣本資料。樣本外預測的操作方法為依照研究者選取的預測期數，將原始資料拆解成「樣本內」與「樣本外」兩個部分，利用樣本內資料(拆解後的已知資料)在實證模型中估計出預測值，再對比樣本外資料(拆解後假裝成的未知資料)計算出預測誤差，藉此評估模型的預測準確度。樣本外預測有兩項優點，一方面可以提升研究的速度，研究者不必確實地等待到預測時間發生就能透過實際資料來檢驗預測成效，另一方面可以增加研究的嚴謹程度，避免模型出現過度配適(Over Fit) 的現象。

本文的原始資料共有256 筆月資料，將資料依照 5 年、10 年、15 年的期間，分別選取60 筆、120 筆、180 筆月資料作為樣本外資料。扣除選取的資料後，剩餘的資料則作為樣本內資料。由於模型設定1、3、6、12 個月的預測期數，故樣本外資料的筆數會受到模型設定的預測期數影響，而分別再減少1、

3、6、12 筆資料。

16

3.4.2 Diebold–Mariano 檢定

本文採用DM 檢定來比較隨機漫步模型、加入央行干預的隨機漫步模型、

17

Diebold–Mariano(1995)提出 DM 統計量，其作為評估兩種模型之間的預測 準確度是否具有統計顯著性，說明如下︰

𝐷𝑀 = 𝑑̅

√ 𝐺̂ 𝑇 − 1

~𝑡(𝑇 − 1),

𝐺̂ = 𝛾̂(0) + 2 ∑ 𝛾̂(𝑗)

𝑚

𝑗=1

其中𝛾̂(𝑗)為𝑗階自我共變異數，𝛾(𝑗) = 𝐶𝑜𝑣(𝑑_𝑡, 𝑑_𝑡−𝑗)的一致性估計式⁵。當樣本很大時，DM 統計量的極限分配為標準常態分配。

𝐷𝑀→ 𝑁(0,1) ^𝑑

陳旭昇(2013)在《時間序列分析》提到務實做法為將𝑑_𝑡對常數項做簡單迴歸，利用Newey and West(1987)提出的 HAC 標準差所得到的 t 統計量，即為 DM 統計量。

本研究使用eviews 軟體計算 DM 統計量，其算式如下︰

𝐷𝑀𝑠𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑐 = 𝑑̅

√𝑉(𝑑) 𝑇

~𝑁(0, 1),

其中𝑉(𝑑)為𝑑的變異數。

由於一致性估計式具有大樣本性質，因此當樣本增加時，估計值會趨近於母體參數真值的機

率提高。

18

在文檔中央行干預下的匯率預測︰以美元兌新台幣與韓元為例 (頁 21-25)

第三章 研究方法

3.4 衡量模型的預測表現

15

16

17

由於一致性估計式具有大樣本性質，因此當樣本增加時，估計值會趨近於母體參數真值的機

率提高。

18

第三章研究方法