時間序列分析 –

(1)

時間序列分析

– 總體經濟與財務金融之應用 _–

預測表現之評估

陳旭昇

2013.12

(2)

1 評估預測表現

2 Diebold-Mariano檢定

3 樣本外預測

4 樣本外預測實例

(3)

評估預測表現

給定預測為

E_t(y_t+k) = [1 0⋯0]Φ^kY_t.

定義預測誤差(forecasting errors)為預測值與實際值之間的差異_: e_t+k,t = yt+k − Et(yt+k).

預期損失函數(expected loss function)就是因為預測誤差所造成的預期損失或是預期成本_,

E [L(e_t+k,t)] , 其中_L(_⋅)為損失函數。

(4)

評估預測表現

文獻上考慮的損失函數包括

1 二次函數(quadratic function): L(et+k,t) = e_t+k,t²

2 絕對函數(absolute function): L(et+k,t) = ∣et+k,t∣

3 效用函數(utility function): L(e_t+k,t) = u(e_t+k,t)

(5)

評估預測表現

如果損失函數為二次函數_,我們就稱預期損失函數為均方差_(mean squared error, MSE)。

MSE= E[e_t+k,t² ] = E [(yt+k − Et(y_t+k))²] .

有時為了保有原來的單位_,我們會考慮均方差的平方根_{(root mean} squared error, RMSE):

RMSE=√

E[e_t+k,t² ] =√

E [(y_t+k − Et(y_t+k))²].

(6)

評估預測表現

如果損失函數為絕對函數_,我們就稱預期損失函數為絕對均差 (mean absolute error, MAE)。

MAE= E[∣e_t+k,t∣] = E [∣yt+k− Et(y_t+k)∣] . 一般而言,最常使用的預期損失函數為均方差(MSE)。

(7)

評估預測表現

在實務上必須以樣本資料予以估計_,以_MSE為例_,其估計式為 MSÊ = 1

T

∑T j=1

eˆ²_t+k,t, 其中

eˆ_t+k,t = y_t+k − ̂E_t(yt+k), Ê_t(yt+k) = [1 0⋯0] ˆΦ^kY_t, 亦即我們將Φ以Φ^ˆ 取代之。

(8)

Diebold-Mariano檢定

Diebold-Mariano 檢定

如果有兩個時間序列模型_A與_B,我們可以分別求得預期預測損失為_E[L(e^A

t+k,t)]與_E[L(e^B

t+k,t)],若_E[L(e^A

t+k,t)] < E[L(e^B_t+k,t)],則稱模型_A是一個預測表現較好的時間序列模型。

然而_,模型_A的預期預測損失要小多少我們才能認定模型_A在統計上顯著小於模型_B?

(9)

Diebold-Mariano 檢定

給定任何形式之損失函數,我們可以執行以下的相同預測能力檢定: H0∶ E[L(e^A_t+k,t)] = E[L(e^Bt+k,t)]

H1∶ E[L(e^A_t+k,t)] < E[L(e^Bt+k,t)]

令

d_t = L(e^A_t+k,t) − L(e^B_t+k,t) =

⎧⎪

⎪⎪

⎪⎨

⎪⎪

⎩

(e^A_t+k,t)²− (e_t+k,t^B )² 二次函數

∣e^A_t+k,t∣ − ∣e_t+k,t^B ∣ 絕對函數 u(e^A_t+k,t) − u(e_t+k,t^B ) 效用函數

且

d =¯ 1 T

∑T t=1

d_t,

(10)

Diebold-Mariano 檢定

Diebold and Mariano(1995)提出了_DM統計量_, DM =

d¯

√ _ˆ

G T−1

∼ t(T − 1),

G = ˆˆ γ(0) + 2 ∑^m

j=1

γˆ(j),

其中γˆ(j)為_j階自我共變異數_{, γ}(j) = Cov(dt,d_{t− j})的一致估計式。

Diebold and Mariano(1995)建議設定_{m = T}^1/3₍取到最接近的整數₎。當樣本很大時_{, DM}統計量的極限分配為標準常態,

DMÐ→ N(0, 1).^d

(11)

樣本外預測

我們在衡量預測表現所面臨的問題為_:如果在第_T期擁有資料為 {y¹,y2, . . . ,y_T},所做出的預測_{ˆy_T+k,T, ˆy_T+k+1,T+1, . . . ,}是沒有實

際資料_{y_T+k,y_T+k+1, . . .}來做預測表現的評判_,只有到了第_{T + k}

期_,才能算出第一個預測誤差eˆ_T+k,T。

一般而言_,我們至少要有多筆預測誤差才能估計_{MSE (}假設是₁₀ 筆₎。因此_,如果建構一個匯率走勢的月時間序列模型_,則必須等

k + 10個月後才會知道所建構的時間序列模型預測能力的好壞。

(12)

樣本外預測

經濟學家通常沒什麼耐性,於是我們會採用一種預測方法稱為「擬真樣本外預測」(pseudo out-of-sample forecasting),簡稱「樣本外預測」(out-of-sample forecasting)。

樣本外預測的概念十分簡單_,將手頭有的資料拆成兩部分_,將其中_R 筆資料_{y₁,y2, . . . ,y_R}稱做樣本內資料(in-sample observations), 另外_P筆資料_{y_R+1,y_R+2, . . . ,y_T}稱做樣本外資料(out-of-sample observations), R + P = T,一般而言_{, R}_{/T =10%}或是_15%。

(13)

樣本外預測

之所以稱此為「擬真」或是「造假」_(pseudo)的樣本外預測_,原因在於並不是執行真正的樣本外預測,所謂的「樣本外」意指樣本以外未知的資料點_,必須是等到本期之後才會實現的資料。

在此_,把已知樣本切成兩部分_,一部分是「已知」_,我們用來估計模型_; 另一部分我們「假裝未知」_,利用這些資料點與模型的預測作比較_, 藉以評估模型的預測能力。

(14)

樣本外預測

以下我們說明執行樣本外預測的程序。

性質₍樣本外預測₎

1 以_{y₁_,_y₂_{, . . . ,}_y_R_}估計時間序列模型。

2 建構預測:{ ˆyR+1,R, ˆy_R+2,R+1, . . . , ˆy_{T ,T−1}}。

3 建構預測誤差_:_{ê_R+1,R, êR+2,R+1, . . . , êT ,T−1}。

4 計算_MSE的估計式

MSÊ = 1 P

T−1

∑

j=T−P

eˆ²_{j+1, j}.

(15)

樣本外預測

如果有兩個時間序列模型_A與_B,我們可以分別求得_MSE_A與MSE_B,若 MSE_A< MSEB,則稱模型_A是一個以樣本外預測來衡量_,預測表現較好的時間序列模型。

(16)

樣本外預測

樣本內估計依照所使用的樣本期間(sample span)而有三種不同作法。

以_AR(1)模型為例_,

y_t = β1y_t−1+ εt.

1. 遞迴法(recursive scheme) βˆ1^(t)=[∑^t

s=1

y²_s]

−1

[∑^t

s=1

y_sy_s+1] , t = R − 1, R, . . . , R + P − 2.

(17)

樣本外預測

2. 滾輪法(rolling scheme)

βˆ^(t)1 = [ ∑^t

s=t−R+2

y²s]

−1

[ ∑^t

s=t−R+2

ys−1ys+1] , t = R − 1, R, . . . , R + P − 2.

3. 固定法(fixed scheme) βˆ1=[∑^R

s=1

y²_s−1]

−1

[∑^R

s=1

y_s−1y_s] .

(18)

樣本外預測

在固定法之下_,只會利用_{y₁,y2, . . . ,y_R}估計出一個_β^ˆ₁_,而遞迴法與滾輪法就會估計出因時而變(time-varying)的估計式_β^ˆ^(t)₁ 。遞迴法是利用_{y₁_,y₂_{,. . .,y}_R_}估計出_β^ˆ⁽¹⁾₁ _,接下來利用_{y₁_,y₂_{, . . .,y}_R_, y_R+1}估計出_β^ˆ⁽²⁾₁ _,...依此類推。

滾輪法則是利用_{y₁_,y₂_{,. . .,y}_R_}估計出_β^ˆ⁽¹⁾₁ ,接下來利用 {y²,y3,. . .,yR, yR+1}估計出_β^ˆ⁽²⁾₁ _,...依此類推。

遞迴法下的樣本數會不斷增加_,而滾輪法下的樣本數是固定的。

(19)

樣本外預測實例

圖_:_AR(1)模型估計結果

(20)

樣本外預測實例

圖_:樣本外預測

3.40 3.44 3.48 3.52 3.56 3.60

04:1 04:3 05:1 05:3 06:1 06:3 07:1 07:3 LSF

Forecast: LSF Actual: LS

Forecast sample: 2004:1 2007:4 Included observations: 16 Root Mean Squared Error 0.021030 Mean Absolute Error 0.015946 Mean Abs. Percent Error 0.457246 Theil Inequality Coefficient 0.003012 Bias Proportion 0.000010 Variance Proportion 0.002387 Covariance Proportion 0.997603

時間序列分析 –