• 沒有找到結果。

研究模型之探討:

圖 1 為原始的時間序列圖。座標 X 軸為日期,從 1982 年 1 月開始,至 2008 年 3 月為止;座標 Y 軸為用電量,以千度為單位。由此圖 2-1-1 可以 很明顯的看出,資料是呈現上升的趨勢。表示台灣地區的用電量是年年的

研究對象 台灣 用電量

研究方法 時間序列迴歸模式

分解法 指數平滑法 ARIMA 分析法

預測分析與

模式比較 結論

增高。另外,也可以看出,資料含有季節的波動,且波動的程度隨時間越 來越大。由以上兩點,我們可以得知,資料的平均數與變異數都沒有保持 平衡,此資料為一份不平穩的時間序列資料,建議在後面的各種分析法中,

都要先解決資料不平穩的問題。

圖 1 台灣月平均用電量原始時間序列圖

我們將先後使用 Time Series Regression、Decomposition Method、

Exponential Smoothing、ARIMA,這四種方法來分析這份資料:

(1)Time Series Regression

從原始的時間序列圖中(圖 2),可以發現全台的用電量有隨著時間呈現 向上遞增的趨勢,在用電量方面可看出在每年夏季的用電量情形較其他季 節高,所以該時間序列圖是存在季節因子的,且季節變異波動隨著時間呈 現波動越來越大的情形,所以首先我們要先對季節變數做轉換,使得用電 量的變異要為常數。在此我們對用電量資料取平方根(yt* = yt )與自然對數 轉換(yt* =ln(yt))。由圖 2 可以得知,在做了平方根轉換後,季節波動變異

為常數了。圖 3 為對資料作自然對數的轉換,由圖中顯示若取自然對數的 轉換,則可能有過度轉換的現象,所以我們建議採用取平方根轉換,來對 資料作進一步的分析。

圖 2 平方根轉換後的時間序列圖

在時間序列當中,當季節變異為常數時,我們通常使用下列模型: 是 Durbin-Waston Test 來檢測。其檢定公式如下:

表 2 為誤差項的自我相關檢測,得知 DW 值為 1.4917,其中 P 值

<0.0001,表示確實有嚴重的正自我相關現象,表示 Model 1 不適合。所以 在後面的步驟,我們對誤差項配適一階自我相關,並產生 Model 2。

表 2 誤差項的自我相關檢測表 The AUTOREG Procedure

SSE 1359504.78 DFE 290 MSE 4668 Root MSE 68.46859 SBC 3482.05145 AIC 3433.77292 Regress R-Square 0.9928 Total R-Square 0.9928

Durbin-Watson 1.4917 Pr < DW <.0001

表 3 Yule-Walker 檢定 Yule-Walker Estimates

SSE 1278272.95 DFE 289 MSE 4423 Root MSE 66.50631 SBC 3469.15708 AIC 3417.16482 Regress R-Square 0.9884 Total R-Square 0.9932

Durbin-Watson 2.0895 Pr < DW 0.7771 Pr > DW 0.2229 Coefficient -0.241135

在時間序列迴歸模型中,我們的虛擬變數為「月份」,因為所有的月份 需為同進同出,所以只要其中一個月份的參數是顯著的,則需將所有的月 份留在模型裡。由表 4 中我們可以得知,大部分的參數皆為顯著的,即使 D1、D3、D4 的 P-value 大於 0.05 為不顯著,但我們仍將所有參數皆留在模 型中。

表 4 時間序列迴歸模型參數估計表

Variable Parameter Estimate T-value Pr > | t |

Intercept 1633 100.11 <.0001 t 8.8056 153.42 <.0001 D1 -35.288 -2.11 0.0361 D2 -167.726 -9.00 <.0001 D3 -22.0907 -1.16 0.2472 D4 8.0607 0.42 0.677 D5 106.9938 5.52 <.0001 D6 192.2867 9.93 <.0001 D7 262.2141 13.54 <.0001 D8 330.8555 17.11 <.0001 D9 272.4387 14.16 <.0001 D10 204.7908 10.89 <.0001 D11 122.816 7.28 <.0001

=

Apr-07 17319344 18410725 17272283 19585497 May-07 19502295 19529508 18325026 20772326 Jun-07 19499790 20415149 19181361 21687390 Jul-07 21116601 21143901 19887828 22438434 Aug-07 22029635 21864856 20587214 23180958 Sep-07 21159553 21404002 20140097 22706367 Oct-07 20621365 20863157 19615560 22149216 Nov-07 19307698 20200129 18972793 21465928 Dec-07 17937274 19188306 17992504 20422577 Jan-08 18605658 18957000 17768781 20183673 Feb-08 16187953 17895700 16741767 19088087 Mar-08 17913642 19226227 18029464 20461444

15000000 17000000 19000000 21000000 23000000 25000000

04/07 05/07 06/07 07/07 08/07 09/07 10/07 11/07 12/07 01/08 02/08 03/08

實際值 預測值 U95%

L95%

圖 4 時間序列法實際值與預測表現圖

由圖 4 可知,我們可以看到大部分的實際值皆落在 95% 的信賴區間之 內,但是最後兩筆觀察值是落在區間之外的,分別為 2008 年 2 月及 2008 年 3 月;且還有兩筆觀測值是落在 95%信賴區間的邊界附近,分別為 2007 年 4 月及 2007 年 12 月;另外,再從整體看來,預測值較實際值為偏高。

綜合以上幾點訊息,此模式的預測能力可能還有待確認。

(2)Decomposition Method

由於每月用電量的多寡會受每月天數所影響,所以在使用分解法時,

我們使用了交易日調整功能。另外,我們已經得知資料的平均數與變異數 有越來越大的趨勢,所以在分解法下,我們將使用乘法模式來討論。乘法 模式的公式為:yt =TRt ×SNt ×CLt×IRt。且趨勢預測估計式為:

t

t t

d01 +ε 。表 6 為分解法中,以乘法模式來計算出之參數估計值。

表 6 分解法趨勢參數估計表 Variable DF Parameter

Estimate

Standard

Error T-Value Pr > |t|

Intercept 1 1820360 71523 25.45 <.0001 t 1 54424 407.8423 133.44 <.0001

由表 6 中結果我們可以得知,此預測估計式為:dt =1820360+54424t, 圖 5 為去季節因素的時間序列圖,紅色圓點原始資料序列圖,綠色星狀為 去季節因素時間序列圖,由圖 5 可以得知去季節因素所顯現出之時間序列 有上升的趨勢;另外,參數估計值中的β0 =1820360為正值。由以上兩點訊 息可得知,原始時間序列是有上升趨勢的。趨勢-循環項的時間序列圖(圖 6)顯示資料是有上升現象的趨勢循環。圖 7 為季節項,由圖可以看出,此 份資料有明顯的季節現象,圖 8 則為不規則項。

圖 5 去季節因素的時間序列圖

圖 6 循環項時間序列圖

圖 7 季節項時間序列圖

圖 8 不規則項時間序列圖

由殘差項的自我相關檢測表(表 7)可看出,Pr<DW 為<0.0001,表示有 嚴重的正自我相關。所以在後面的步驟,我們將會對殘差配適一階自我相 關。表 8 為對殘差配適一階自我相關之後的自我相關檢測表。由表 8 可看 出,對殘差配適自我一階相關之後的 DW 值為 2.6657,P-value 仍小於 0.0001,表示資料仍有負自我相關。

表 7 殘差項的自我相關檢測表 The AUTOREG Procedure

SSE 115692000000000 DFE 301

MSE 384358000000 Root MSE 619966

SBC 8951.774 AIC 8944.347

Regress R-Square 0.9835 Total R-Square 0.9835 Durbin-Watson 0.5548 Pr < DW <.0001

Pr > DW 1.0000

表 8 自我相關檢測表 The AUTOREG Procedure

SSE 55764900000000 DFE 300

MSE 185883000000 Root MSE 431142

SBC 8737.072 AIC 8725.93

Regress R-Square 0.9139 Total R-Square 0.9920 Durbin-Watson 2.6777 Pr < DW 1.0000

Pr > DW <.0001

我們保留了 12 筆的真實值,並以程式計算出之估計式,計算出 12 筆 的預測值。我們將這預測出之 12 筆預測值與 12 筆真實值整理如表 9,且 將預測值與真實值,以及估計出之 95%信賴水準的上下界線,繪製成圖 9。

表 9 分解法實際值與預測表現表

日期 真實值 預測值 L95% U95%

Apr-07 17319344 17094883 16249472 17940294 May-07 19502295 18238471 17157561 19319381 Jun-07 19499790 19378116 18145987 20610246 Jul-07 21116601 20072483 18756070 21388896 Aug-07 22029635 21050586 19650878 22450293 Sep-07 21159553 21217525 19798753 22636296 Oct-07 20621365 20007020 18667024 21347016 Nov-07 19307698 18874701 17611038 20138363 Dec-07 17937274 17662423 16481590 18843255 Jan-08 18605658 16937226 15807060 18067391 Feb-08 16187953 15451821 14423032 16480610 Mar-08 17913642 17958980 16766044 19151916

14000000 16000000 18000000 20000000 22000000 24000000

04/07 05/07 06/07 07/07 08/07 09/07 10/07 11/07 12/07 01/08 02/08 03/08

實際值 預測值 U95%

L95%

圖 9 分解法實際值與預測表現圖

由圖 9 的表現可以看出,在 12 筆的資料當中,即使使用了交易日調整 功能,仍有 2 筆的真實值都超出預測區間之外,分別為 2007 年 5 月及 2008 年 1 月;另外若從整體看來,預測值較實際值為偏低。綜合以上幾點訊息,

此模式的預測能力仍有待商確。

(3)Exponential Smoothing

在指數平滑法當中,當季節的波動沒有變異、保持一致時,通常會對 資料配適加法季節模式;但若遇上季節波動有漸大或漸小的趨勢時,通常 會對資料配適乘法季節模式。若配適乘法季節模式,即能解決變異數不平 穩的問題,不需要再對資料作變數的轉換。

由我們的原始時間序列圖(圖 1)可以看出,此份資料的季節波動有漸大 的趨勢,為變異數不平穩的時間序列,所以我們決定不對資料作變數轉換,

直接配適乘法季節模式。經過多種試驗,我們認為配適 Multiplicative Holt -

Winter Method 的表現為最佳。圖 10 為配適 Multiplicative Holt - Winter Method 後的 ACF 圖與 PACF 圖。

圖 10 ACF 圖與 PACF 圖

由圖 10 顯示配適 Multiplicative Holt - Winter Method 之後的 ACF 圖與 PACF,皆呈現了良好的 cut off 表現,表示配適這個模式是適當的。本分析 方法之預測 Multiplicative seasonality 模式如下:

表 10 為配適 Multiplicative Holt - Winter Method 之後的參數估計值表:

Model Parameter Estimate Std. Error T Prob>|T|

LEVEL Smoothing Weight 0.09276 0.0167 5.5617 <.0001 TREND Smoothing Weight 0.03354 0.0111 3.0287 0.0027 SEASONAL Smoothing Weight 0.179 0.0237 7.5429 <.0001

Residual Variance (σ2) 156000000000 . . .

表 11 指數平滑法實際值與預測值表現表

日期 真實值 預測值 L95% U95%

Apr-07 17319344 17644137 16870540 18417735 May-07 19502295 19056527 18278820 19834235 Jun-07 19499790 20161478 19379090 20943866 Jul-07 21116601 20834752 20047512 21621993 Aug-07 22029635 22010231 21216710 22803753 Sep-07 21159553 21587693 20790555 22384831 Oct-07 20621365 20725531 19925878 21525183 Nov-07 19307698 19632463 18831138 20433787 Dec-07 17937274 18204351 17402673 19006029 Jan-08 18605658 17769415 16964426 18574403 Feb-08 16187953 16124168 15320516 16927820 Mar-08 17913642 18416903 17598020 19235787

14000000 16000000 18000000 20000000 22000000 24000000

04/07 05/07 06/07 07/07 08/07 09/07 10/07 11/07 12/07 01/08 02/08 03/08 真實值 預測值 U95%

L95%

圖 11 指數平滑法實際值與預測值表現圖

由表 11 可以看出,所有的預測值皆與真實值相去不遠,表示我們所建 立出來估計式的預測能力是良好的。再由 95%信賴水準的預測圖可以看 出,所有的預測值皆在信賴區間的範圍之內,僅有 1 筆觀測值是落在 95%

信賴區間的邊界附近,為 2008 年 1 月。若從整體看來,指數平滑法的預測 表現,較時間序列迴歸及分解法的預測表現為佳,表示該模式的預測能力 還不錯。

(4)ARIMA

由於從原始時間序列圖(圖 2)當中,我們已經得知資料的平均數與變異 數皆為不平穩的,所以首先我們要解決變異數不平穩的問題。經過多種試 驗,在此我們將利用取對數後的資料來進行 ARIMA 方法分析。圖 12 為經 過對數轉換之後的時間序列圖,其顯示經過對數轉換之後的時間序列,季 節的波動保持一致的狀態,表示變異數已經達到平穩了。但由此圖 12 仍可 以看出,資料有上升的趨勢,表示平均數仍未達到平穩。另外,我們也可 以配合資料的 ACF 與 PACF 圖,來確定資料是否平穩。由圖 13 經過對數 轉換之後的 ACF 與 PACF 圖可以發現 ACF 圖呈現的是 dies down slowly 的 狀態,更確定了此份資料在經過對數轉換之後,平均數仍是不平穩的,所 以我們要再對資料作一次的差分。圖 14 為經過 log 轉換及一次差分之後的 ACF 與 PACF 圖,由 ACF 圖可以看出,殘差在 lag 12 與 lag 24 之處皆為明 顯的不顯著,這個訊息代表資料是含有季節波動的。如果要解決季節因素 的問題,則需要對資料做季節的差分。

圖 12 變數轉換之後的時間序列圖

圖 13 log 轉換之 ACF 與 PACF 圖

圖 14 Log 轉換及一次差分之 ACF 圖與 PACF 圖

圖 15 為經過 log 轉換及季節差分之後的 ACF 與 PACF 圖,由 ACF 圖 可以看出,此圖所呈現的仍是 dies down 的狀態表示只經過季節差分之後,

資料仍然是不平穩的,所以我們需要對資料做一次差分與季節差分。圖 16 為經過 log 轉換、一次差分、季節差分之後的時間序列圖。由圖可以看出,

在經過這些轉換之後,時間序列的變異數與平均數皆已達到平穩的狀態,

表示資料經過這些轉換是合適的。

圖 15 季節差分後的 ACF 與 PACF 圖

圖 16 經過一次差分與季節差分之後的時間序列圖

圖 17 為經過 log 轉換、一次差分、季節差分之後的 ACF 與 PACF 圖。

由圖可以看出,在經過這些轉換之後,資料已呈現 cut off 的狀態,更加說 明資料已經達到平穩了。另外,我們認為 ACF 圖呈現出較好的 cut off 表現,

所以我們決定要配適 MA 模式。由 ACF 圖可以看出,殘差在 lag1 與 lag12 之處有較明顯的不顯著,且由於原始資料的變異數有變大的趨勢,所以我 們將以乘法模式來處理,對資料配適 ARIMA(0,1,1)(0,1,1)s 的模式。

圖 17 一次差分與季節差分後 ACF 與 PACF 圖

由圖 18 可以看出,資料呈現出良好的 cut off 狀態,且所有的殘差皆在 兩倍標準差之內,表示此模式的配適是適當的。另外,我們也試驗了其他

由圖 18 可以看出,資料呈現出良好的 cut off 狀態,且所有的殘差皆在 兩倍標準差之內,表示此模式的配適是適當的。另外,我們也試驗了其他

相關文件