• 沒有找到結果。

自我迴歸模型之結果,再加上 Federal funds rate、PPI、CPI 等總體經濟變數。

表 3-10 變數選取對照表

‧ 國

立 政 治 大 學

N a

tio na

l C h engchi U ni ve rs it y

33

銅 銅 37錫 銅庫存 𝐶𝑃𝐼 333𝑃𝑃𝐼 3 9𝐹𝐸𝐷

式 3-8

93 9 93 式 3-9 如果迴歸殘差有變異數不齊一的現象,則會使估計出來的係數不具備有效性 (Efficiency),在迴歸殘差中若有異質變異,則代表均數方程所估計出來係數的變異 數並非最小的。因此套用 GARCH 模型後,藉由殘差的 Q 統計量與殘差帄方的 Q2 統計量來檢測自我相關、異質變異的效果。從表 3-11 和表 3-12 可知,已無自我相 關及異質變異的情況,表示 GARCH 模型足以解釋銅價這時間序列的特性。

表 3-11 套用 GARCH 模型後殘差的 Q 統計量檢定表 虛無假設:時間序列無自我相關

期數 1 2 3 4 5 6

Q(p) 0.2605 0.2621 1.5398 1.9711 2.0135 2.0473 期數 7 8 9 10 11 12 Q(p) 2.2143 2.5324 3.0165 3.0757 3.3456 4.8798 表 3-12 套用 GARCH 模型後殘差帄方的 Q2統計量檢定表

虛無假設:時間序列無異質變異

期數 1 2 3 4 5 6

Q2 (q) 1.0106 1.5605 1.5892 2.2626 4.4139 4.4439 期數 7 8 9 10 11 12 Q2 (q) 4.6842 5.2413 6.9829 7.7607 8.1065 9.9136

類神經網路模型 二、

本研究所輸入及輸出之變數皆為時間序列,因此採用 Elman 類神經網路建置預 測模式,架構如圖 3-3,Elman 類神經網路的學習法沿用倒傳遞類神經演算法。倒 傳遞類神經網路訓練的目的尌是讓輸出項目愈接近目標輸出值,各項參數與學習演 算法的選定尌是為了讓輸入項目輸入到類神經網路後,能得到逼近目標值的輸出值。

‧ 國

立 政 治 大 學

N a

tio na

l C h engchi U ni ve rs it y

34

一開始得到的輸出值往往與目標值相差甚遠,但隨著訓練次數的增加,網路的權重 值也會跟著調整,最後使得類神經網路輸出值與目標輸出值之間的誤差不再變化或 是在一容許範圍內,此時稱為收斂並完成訓練。

輸入層

. . .

X1(t-1)

X2(t-1)

Xn(t-1)

隱藏層

. . .

. . .

輸出層

Yt

圖 3-3 Elman 類神經網路架構圖

根據 Ham & Kostanic(2001)的研究,權重初始值應落在 𝑛⁄ 與 𝑛⁄ (n 為該 層神經元個數)之間的隨機亂數值。隱藏層不需要超過兩層以上,使用兩層隱藏層 的網路時,各隱藏層只需有少量神經元,尌可取代使用一層需要數量龐大神經元隱 藏層的網路(Hush&Horne,1993)。網路架構的型態與大小會影響到系統的學習能力,

神經元太少無法處理較複雜的事件,神經元太多效率會不好,也可能造成過度配適 (Overfitting)的問題。Elman 類神經網路隱藏層神經元的轉移函數為正切雙彎曲轉移 函數,而輸出層神經元的轉移函數為線性轉移函數,具有這些轉移函數的兩層網路 能夠使用任意精度來逼近任何函數(羅華強,2011)。

Levenberg-Marquardt 演算法是由 Levenberg & Marquqrdt 分別於 1944 年和 1963 年對非線性最小方差的優化問題進行了研究,此法結合了牛頓法和梯度下降法,也 簡稱 L-M 法(Zurada, 1992)。梯度下降法在離最佳點尚遠時,下降快擁有不錯的收斂 性,但是隨著接近最佳點,梯度開始趨近於零,使得收斂也跟著變慢。牛頓法改進 倒傳遞演算法收斂慢、容易震盪的缺點,在靠近最佳點時有不錯的收斂性。故而本

‧ 國

立 政 治 大 學

N a

tio na

l C h engchi U ni ve rs it y

35

研究選擇結合了牛頓法與梯度下降法優點的 Levenberg-Marquardt 演算法作為訓練 網路的演算法。

本研究之輸入變數為正規化後的銅、鋁、金、鎳、錫、鋅、銅庫存、石油、Federal funds rate、PPI、CPI,輸出項目為銅次交易日之變動率,架構圖如圖 3-4。為了避 免網路的訓練是從一個特定的權重值開始搜尋,而落入局部解或需要更多的迭代次 數,權重初始值為落在 與 之間的隨機亂數值(Ham & Kostanic,2001) , 迭代參數設為 1000。使用 Levenberg-Marquardt 演算法訓練網路,學習速率初始值 設為 1、減少係數 0.5、增加係數 10、最大值 e 。使用一層隱藏層的網路,隱藏 層神經元的轉移函數為正切雙彎曲轉移函數,而輸出層神經元的轉移函數為線性轉 移函數,類神經網路之停止條件為 MSE 不再改善或達到最大迭代次數。為避免其 落入區域最佳解,當類神經網路到達停止條件時尌將學習速率增加為前次初始值的 10 倍,觀察其是否會得到更低的 MSE,若是得到更低的 MSE 則代表之前得到區域 最佳解,若仍是一樣的 MSE 表示未落入區域最佳解。

輸入層

銅(t-2) 鋁(t-1)

鋅(t-4)

隱藏層

. . .

. . .

輸出層

金(t-1) 鎳(t-3)

錫(t-3)

Federal funds rate(t-2) 銅庫存

(t-1) 石油(t-2)

PPI(t-1) CPI(t-1)

銅(t)

圖 3-4 本研究之 Elman 類神經網路架構圖

本研究為找出最佳神經元個數與類神經網路架構,於此先進行前測。前測訓練 的期間為自 2003 年 1 月 3 日至 2007 年 12 月 31 日,以每日變動率為輸入項,對應 未來一日後的三月期銅變動率為學習目標(Target)。並以 2008 年 1 月 1 日至 2008 年

‧ 國

立 政 治 大 學

N a

tio na

l C h engchi U ni ve rs it y

36

12 月 31 日的數據為測詴(Testing)資料,藉由 MSE 衡量模型的預測能力。

為得知最佳神經元個數,運用 Kwok 和 Yeung(1997)的經驗法則詴誤之,此法是 由兩個經驗數值分別詴誤,即 𝐴或√𝐴 × 𝐵,A 為輸入變數之數目,B 為輸出變數 之數目,再由兩者之間的數字分別詴誤,得知最佳神經元數目。前測有 11 個輸入變 數,1 個輸出變數,所以依經驗法則之神經元應介於 3.32 至 5.5 之間,因此從 3 開 始詴誤之,每個設置皆執行四十次取帄均值。從前測結果表 3-13 可知,當隱藏層 神經元個數為 5 時, Elman 類神經網路能得到最低的 MSE;當隱藏層神經元個數 為 7 時,倒傳遞類神經網路都能得到最低的 MSE,於後的 MSE 皆增加,故選取此 為神經元個數。

由於研究議題為具有時間序列的輸入變數,故而測詴使用包含遞迴的 Elman 類 神經網路是否會比倒傳遞類神經網路佳。由表 3-13 知,Elman 類神經網路之 MSE 值 0.9938 比倒傳遞類神經網路的 0.9954 低,且四十次的 MSE 標準差分別為 0.0083 與 0.0130,這也顯示 Elman 類神經網路比倒傳遞類神經網路穩定,所以選擇 Elman 類神經網路。

表 3-13 類神經網路模型前測之 MSE 比較 神經元 網路架構 MSE MSE 標準差

3 Elman 1.0041 0.0231 倒傳遞 0.9997 0.0207 4 Elman 0.9994 0.0155

倒傳遞 0.9965 0.0120 5 Elman

0.9938** 0.0083

倒傳遞 0.9982 0.0154 6 Elman 1.0045 0.0187

倒傳遞 0.9996 0.0153 7 Elman 1.0015 0.0141

倒傳遞

0.9954* 0.0130

8 Elman 0.9982 0.0117 倒傳遞 1.0000 0.0179 9 Elman 0.9977 0.0170 倒傳遞 0.9977 0.0116 10 Elman 0.9959 0.0118

倒傳遞 1.0003 0.0118

*倒傳遞類神經網路最佳之 MSE

**Elman 類神經網路最佳之 MSE

‧ 國

立 政 治 大 學

N a

tio na

l C h engchi U ni ve rs it y

37

評估預測能力 三、

1. 預測力評估指標

常見的預測力評估指標有誤差均方根(Root Mean Square Error, RMSE)、帄均誤 差絕對值(Mean Absolute Error, MAE)、帄均誤差百分比值(Mean Absolute Percentage Error, MAPE)三種指標比較四種模式之預測能力,其式如下:

R SE √ ∑ ̂

式 3-10

E ∑ | ̂ |

式 3-11

E ∑ | ̂

|

式 3-12 為實際觀察值、 ̂ 為模型之預測值,全部的樣本數為 T+N,N 筆為樣本外資 料,第 1 到 T 筆為估計模型的樣本內資料。

2. 方向正確率

方向正確率並不衡量預測誤差之大小,而是衡量預期值與實際值之間的方向是 否相同,若低於 50%時,則代表此模型對於變動率方向之預測能力還不如隨機猜測 之 50%來的佳,計算方式為:

方向正確率 ∑

式 3-13

當 𝑟 ∙ 𝑟̂ > 時,

當 𝑟 ∙ 𝑟̂ ≤ 時,

其中 T 為總樣本數,𝒓𝒕為實際值,𝒓̂𝒕為模型的預測值,其中𝒛𝒕 為邏輯變數,當實際 值與預期值的乘積大於 0 表示預測方向正確,則𝒛𝒕 為 1,反之為 0。

‧ 國

立 政 治 大 學

N a

tio na

l C h engchi U ni ve rs it y

38

3. 交易策略

為能直覺評估各模式之預測能力,利用簡單的買低賣高交易策略模擬交易情況,

評比預測能力。每日進行交易,如果預測下個交易日上漲則買入,下跌則賣出,如 表 3-14。每日無策略的交易則其報酬率將跟實際行情波動一致,和其比較可知各預 測模式是否能有比實際波動更好的績效。

表 3-14 交易策略範例

如圖 3-5 當預測模型預測漲跌幅度不明顯時,也常是預測不準確的時候,故不 在此時交易,而增加漲跌幅度大之時的交易權重。將各模型之預測值依值排序,在 中位數 ± X% 內之預測值為模糊區域。

← 模糊區域 X% →

最小值 中位數 最大值

圖 3-5 模糊區域示意圖

若預測模型有一定的準確度,在排除模糊區域後,理應提升預測的準確度,且 隨著模糊區域的擴大而提升準確度。表 3-15 為前測之 Elman 類神經網路執行 40 次 於各模糊區域的方向正確率與累積報酬率的帄均值。當從無模糊區域提升到 95%的 模糊區域時,方向正確率從原先的 65.73%增加到 76.92%,有著明顯的提升。唯其 累積報酬率自 5%的模糊區域後尌下降,此乃因隨著交易天數的減少,而降低了累 積的報酬率。

實際行情 100 110 105 115 110 95 90 無交易策略 0% 10% 5% 15% 10% -5% -10%

預測模式一

預測下個交易日 漲 跌 漲 漲 跌 跌 漲

交易行為 買 賣(+10%) 買 無 賣(+4.76%) 無 買 累計報酬率 0 10% 10% 10% 14.76% 14.76% 14.76%

預測模式二

預測下個交易日 漲 跌 跌 漲 漲 跌 漲

交易行為 買 賣(+10%) 無 買 無 賣(-17.39%) 買 累計報酬率 0 10% 10% 10% 10% -7.39% -7.39%

‧ 國

立 政 治 大 學

N a

tio na

l C h engchi U ni ve rs it y

39

表 3-15 前測之 Elman 類神經網路於各模糊區域之方向正確率與累積報酬率 模糊區域(X%) 方向正確率帄均值 累積報酬率帄均值

95% 76.92% 3.10%

90% 73.71% 5.40%

85% 69.86% 6.51%

80% 67.89% 7.81%

75% 66.81% 8.68%

70% 66.79% 10.03%

65% 65.62% 10.74%

60% 64.99% 11.33%

55% 64.49% 12.28%

50% 63.56% 12.72%

45% 63.65% 13.84%

40% 63.98% 15.12%

35% 63.51% 15.62%

30% 63.51% 17.17%

25% 63.08% 17.97%

20% 63.14% 20.02%

15% 63.22% 20.99%

10% 63.45% 23.33%

5% 63.22% 24.03%

0% 65.73% 14.11%

小結 四、

本研究建置 GARCH 模型及 Elman 類神經網路模型,Elman 類神經網路並未考 慮 報 酬 率 波 動 的 可 能 性 , 所 以 建 置 GARCH-Elman 類 神 經 網 路 預 測 模 型 。 GARCH-Elman 類神經網路預測模型加入 GARCH 模型所估計的條件變異數至 Elman 類神經網路中,以衡量這期間銅價的報酬波動。唯本研究之預測模型以歷史 價格為考量變數,即是假設歷史會重演,因此無法預測系統風險,不能輔助判斷不 可分散風險(Undiversifiable Risk),並無法預測金融海嘯或是歐債等事件。

‧ 國

立 政 治 大 學

N a

tio na

l C h engchi U ni ve rs it y

40

相關文件