• 沒有找到結果。

中 華 大 學

N/A
N/A
Protected

Academic year: 2022

Share "中 華 大 學"

Copied!
171
0
0

加載中.... (立即查看全文)

全文

(1)

中 華 大 學 碩 士 論 文

題目:遺傳神經網路股票買賣決策系統的實證 Applications of Stock Trading Decision System

Using Genetic Neural Networks

系 所 別:資訊管理系

學號姓名:M09410005 黃兆瑜 指導教授:葉怡成

中華民國 九十六 年 六 月

(2)

摘要

本研究採用「強化式學習」的策略,直接建構基於技術指標的遺傳神經網路 (GNN)股市買賣決策系統,免除了傳統上必須先建構精確的股市漲跌預測系統的 困難。並探討七個台灣股票市場的議題,其結果如下:(1) 在演化過程中,確實 可以觀察到「訓測相關」與「世代進步」現象,顯示在強化式學習的演化歷程中,

GNN 確實學習到具普遍化獲利能力的交易策略。(2) 使用包含成交量的資訊產生 的系統如果能避免過度學習,可以提高投資績效。(3) 使用 12 年的訓練期間資 料足以學習到具普遍化獲利能力的交易策略,4.5 年的訓練期間則否。(4) 使用 多數決策略無助於提高對大盤的投資績效,僅可使其更加穩定。(5) 使用 GNN 決策系統到八大類股指數並無法提高類股投資績效。(6) 使用雙向交易的 GNN 獲利顯著高於單向交易的GNN。(7) 當技術指標 RSI、MAI 與 MVI 越大,越可 能是買入時機。此外,以包含各種經濟發達程度的22 個國家 1997~2006 共九年 的股票市場為樣本,進行實證研究。研究結果顯示,部份國家的股票市場在考慮 交易成本下使用技術分析仍可獲得明顯的超額利潤,因此市場行為有其非線性成 份存在。在測試期間,人均國內生產毛額可解釋市場效率指標61%的變異,F 統 計達0.002%顯著水準,可見市場效率與經濟發展程度有關。

關鍵字:股票市場、技術指標、遺傳演算法、類神經網路、市場效率,經濟發展。

(3)

Abstract

This study employed “Reinforced Learning” strategy to construct stock trading decision system using Genetic Neural Networks (GNN) directly, and to avoid constructing forecast system for stock price rise and drop, and validated seven important issues aiming at Taiwan stock market. The results showed that (1) in the evolution process of GNN, two phenomena can be observed that “the training period performance is truly relevant to test period performance” and “the performance increases as the evolution generation of GNN increases”, which demonstrated that GNN can learn the general profitable trading strategy; (2) adding the volume information into the trading system can increase investment performance if overlearning can be avoided; (3) the profit of the trading system using short period information (4.5 years) is obviously smaller than that using long period information (12 years), which demonstrated that 4.5 years is too short to learn a general profitable trading strategy; (4) using “majority decision strategy based on multi-GNNs” can not increase the mean but can reduce the standard deviation of profit , which demonstrated that this strategy is useful to improve the stability of investment performance; (5) with regard to sector price index, the profit of the trading system is about the same as the buy-and-hold strategy, which demonstrated that the system can not increase the investment performance on the sector index; (6) GNN using

“two-way trading” is obviously better than “buy-and-hold” strategy; and (7) when RSI、MAI and MVI is high, it may be a buying opportunity suitably. Moreover, twenty two countries, that contain each economy development degree, nine years (1997~2006) stock market data were used as the samples to conduct the study. The findings showed that it is still possible to obtain obvious excess profit by using technical analysis under considering transaction cost in some stock markets; therefore, the market behavior has its non-linear ingredient. In test period, the per capita GDP may explain 61% variation of the market efficiency index, the F statistics reaches 0.002% remarkable level; therefore, the economy development degree obviously affects the market efficiency.

Keywords: stock market, technical index, genetic algorithms, neural networks,

market efficiency, economy development.

(4)

誌謝

首先要感謝我的指導老師 葉怡成教授,在研究所這段期間不厭其煩細心的 指導,不論在專業的知識或生活上待人處事方面,都讓我獲益匪淺,真的 非常感謝老師的教導。

另外要感謝 徐聖訓老師,在我剛進研究所半年多的時間,除了教導我許多 專業知識,並從老師身上學習到獨特的思維與想法,真誠的感謝老師的教導。

此外要特別感謝立川學長,提供我寶貴的資料,並撥空教導我軟體操作的方 法,也要感謝文盟學長、靜婉學姐給予我研究上的協助,也要感謝同學韋綸、謹 豪、冠呈、逸芸、夏暘、育銘、郁君以及萬鈞學弟,這段時間在實驗室陪伴我研 究,也讓我留下許多美好的回憶。

最後感謝我的家人,親愛的爸爸、媽媽以及哥哥,因為有你們鼓勵與支持,

才讓我有機會完成研究所的學位,非常感謝你們,謹將此論文獻給你們,分享我 小小的榮耀。

謹識于中華大學資訊管理研究所 九十六年六月

(5)

目錄

摘要...i

Abstract...ii

誌謝...iii

目錄...iv

圖目錄...vi

表目錄...viii

第一章 導論 ...1

第一節 研究動機...1

第二節 文獻回顧...4

第三節 研究內容... 11

第二章 遺傳神經網路股票買賣決策系統 ...12

第一節 資料收集...12

第二節 技術指標的計算...12

第三節 交易規則及適應度函數定義...14

第四節 遺傳神經網路(Genetic Neuron Network, GNN)...15

第五節 系統建構...18

第六節 決策規則之評估方式...18

第七節 神經網路的輸入對輸出的關係...19

第三章 台灣股票市場之實證 ...22

第一節 前言...22

第二節 遺傳神經網路可以提高對大盤的投資績效嗎?...22

第三節 成交量的資訊可提高對大盤的投資績效嗎?...24

第四節 訓練期間的長度需要多長以上才足夠呢?...27

第五節 多遺傳神經網路多數決策略可提高對大盤的投資績效嗎?...28

第六節 遺傳神經網路可提高對類股的投資績效嗎?...33

第七節 雙向交易可提高對大盤的投資績效嗎?...34

第八節 隱藏在遺傳神經網路內的決策規則是什麼?...38

第九節 結合加入量的資訊與多網決策之GNN模式...43

(6)

第十節 最近三年之驗証結果...53

第十一節 移動學習法可以改善績效嗎?...61

第十二節 過度學習是可以改善嗎?...65

第十三節 結論...66

第四章 各國股票市場效率與經濟發達程度關係之實證 ...69

第一節 前言...69

第二節 資料收集...70

第三節 單向交易策略...70

第四節 雙向交易策略...78

第五節 結論...81

第五章 結論與建議 ...83

第一節 結論...83

第二節 建議...84

參考文獻...87

附錄一、本研究選取的股價指數...91

附錄二 本研究股價指數來源 ...92

附錄三 GA程式...94

附錄四 GANN程式...109

附錄五 遺傳演算套裝軟體Gene Hunt簡介 ...124

附錄六 遺傳神經網路股票買賣決策系統GAStock...136

附錄七 遺傳神經網路股票買賣決策試算表 ...154

附錄八 光碟目錄 ...161

(7)

圖目錄

圖2-1 訓練期間及測試期間的大盤指數 ...12

圖2-2 遺傳演化神經網路大盤加權指數交易決策模型 ...16

圖2-3 遺傳傳神經網路流程圖 ...17

圖2-4 Gene Hunter上實作圖 ...18

圖3-1 不同世代下訓練期間與測試期間獲利係數散佈圖 ...24

圖3-2 長訓練期間與三個短訓練期間 ...27

圖3-3 100 世代 1~30 網測試期間的獲利係數直方圖(買賣網數決策門檻法)...31

圖3-4 100 世代三十網路之買、賣、不買不賣網路數目變化圖...32

圖3-5 單向交易獲利係數的平方與雙向交易獲利係數平方的關係 ...36

圖3-6 GNN(6-6-1) 線性作用指標...38

圖3-7 GNN(9-6-1) 線性作用指標...39

圖3-8 GNN(18-6-1) 線性作用指標...40

圖3-9 訓練範例的買入與賣出交易點 ...45

圖3-10 測試範例的買入與賣出交易點 ...45

圖3-11 訓練範例的大盤指數與買賣績效比較圖 ...46

圖3-12 測試範例的大盤指數與買賣績效比較圖 ...46

圖3-13 GNN買賣決策時間點與技術指標的關係...47

圖3-14 GNN買賣決策時間點與技術指標的關係(續一) ...48

圖3-15 GNN買賣決策時間點與技術指標的關係(續二) ...49

圖3-16 GNN買賣決策時間點與技術指標的關係(續三) ...50

圖3-17 GNN買賣決策時間點與技術指標的關係(續四) ...51

圖3-18 加入近三年資料的訓練範例大盤指數與買賣績效比較圖 ...54

圖3-19 加入近三年資料的測試範例大盤指數與買賣績效比較圖 ...54

圖3-20 加入近三年資料的訓練範例大盤指數與買賣績效比較圖 ...55

圖3-21 加入近三年資料的測試範例的大盤指數與買賣績效比較圖 ...55

圖3-22 加入近三年資料的GNN買賣決策時間點與技術指標的關係...56

圖3-23 加入近三年資料的GNN買賣決策時間點與技術指標的關係(續一)...57

圖3-24 加入近三年資料的GNN買賣決策時間點與技術指標的關係(續二)...58

(8)

圖3-25 加入近三年資料的GNN買賣決策時間點與技術指標的關係(續三)...59

圖3-26 加入近三年資料的GNN買賣決策時間點與技術指標的關係(續四)...60

圖3-27 DW權值敏感度折線圖...62

圖3-28 RSI權值敏感度折線圖 ...62

圖3-29 PVI權值敏感度折線圖 ...63

圖3-30 PVC權值敏感度折線圖...63

圖3-31 MAI權值敏感度折線圖...64

圖3-32 MVI權值敏感度折線圖...64

圖3-33 加入近三年資料的GNN線性作用指標...65

圖4-1 訓練期間各國市場效率指標與Log10 GDP之散佈圖(考慮交易成本) ...73

圖4-2 測試期間各國市場效率指標與Log10 GDP之散佈圖(考慮交易成本) ...73

圖4-3 訓練期間對測試期間的市場效率指標之散佈圖(考慮交易成本)...74

圖4-4 訓練期間各國市場效指標與Log10 GDP之散佈圖(不考慮交易成本) ...77

圖4-5 測試期間各國市場效率指標與Log10 GDP之散佈圖(不考慮交易成本) ...77

圖4-6 訓練期間對測試期間的市場效率指標之散佈圖(不考慮交易成本)...78

圖4-7 訓練期間各國市場效率指標與Log10 GDP之散佈圖(雙向交易) ...80

圖4-8 測試期間各國市場效率指標與Log10 GDP之散佈圖(雙向交易) ...80

圖4-9 訓練期間對測試期間的市場效率指標之散佈圖(雙向交易)...81

(9)

表目錄

表1-1 類神經網路在證券市場交易決策的應用文獻回顧 ...5

表1-2 遺傳演算法在證券市場交易決策的應用文獻回顧 ...7

表1-3 遺傳演算法結合類神經網路在證券市場交易決策的應用文獻回顧 ...9

表3-1 不同世代數下訓練期間與測試期間的結果平均值 ...23

表3-2 純價格系統(只使用與價格有關的指標)的執行結果...25

表3-3 標準價量系統(使用成交量與價格的 18 個指標)的執行結果...26

表3-4 簡化價量系統(使用成交量與價格的 6 個指標)的執行結果...26

表3-5 台灣大盤不同時期的投資績效 ...28

表3-6 單網路單一決策略測試期間獲利係數表 (買賣網數決策門檻法)...30

表3-7 十網路多數決策略測試期間獲利係數表(買賣網數決策門檻法)...30

表3-8 三十網路多數決策略測試期間獲利係數表(買賣網數決策門檻法)...30

表3-9 6-6-1 三十世代三十網路獲利係數表(買賣網數差額門檻法) ...33

表3-11 台灣大盤不同世代績效表 ...35

表3-13 台灣大盤不同世代雙向與單向操作績效表 (傳統獲利係數)...37

表3-14 GNN(6-6-1) 線性作用指標...38

表3-15 GNN(9-6-1) 線性作用指標...39

表3-16 GNN(18-6-1) 線性作用指標...40

表3-17 GNN決策規則表...42

表3-18 6-6-1 網路的二階敏感性平均值矩陣...43

表3-19 6-6-1 網路的二階敏感性標準差矩陣...43

表3-20 6-6-1 網路的二階敏感性t檢定矩陣...43

表3-21 以 6-6-1 模型結合三十網路多數決策略測試期間獲利係數表...44

表3-22 三十網路多數決策略在訓練範例期間之比較 ...52

表3-23 三十網路多數決策略在測試範例期間之比較 ...52

表3-24 以 6-6-1 模型結合三十網路多數決策略測試期間獲利係數表...53

表3-25 以三十世代使用移動學習法十一個時期的獲利係數表 ...61

表3-25 以一世代使用移動學習法十一個時期的獲利係數表 ...66

(10)

表3-26 以三自變數使用移動學習法十一個時期的獲利係數表 ...66

表4-1 各國股市市場效率指標(考慮交易成本)...71

表4-2 訓練資料的Log10 GDP對市場效率指標之ANOVA分析(考慮交易成本) .72 表4-3 測試資料的Log10 GDP對市場效率指標之ANOVA分析(考慮交易成本) .72 表4-4 訓練期間對測試期間的市場效率指標之ANOVA分析(考慮交易成本)...72

表4-5 各國股市市場效率指標(不考慮交易成本)...75

表4-6 訓練資料的Log10 GDP對市場效率指標之ANOVA分析(不考慮交易成本) ...76

表4-7 測試資料的Log10 GDP對市場效率指標之ANOVA分析(不考慮交易成本) ...76

表4-8 訓練期間對測試期間的市場效率指標之ANOVA分析(不考慮交易成本).76 表4-9 各國股市市場效率指標(不考慮交易成本,雙向交易)...79

表4-10 訓練資料的Log10 GDP對市場效率指標之ANOVA分析(雙向交易) ...79

表4-11 測試資料的Log10 GDP對市場效率指標之ANOVA分析(雙向交易) ...79

表4-12 訓練期間對測試期間的市場效率指標之ANOVA分析(雙向交易)...79

(11)

第一章 導論

第一節 研究動機

股票市場一直是一個風險極高的投資市場,原因在於影響股價的因素太多,

使得股票市場難以預測。在股市投資決策中,技術分析[8]的實用性以及參考價 值往往最受到投資人青睞[5-7,13,17,38-40,54]。但有學者曾提出市場效率假說 [36],主張在弱勢效率市場中,目前的市場價格已充份的反應了過去的市場價格 所提供的各種資訊,因此投資人無法根據過去的歷史資料透過技術分析與預測來 從中賺得超額的報酬。

近十餘年來,許多人工智慧的方法被應用到股票市場的預測與買賣決策上,

如具有建構非線性模型能力的類神經網路(artificial neural networks)[48]、具有尋 找總體最佳化能力的遺傳演算法(genetic algorithms) [4,12,36]等,以及結合二者的 混合方法。這些研究大多企圖建立一個股價漲跌預測系統,再以此預測系統為基 礎來建構買賣決策系統[2, 3, 10-11,16, 20-23, 26-27, 32, 33-34,50]。但因為股價難 以預測,這種研究的效果有其限制。

近年來有許多研究改採新的思維,放棄建構股價漲跌預測系統的企圖,而直 接建構買賣決策系統[1,19]。此一思維看似不合理,但從控制論的觀點來看則不 盡然,好比一般人都能透過練習學會順利駕駛的技巧,但很少人真的懂汽車動力 學。或者說,一般人並無法對汽車的運動作出精確的「預測」,但仍有能力去作

「決策」(控制方向盤)。許多研究指出這種策略可有效提升投資績效[1,19,42]。

遺傳神經網路(genetic neural networks, GNN)是一種結合類神經網路的非線 性模型能力與遺傳演算法的總體最佳化能力的一種決策系統,它利用「強化式學 習」(reinforced learning)的策略跳過建構股價漲跌預測系統,而直接建構買賣決 策系統[42]。其基本原理是用類神經網路做為決策系統,每日股市交易的價量技 術指標做為系統的輸入,以買賣決策指標做為系統的輸出,當此指標大於某上限 則買進;反之,小於某下限則賣出。再以演化論的「物競天擇,優生劣敗,適者 生存」原理產生最佳化的決策系統。詳細的步驟是:

(1) 產生初始世代:隨機產生第一世代的多個決策系統,即隨機設定多個類神經

(12)

網路的網路連結權。

(2) 評價個體:令這些系統在一特定期間(訓練期間)的股市歷史資料的模擬環境 中進行買賣操作,以期末獲利高低得到這些系統的優劣評價。

(3) 複製個體:依系統的優劣評價複製下一世代的個體,評價高的系統被複製的 機率高,反之機率低。

(4) 重組個體:將複製的個體以交配、突變運算得到新世代個體,即重組類神經 網路的網路連結權。

(5) 進行世代交替:以新世代個體取代舊世代個體。

(6) 檢查終止條件,如果滿足終止條件(例如預設的世代數),到步驟(7),否則回 到步驟(2)。

(7) 輸出最佳個體:將最後世代的最佳個體(決策系統)輸出,即一組類神經網路 的網路連結權。

需注意上述的方法只能保證所產生的決策系統在訓練期間能有良好的獲利 績效,但不保證使用此一系統於未來的市場有一樣良好的獲利績效。因此,必須 將股市歷史資料切割成前、後二期,以前期為「訓練期間」,後期為「測試期間」。

在上述步驟(2)中對訓練期間、測試期間分別計算各期的期末獲利,而在步驟(3) 中只根據訓練期間的期末獲利做為複製機率高低的依據,而測試期間的獲利只用 來評估個體(決策系統)的獲利能力是否具有普遍性。

文獻[42]指出應用遺傳神經網路在台灣股市,其獲利高於買入持有策略的機 率達91.77%。本研究以該文獻[42]為基礎,應用遺傳神經網路進一步針對台灣股 市探討幾個重要問題:

問題 1:遺傳神經網路可以提高對大盤的投資績效嗎?

理論上演化世代數越大,遺傳神經網路在訓練期間的投資績效越佳,但測試 期間有可能在演化初期會變佳,而後期會變差,即在強化式學習的過程中發生過 度學習(over-learning)的現象[48]。雖然該文獻已指出遺傳神經網路可以提高對大 盤的投資績效,但對遺傳神經網路是否在演化的過程中確實學習到具普遍化獲利 能力的交易策略並未詳加分析。

問題 2:成交量的資訊可提高對大盤的投資績效嗎?

(13)

股市歷史資料主要由價、量這兩種資料構成,這些資料可運算出不同的價量 技術指標。長期以來,雖價格被視為最重要的資訊,但成交量也被視為有用的指 標。但量的資訊對於提高對大盤投資績效有多少影響力是一個值得探討的問題。

問題 3:訓練期間的長度需要多長以上才足夠呢?

訓練期間越長雖然可以使決策系統歷經多個多頭與空頭市場,因而可能有助 於建構獲利能力具普遍性的決策系統。然而市場結構、經濟情勢不斷演進,太長 的訓練期間也代表太陳舊的資料,這些資料對於建構優越的買賣決策系統可能有 害而無益,因此訓練期間的長度需要多長以上才足夠也應加以研究。

問題 4:多遺傳神經網路多數決策略可提高對大盤的投資績效嗎?

文獻是採用單一神經網路做為決策系統,但遺傳演算法具有不確定性,因此 文獻也重複多次演化過程,以統計的檢定分析探討單一神經網路決策系統的可靠 度。雖然檢定分析證實其獲利高於買入持有策略的機率達 91.77%,但其獲利績 效有很大的變異,這對投資人而言意味這很高的風險。由於獲利績效的變異可能 來自系統誤差與偶然誤差,採用多神經網路配合多數決策略,可能可以消減偶然 誤差,進而提高對大盤的投資績效的平均值,並減小其標準差。這與團體決策有 可能產生比個人決策更穩健的結果有相似的原理。

問題 5:遺傳神經網路可提高對類股的投資績效嗎?

文獻是針對大盤進行模擬交易,獲得不錯的投資績效,但是否適用於類股仍 需進行實證。雖然理論上大盤是類股的集合,但投資人的資金在各類股間的流動 是十分容易的,跨國間的流動是十分困難的,因此對大盤而言,會有一個具一定 忠誠度的「資金庫」在支持,但類股則無。故大盤的漲跌特性與類股的漲跌特性 可能不同,對大盤有效的方法對類股未必有效。

問題 6:雙向交易可提高對大盤的投資績效嗎?

股市投資所賺取的利潤包括股價的差額。在單向交易情形下,投資人只能在 上漲時期「買低賣高」來獲利。但股市的波動有漲、有跌,若投資者能透過期指 交易、認購權證等投資工具以雙向交易的方式,在上漲時期「買低賣高」,在下 跌時期「賣高買低」,理論上有可能可以獲得更高的投資報酬。

問題 7:隱藏在遺傳神經網路內的決策規則是什麼?

GNN 與倒傳遞神經網路一樣都以具有隱藏層的架構來表達模型,其差別僅

在於以遺傳演算法取代最陡坡降法,故缺乏明示的因果模型,仍屬於黑箱模型

(14)

(black box model)。即雖然 GNN 能為使用者產生一個買賣決策,卻無法告知使用 者隱藏在神經網路內的決策規則到底是什麼。如果能知道買賣決策與技術指標之 間的決策規則,並與現有的知識作比較,將有助於判斷模型的合理性。

問題 8:各國股票市場效率與經濟發達程度有關係嗎?

效率市場假說主張在弱勢效率市場中,目前的市場價格已充份的反應了過去 的市場價格所提供的各種資訊,因此投資人無法根據過去的歷史資料透過技術分 析與預測來從中賺得超額的報酬。此一主張多年來有許多實證研究支持[8,37,53]

或駁斥[28,39,45,54],為何會產生這種矛盾的結論?本文提出二個假說:

假說一:市場行為是非線性的,用簡單的線性方法不可能獲得超額的報酬,但非 線性方法則仍有可能。

假說二:市場效率與經濟發達程度成正比,因此在經濟發達程度高的國家市場效 率高,無法獲得超額的報酬;但在經濟發達程度低的國家市場效率低,

可能可以獲得超額的報酬。

本研究針對「假說一」採用具有非線性建模能力的GNN來探討非線性方法 獲得超額利潤的可能性。本研究針對「假說二」提出一個「市場效率指標」做為 因變數,以聯合國公佈的人均國內生產毛額(Per capita GDP, $US, 2003) [30]做為 經濟發達程度的指標,並以此為自變數來解釋市場效率指標這個因變數。

第二節 文獻回顧

一、 類神經網路在證券市場交易決策的應用

類神經網路是「一種基於腦與神經系統研究所啟發的資訊處理技術」。它以 利用一組範例建立系統模型,有了這樣的系統模型便可用於推估、預測、決策、

診斷[48]。類神經網路具有學習能力與容錯能力的優點,常被用來建構複雜的模 型。在類神經網路模式中,倒傳遞類神經網路模式最具代表性,其發表的應用至 少在數千個以上。倒傳遞類神經網路其基本觀念是利用最陡坡降法(Gradient Steepest Descent Method)之觀念,將誤差函數最小化。在類神經網路理論與應用 的蓬勃發展下,其技術日趨成熟,應用也日漸廣泛,包括工業控制、商業決策和 辨識系統等各方面的應用都有不錯的表現[50]。近年來,已有不少文獻利用類神

(15)

經網路於證券市場交易決策,部份文獻整理如表1-1。

表1-1 類神經網路在證券市場交易決策的應用文獻回顧

文獻 研究內容

Kimoto (1990)

本研究應用倒傳遞類神經網路,以乖離率、成交量、利率、匯率、紐 約道瓊指數平均值、及其他等技術性與經濟性指標為輸入變數,以未 來一個月漲跌百分比為輸出變數進行預測,由輸出變數的值來判斷該 買該賣,當輸出變數值大於或等於0.5時買,小於0.5則賣。系統模擬 範圍從1987年1月到1989年9月的33個月,採用此系統共獲利98%,與 買入持有相較可提高46%的投資效益。

Mizuno (1998)

本研究應用倒傳遞網路模型來建構東京股票交易價格(TOPIX)買賣決 策系統。系統以技術指標(移動平均值、乖離率、相對強弱指標與心 理線)為輸入變數,以三個處理單元代表「買入」、「賣出」與「持 有」等三個邏輯二元值輸出變數,以正確率來衡量買賣點預測模型之 績效。系統以1982年9月到1987年8月的週資料為訓練樣本,1987 年 10月到1990年1月的週資料為測試樣本。研究結果顯示,在測試期間 類神經網路與區別分析所得的系統,其正確率分別為63%與50%。

蔡依玲 (2001)

本研究應用倒傳遞網路模型來建構台灣電子類股買賣決策系統。系統 以技術指標:移動平均線(MA)、相對強弱指標(RSI)、隨機指標

(KD)、指數平滑異同平均線(MACD)、趨向指標(DMI)、乖離率

(BIAS)與威廉式指標(W%R)、心裡線(PSY)為輸入變數,以電子 類股週股價指數為輸出變數。買賣策略則採(本週收盤價-前一週收盤 價)/前一週收盤價的值,若大於 3%為買點,小於-3%為賣點,介於之 間則為持平。以1996 年 2 月至 2000 年 6 月止之電子類股週股價指數 為訓練樣本,以2000 年 7 月至 8 月止為測試樣本。結果在測試期間 共出現16 次的交易機會。不考慮交易成本的情況下年投資報酬率為 481.44%,考慮交易成本的情形下年投資報酬率為 463.68%。

Yim (2002)

本研究比較類神經網路與傳統ARIMA-GARCH 時間序列模型預測巴 西股價指數的能力。以1994 年 7 月至民國 1998 年 6 月,共 988 日資 料做為樣本。結果顯示,類神經網路優於ARIMA-GARCH 模型。

(16)

李惠妍 (2003)

本研究以類神經網路及迴歸分析來預測台股指數期貨的隔日收盤指 數。使用MA、RSI、KD、MACD、DMI、BIAS、W%R、PSY、VR、

AR、BR 等 11 種不同的技術指標為輸入變數。以民國 89 年 12 月至 91 年 12 月台灣加權股價指數日資料作為樣本。結果顯示:迴歸分析 績效最好MAE 為 72.866,其次是改良式類神經網路 MAE 為 72.878,

而預測績效最差的是倒傳遞類神經網路MAE 為 73.441。

林婉茹 (2004)

本研究以類神經網路建立其開盤價格預測模型及漲跌之預測模型。以 台灣50 指數ETF 現貨價格,台股指數期貨價格及美國道瓊工業指 數、那斯達克和S&P500 之股價指數為輸入變數,以台灣50 指數ETF 開盤價格及漲跌方向為輸出變數。以民國91年7月至民國92年3月之台 灣50ETF的資料作為樣本。並以信用交易作資券相抵之當日沖銷 ( Day Trading ),利用同一個交易日,買進及賣出台灣50 指數ETF,

以賺取其中之價差為交易策略來驗證。結果顯示,模型在驗證數據集 之預測能力極佳,整體之漲跌預測方向正確率達69.57%,若以該交易 策略模擬該模型之報酬,其年報酬率達94.73%。

資料來源:連立川、葉怡成(2007)與本研究整理

二、遺傳演算法在股市投資的應用

遺傳演算法(Genetic Algorithms, GA),或稱基因演算法,是由 Holland 於 1975 年發展出來。到了1989 年 Goldberg 又出版遺傳演算法專書 Genetic Algorithms in Search, Optimization and Machine Learning,更使得學術界普遍了解到此種極為強 健的最佳化技術[49]。遺傳演算法是仿效生物界中物競天擇、適者生存的自然法 則,經由母代交配交換彼基因產生子代,再由新生代淘汰適應性低的個體,保留 適應性高之優良基因個體做為新母代,經由世代交替,產生適應性最高之個體。

由於它有跳離局部最佳值,趨近總體最佳值的能力,近年來快速發展,成為極具 潛力的最佳化方法之一。

近年來,已有不少文獻利用遺傳演算法於證券市場交易決策,部份文獻整理 如表1-2。

(17)

表1-2 遺傳演算法在證券市場交易決策的應用文獻回顧

文獻 研究內容

Allen (1999)

本研究以遺傳規劃的方法來產生技術性的買進、賣出點的決策交易法 則。以移動平均線、最高價、最低價及成交量為輸入變數。以1928 年 至1998 年的 SP500 指數為研究樣本。結果顯示:考慮 0.25%為其交易 成本,其整體績效不如買進並持有策略。

林耀堂 (2001)

本研究企圖將所有技術指標納入,再以演化來選擇,甚至允許以組合 或分解的方式,產生前所未有的新技術指標,改善以往技術指標在質 和量方面不足的問題。透過世代的演化,產生多單進場、空單進場、

多單出場、空單出場的 4 條交易規則。研究以民國 87 年 10 月至民國 88 年 4 月的台積電股價日資料作為樣本,採用移動視窗的訓練方式,

以適應環境的變遷。在適應函數分別以「獲利追求導向」及「風險趨 避導向」為原則的設計下,由遺傳程式規劃所產生之擇時交易策略。

結果顯示:在以大多頭市場為測試期間的平均總投資報酬率56.98%,

皆能略高或貼近於買入持有策略總報酬率55.62%。而其中在風險趨避 導向設計下所產生之交易策略,不僅能夠同時兼顧到風險的考量,同 時也能夠達到總報酬率達55.33%。

Korcazk (2002)

本研究以四種技術指標結合遺傳演算法進行報酬率最大化的優化。以 西元1997 年 1 月 2 日至 1999 年 11 月 10 日之法國股市為研究樣本,

由CAC40 指數中,挑選出 24 支股票。其中訓練期為 261 天,測試期 為 7 天。結果顯示,遺傳演算法所產生的策略大部分較買入持有策略 之報酬率來的高。

Jiang (2003)

本研究以移動平均指標所轉換之四種技術指標,並結合遺傳演算法進 行報酬率最大化的優化,產生交易規則。以西元1990年1月1日至2002 年8月30日共3305筆交易資料的Microsoft、Intel Dell及Oracle為研究樣 本。其中2000筆資料為訓練期,後1305資料作測試期。結果顯示:買 入持有在四個樣本股票測試期間報酬率分別為3.16、1.52、2.22、11.5%,

而遺傳演算法則為24.9、15.2、52.5、96.2%,傳演算法則所產生之報酬 率明顯高於買入持有策略。

(18)

許智明 (2003)

本研究利用遺傳演算法搜尋最佳之技術指標,以民國84 年 1 月至民國 91 年 12 月的台灣加權股價指數日資料做為樣本。結果顯示,在搜尋期 間,所搜尋到的六條最佳交易法則的績效明顯優於同期間五年的買進 並持有策略的績效。在實證期間,僅一條交易法則劣於買進並持有策 略的年獲利率-2.67%,其餘五條交易法則皆能打敗買進並持有策略,

且最高能夠獲得年獲利率8.61%,證明其交易法則是具備獲利能力的。

從實證結果得知技術分析仍然具備參考價值,但投資人不應該將常用 的技術指標視為最佳的交易法則。

劉俊鴻 (2003)

本研究使用字串編碼方式來表達多種「技術指標」相互組合成的交易 規則,經適應度函數的評估,找出平均報酬率最高且風險最低的交易 規則。以民國89年01月日至90年12月為訓練期,而91年1月至91年12月 為測試期。結果顯示,在測試期時,比較各種方式所搜尋出的擇時交 易規則,可發現若僅考慮總報酬率,則GA 區塊交點解最佳,GA 效率 前緣解次之,GA 傳統求解最差。若考慮總報酬率與風險值,則GA 效 率前緣解最佳,GA區塊交點解次之,GA 傳統求解最差。

連立川 (2006)

本研究使用遺傳演算法搜尋最佳買賣規則,以18 種價量技術指標做為 輸入參數,以期末資金最大化做為適應度函數,經過訓練後,系統會 定出最佳買賣決策規則。以民國78 年 7 月至 93 年 7 月台灣加權股價 指數日資料作為樣本。結果顯示:雙向 GA 買賣決策策略、單一雙向 GA 買賣決策策略、及買入持有策略,在測試範例期間的平均年獲利率 分別是10.72%、6.30%與-7.2%。

資料來源:連立川、葉怡成(2007)與本研究整理

三、遺傳演算法及類神經網路彼此結合在財務的應用

倒傳遞網路是利用最陡坡降法的觀念將誤差函數最小化,將誤差函數收斂至 特定範圍內。但空間中若存在局部最小值時,最陡坡降法將不易有效找到全域中 的網路最佳權重和偏權值,而易陷入局部最小值。遺傳神經網路是利用遺傳演算 法取代最陡坡降法,以其獨特的複製、交配、突變等過程跳離局部最佳值,以克 服倒傳遞網路易陷於局部最小值的缺點。此外,倒傳遞網路只適用於輸出目標值 已知的監督式學習,不適用於輸出目標值未知的強化式學習,這也是必須使用遺

(19)

傳神經網路的另一個原因。

近年來,已有不少文獻利用遺傳演算法結合類神經網路於證券市場交易決 策,部份文獻整理如表1-2。

表1-3 遺傳演算法結合類神經網路在證券市場交易決策的應用文獻回顧

文獻 研究內容

Kim (2000)

本研究利用遺傳演算法與類神經網路,建構GAFD(Genetic Algorithm Approach to Feature Discretization For ANN )來做股市預測。以12種不 同的技術指標為輸入變數,輸出變數為次一日的漲跌。此方法是以遺 傳演算法作特微選取和決定預測股價指數的類神經網路連結權種 值。以1989年1月至1998年12月的韓國股市(KOSPI)日資料作為樣本。

結果顯示:GAFD與傳統利用線性轉換模式的倒傳遞網路比較,發現 GAFD 的效果較佳,可改善的幅度約在10%左右。

劉克一 (2000)

本研究以遺傳演算法演化類神經網路的權重。使用股票的技術指標作 為輸入變數,而輸出則是決定該股票的買入或賣出。以民國85年1月 至民國88年12月摩根成份股來做為研究樣本,其中訓練期間為1996 年1 月4 日至1999 年12 月28日,測試期間為2000 年1 月4 日至 2000 年12 月30 日。結果顯示:以台灣加權股價指數為例,在測試 期間其買入持有報酬率為-43.91%,但遺傳神經網路能使其報酬率達 14.68%,是買入持有的四倍左右。

周慶華 (2000)

本研究以遺傳演算法與類神經網路模式針對現貨開盤指數進行預 測。選擇領先現貨開盤的期貨指數及前一日現貨與期貨之收盤指數當 作輸入變數。以民國87年10月至民國89年12月新加坡交易所摩根台股 指數現貨與期貨指數資料做為樣本,其中87年10月1日至89年9月7日 為訓練樣本,89年9月8日至89年12月30日為測試樣本。結果顯示:整 合遺傳演算法與類神經網路之預測模式在測試期間對現貨開盤指數 漲跌方向預測之正確率達80.46%。

林建成 (2001)

本研究結合遺傳演算法與倒傳遞類神經網路來預測未來漲跌走勢,並 假設投資者每天進賣買賣,當模型預測明天為正報酬率時,投資人當

(20)

於今日作買進的動作,若明天實際值為正報酬率,則該投資人的利得 為正報酬率,若明天實際值為負報酬率,則招致負報酬率的損失作為 交易模擬策略與報酬率之評估。該研究採以有限記憶的調適學習模 式,分成三個區段,建立時間序列之移動窗戶。此外也建立多元迴歸 估計式,以比較兩者的預測績效。以民國86年1月至民國90年6月台灣 加權股價指數日資料作為樣本,以開盤價、收盤價、最高價、最低價、

成交量及一般股市投資人常用之技術分析指標做為輸入變數。結果顯 示:在整體的預測績效上,遺傳演算類神經網路模式平均報酬率為 348.6%,顯然優於多元迴歸模式報酬率為97.6%。

Phua (2001)

本研究以遺傳演算法做為類神經網路設定參數的搜尋工具,預測隔天 股市上漲或下跌。以開盤價、收盤價、最高價、最低價、成交量以及 國外其他市場大盤指數等為輸入變數。以民國87 年 9 月至民國 89 年 1 月新加波海峽指數(STI)日資料作為樣本。結果顯示,其準確率高達 81%。

李建輝 (2002)

本研究利用遺傳演算法所建構的類神經網路,以前三天之期貨指數漲 跌幅為輸入變數,及以五種技術指標為輸入變數,預測未來每日期貨 指數之漲跌幅。交易策略為輸出值為正(負)值時則買(賣),與傳統操作 策略(順向操作、逆向操作、迴歸操作及買進持有策略)作比較。以民 國90 年 1 月至民國 90 年 12 月台灣加權股價指數日資料作為樣本。

結果顯示,不管有無考慮技術指標,遺傳演化類神經網路所預測出的 平均每月準確率及平均每月報酬率分別為 54.32%及 12.51%,其績效 均優於迴歸策略;且有考慮技術指標之遺傳演化類神經網路所預測出 之平均每月準確率及平均每月報酬率分別為 62.42%及 59.62%,較不 考慮技術指標之遺傳演化類神經網路者為優。

Kwon (2003)

本研究使用遺傳演算法優化類神經網路權值。以 64 個日資料轉換的 技術指標作為輸入變數,輸出變數為各家公司隔天股價的漲幅。研究 以西元1992 年至西元 2001 年共十年 NYSE 及 NASDAQ 共 36 家公司 股價作為驗證樣本,但實際使用 13 年的歷史資料,因為需要二年期 間作為訓練範例,第三年期間作為測試範例,最後以第四年期間作為

(21)

實際驗證範例,並以移動視窗的概念每次移動一年,每次皆算為一個 case,共有 359 個 case(36 家*10 年=360,但有一家只有 9 年)。結果 顯示:實際驗證範例中,遺傳演化類神經網路的方法比買入持有表現 好的有173 個 case,較差的有 80 個 case,兩者差不多的有 106 個 case,

確實能夠達到良好之獲利情況。

Versace (2004)

本研究以基因演算法找出最佳的混合式類神經網路參數設定,再利用 最佳的網路模式及參數設定預測DIA ETF 的收盤價漲跌方向。以股價 指數、美元匯率、各種年期的債券及黃金價格做為recurrent back- propagation network及radial basis function network兩種網路的輸入變 數。以2001年11月11日至2003日至2月12日為研究期間。結果顯示,

預測漲跌方向正確率,最高可以達到75.2%。

Armano (2005)

此研究整合遺傳演算法及類神經技術,提出一個新的時間序列預測架 構NXCS。以COMIT指數(1992年5月21日至2000年4月20日)和S&P500 指數(1993年1月2日至2001年5月3日)作為研究樣本,前1000筆為設 定架構用,剩下1000筆前800為訓練樣本,後200測試樣本。並提出ideal profit (ip%)做為衡量方法預測能力好壞的指標,與Locally Recurrent ANN(LRANN)與Buy and Hold(B&H)做比較。結果顯示:在COMIT指 數上,B&H、LRANN與NXCS的ip%值分別為11.204%、12.240%、

17.121%,在S&P500指數上,分別為4.904%、11.370%、14.126%,在 兩種不同的股票指數上,NXCS的預測效果皆為最好。

資料來源:連立川、葉怡成(2007)與本研究整理

第三節 研究內容

本文共分五章。第二章為研究方法,包括:資料收集、技術指標的計算、交 易規則及適應度函數定義、遺傳神經網路架構、系統建構、決策規則之評估方式、

神經網路的輸入對輸出的關係。第三章為台灣股票市場之實證,對第一章所提出 的問題1~6加以實證。第四章為國際股票市場之實證,對第一章所提出的問題7 加以實證,探討各國股票市場效率與經濟發達程度關係。第五章為結論與建議,

說明研究的成果與後續研究的建議。

(22)

第二章 遺傳神經網路股票買賣決策 系統

第一節 資料收集

本研究資料共收集民國78 年 6 月 7 日至 93 年 7 月 2 日台灣股市大盤股價指 數4109 筆資料,每筆資料包含當日開盤價、收盤價、最高價、最低價以及成交 值。本研究將數據依時序分成二部分:前段為訓練期間;後段為測試範例。本研 究以78 年 7 月 8 日至 89 年 6 月 27 日共 3089 筆約 12 年的資料做為訓練範例,

89 年 6 月 28 日至 93 年 7 月 2 日共 1000 筆約 5 年的資料做為測試期間,如圖 2-1 所示。從圖中能夠發現,訓練階段及測試階段皆經過多次漲跌時期,因此資料具 有代表性。GNN 只對訓練範例進行最佳化,所產生的買賣決策系統再應用在測 試範例,所得之評估結果將具有普遍性。

圖2-1 訓練期間及測試期間的大盤指數

第二節 技術指標的計算

本研究採用下列技術指標:

(23)

2 1 1

2

( )

( )

n

t t

t

n n

t t

C C

DW

C

=

Δ − Δ

=

Δ

………...………(2-1) 其中

C =第 t 日的收盤價;

t Δ =

C

t

C -

t

C

t1;n=5,10,20。

1

1

( ,0)

| |

n

t t

n n

t t

Max C RSI

C

=

=

Δ

=

Δ

……….……….…(2-2) 其中n=5,10,20。

=

=

× Δ

× Δ

= n

t n

t

PVIn 1

t t 1

t t

V C

V C

………..….(2-3)

其中Vt=第 t 日的收盤價;n=5,10,20。

=

=

Δ

× Δ

Δ

× Δ

= n

t n

t

PVCn 1

t t 1

t t

V C

V C

……….…...(2-4)

其中ΔVt=Vt-

V

t1;n=5,10,20。

,

1 1

m n

m m n

t t n

MAI MA

MA

=

∑∑

……….…..(2-5) 其中

MA = n 日收盤價的移動平均;

n

MA = m 日收盤價的移動平均。

m

∑∑

= m

t n

t n

m n

m MV

MVI MV

1 1

, ………..(2-6) 其中MVn= n 日成交值的移動平均;MVm= m 日成交值的移動平均。

採用DW (Durbin-Watson)指標的原因是它可以偵測市場是否具有趨勢,當 DW 值接近 2 時市場價格的波動屬隨機波動;明顯大於 2 時市場具有趨勢。採用

(24)

RSI (Relative Strength Indicator)指標的原因是它可以偵測市場的漲跌趨勢,一般 而言,RSI 大於 70%代表已出現明顯上漲趨勢,RSI 小於 30%代表已出現明顯下 跌趨勢。採用PVI (Price Volume Indicator)與 PVC(Price Volume Change)指標的原 因是它可以評估價量配合的情況,其值越大代表市場交易的價量趨勢越配合,即 價漲量增、價跌量縮;反之價量背離,即價漲量縮、價跌量增。採用MAI (Moving Average Indicator)指標的原因是基於 Gran Ville 的移動平均線概念,當 MAI 大於 1 時,代表價格短期移動平均大於長期移動平均,可能是適當的買點;反之可能 是賣點。採用MVI (Moving Volume Indicator)指標的原因是它可以分析成交量的 趨勢,當MVI 大於 1 時,代表成交量短期移動平均大於長期移動平均,市場的 資金動能增強,人氣匯集,可能是適當的買點;反之可能是賣點。

第三節 交易規則及適應度函數定義

本研究只考量買入點至賣出點的獲利(或虧損),不考量賣出點至買入點的獲 利(或虧損)。此外,由於本研究的目的是以發展能提升投資台灣股市績效的交易 策略,因此其交易成本參考真實個股之交易成本定義,諸如買入之手續費為 0.1425%,如公式 (2-7) 所示,而賣出之手續費為 0.1425%,此外賣出需再付給 0.3%交易稅,如公式 (2-8) 所示。

% 8575 .

×99

=當日股價

買入持有股票 持有資金 …...……….(2-7)

% 5575 .

×99

×

=持有股票 當日股價

賣出持有資金 ………... (2-8)

本研究所採用之買賣決策規則的適應度函數為期末資金。當期末為買入狀態 下,則需轉換為期末資金;若期末為賣出狀態下,則直接等於期末資金。公式如 下:

買入狀態 資金=持有股數×期末股價 ……….(2-9) 期末

賣出狀態 資金=資金持有 …..……….………..(2-10)

(25)

第四節 遺傳神經網路(Genetic Neuron Network, GNN)

一、輸入變數

在輸入層的部分,由前述技術指標構成。由於每種指標值域的範圍不一,為 求正規化,其轉換公式如公式 (2-11) 所示。

σ μ 2

= old

new

V V

……….………...(2-11) 其中Vold為正規化前的技術指標;μ 為該技術指標之平均值;σ 為該技術指標之 標準差;Vnew為正規化後的技術指標。

二、輸出變數與目標函數

本研究是以類神經網路模型架構,輸出變數是買賣決策指標y,

當y >α 時,為買入訊號 當y <β 時,為賣出訊號

y 值愈大,代表愈該買入;反之愈小,代表愈該賣出。α、β 和神經網路的權值一 樣,都由遺傳演算法優化之。

由於此輸出變數並無目標值,因此傳統的最陡坡降法無法使用,在此改以遺 傳演算法來決定網路的連結權值,目標函數也由傳統的誤差均方和改為前述「期 末資金」。遺傳演算法以最大化此一目標函數為原則決定最佳的連結權值,其GA 搜尋的權值範圍為-10~10 之間的數值。

三、網路架構

本研究是以類神經網路模型架構,隱藏層設定為一層,其中輸入層與隱藏層 節點的關係如下:

) tanh(

)

( k k

k

f net net

h

= = ……….………...…...…….….……...(2-12)

k N

i

i ik k

inp

x W

net

=

× +θ

=1

………..………..……..…….…...(2-13) 其中 netk 是隱藏層節點的加權乘積的值;Wik 是隱藏層節點與輸出層之間的權 值;xi是尺度化後的輸入變數;θk是隱藏層的偏權值。

(26)

神經網路輸出層與隱藏層節點的關係如公式 (6-5) 所示。

) tanh(

)

( j j

j

f net net

y

= = ……….………...…...…….….……...(2-14)

j N

k

k kj j

hid

h W

net =

× +θ

=1

………..………..……..…….…...(2-15) 其中Wkj是隱藏層節點與輸出層之間的權值;θ 是輸出層的偏權值。 j

最後再由 GA 優化決定最佳之「買入門檻值」及最佳之「賣出門檻值」,即 當神經網路的輸出層之「買賣決策指標」大於「買入門檻值」,進行買入動作;

當「買賣決策指標」小於「賣出門檻值」,進行賣出動作。

本研究所使用之遺傳神經網路之架構如圖2-2,流程圖如圖 2-3 所示。

圖2-2 遺傳演化神經網路大盤加權指數交易決策模型

四、遺傳演算法參數設定

本研究所採用之遺傳演算法參數設定為[41]:

z 母體個數設定為 200 個。

z 交配率設定為 0.9。

z 突變率設定為 0.001。

輸入層 隱藏層 輸出層

DWn=5

y

DWn=10

DWn=20

MAIn=(5,10)

RSIn=5

MAIn=(5,20)

MAIn=(10,20)

RSIn=20

RSIn=10

買賣訊號

(27)

此外,除有特別說明以外,演化世代設定為30 世代;只使用與價格有關的指標 (DW5、DW10、DW20、RSI5、RSI10、RSI20、MAI5,10、MAI10,20、MAI5,20等九個 指標) 做為輸入變數;網路架構採用 9-6-1,即 9 個輸入單元、6 個隱藏單元、1 個輸出單元(買賣決策指標)。

圖 2-3 遺傳傳神經網路流程圖

計算個體適應度:將「訓練範例」載入每一個體進行買賣模擬,

以算出的「期末資金」做為個體的目標函數,並轉換成適應度。

產生初始個體族群:每一個體包含下列編碼

(1) 一組從 18 個指標中選出 6 個指標做為輸入變數之整數編碼,

例如{3,5,6,9,14,18} 代表選用 { DW(20), RSI(10), RSI(20), PVI(20), MAI(5,20), MVI(10,20) } 為輸入層中的變數 1 至變 數6。

(2) 一組 6-6-1 架構的神經網路之權值與偏權值之實數編碼

交配:依交配率選取一定數目的個體進行配對,並對其編碼進行 二點交配法,以產生新個體。

複製:依「輪盤法」選擇被複製的個體。適應度大的個體被複製 的機率大。

突變:依突變率選取一定數目的個體之編碼進行突變,以產生新 個體。

世代交替:以新世代個體族群取代原世代個體族群,並將適應度 最大的個體(最佳個體)無條件複製到新世代的族群之中。

滿足收斂條件?

開始

結束

評價:將「測試範例」載入「最佳個體」進行買賣模擬,以算出 的「期末資金」做為評價「最佳個體」真正績效的依據。

No Yes

(28)

第五節 系統建構

本研究在系統的建構上是將神經網路建置在試算表上,再利用套裝軟體Gene Hunter 以期未資金為目標函數來優化各權值和 α、β 值(買賣門檻),如圖 2-4,系 統會依照輸出值來比對買賣門檻,定出買賣點。系統建構的細節參考附錄六。

圖2-4 Gene Hunter 上實作圖

第六節 決策規則之評估方式

為了衡量遺傳神經網路決策系統的績效,本研究提出「獲利係數」如下:

獲利係數 =

2 n

n

Me Ms Ce Cs

………(2-16)

其中n 等於總交易年數;Ms為期初投資者所擁有的資金(本研究設定為 100 萬 元);Me為期末投資者所擁有的資金;Cs為期初收盤價;Ce為期末收盤價。

利用Gene Hunter 的優化的權值

目標函數

(29)

獲利係數大於1.0 代表交易策略可以擊敗市場,可以獲得超額利潤。在上式 中,分母要開2n 次根,而非 n 次根的理由詳述如下:

(1) 獲利係數的分子顯示基於「特定交易策略」的每年績效,分母是基於「基準 交易策略」的每年績效。

(2) 因為市場走向不可預知,如果採用「買入持有策略」為基準交易策略,則在 股市長期上漲時期,是一個很難擊敗的交易策略;反之在長期下跌時期,是 一個很容易擊敗的交易策略。

(3) 相反地,如果採用「不買空手」策略,則股市長期上漲時期,是一個很容易 擊敗的交易策略;反之在長期下跌時期,是一個很難擊敗的交易策略。

(4) 因此合理的基準交易策略既非「買入持有」,亦非「不買空手」,而是「盲目 買賣」,此一策略在交易期間中的50%的期間持有,50%的期間空手。例如,

如果期初收盤指數100 點,期未收盤指數 300 點,歷經 10 年,則因在此十年 內只有50%的期間持有,故在計算其年績效時不能採用 10 年,而應採用 20 年,因為在「盲目買賣」策略下,歷經20 年才有 10 年(20 年 × 50% )的持有 期間。故合理的「基準交易策略」的每年績效之估計值應為:

基準交易策略年績效=10 2300

× 100 =1.056……….(2-17)

由以上的分析可知,在(2-16)式中,分母要開 2n 次根,而非 n 次根,才是較 合理的作法。

第七節 神經網路的輸入對輸出的關係

GNN 與倒傳遞神經網路一樣都以具有隱藏層的架構來表達模型,其差別僅

在於以遺傳演算法取代最陡坡降法,故缺乏明示的因果模型,仍屬於黑箱模型 (black box model)。即雖然 GNN 能為使用者產生一個買賣決策,卻無法告知使用 者隱藏在神經網路內的決策規則到底是什麼。如果能知道買賣決策與技術指標之 間的決策規則,並與現有的知識作比較,將有助於判斷模型的合理性。

神經網路的輸入對輸出的關係推導如下:

1. 輸出變數與輸入變數的函數關係

(30)

倒傳遞網路的隱藏層輸出值公式如下:

) exp(

1 1

k

k

net

h

= + − ………...(2-18)

=

i

k i ik

k

W X

net

θ ………...(2-19)

其中

h

k=第 k 個隱藏單元的輸入值;

net

k輸入值之加權乘積和;

X =第 i 個

i 輸入單元的輸入值;

W

ik第 i 個輸入單元與第 k 個隱藏單元間的連結加權值;

θk=第k個隱藏單元的門限值。

輸出層輸出值公式如下:

) exp(

1 1

j

j net

y = + − ………...………(2-20)

j k

k kj

j

W h

net

=

−θ ………...……...(2-21)

其中

net =隱藏值之加權乘積和;

j

W =第 k 個隱藏單元與第j個輸出單元間的

kj 連結加權值;θj=第 j 個輸出單元的門限值。

2. 輸出變數對輸入變數的微分關係

因此,第 j 個輸出變數的第 i 個輸入變數之一次微分如下:

i k k k

k k

j

j j

i j

x net net

h h net net

y x

y

= ∂

=

k

ik k kj

j

W f W

f

' ' ………..(2-22) 其中

W

kj第 k 個輸入單元與第 j 個隱藏單元間的連結加權值;

W

ik第 i 個輸 入單元與第 k 個隱藏單元間的連結加權值。

而第 j 個輸出變數的第 i 個及第 l 個輸入變數的二次偏微分如下:

⎟⎟⎠

⎜⎜ ⎞

= ∂

i j

l l i

j

x y x x x

2

y

………(2-23)

將(2-22)代入上式得

(31)

∑ ∑

∑ ∑

⎟⎟⎠

⎜⎜⎝

⎛ ⎟⎟+

⎜⎜ ⎞

⎛ ⋅ ⋅ ⋅

=

⎟⎟

⎜⎜

∂ + ∂

⎟⎟

⎜⎜

⋅ ∂

=

⎟⎟

⎜⎜

⋅∂ +

∂ ⋅

⋅ ∂

=

⎟⎟

⎜⎜

⎛ ⋅

⋅∂

⋅ +

∂ ⋅

= ∂

⎟⎠

⎜ ⎞

⎛ ⋅ ⋅ ⋅

=∂

k

lk k j k

lk k j k j k

kj ik

k l

k k k j

k l

k k

k k

j

j j k

ik kj

k l

k j k l j ik kj k

ik l k kj j ik k kj l j k

ik k kj j l

j

l i

j

W f f W

f W f f

W W

x net net f f x

net net

f h net net f f

W W

x f f x f

W f W

x W W f f W f x W

f

W f W x f

y x x

y

"

' 2

2 '

2 2

"

'

' ' 2

2 2

2 2 ' '

' ' ' '

' '

' '

' '

2

(2-24)

3. 影響力的簡化計算

由於(2-22)式與(2-24)式的計算過於繁雜,在此簡化(2-22)式定義

S 為第i個

ij 輸入變數對第j個輸出變數的敏感度:

ij

S

k

ik

kj

W

W

…...(2-25)

簡化(2-24)式定義

S 為第 i 個與第 l 個輸入變數對第 j 個輸出變數的交互敏感度:

ilj

ilj

S

k

lk ik

kj

W W

W

………... (2-26)

其中;

W =第 i 個輸入變數與第 k 個隱藏單元的加權值;

ik

W =第 i 個輸入變

lk 數與第 k 個隱藏單元的加權值;

W =第 k 個隱藏單元與第 j 個輸出變數的加

kj 權值。

(32)

第三章 台灣股票市場之實證

第一節 前言

本章將探討在第一章提出的七個問題:

問題1:遺傳神經網路可以提高對大盤的投資績效嗎?

問題2:成交量的資訊可提高對大盤的投資績效嗎?

問題3:訓練期間的長度需要多長以上才足夠呢?

問題4:多遺傳神經網路多數決策略可提高對大盤的投資績效嗎?

問題5:遺傳神經網路可提高對類股的投資績效嗎?

問題6:雙向交易可提高對大盤的投資績效嗎?

問題7:隱藏在遺傳神經網路內的決策規則是什麼?

本章除有特別說明以外,演化世代設定為30 世代;只使用與價格有關的指 標(DW5、DW10、DW20、RSI5、RSI10、RSI20、MAI5,10、MAI10,20、MAI5,20等九 個指標)做為輸入變數;網路架構採用 9-6-1,即 9 個輸入單元、6 個隱藏單元、1 個輸出單元(買賣決策指標)。

第二節 遺傳神經網路可以提高對大盤的投資績效嗎?

遺傳神經網路是利用遺傳演算法優化神經網路的權重和偏權值,經過演化的 過程來產生最佳的神經網路。理論上演化世代數越大,遺傳神經網路在訓練期間 的投資績效越佳,但測試期間有可能在演化初期會變佳,而後期會變差,即在學 習的過程中發生過度學習(over-learning)的現象。如果遺傳神經網路真的能學習到 具普遍化獲利能力的交易策略,它應該會產生二個現象:

(1) 訓測相關:在訓練期間的投資績效應與在測試期間的投資績效成正比。

(2) 世代進步:隨著世代的增加,訓練期間的投資績效增加,而測試期間則至少 在演化初期會增加。

為了探討遺傳神經網路是否有這二個現象,本研究採用1、3、10、30、100 等五種世代數進行實證。又因為遺傳演算法的優化結果具有隨機性,故本研究將

(33)

這五種世代數均重複執行十次。產生的訓練期間與測試期間獲利係數的結果繪成 散佈圖得圖3-1,再將重複執行十次的獲利係數結果取平均值得表 3-1。買入持 有策略的訓練期間與測試期間的年平均獲利分別為-0.03%、-7.52%;獲利係數分 別為1.00、0.96。由 t 統計單尾檢定可知,GNN 五種演化世代的訓練期間與測試 期間之年平均獲利、獲利係數均顯著高於買入持有策略,顯著水準均通過0.5%。

圖3-1 中的迴歸線顯示,在訓練期間的投資績效確實與在測試期間的投資績 效成正比,二者之間的判定係數達0.1656。雖然沒有很明顯的「訓測相關」現象,

由表3-1 來看,隨著世代數越大,不論訓練期間與測試期間,其投資績效都越佳,

可見有明顯的「世代進步」現象。總結上述證據得知,遺傳神經網路確實能學習 到具普遍化獲利能力的交易策略。

表3-1 不同世代數下訓練期間與測試期間的結果平均值

年平均獲利(%) 獲利係數

GNN GNN

世代數 平均值 標準差 買入持有 t 檢定

平均值 標準差

買入持有 t 檢定

1 9.865% 1.625% -0.026% 6.35E-09 1.098 0.016 1.000 6.32E-09 3 12.834% 1.245% -0.026% 5.80E-11 1.128 0.012 1.000 5.78E-11 10 15.021% 1.573% -0.026% 1.15E-10 1.149 0.016 1.000 1.37E-10 30 17.303% 0.487% -0.026% 8.81E-16 1.172 0.005 1.000 8.79E-16

100 22.200% 5.072% -0.026% 1.12E-07 1.221 0.051 1.000 1.12E-07 1 -1.526% 5.498% -7.520% 3.65E-03 1.022 0.057 0.960 3.59E-03 3 1.114% 7.944% -7.520% 3.71E-03 1.050 0.082 0.960 3.67E-03 10 1.984% 3.769% -7.520% 1.14E-05 1.059 0.039 0.960 1.20E-05 30 1.366% 5.646% -7.520% 3.81E-04 1.052 0.059 0.960 3.76E-04

100 5.560% 2.772% -7.520% 5.90E-08 1.096 0.029 0.960 5.83E-08

參考文獻

相關文件

Pursuant to the service agreement made between the Permanent Secretary for Education Incorporated (“Grantor”) and the Grantee in respect of each approved programme funded by the

Training two networks jointly  the generator knows how to adapt its parameters in order to produce output data that can fool the

• To achieve small expected risk, that is good generalization performance ⇒ both the empirical risk and the ratio between VC dimension and the number of data points have to be small..

* All rights reserved, Tei-Wei Kuo, National Taiwan University, 2005..

The final results of experiment show that the performance of DBR system declines when labor utilization increases and the CCR-WIP dispatching rule facilitate to

The numerical results of the stress distribution and the plastic deformation along the center line (interface) of the lateral plate show that the weight of the plate is reduced to

It was found from the study that (1) From the reaction formula of sludge -lime, we can confirm its adhesive action; (2) It was found that when the maintenance period is not

Our experimental results show that when using the same set of training and test data, the proposed multi-angle hand posture recognition method can achieve