• 沒有找到結果。

結合基因演算法與支持向量迴歸探討美國股市之 價值溢價與規模溢價

N/A
N/A
Protected

Academic year: 2022

Share "結合基因演算法與支持向量迴歸探討美國股市之 價值溢價與規模溢價 "

Copied!
70
0
0

加載中.... (立即查看全文)

全文

(1)

中 華 大 學 碩 士 論 文

結合基因演算法與支持向量迴歸探討美國股市之 價值溢價與規模溢價

Using GA-based Support Vector Regression to Explore the Value Premium and Size Premium of Stock Market

in the United States

系 所 別:資訊管理系碩士班 學號姓名:M09610010 李小青 指導教授:邱 登 裕 博 士

中華民國九十九年八月

(2)

摘要 摘要 摘要 摘要

股市預測在人工智慧領域是一個重要的議題。我們的研究使用混合式的 AI 以預測 S&P 500 芭拉價值指標和 S&P 500 芭拉成長股之間的價值溢價;S&P 600 小 型股指標和 S&P 500 指標之間的規模溢價。這個研究使用 GA 從 17 個變數選擇最佳 的輸入變數,然後我們使用支持向量迴歸以解決非線性的問題。我們提出兩種方 法:GA-SVR 方法及 GA-SVM 方法,在 GA-SVR 方法中,分別以 GA-SVR 價值股成長股 投資策略及 GA-SVR 小型股大型股投資策略來探索股市;在 GA-SVM 方法中,則分別 以 GA-SVM 價值股成長股投資策略及 GA-SVM 小型股大型股投資策略來探索股市。

在 GA-SVR 及 GA-SVM 價值股成長股交替策略中,我們嘗試探索股市價值溢價 的交替策略,能夠避免局部最佳化、overfitting 等分類的問題,並有能力減少輸 入變數的雜訊以選擇趨近於最理想的輸入變數。我們運用了基因演算法以找出趨近 於最佳的技術變數及經濟變數的組合。而支持向量迴歸非線性及高維度的特性則被 運用來決定選擇價值股或成長股。我們的目標是 S&P 500 價值指標及 S&P 500 成 長指標之間的價值溢價。最後則是實驗結果的評估,以檢視本研究所提出之策略之 年平均報酬率是否能勝過買入持有策略及被動式價值股差成長股策略。

而在 GA-SVR 及 GA-SVM 小型股大型股交替策略中,則為探索股市規模溢價的 交替策略,同樣地,我們運用了基因演算法以找出趨近於最佳的技術變數及經濟變 數的組合。而支持向量迴歸則被運用來決定選擇小型股或大型股。我們的目標是 S&P 600 小型股指標及 S&P 500 大型股指標之間的規模溢價。在實驗結果的評估方 面,則是檢視本研究所提出策略之年平均報酬率是否能勝過 S&P 600 小型股買入持 有策略、S&P 500 大型股買入持有策略與被動式小型股差大型股投資策略。

實證的研究顯示了所提出的方法可以用來探索股市的趨勢。

關鍵字:

基因演算法,支持向量迴歸,價值溢價,規模溢價,被動式價值股差成長股策略,

S & P 500 指標

(3)

Abstract

Stock market prediction is an important research issue of Artificial Intelligent. Our research used hybrid AI to explore the value premium of S&P 500 Barra value index and S&P 500 Barra growth index, size premium between S&P 600 small cap index and S&P 500 index with GA-SVR method.

We proposed two investment strategies: GA-SVR value-growth strategy and GA- SVM value-growth strategy. We try to explore the rotation strategies for value premium of stock market with the ability to avoid classification problems, such as local optimum, overfitting and with the ability to avoid input noises and choose optimal input variables., We utilize genetic algorithm to locate the approximate optimal combination of technical variables and economics variables. Then the property of nonlinearity and high dimensionality of the support vector regression is employed to decide the preference of value stocks or growth stocks. Our targets are value rotation between the S&P 500 value index and S&P 500 growth index. We compare the results obtained with some existing ones. We find that the proposed approach can reduce noises. The main reason is that the proposed approach uses GA to choose the optimal variables as the input of SVR. We also find that the proposed approach improves the accuracy rate. The main reason is that SVR can explore dynamism of stock market well with optimal input data.

Also, we proposed the other two investment strategies to explore the rotation strategies for size premium of stock market. These two strategies are GA-SVR small-large strategy and GA-SVM small-large strategy. We utilize GA to locate the approximate optimal combination of technical variables and economics variables. Then the property of nonlinearity and high dimensionality of the support vector regression is employed to decide the preference of value stocks or growth stocks. Our targets are size premium between the S&P 600 small cap index and S&P 500 index.

The empirical result shows that the proposed approach can be used to explore the value premium and size premium of the stock market in the United States.

Keywords

Gene Algorithm, Support vector regression, Passive value minus growth strategy, S & P 500 index, Size premium, value premium

(4)

誌謝 誌謝 誌謝 誌謝

承蒙指導老師邱登裕博士於研究所期間的指導與照顧,使我在課程及研究 上,受益匪淺,此外在老師悉心訓練培養下,亦大幅提昇個人應有的獨立思考與解 決問題的能力,相信在未來的工作學習上將是受用無窮。

感謝高雄應用科技大學陳聰毅博士,及資管系王貞淑博士於口試期間給予的 建議與指教,及時匡正論文疏失,俾之能使本論文更臻完善。此外,也非常感謝資 管系所有老師的鼓勵與指導。

在研究所期間,很榮幸有雅真學姐、士億及宇宏學長的不吝於指導,在研究 及學習上給我很大的幫助;也感謝同學俊言、子邦、學弟聖竣以及M225實驗室所有 學長姐和學弟妹的幫助。還有同班同學羿君及鉯喬,每當我在生活及研究上遭遇到 挫折或困難時,總是不斷地鼓勵我,為我加油打氣,讓我能重振士氣渡過難關。

謹將此榮耀獻給摯愛的家人,謝謝你們一直以來的付出與包容,默默地在一 旁支持著我,才能使我順利的完成學業。願將這份喜悅與你們分享。

李小青 謹誌於中華大學資管所

中華民國九十九年八月

(5)

目錄 目錄 目錄 目錄

摘要摘要摘要

摘要 ... I Abstract...II 誌謝

誌謝誌謝

誌謝 ...III 第壹章第壹章第壹章

第壹章 緒論緒論緒論 ... 1 緒論 1.1

1.1 1.1

1.1 研究背景與動機研究背景與動機研究背景與動機 ... 1 研究背景與動機 1.2

1.2 1.2

1.2 研究目的研究目的研究目的 ... 2 研究目的 1.3

1.3 1.3

1.3 研究流程研究流程研究流程 ... 2 研究流程 1.4

1.4 1.4

1.4 論文架構論文架構論文架構 ... 4 論文架構 第貳章

第貳章第貳章

第貳章 文獻探討文獻探討文獻探討 ... 5 文獻探討 2.1

2.1 2.1

2.1 價值溢價與規模溢價價值溢價與規模溢價價值溢價與規模溢價(Value premium and size premium) ... 5 價值溢價與規模溢價 2.

2.2.

2.2222 基因演算法基因演算法基因演算法(基因演算法(((Genetic AlgorithmsGenetic AlgorithmsGenetic AlgorithmsGenetic Algorithms)))) ... 10 2.

2.2.

2.3333 支持向量迴歸支持向量迴歸支持向量迴歸支持向量迴歸((((Support Support Support Support VVVVector ector ector Rector RRRegressionegressionegressionegression)))) ... 13 第參章

第參章第參章

第參章 研究方法研究方法研究方法 ... 15 研究方法 3.1 3.1 3.1

3.1 研究架構研究架構研究架構 ... 15 研究架構 3.2

3.2 3.2

3.2 支持向量機支持向量機支持向量機(SVM)支持向量機(SVM)(SVM)(SVM)及支持向量迴歸之設定及支持向量迴歸之設定及支持向量迴歸之設定... 18 及支持向量迴歸之設定 3.3 3.3 3.3

3.3 染色體與適應函數之設計染色體與適應函數之設計染色體與適應函數之設計 ... 19 染色體與適應函數之設計 第肆章

第肆章第肆章

第肆章 實驗實驗實驗 ... 21 實驗 4.1 4.1 4.1

4.1 資料與研究變數資料與研究變數資料與研究變數 ... 21 資料與研究變數 4.2

4.24.2

4.2 實驗設計實驗設計實驗設計實驗設計 ... 24 4.2.1

4.2.14.2.1

4.2.1 移動視窗移動視窗移動視窗移動視窗(slid(slid(sliding windows)(sliding windows)ing windows)ing windows)式模型設計式模型設計式模型設計 ... 25 式模型設計 4.2.2 GA-SVR 和和 GA-SVM 方法之設定和 方法之設定方法之設定方法之設定 ... 26 4.3

4.3 4.3

4.3 實驗結果實驗結果實驗結果 ... 27 實驗結果 4.34.34.3

4.3.1 GA.1 GA.1 GA-.1 GA---SVRSVRSVRSVR 價值股成長股交替策略實驗結果價值股成長股交替策略實驗結果價值股成長股交替策略實驗結果價值股成長股交替策略實驗結果... 27 4.3.2 GA

4.3.2 GA4.3.2 GA

4.3.2 GA----SVRSVRSVRSVR 小型股大型股交替策略實驗結果小型股大型股交替策略實驗結果小型股大型股交替策略實驗結果小型股大型股交替策略實驗結果... 32 4.3.3 GA

4.3.3 GA4.3.3 GA

4.3.3 GA----SVMSVMSVMSVM 價值股成長股交替策略實驗結果價值股成長股交替策略實驗結果價值股成長股交替策略實驗結果價值股成長股交替策略實驗結果... 35 4.3.4 GA

4.3.4 GA4.3.4 GA

4.3.4 GA----SVMSVMSVMSVM 小型股大型股交替策略實驗結果小型股大型股交替策略實驗結果小型股大型股交替策略實驗結果小型股大型股交替策略實驗結果... 38 4.4

4.44.4

4.4 實驗比較實驗比較實驗比較實驗比較 ... 41 4.4.1 GA

4.4.1 GA4.4.1 GA

4.4.1 GA----SVRSVRSVRSVR 價值股成長股交替策略與其它方法實驗結果之比較價值股成長股交替策略與其它方法實驗結果之比較價值股成長股交替策略與其它方法實驗結果之比較價值股成長股交替策略與其它方法實驗結果之比較 ... 41 4.4.2 GA

4.4.2 GA4.4.2 GA

4.4.2 GA----SVRSVRSVRSVR 小型股大型股小型股大型股小型股大型股小型股大型股交替策略與其它方法實驗結果之比較交替策略與其它方法實驗結果之比較交替策略與其它方法實驗結果之比較 ... 43 交替策略與其它方法實驗結果之比較 第伍章第伍章第伍章

第伍章 結論與未來展望結論與未來展望結論與未來展望 ... 44 結論與未來展望 參考文獻

參考文獻參考文獻

參考文獻 ... 46 附附附

附 錄錄錄錄 ... 49

(6)

附錄一附錄一附錄一

附錄一::::技術變數與經濟變數技術變數與經濟變數技術變數與經濟變數 ... 49 技術變數與經濟變數 附錄二

附錄二附錄二

附錄二::::被動式小型股差大型股報酬率計算範例被動式小型股差大型股報酬率計算範例被動式小型股差大型股報酬率計算範例... 52 被動式小型股差大型股報酬率計算範例 附錄三

附錄三附錄三

附錄三::::實驗評估實驗評估實驗評估 ... 54 實驗評估 附錄四

附錄四 附錄四

附錄四::::GAGAGA-GA---SVRSVRSVRSVR 模型編號模型編號模型編號、模型編號、、、訓練及測試筆數對照表訓練及測試筆數對照表訓練及測試筆數對照表訓練及測試筆數對照表... 58 附錄五

附錄五附錄五

附錄五::::變數來源變數來源變數來源 ... 59 變數來源

(7)

表目錄 表目錄 表目錄 表目錄

表 1 與價值溢價、規模溢價之相關文獻(含國內外)... 9

表 2 與基因演算法相關之國內外文獻... 11

表 3 與支持向量機相關之國內外文獻... 14

表 4 染色體設計... 19

表 5 分類矩陣... 20

表 6 使用於 GA-SVR 方法中的技術變數... 22

表 7 使用於 GA-SVR 方法中的經濟變數... 22

表 8 輸入變數與輸出變數之間的關係... 24

表 9 價值溢價實際值與預測值之分類矩陣... 27

表 10 GA-SVR 價值股成長股交替策略之預測模型所得到的預測結果... 28

表 11 變數編號及其對應之變數名稱... 29

表 12 GA-SVR 價值股成長股交替策略最佳前五名之年平均報酬率及其對應之基因 ... 30

表 13 GA-SVR 價值股成長股交替策略最佳前五名之 C 值及 gamma 值... 30

表 14 GA-SVR 價值股成長股交替策略中購買價值股或成長股之交易百分比... 31

表 15 規模溢價實際值與預測值之分類矩陣... 32

表 16 GA-SVR 小型股大型股交替策略所得到的預測結果... 33

表 17 GA-SVR 小型股大型股交替策略最佳前五名之年平均報酬率及其對應之基因 ... 34

表 18 GA-SVR 小型股大型股交替策略最佳前五名之 C 值及 gamma 值... 35

表 19 GA-SVR 小型股大型股交替策略中購買小型股或大型股之交易百分比... 35

表 20 GA-SVM 價值股成長股交替策略所得到的預測結果 ... 36

表 21 GA-SVM 價值股成長股交替策略最佳前五名之正確率及其對應之基因 ... 37

表 22 GA-SVM 價值股成長股交替策略最佳前五名之 C 值及 gamma 值 ... 37

表 23 GA-SVM 價值股成長股交替策略中購買價值股或成長股之交易百分比... 38

表 24 GA-SVM 小型股大型股交替策略之預測結果 ... 38

表 25 GA-SVM 小型股大型股交替策略最佳前五名之正確率及其對應之基因 ... 39

表 26 GA-SVM 小型股大型股交替策略最佳前五名之 C 值及 gamma 值 ... 40

表 27 GA-SVM 小型股大型股交替策略中購買小型股或大型股之交易百分比 ... 40

表 28 GA-SVM 小型股大型股交替策略之精確率及召回率 ... 41

表 29 GA-SVR 價值成長交替策略與其它方法報酬率之比較... 42

表 30 GA-SVR 小型股大型股交替策略及其它方法報酬率之比較... 43

(8)

表 31 領先指標之主要因素... 51 表 32 GA-SVR 價值股成長股交替策略之檢定統計表... 54 表 33 z檢定:兩個母體平均數差異檢定(GA-SVR 價值股成長股交替策略 vs. S&P 500 買入持有方法) ... 55 表 34z檢定:兩個母體平均數差異檢定(GA-SVR 價值股成長股交替策略 vs.被動式 價值股差成長股策略) ... 55 表 35 GA-SVM 價值股成長股交替策略之檢定統計表 ... 56 表 36 z檢定:兩個母體平均數差異檢定(GA-SVM 價值股成長股交替策略 vs. S&P 500 買入持有方法) ... 56 表 37 z檢定:兩個母體平均數差異檢定(GA-SVM 價值股成長股交替策略 vs.被動 式價值股差成長股策略) ... 57

(9)

圖目錄圖目錄 圖目錄圖目錄

圖 1 研究流程圖... 3

圖 2 S&P 500 (大型股)指標波動圖 ... 6

圖 3 S&P SmallCap 600 指標之波動圖 ... 7

圖 4 S&P 500 價值股股價波動圖 ... 8

圖 5 S&P 500 成長股股價波動圖 ... 8

圖 6. 本研究所提出的 GA-SVR 方法架構... 17

圖 7 移動視窗(sliding windows)式模型設計... 25

圖 8 GA-SVR 價值股成長股交替策略之投資訊號... 31

圖 9 採購經理指標... 51

(10)

第 第

第 第壹 壹 壹 壹章 章 章 章 緒論 緒論 緒論 緒論

1.1 1.1 1.1

1.1 研究背景與動機 研究背景與動機 研究背景與動機 研究背景與動機

美國股市是全球股票市值的三分之一,由此可見其重要性。紐約證券交易所 (New York Stock Exchange, NYSE)擁有悠久的歷史,而且它是美國最重要的次級 市場。S&P 500 綜合指標是可以衡量 NYSE 大型股整體市場表現的一個良好指標 (Bodie et al., 2003) 。己經有許多和 S&P 500 指標相關的研究。

我們的研究嘗試預測 S&P 500 價值指標和 S&P 500 成長指標之間的價值溢價 (size premium);此外,我們也希望能預測 S&P 600 小型股指標和 S&P 500 指標之 間的規模溢價(size premium)。價值股是指有高淨值市值比的公司,成長股則是指 有著較低的淨值市值比的公司(Nalbantov et al., 2004)。

股市預測是人工智慧領域一項重要的議題。股市的動態複雜和很多的變數有 關。有許多的事件都可能影響股價,像是利率、商業循環、油價、全球的經濟等 等。已經有許多的研究提出了許多的預測方法。Hassan et al.(2006)提出並執行 了一個聯合模型,它結合了隱藏式馬可夫模型(Hidden Markov Model, HMM)、類神 經(Artificial Neural Network, ANN)以及基因演算法(Gene Algorithm, GA)去預 測股市的變化。實驗的結果指出聯合模型的預測正確性比統計工具 ARIMA 更佳。而 且研究者不需要事先分析資料。邱登裕(2009)提出了一個結合基因演算法和支持向 量機的動態模糊模型來預測台灣股市。輸入的變數包含了個變數,研究的結果顯示 所提出的模型比傳統預測方法的表現更好。Hsu et al.(2010) 運用了 GreySOM 研 究財務時間序列,這個方法結合了灰色關聯分析(Grey relation analysis)及自組 織映射圖(self-organizing map)。灰色關聯分析可以用在資訊不確定及不完整 時。研究結果顯示 ,GreySOM 方法可以捕捉到未來股價的走勢。Nalbantov et al.(2004)以 17 個變數建構 SVR 風格擇時模型為預測工具,並且以三個策略來預測 equity style timing:價值成長交替策略、小型股大型股交替策略以及同步價值 成長與規模擇時策略。實驗的結果顯示了價值溢價和規模溢價都是可預測的。

(11)

本研究建構了 GA-SVR 模型,以探索股市的規模溢價和價值溢價。我們提出 了兩個策略:GA-SVR 價值成長交替策略、GA-SVR 小型股大型股交替策略。在第一 個策略中,如果這個模型的輸出是正的數值,則它代表這是一個購買價值股並且賣 出成長股的良好時機。然後我們將 GA-SVR 價值股成長股交替策略的平均報酬率和 另一個標竿策略—被動式價值成長策略的平均報酬率相比,以檢視是否我們所提出 的策略可以勝過標竿策略。在本研究所提出的第二個策略中,如果 GA-SVR 模型的 輸出的數值為正,則我們將買進小型股並且賣出大型股,如果模型的輸出為負,則 我們將買進大型股並且賣出小型股。然後我們比較 GA-SVR 小型股大型股交替策略 和被動式小型股大型股交替策略的平均報酬率。實驗的結果顯示了我們所提出的方 法勝過被動式價值股差成長股策略和被動式小型股大型股交替策略。

1.2 1.2 1.2

1.2 研究目的 研究目的 研究目的 研究目的

(1)以基因演算法結合支持向量迴歸探討美國股市的價值溢價與規模溢價。

(2)提出四種投資策略—GA-SVR 價值股成長股投資策略、GA-SVR 小型股大型股投資 策略、GA-SVM 價值股成長股投資策略及 GA-SVM 小型股大型股投資策略並分別 探討這四種策略是否勝過標竿投資策略。

(3)與其它模型和方法比較與分析,檢視本研究所提出的兩種策略之正確率及報酬 率是否勝過其它方法。

1.3 1.3 1.3

1.3 研究流程 研究流程 研究流程 研究流程

(12)

圖 1 研究流程圖

確定研究動機與目的

文獻蒐集與探討 1. 價值溢價與規模溢

2. 基因演算法 3. 支持向量迴歸

第壹章 緒論

第貳章 文獻探討

方法設計與分析 1.基因演算法適應函

數設計 2.支持向量機 3.支持向量迴歸

第參章 研究方法

實驗設計 1.實驗資料說明 2.實驗設計與評估 3.實驗分析

第肆章 實驗

結論與未來展望 第伍章 結論

(13)

1.4 1.4 1.4

1.4 論文架構 論文架構 論文架構 論文架構

本論文共分為五個章節,分別為

第一章 緒論:介紹本研究之研究動機、研究目的和研究架構

第二章 文獻探討:說明價值溢價、規模溢價、價值股、成長股、小型股、大型股 等相關投資理論,並描述基因演算法、支持向量迴歸的相關文獻

第三章 研究方法與架構:以基因演算法從 17 個變數中挑選有最佳適應值之變數,

並結合支持向量迴歸預測選股時機。

第四章 實驗結果與分析:

(1) 以本研究所提出的兩個投資策略:GA-SVR 價值股成長股交替策 略、GA-SVM 價值股成長股交替策略和標竿策略-被動式價值差成 長策略相比較,以檢視本研究所提出之投資策略之平均報酬率是 否勝過標竿策略。

(2) 以本研究所提出的另外兩個策略:GA-SVR 小型股大型股交替策 略、GA-SV 小型股大型股交替策略和標竿策略—被動式小型股差 大型股策略相比較,以檢視本研究所提出之投資策略之平均報酬 率是否勝過其它策略。

(3) 與其它模型和方法比較與分析。

第五章 總結與未來展望:探討研究結果與貢獻,以及未來展望與建議。

(14)

第 第

第 第貳 貳 貳 貳章 章 章 章 文獻探討 文獻探討 文獻探討 文獻探討

與本研究相關之研究領域主要是結合了基因演算法與支持向量迴歸之方法,以 探索美國股市的價值溢價及規模溢價。首先針對價值溢價與規模溢價的相關文獻作 說明,第二節介紹基因演算法,並探討其相關研究,第三節則介紹支持向量迴歸及 其相關研究。

2.1 2.1 2.1

2.1 價值溢價與規模溢價 價值溢價與規模溢價 價值溢價與規模溢價 價值溢價與規模溢價(Value premium and size premium)

Fama et al. (1997) 指出在全世界的股市中,價值股比成長股有更高的報酬。

在他們的研究當中,發現了從 1975 年到 1995 年,在 13 個主要市場中的 12 個主要 市場,價值股勝過成長股。然而,Nalbantov et al.(2004)指出,在美國的價值溢價 行為中有著循環的模式。根據他們的研究,在 1988 年到 2002 年之間,某些時期,

成長股會勝過價值股,但是在其它的時期,價值股則勝過成長股。法瑪、法蘭西與 雷加納(Famma、French and Reinqanum)發現:預測各種證券報酬率的有效預測指 標,就是證券的帳面價值對市值比(book-to-market ratios)。法瑪和法蘭西依照帳面 價值對市場價值比,將企業分為 10 群,並檢視每群從 1963 年 7 月至 1990 年 12 月 的平均每月報酬率。比率最低的前十分之一之平均月報酬率為 1.65%,而比率最高 的前十分之一,則只有 0.72%的每月平均報酬率。(楊之宜譯,1993)

“規模溢價”,或稱為規模效應(size effect),首先由 Banz [11]提出,他將 NYSE 股 票根據公司規模分成五個階級,發現小型公司的平均報酬比大型公司的平均報酬還 高 。 他 發 現 規 模 最 小 的 企 業 等級,其平均年 報酬率高於規模最大的企 業等級 19.8%。另一位學者 Reinganum 利用 NYSE 和美國證交所(AMEX)之上市公司為樣 本,發現小型股有超額的風險調整後報酬。小型企業、市價與帳面價值比(book- to-market ratio),以及長期逆轉效應是目前財務學中實證最難以解釋的現象 (Jones,1998)。

法瑪和法蘭西提出了三要素模式(three-factor model)。風險係由股票三個要 素的敏感度來決定:(1)市場的投資組合,(2)反應小企業相對報酬率的投資組合,

(15)

(3)反應高低帳面價值對市價比率之企業的相對報酬率之投資組合。(楊之宜譯,

1993)

在這個研究中,我們嘗試以 GA-SVR 方法預測 S&P 500 芭拉價值指標和 S&P 500 芭拉成長指標之間的價值溢價的趨勢,以及 S&P 600 小型股指標和 S&P 500 (大型股)指標之間的規模溢價。以下我們分別敍述 S&P 500 (大型股)指標和 S&P 600 小型股指標、S&P 500 芭拉價值指標和 S&P 500 芭拉成長指標如下:

(一)S&P 500 (大型股)指標:

標準普爾公司是國際著名的財務評等公司,該公司編製了數種股數,最常使 用的就是「標準普爾 500 指數(S&P 500 Index)」或稱為標準普爾綜合指數(S&P Composite Index)。標準普爾綜合指數是以紐約證交所(NYSE)、美國證交所(AMEX) 及那斯達克中的 500 家公司為樣本,所計算出的指數。(徐俊明,2007)。S&P 500 (大型股)指標廣泛地被視為是美國股市的最佳的單一衡量標準,這個世界知名的指 標包括了美國經濟的主要產業中的 500 家最重要的公司。S&P 500 指標的建構有以 下的特色:市場覆蓋範圍-將近美國股票市場的 75%、市值-至少 30 億美金,公開 流通 – 至少 50%。史坦普 500 股票指數可以回朔到 1923 年,於 1957 年擴張到包 含 500 家公司。圖 2 為 S&P 500 指標 1994 年 1 月至 2005 年 10 月之波動圖。

S&P 500 (大型股)指標

5000 10001500 2000

1994/1/4 1995/1/4 1996/1/4 1997/1/4 1998/1/4 1999/1/4 2000/1/4 2001/1/4 2002/1/4 2003/1/4 2004/1/4 2005/1/4

S&P 500 COMPOSITE - PRICE INDEX

圖 2 S&P 500 (大型股)指標波動圖

(16)

(二) S&P SmallCap 600 指標:

自從 1994 年由標準普爾所提出之後,S&P SmallCap 600 很快地成為美國所 偏好的小型股指數。S&P SmallCap 600 是被設計來成為一個有效的投資組合,這 些公司必需符合特定標準,以確保它們是值得投資的並且在財務上是可實行的。結 果,S&P SmallCap 600 獲得了廣泛的接受度成為主動式和被動式管理的標竿選 擇。S&P SmallCap 600 是美國指數的核心組成元件,它可以被使用來建造投資組 合。圖 3 為 S&P SmallCap 600 指標 1994 年 1 月至 2005 年 10 月之波動圖。

S&P 600 小型股股價

0 100 200 300 400

1994/1/4 1995/1/4 1996/1/4 1997/1/4 1998/1/4 1999/1/4 2000/1/4 2001/1/4 2002/1/4 2003/1/4 2004/1/4 2005/1/4

S&P 600 SMALL CAP - PRICE INDEX

圖 3 S&P SmallCap 600 指標之波動圖

(三) S&P 芭拉成長與 S&P 芭拉價值指標:

S&P 芭拉成長與價值指標是藉由將股票根據一個單一的屬性:淨值市值比 (book-to-price ratio)所建造的。值指標包含了擁有比較高的淨值市值比的公 司,相反地,成長指標則是有著比較低的淨值市值比的公司。在成長股指標裡的公 司,平均上,會比價值指標裡的公司有著比較高的市值。一般來說,在價值指數裡 的公司也會展現與“價值”股票有關的特徵:比較低的 P/E 比。圖 4 為 S&P 芭拉成 長指標 1994 年 1 月至 2005 年 10 月之波動圖。圖 5 則為 S&P 芭拉價值指標 1994 年 1 月至 2005 年 10 月之波動圖。

(17)

S&P 500 芭拉成長股指標

0 500 1000 1500

1994/1/4 1995/1/4 1996/1/4 1997/1/4 1998/1/4 1999/1/4 2000/1/4 2001/1/4 2002/1/4 2003/1/4 2004/1/4 2005/1/4

S&P 500 BARRA GROWTH(PRICE INDEX)

圖 4 S&P 500 價值股股價波動圖

S&P 500 芭拉成長股指標

0 500 1000 1500

1994/1/4 1995/1/4 1996/1/4 1997/1/4 1998/1/4 1999/1/4 2000/1/4 2001/1/4 2002/1/4 2003/1/4 2004/1/4 2005/1/4

S&P 500 BARRA GROWTH(PRICE INDEX)

圖 5 S&P 500 成長股股價波動圖

表 1 為與價值溢價、規模溢價之相關文獻。

(18)

表表

表 1 與價值溢價與價值溢價與價值溢價、與價值溢價、、、規模溢價之相關文獻規模溢價之相關文獻規模溢價之相關文獻規模溢價之相關文獻(含國內外含國內外含國內外含國內外)

論文作者 研究方法/目的 資料 實證研究與結論

2002 劉秉龍 探討由市價/每股 淨值比、市價/每 股盈餘比與市價/

每股銷貨比所分 類之成長型股票 與價值股票之投 資報酬。與大盤 比較尋求較佳之 投資策略。

收集台灣證交所 中股票上市公司 1996 年 1 月至 2001 年 9 月間 之各項財務資料 及每月之收盤股 價。

成長股報酬顯著落 後大盤,價值股的 平均報酬率優於大 盤,其中又以市價/

每股盈餘比為分類 標準時更顯著。

2003 Elroy Dimson,

Stefan Nagel, Garrett Quigley

將投資組合分別 根據帳面價值與 市值比以及股票 的市值排序,投 資組合的形成機 制很接近 Fama 和 French 的方法

從 LSPD(倫敦股 價資料庫)取得 上市資訊、每月 報酬、每月市 值。這個資料庫 的主要指標包含 了從 1955 年起 英國股市所有上 市的股票。並從 Datastream 資 料庫、

Cambridge/DTI 資料庫以及 Stock Excnage Yearbooks 取得 相關會計資訊。

使用會計資訊的新 資料並整合股價,

作者發現從 1955- 2001 年,在英國有 著強烈的價值溢 價。它不只存在於 小型股也存在於大 型股之間。

2007 楊慶豪 探討市價/淨值比 及市價/盈餘比所 分類出價值股成 長股投資策略方 法之投資報酬績 效是否超越加權 指數,並期望尋 求更佳投資策 略,藉以提昇投 資績效。

研究期間為 1996 年 12 月至 2006 年 12 月

在市價/淨值比分類 上,價值股投資報 酬績效優於成長股 投資報酬績效。

本研究整理

項目 出版年

(19)

2. 2. 2.

2.2 22 2 基因演算法 基因演算法 基因演算法 基因演算法( (( (Genetic Algorithms Genetic Algorithms Genetic Algorithms Genetic Algorithms) )) )

基因演算法(GA)的基本理論是由 Holland 於 1975 年所提出。是基於自然選擇 過程的一種最佳化搜尋機構。基因演算法的主要運算子是複製(reproduction)、交 配(crossover)和突變(mutation) (蘇春木、張孝德,2004)。基因演算法同時考慮 搜尋空間上多個點而不是單一個點,因此可以比較快得到整體最佳解,這是 GA 的 最大優點。

複製是依據每一物種的適應程度來決定其在下一代中應被複製的個數多寡的 一種運算過程。複製過程有以下兩種形式:

(1)輪盤式選擇:在每一代的演進過程中,依每個物種(字串)的適應函數值的大小 來分割輪盤上的位置,適應函數值越大,則在輪盤上佔有的面積也越大,每個 物種在輪盤上所佔的面積比例也就代表其被挑選至交配池的機率;然後隨機地 選取輪盤上的一點,其所對應的物種即被選中送至交配池中。

(2)競爭式選擇:在每一代的演化過程中 ,首先隨機地選取兩個或多個物種(字 串),具有最大適應函數值的物種即被選中送至交配池中。由於競爭式選擇所需 要的計算量較少、而且可以藉由一次選取物種個數的多寡來控制競爭的速度,

因此本研究採用競爭式選擇來進行複製。

交配過程是隨機地選取交配池中的兩個母代物種字串,並且彼此交換位元資 訊,進而組成另外兩個新的物種,藉著累積前代的優秀位元資訊以期望能產生更優 秀的子代。,交配過程有三種形式:單點交配、兩點交配和字罩交配。本研究採用 兩點交配。

突變過程是隨機地選取一物種字串,共且隨機地選取突變點,然後改變物種 字串裡的位元資訊。突變過程發生的機率由突變機率所控制。本研究將突變機率設 定為 0.01。

有一些研究嘗試以調整突變率來改善 GA 的效能。適應函數的設計也非常的 重要。大部份基因演算法的使用者所關心的是非線性的問題[4]。目前,已經有許

(20)

多的研究使用基因演算法。Chiu et al. (2009) 提出了一個混合的方法,應用 Black Scholes 定價方法與灰色理論結合了 GA 和倒傳遞類神經網路,以預測台灣 的財務市場中認購權證的投資時機;其中,GA 是被用來找出 BPN 的最佳架構以避 免局部的最佳化。Wu et al. (2007) 運用了實數型基因演算法將 SVM 的參數最佳 化,以預測企業財務危機。資料樣本包括了從 1995 年到 2002 年在台灣破產的公 司;和其它的統計方法與人工智慧模型相比,GA-SVM 方法有最佳的預測正確性。

Wang(2009)運用了一個混合式的人工智慧方法,其結合了基因演算法及 fuzzy c- means 分群演算法(FCM),以改善分群的效果。GA 是被用來解決 FCM 的局部最佳化的 問題。首先,GA 選擇最佳的群中心的數目,然後 FCM 執行群集分析。

本研究另外整理了和基因演算法有關之國內外文獻(如表 2)。

表表

表 2 與基因演算法相關之國內外文獻與基因演算法相關之國內外文獻與基因演算法相關之國內外文獻 與基因演算法相關之國內外文獻

論文作者 研究方法 輸入變數 實證研究與結論

2004 葉明政 結合 Fuzzy, GA 與倒傳遞類 神經路

以台灣 50 指數期貨、現 貨 ETF 商品-寶來台灣卓 越 50 基金為指數套利的 研究對象

以人工智慧預測 方法進行套利決 策皆優於不做預 測套利方式及統 計複迴歸預測方 法,尤其以模糊 遺傳演化倒傳遞 類神經網路預測 方法績效最佳,

其次為 GA-BPN 方法。

項目 出版年

(21)

2007 林詠智 結合遺傳演算 法與類神經網 路模型

以 7 項變數:臺灣加權 股價指數、臺指期前十 大交易人淨持有部位、

臺指選擇權賣權買權未 平倉比例、臺指選擇權 成交量變化、隱含波動 率指數(VIX)變化、摩臺 指變化、外資臺股累計 買賣超變化等為研究變 數,並以衍生性金融商 品中的臺灣指數期貨做 為模擬投資對象。

遺傳演化類神經 網路模型對於臺 指期貨走勢變動 率的方向預測命 中率可達

63.61%,高於迴 歸估計之

54.55%、基因演 算法之

36.36%、類神經 網路之

41.56%,其投資 績效顯著優於其 他投資策略。

2008 Shian- Chang Huang , Tung- Kuang Wu

整合基因演算 法與支持向量

使用兩種資料集:1.美 國 NASDAQ 指數,日本 NK225 指數、台灣 TWSI 指數和韓國 KOSPI 指 數。資料期間從 2003 年 1 月至 2004 年 12 月。2.

以 G7 股票指數的每日指 數為資料,資料期間從 2004 年 1 月到 2005 年 12 月

與類神經、純粹 的 SVM 或傳統的 GARCH 模型相 比,此研究所提

出的 GA-SVM 方 法表現最佳

2009 Deng-Yiv Chiu, Ping-Jie Chen

結合 GA、模糊 及 SVM 預測台 灣股市

以 61 個變數為輸入變 數--包括了股市中的 21 項技術指標、期貨市場 中的 21 項技術指標及 21 個總體經濟變數。資料 期間為兩年,從 2003 年 1 月至 2004 年 12 月。

所提出的 GA- Fuzzy-SVM 方法 之最佳正確率為 79%。

本研究整理

在本研究中,共有 17 個變數,因此我們使用 GA 選擇有最佳的適應值的變數 為輸入變數。

(22)

2. 2. 2.

2.3 33 3 支持向量迴歸 支持向量迴歸 支持向量迴歸 支持向量迴歸( (( (Support Support Support Support V VV Vector ector ector ector R RR Regression egression egression egression) )) )

支持向量迴歸是在高維度的特徵空間中,使用線性函數的假設空間的學習系 統。對於資料分類而言,SVM 是項有用的技術。SVM 有四個基本的核心函數:線性 (linear)、多項式(polynomial)l, 放射型函數(radial basis function,RBF) 和 S 型(sigmoid).( Hsu et al,2010)

Nalbantov et al. (2004) 綜合了其它的文獻之後,提出了支持向量迴歸的三 個關鍵特色:

(1)即使在高維度的特徵問題中,或者換言之,就是解釋的變數很多,以及在雜 訊、複雜的領域,SVR 的表現仍然很堅定。

(2) SVR 達到非凡的概化(generalization)能力,在一個所給的訓練資料和模型複 雜度上,在某些水準的模型正確性之間達成一個平衡。

(3)SVR 對所給的問題,總是可以找到一個總體的解決方案,例如,和神經網路成 了一個強烈的對比。

Hsu et al (2010)提出RBF是明智的第一選擇。RBF函數非線性地將樣本映射到比 較高維度的空間;當類別標籤和屬性之間的關係為非線性時,它還是可以解決這樣 的問題。支持向量方法可以被應用在迴歸的情況下。其中有三個參數ε, C 和 γ必 需 被 調 整 , 以 找 出 在 支 持 向 量迴歸的複雜度 和訓練的正確性之間最佳 的平衡 (Nalbantov et al.,2004)。目前已經有許多和支持向量迴歸相關的研究。Huang et al. (2008)整合了基因演算法和SVM預測多個股市的每日報酬,實驗的結果指出 其所提出的方法可以捕捉所有重要的特徵,而且預測的效果極佳。但是他們的研究 資料只有兩年,在財務的研究中,研究資料的期間應該更長。Lin et al. (2010) 結合了模糊集合理論 (fuzzy set theory) 與支持向量迴歸成為一個FSVR (模糊支 持向量迴歸) 方法,以探索台灣的商業循環。模糊集合理論可以被用在資訊不確定 時。SVR則是被用來找出模糊數字中的最高和最低的邊界,研究結果指出FSVR在可 以在不確定的環境下,預測商業循環。

(23)

在本研究中,我們使用由林智仁教授所開發的軟體 Libsvm 並結合基因演算 法以挑出最佳的變數。表 3 是支持向量機相關之國內外文獻。

表 表

表 3 與支持向量機相關之國內外文獻與支持向量機相關之國內外文獻與支持向量機相關之國內外文獻 與支持向量機相關之國內外文獻

論文作者 研究方法 輸入變數 實證研究與結論

2009 Hui Li, Jie Sun

複合式案件式推 論結合支持向量 機(Multi-CBR–

SVM)

樣本資料為和財 務比相關的 30 個變數

實證結果指出 Multi-CBR-SVM 同 時具有高度的預 測的正確性與穩 定性,並且可預 測研究中所列出 的中國公司之財 務危機

2009 Reshma

Khemchandani, Jayadeva, Suresh Chandra

以調整最小平方 模糊支持向量迴 歸(regularized least squares fuzzy support vector

regression)預 測財務時間序 列,這個方法將 較高的歸屬程度 指派給包含有更 相關資訊的資料 樣本。

使用從 Yahoo financial website 上的資 料,包括了 IBM、

Microsoft、

Google、

Redhat、

Citigroup 以及 S&P 500 指數 (資料期間為 4 年)等財務資 料。

財務時間序列中 兩大問題是:雜 訊及不穩定性。

RLFSVR 使用和財 務時間序列資料 樣本中的雜訊和 不穩定的知識,

改善概化的問 題。實驗的結果 展示了這個新的 迴歸方法的功 效。

2009 Cheng-Lung Huang , Cheng-Yi Tsai

結合自組織特徴 圖(SOFM)與 SVR 並使用 filter- based featur selection 選擇 重要的屬性;以 SOFM 將訓練樣本 分群,並以 SVR 預測 FITX 股價 指數

使用 FITX 的資 料集,資料期間 從 2000 年 1 月 4 日至 2006 年 2 月 20 日。以 M 13 個技術指標為 輸入變數。

所提出的方法以 多個 SVR 模型提 供不同的模式預 測每日的 FITX 指 數。以 filted- based 特徵選擇方 法,SOFMSVR 模型 可以同時維持正 確率並縮短訓練 時間

本研究整理

出版年 項目

(24)

第參章 第參章

第參章 第參章 研究方法 研究方法 研究方法 研究方法

本研究結合基因演算法、支持向量機、支持向量迴歸方法,探索美國股市的價 值溢價及規模溢價。我們提出兩種方法:GA-SVR 方法及 GA-SVM 方法,在 GA-SVR 方法中,分別以 GA-SVR 價值股成長股投資策略及 GA-SVR 小型股大型股投資策略來 探索股市;在 GA-SVM 方法中,則分別以 GA-SVM 價值股成長股投資策略及 GA-SVM 小型股大型股投資策略來探索股市。

在 GA-SVR 及 GA-SVM 價值股成長股交替策略中,我們嘗試探索股市價值溢價的 交替策略,能夠避免局部最佳化、overfitting 等分類的問題,並有能力減少輸入 變數的雜訊以選擇趨近於最理想的輸入變數。我們運用了基因演算法以找出趨近於 最佳的技術變數及經濟變數的組合。而支持向量迴歸非線性及高維度的特性則被運 用來決定選擇價值股或成長股。我們的目標是 S&P 500 價值指標及 S&P 500 成長 指標之間的價值溢價。最後則是實驗結果的評估,以檢視本研究所提出之策略之年 平均報酬率是否能勝過買入持有策略及被動式價值股差成長股交替策略

而在 GA-SVR 及 GA-SVM 小型股大型股交替策略中,則為探索股市規模溢價的交 替策略,同樣地,我們運用了基因演算法以找出趨近於最佳的技術變數及經濟變數 的組合。而支持向量迴歸則被運用來決定選擇小型股或大型股。我們的目標是 S&P 600 小型股指標及 S&P 500 大型股指標之間的規模溢價。在實驗結果的評估方面,

則是檢視本研究所提出策略之年平均報酬率是否能勝過 S&P 600 小型股買入持有策 略、S&P 500 大型股買入持有策略與被動式小型股差大型股投資策略。

3. 3. 3.

3.1 11 1 研究架構 研究架構 研究架構 研究架構

本研究應用了基因演算法及支持向量機和支持向量迴歸以探討股市的動態,其 架構如圖 6 所示。:在本研究所提出的方法當中,技術變數和經濟變數被當作輸入 變數,基因演算法是被用來根據適應函數值選擇變數當作輸入變數;詳述本研究所 提出之方法如下:

(1) 蒐集實驗資料:實驗的資料主要是從 DataStream 資料庫和標準普爾網站所 蒐集。總共有 17 個變數,資料期間是從 1994 年 1 月到 2005 年 10 月份為

(25)

止。技術變數的樣本資料如表 10 和表 11 所示。

(2)基因算法流程中對染色體的初始化:GA流程中的第一代是以隨機的方生初始化 的,每一代包含了20條染色體,而每一條染色體則包含了37個基因。

(3)參數解碼:將基因解碼,以產生所選擇的技術變數及經濟變數的組合

(4)選擇訓練資料:所選擇的技術變數與經濟變數所對應的值,會被擷取成為訓練資 料,以形成SVR的輸入。

(5) SVR訓練:所擷取的訓練資料被用來訓練SVR,並產生需要的數值以評估適應函 數。

(6)適應函數的評估:為了找出最佳的輸入變數的組合,於設計適應函數時,我們 同時考量了年平均報酬率和F-measure。適應函數的值越大,表示染色體的表現 越好。

(7)基因演算法的終止條件:終止的條件為fitness值低於預設的門檻值,若符合終 止條件則直接跳到步驟(9) 。

(8)基因演算法的程序:在基因演算法中,染色體的演化包含了三個流程:選擇,

交配和突變。在選擇的流程中,從20個染色體選擇了10個最高的適應函數值的染 色體,並且以競爭式選擇方法進行複製;在交配的流程中,我們用了兩點交配的 方法;在突變的流程中,突變率則設定為0.01。然後重新回到步驟(3)

(9)以訓練過的SVR分類器評估測試資料:訓練過的SVR分類器會被用來分類測試資 料,以決定適合的交易時間點。

(10)結果的比較:本計劃所提出方法之結果將和其它的方法作比較,以檢視本方法 是否較其它方法更適合用在擇股策略之議題。

(26)

圖 6. 本研究所提出的 GA-SVR 方法架構

…...

…...

…...

母體

蒐集資料

GA-SVR 模組

是否滿足終 止條件

染色體初始化

參數解碼

評估適應函數值 由被選擇的技術變數和 經濟變數選擇訓練資料

以訓練資料訓 SVR 分 類器

以訓練過的 SVR 分類 器分類測試資料

評估結果

訓練資料

測試

執行 GA 流 程

(27)

我們提出兩種方法:GA-SVR 方法及 GA-SVM 方法,在 GA-SVR 方法中,分別以 GA-SVR 價值股成長股投資策略及 GA-SVR 小型股大型股投資策略來探索股市;在 GA-SVM 方法中,則分別以 GA-SVM 價值股成長股投資策略及 GA-SVM 小型股大型股 投資策略來探索股市。在此,簡介本研究所提出的四種投資策略如下:

(1)GA-SVR 價值股成長股交替策略:如果 GA-SVR 方法的輸出值是正的,則表示這 是買進價值股並賣出成長股的時機。

(2)GA-SVR 小型股大型股交替策略:如果 GA-SVR 方法的輸出是正的值,則買進小 型股並且賣出大型股股票,如果輸出是負的值,則買進大型股並且賣出小型

股。

(3)GA-SVM 價值股成長股交替策略:如果 GA-SVM 方法的輸出值是正的,則表示這 是買進價值股並賣出成長股的時機。

(4)GA-SVM 小型股大型股交替策略:如果 GA-SVM 方法的輸出是正的值,則買進小 型股並且賣出大型股股票,如果輸出是負的值,則買進大型股並且賣出小型

股。

3.2 3.2 3.2

3.2 支持向量機 支持向量機 支持向量機 支持向量機( (( (SVM SVM SVM SVM) )) )及支持向量迴歸 及支持向量迴歸 及支持向量迴歸 及支持向量迴歸之設定 之設定 之設定 之設定

本研究使用台灣大學林智仁教授所開發的 LIBSVM 軟體來進行實驗。LIBSVM 軟 體有五種分類方法可使用:C-SVC、nu-SVC、epsilon-SVR、nu-SVR 和 one-class SVM。在本研所提出的 GA-SVM 方法中使用的是 C-SVC 分類方法,在 GA-SVR 方法中 所使用的則為 epsilon-SVR 方法。

常用的核心函數有線性(linear)、多項式(polynomial)、放射型(radial basis function, RBF)以及 S 型(Sigmoid)等四種。其中放射型(RBF)核心函數有能 力分類非線性且高維度的資料集,故本研究之核心函數設定為 RBF 核心函數。(Hsu et al,2010;張順榮,2009)

(28)

3. 3. 3.

3.3 33 3 染色體 染色體 染色體 染色體與適應函數之 與適應函數之 與適應函數之 與適應函數之設計 設計 設計 設計

在本研究中,染色體被分成三個主要的部份,技術變數及經濟變數、SVR 參 數中的 gamma 值和 C 值,如表 4。其中,前 17 個基因代表技術變數及經濟變數。

如果數值為 1,則表示選擇這個變數作為輸入變數,否則,就表示這個變數並未被 選擇。接下來的 10 個基因決定 SVR 參數中的 gamma 值,最後的 10 個基因則決定 SVR 參數中的 C 值。

表 4 染色體設計染色體設計染色體設計染色體設計

Component 位元組

技術變數及經濟變數 17

C 值 10

Gamma 值 10

共 37 個位元組

適應函數的設計很重要,因為它會影響預測的確率,本研究在設計適應函時 考慮總報酬率(total return, TR)、F-measure。(如公式(1)) 。

Fitness=TR+F-measure (1) 其中,TR 是指總報酬率,其公式如下:

1 1

% t t 100

t

P P

TR P

= − ∗

Pt 表示當月的指標值

(2)

(29)

Pt-1 表示前一個月的指標值

F_ Measure 的公式如下,:

1

2 2

2

= = ×

+ × + +

rp TP

F r p TP FP FN (3) (Tan et al.,2008)

其中 r 是指回覆率(recall),p 是指精確率(recision),

其公式為 精確率,p=

+ TP

TP FP (4)

TP:真陽性(true positive),也就是這些例子實際上是正類別,而且也真的被判 為正類別。

FP:偽陽性(false positive),也就是這些類別實際上是負類別,但是卻被誤判為 正類別。

回覆率,r=

+ TP

TP FN (5)

FN:偽陰性(false negative),也就是這些類別實際上是正類別,但是卻被誤判為 負類別。

「精確率」是指在所有模式預測為正類別的資料中,有多少比例恰好是正類別 的資料,其值愈高,表示被誤判的比例愈低;「回覆率」則是指實際上為正類別的 資料中,同時也被模式判為正類別的比例,回覆率的值愈高,表示誤判的比例也較 低。精確率及回覆率可以整合成F1評估指標,如公式(3)

表表表

表 5 分類矩陣分類矩陣分類矩陣分類矩陣 預測類別

Class=Yes Class=No

Class=Yes TP FP

實際類別

Class=No FN TN

(30)

第肆章 第肆章

第肆章 第肆章 實驗 實驗 實驗 實驗

本研究結合基因演算法、支持向量機、支持向量迴歸方法,探索美國股市的價 值溢價及規模溢價。我們提出兩種方法:GA-SVR 方法及 GA-SVM 方法,在 GA-SVR 方法中,分別以 GA-SVR 價值股成長股投資策略及 GA-SVR 小型股大型股投資策略來 探索股市;在 GA-SVM 方法中,則分別以 GA-SVM 價值股成長股投資策略及 GA-SVM 小型股大型股投資策略來探索股市。

在這一章中我們將會呈現實驗的結果,並且將所提出的策略和標竿投資策略 的結果相比較。此外,也將本研究所提出方法的實驗結果和其它方法相比。第一節 介紹資料與研究變數,第二節介紹實驗設計,第三節詳述實驗之結果,最後則為實 驗的比較。

4.1 4.1 4.1

4.1 資料與研究變數 資料與研究變數 資料與研究變數 資料與研究變數

本研究中所採用的變數主要是參考由 Nalbantov et al.所提出的 17 個變數,

包括了 LagVmG、LagSmL、VOL、FPE、MOM、Profit cycle、PE dif.及 DY dif.等 8 個技術變數,9 個經濟變數則為法人信用利差、核心通貨膨脹、Earnings-yield gap、利潤曲線利差、實際債券利潤、工業生產季調整、油價、採購經理指標及領 先指標等變數。(Nalbantov,2004) (詳細的定義請參考表 6 和表 7) 。實驗資料 主要從 DataStream 資料庫及標準普爾等相關網站所取得。資料期間從 1994 年 1 月 至 2005 年 10 月的每日資料。總資料筆數為 2970 筆。

(31)

表表

表 6 使用於使用於使用於 GA-SVR 方法中的技術變數使用於 方法中的技術變數方法中的技術變數 方法中的技術變數 技技

技技 術術術 術 變變變變 數數數數 No.No.

No.No. 變數名稱變數名稱變數名稱變數名稱 變數定義變數定義變數定義變數定義

1 LagVmG 落後的價值股/成長股利差 2 LagSmL 落後的小型股/大型股利差 3 VOL S&P 500 的波動性

4 FPE S&P 500 12 個月的向前 P/E 5 動量

MOM S&P 500 六個月的動量(Momentum) 6 利潤循環

Profit cycle S&P 500 每股盈餘的年度變化 7 本益比差異

PE dif.

在價值股和成長股指標之間本益比的差異,或在 S&P 500 和小型股(small cap)指標之間本益比的差異 8 股息利潤差異

DY dif.

價值和成長指標之間在股息利潤上的差異或 S&P 500 和 小型股(small cap)指標之間股息利潤的差異

表表

表 7 使用於使用於使用於 GA-SVR 方法中的經濟變數使用於 方法中的經濟變數方法中的經濟變數 方法中的經濟變數 經濟變數

經濟變數 經濟變數 經濟變數 No.No.No.

No. 變數名稱變數名稱變數名稱變數名稱 變變變變 數數數數 定定定 定 義義義義

1 法人信用利差 (Lehman Aggregate)Baa 級公司對 Aaa 級公司的 利潤利差

2 核心通貨膨脹

Core inflation 美國消費者物價指數 12 個月的蔓延的變動 3 Earnings-yield gap S&P 500 的向前 E/P 比和 10 年長期國庫債券利

潤之間的差異 4 利潤曲線利差

Yield Curve Spread

10 年長期國庫債對 3 年短期國庫券的利潤差異

5 實際債券利潤 Real Bond Yield

由於 12 個月蔓延的通貨膨脹率,對 10 年長期 債券利潤調整

(32)

6 工業生產季調整

Ind. Prod 美國工業生產季調整 7 油價(Oil Price) 一個月的油價變動 8 採購經理指標

ISM (MoM)

U.S. I.S.M.採購經理指標(Mfg Survey)的一個 月的變動

9 領先指標

Leading Indicator

在 Conference Board 領先指標中 12 個月的變 化

關於以上的變數,說明如下:

(1)核心通貨膨脹:消費者物價指數(CPI-U)是由美國勞工統計局所匯編,是根據以 1982 年指數值為 100 為基礎。例如,消費者物價指數若為 158 則是指出從 1982 年 到 現 在 有 58% 的 通 貨 膨 脹 。 核 心 通 貨 膨 脹 的 資 料 可 由美國勞工統計局 網站或 Datastream 資料庫取得。

(2)油價(Oil Price):油價突然高漲或下跌時,會對股市產生負面衝擊或正面鼓 舞,但分析股勢走勢時,不能只以油價來判斷股價,應同時考慮總體環境中的其它 條件(徐俊明,2007)。

(3)領先指標(Leading Indicators) :經濟學家經常會使用一些經濟領先指標來預 測未來的景氣概況。

其餘變數之詳細說明請參考附錄一。

(33)

表 8 是本研究根據相關文獻所整理出的輸入變數與輸出變數之間的關係。

表表

表 8 輸入變數與輸出變數之間的關係輸入變數與輸出變數之間的關係輸入變數與輸出變數之間的關係 輸入變數與輸出變數之間的關係 變

變變

變 數數 輸入變數與輸出變數之間的關係輸入變數與輸出變數之間的關係輸入變數與輸出變數之間的關係輸入變數與輸出變數之間的關係 參考文獻參考文獻參考文獻參考文獻

VOL (VIX)

VIX 增加的日子,大型股的投資組 合會勝過小型股的投資組合,而且 價值股的投資組合會勝過成長股的 投資組合。

VIX 減少的日子,則反之。

Reference: Market Timing: Style and Size Rotation Using the VIX [8]

核心通貨膨脹

Anderson[1997] 指 出 通 貨 膨脹對小 型股有利

The Profitability of Style Rotation Strategies in the United Kingdom [9]

利潤曲線利差 利 潤 曲 線 利 差 和 風 格 利 差 (style spread) 是正相關的

真實債券利潤 真 實 債 券 利 潤 和 風 格 利 差 (style spread) 是正相關的

Equity Style Timing[10]

本研究整理

4.2 4.2 4.2

4.2 實驗設計 實驗設計 實驗設計 實驗設計

在本小節,我們將介紹四種投資策略之實驗設計,並簡介移動視窗模型之 設計。本研究之實驗設計主要分為 GA-SVR 及 GA-SVM 兩種方法,再分別設計兩個投 資略:因此共有以下四種投資策略:

1. GA-SVR 價值股成長股交替策略。

2. GA-SVR 小型股大型股交替策略。

3. GA-SVM 價值股成長股交替策略。

4. GA-SVM 小型股大型股交替策略。

在 GA-SVR 及 GA-SVM 價值股成長股交替策略中,我們嘗試探索股市價值溢價 的交替策略,能夠避免局部最佳化、overfitting 等分類的問題,並有能力減少輸 入變數的雜訊以選擇趨近於最理想的輸入變數。我們運用了基因演算法以找出趨近 於最佳的技術變數及經濟變數的組合。而支持向量迴歸非線性及高維度的特性則被 運用來決定選擇價值股或成長股。我們的目標是 S&P 500 價值指標及 S&P 500 成

(34)

長指標之間的價值溢價。最後則是實驗結果的評估,以檢視本研究所提出之策略之 年平均報酬率是否能勝過買入持有策略及被動式價值股差成長股交替策略

而在 GA-SVR 及 GA-SVM 小型股大型股交替策略中,則為探索股市規模溢價的 交替策略,同樣地,我們運用了基因演算法以找出趨近於最佳的技術變數及經濟變 數的組合。而支持向量迴歸則被運用來決定選擇小型股或大型股。我們的目標是 S&P 600 小型股指標及 S&P 500 大型股指標之間的規模溢價。在實驗結果的評估方 面,則是檢視本研究所提出策略之年平均報酬率是否能勝過 S&P 600 小型股買入持 有策略、S&P 500 大型股買入持有策略與被動式小型股差大型股投資策略。

4.2.1 4.2.1 4.2.1

4.2.1 移動視窗 移動視窗 移動視窗 移動視窗(sliding windows) (sliding windows) (sliding windows)式模型設計 (sliding windows) 式模型設計 式模型設計 式模型設計

經濟的運作是一種規律變動的週期,如股票價格或期貨指數等,因此在資料進 行分析決策時,其訓練資料也必需隨著時間而改變,此稱為移動式模型(Kimoto et al., 1990)。移動視窗式模型是以過去某段期間的資料當成訓練資料,再以其後的 某段期間的資料當成測試資料而形成一個視窗,然後訓練資料的期間向後移動而建 立另一個視窗(周俊言,2009)。本研究之資料總筆數為 2970 筆,我們以 300 筆訓 練資料,預測 30 筆測試資料;所以每一條染色體都各有 89 個訓練模型(請參考附 錄四 GA-SVR 模型編號、訓練及測試筆數對照表)。(如圖 7)

圖 7 移動視窗(sliding windows)式模型設計

300 筆訓練資料

300 筆訓練資料

300 筆訓練資料

30 筆 測 試 資

30 筆 測 試 資

30 筆 測 試 資

(35)

4.2.2 GA-SVR 和 和 和 和 GA-SVM 方法之設定 方法之設定 方法之設定 方法之設定

在此,分別簡介我們所採用的四個投資策略的設定。

1.1.1.

1. GAGA-GAGA---SVR SVR SVR SVR 價值成長交替策略價值成長交替策略價值成長交替策略價值成長交替策略 ( ( (GA (GAGA-GA---SVR Value Growth rSVR Value Growth rSVR Value Growth rSVR Value Growth rototototaaaation strategytion strategytion strategytion strategy)))) 在這個策略中,當 GA-SVR 方法的輸出為正值,表示這是買進價值股並賣出 成長股的時機;相反地,若其輸出為負值,則表示這是買進成長股並賣出價值股的 好時機。本研究使用三種不同的預測範圍以檢視何者之表現為最佳,然後我們將這 三種不同的預測範圍的平均報酬率和標竿策投資策略--被動式價值股差成長股策略 之平均報酬率加以比較。被動式價值股差成長股策略持續地買進價值股並賣出成長 股。

2.

2.2.

2. GAGA-GAGA---SVRSVRSVRSVR 小型小型小型股小型股股股大型大型大型股交替策略大型股交替策略股交替策略股交替策略((((GAGAGA-GA---SVR SVR SVR SVR SmallSmallSmallSmall LargeLargeLarge rLarge r r rooootation strategytation strategytation strategytation strategy)))) 在這個策略中,當 GA-SVR 方法的輸出為正值則代表這是買進小型股並且賣 出大型股的時機。若是輸出的訊號為負值,則表示這是買大型股並賣出小型股的良 機。我們將 GA-SVR 小型股大型股交替策略的年平均報酬率和標竿投資策略—被動 式小型股差大型股策略之報酬率加以比較。被動式小型股差大型股策略持續地買進 小型股並且賣出大型股。

3.

3.3.

3. GAGA-GAGA---SVMSVMSVMSVM 價值價值價值股價值股股股成長成長成長股成長股股股交替策略交替策略交替策略 交替策略

在這個策略中,當 GA-SVM 方法的輸出為+1,表示這是買進價值股並賣出成 長股的時機;相反地,若其輸出為-1,則表示這是買進成長股並賣出價值股的好時 機。

4.

4.4.

4. GAGA-GAGA---SVMSVMSVMSVM 小型股大型股交替策小型股大型股交替策小型股大型股交替策略小型股大型股交替策略略略

在這個策略中,當 GA-SVM 方法的輸出為+1 則代表這是買進小型股並且賣出大型股 的時機。若是輸出的訊號為-1,則表示這是買大型股並賣出小型股的良機。

(36)

4.3 4.3 4.3

4.3 實驗結果 實驗結果 實驗結果 實驗結果

在這一節我們將呈現 GA-SVR 價值股成長股交替策略、GA-SVR 小型股大型股 交替策略、GA-SVM 價值股成長股交替策略、以及 GA-SVM 小型股大型股交替策略之 實驗結果,並找出影響價值溢價及規模溢價之重要變數。另外,我們也將比較不同 的方法的正確率及報酬率,以檢視本研究所提出之 GA-SVR 方法及 GA-SVM 方法之效 能。

4.3.1 GA 4.3.1 GA 4.3.1 GA

4.3.1 GA- -- -SVR SVR SVR 價值股成長股交替策略實驗結果 SVR 價值股成長股交替策略實驗結果 價值股成長股交替策略實驗結果 價值股成長股交替策略實驗結果

我們將預測結果以分類矩陣的方式來呈現,從分類矩陣中我們可以瞭解型 I 誤差率、型 II 誤差率、錯誤率及正確率,以評估各預測模型之預測效果。分類矩 陣如表 9,分成四種類型:

表 表表

表 9 價值溢價實際值與預測值之分價值溢價實際值與預測值之分價值溢價實際值與預測值之分價值溢價實際值與預測值之分類矩陣類矩陣類矩陣類矩陣

預測值 實際值

價值溢價 非價值溢價

價值溢價 TP FP

非價值溢價 FN TN

TP:預測正確:實際為價值溢價,且被 GA-SVR 方法判定為價值溢價。

FP:預測錯誤:實際為價值溢價,但卻被 GA-SVR 方法判定為非價值溢價 (型 I 誤 差)。

(37)

FN:預測錯誤:實際為非價值溢價,但卻被 GA-SVR 方法判定為價值溢價 (型 II 誤 差)。

TN:預測正確:實際為非價值溢價,且被 GA-SVR 方法判定為非價值溢價。

本實驗所使用的型 I 誤差率、型 II 誤差率、模型錯誤率與模型正確率的公式 如下所示。

型 I 誤差率=實際為價值溢價,但被判定為非價值溢價筆數(FP)

實際為價值溢價筆數

型 II 誤差率=實際為非價值溢價,但被判定為價值溢價筆數(FN)

實際為非價值溢價筆數

模型錯誤率= +

+

判定錯誤筆數( )

總筆數(實際為價值溢價筆數 實際為非價值溢價筆數) FP FN

模型正確率==== +

+

判定正確筆數( )

總筆數(實際為價值溢價筆數 實際為非價值溢價筆數) TP TN

GA-SVR 價值股成長股交替策略之探討方法所得到的預測結果如表 10 之分類 矩陣所示。由該分類矩陣中可知,其型 I 誤差為 35.73%、型 II 誤差為 59.55%、模 型錯誤率為 47.27%,而總模型預測正確率則為 52.73%。

表表

表 10 GA-SVR 價值價值價值股成長股交替策略之預測模型所得到的預測結果價值股成長股交替策略之預測模型所得到的預測結果股成長股交替策略之預測模型所得到的預測結果股成長股交替策略之預測模型所得到的預測結果 價值溢價價值溢價

價值溢價價值溢價 非價值溢價非價值溢價非價值溢價非價值溢價 總和總和總和 總和

價值溢價 885 492 1377

非價值溢價 770 523 1293

價值溢價 64.27% 35.73% 100%

非價值溢價 59.55% 40.45% 100%

預測值 實際值

(38)

型 I 誤差: 492

1377=35.73%

型 II 誤差: 770

1293=59.55%

模型誤差率:(492 +770)

2670 =47.27%

模型正確率:(885 + 523)

2670 =52.73%

表 11 是變數編號及其對應的變數名稱。

表 表

表 11 變數編號及其對應之變數名稱變數編號及其對應之變數名稱變數編號及其對應之變數名稱變數編號及其對應之變數名稱 變數編號

變數編號 變數編號

變數編號 變數名稱變數名稱變數名稱 變數名稱 變數編號變數編號變數編號變數編號 變數名稱變數名稱變數名稱變數名稱 (1) S&P 500 的動量 (9) 領先指標

(2) LagSmL (10) 油價

(3) LagVmG (11) 核心通貨膨脹

(4) S&P 500 的波動性 (12) Earnings-yield gap

(5) FPE (13) 實際債券利潤

(6) 工業生產季調整 (14) 利潤曲線利差 (7) 採購經理指標 (15) 利潤循環

(8) 法人信用利差 (16) 本益比差異(PE dif.) (17) 股息利潤差異(DY dif.) 表 12 是 GA-SVR 價值股成長股交替策略最佳前五名之正確率及其對應之基因,

以 排 名 第 1 的 基 因 為 例 , 其 年 平 均 報 酬 率 為 9.66%, 前 面 的 8 個 位 元 組 為 01011001,其所對應的變數是第 2、4、5 及第 8 個變數,依序為:LagSmL、S&P 500 的波動性、FPE 及法人信用利差。接下來的 9 個位元組:011011100,其對應變

(39)

數為油價、核心通貨膨脹、實際債券利潤、利潤曲線利差及利潤循環。所以在 17 個變數之中,GA 共挑選了 9 個變數成為 SVR 的輸入變數。GA 代號 5-6 表示為第 5 代中的第 6 條染色體。

表 表

表 12 GA-SVR 價值股成長股交替策略最佳價值股成長股交替策略最佳價值股成長股交替策略最佳價值股成長股交替策略最佳前五名之前五名之前五名之前五名之年平均報酬年平均報酬年平均報酬率及其對應之基因年平均報酬率及其對應之基因率及其對應之基因率及其對應之基因

排名排名

排名排名 GAGAGA 代碼GA代碼代碼代碼 基因基因 基因基因 FFFitnessFitnessitnessitness 值 年平均報酬率年平均報酬率年平均報酬率年平均報酬率

1 5-6 0101100101101110010011010100111100110 10.17443 9.66%

2 14-5 0111111000110111001011101100011010110 9.674464 9.16%

3 14-1 0111111000110111101011101100111000110 9.570218 9.05%

4 9-18 0111111100100011001011101100111010010 9.450909 8.94%

5 9-1 0111111000100011001011101100111010110 9.41847 8.90%

*基因所挑選之變數可參照表 11

表 13 為 GA-SVR 價值股成長股交替策略最佳前五名之 C 值及 gamma 值,其中排 名第一的 C 值及 Gamma 值分別為 415 及 0.3378906。第一名到第五名的 C 值在 303 到 431 之間,而 Gamma 值則介於 0.3378906 至 0.4326172 之間。

表 表表

表 13 GA-SVR 價值股成長股交替策略最佳前五名之價值股成長股交替策略最佳前五名之價值股成長股交替策略最佳前五名之價值股成長股交替策略最佳前五名之 C 值及值及值及值及 gamma 值值值 排名

排名 排名

排名 基因基因基因基因 CCCC 值值值值 GammaGammaGammaGamma 1 0101100101101110010011010100111100110 415 0.3378906 2 0111111000110111001011101100011010110 429 0.4326172 3 0111111000110111101011101100111000110 399 0.4326172 4 0111111100100011001011101100111010010 303 0.4326172 5 0111111000100011001011101100111010110 431 0.4326172

(40)

表 14 顯示了以本研究所提出的 GA-SVR 方法購買成長股的交易百分比為 38.02% 而購買價值股之百分比則為 61.98%。這顯示了以交替策略來預測價值溢價 是有其必要的,因為其中於美國股市中購買成長股之百分比為 38.02%,以 GA-SVR 方法投資者可以選擇對的交易時間點。

表 表

表 14 GA-SVR 價值股成長股交替策略中購買價值股或成長股之交易百分比價值股成長股交替策略中購買價值股或成長股之交易百分比價值股成長股交替策略中購買價值股或成長股之交易百分比價值股成長股交替策略中購買價值股或成長股之交易百分比 總交易百分比 GAGA-GAGA---SVRSVRSVRSVR 價值股成長股交替策略

總交易筆數中購買成長股之百分比 38.02%

總交易筆數中購買價值股之百分比 61.98%

圖 8 為 GA-SVR 價值股成長股交替策略之投資訊號,輸出為正,表示買入價值股並 賣出成長股,輸出為負則表示買入成長股並賣出價值股。(於 2670 個交易日當中,

61.98%之投資訊號建議購買價值股,38.02%之投資訊號則建議購買成長股)

GA-SVR價值股成長股交替策略之投資訊號之投資訊號

-10.00 -5.00 0.00 5.00 10.00

3/14/95 12/5/95 8/29/96 5/27/97 2/20/98 11/12/9 8/10/99 5/3/00 1/29/01 10/26/0 7/24/02 4/17/03 1/12/04 10/6/04 6/30/05

圖 8 GA-SVR 價值股成長股交替策略之投資訊號

參考文獻

相關文件

某項貨物的單位價格是指該項貨物的貿易貨值與其貨量之比。季度單位價格指數是計算當季各

某項貨物的單位價格是指該項貨物的貿易貨值與其貨量之比。季度單位價格指數是計算當季各

1.採減價收受者,按不符項目標的之契約單價 20 % (由機關視需要於 招標時載明;未載明者,依採購法施行細則第 98 條第 2 項規定) 與

面向東南亞,尋求區域合作的價值與意義。如今當我們面對台灣原住民的「民族數學」研究時,尤其

價值觀教育須結合學校和家庭教育,學校與家長必須緊密合作,才能

價值觀教育須結合學校和家庭教育,學校與家長必須緊密合作,才能

探索個人及社會議題,培 養他們正面的價值觀和態 度,幫助他們成為有識見 和負責任的公民,懂得關

• 有一個可以耐重 W 的背包,及 N 種物品,每種物品有各自的重量 w[i] 和價值 v[i] ,且數量為 k[i] 個,求在不超過重量限制的情 況下往背包塞盡量多的東西,總價值最大為多少?.