• 沒有找到結果。

本論文使用前一年台股市值前兩百家公司的基本分析指標作為財務資料,以支援向 量機建構訓練模型,並以訓練所得之模型對這兩百家公司在該年度收益表現進行分析,

藉由分析結果判斷最有潛力的公司做為投資標的。此外以兩百家公司的平均收益作為比 較基準,找出可優於大盤績效表現的選股模型。

首先針對模型最佳化問題進行驗證,此部分將分成四種不同情況,分別就特徵選取 與支援向量機的 kernel 參數最佳化之必要性設計實驗:(1)以固定的 kernel 參數搭配所 有的特徵資料建構選股模型;(2)以遺傳演算法最佳化 kernel 參數搭配所有的特徵資料 建構選股模型;(3)以遺傳演算法進行特徵選取並搭配固定的 kernel 參數建構選股模型;

(4)以遺傳演算法對選股模型進行特徵選取與 kernel 參數的最佳化;藉由上述的方法將 可證明選股模型最佳化之重要性。

(1) 以固定的 kernel 參數搭配所有的特徵資料建構選股模型

這部分採用先前支援向量機相關研究所提出的建議設定,以高斯函數建構選股模 型,並嘗試不同的建議參數找出較為合適的比較模型。其中驗證的參數組合包含(C, kernel point) = (100, 25), (25, 100)所建構的支援向量機模型。圖 10 為 kernel 參數(100, 25) 以及所有特徵資料建立的選股模型自 1996 年到 2010 年期間分別以選股策略中前十股、

前二十股以及前三十股做為投資標的之累計交易情形,與大盤進行比較可發現交易期間 結束後選擇前二十股及前三十股的投資策略可優於大盤的累計獲利;圖 11 表示 kernel 參數為(25, 100)的選股模型累計收益情形,圖中顯示選擇十股、二十股及三十股的交易 策略皆可優於大盤。從以上的實驗可證實支援向量機的確可用以建構適當的選股模型,

在接下來的研究中將以 kernel 參數(25, 100)作為預設組合與其他方法進行比較。

圖 10. 大盤與選股策略累計收益比較(C, kernel point) = (100, 25)

圖 11. 大盤與選股策略累計收益比較(C, kernel point) = (25, 100)

25

(2) 最佳化 kernel 參數搭配所有的特徵資料建構選股模型

如同先前提到的最佳化需求,第二部分將要驗證對於 kernel 參數的最佳化是否能夠 強化所建構的選股模型分析效能,在此以遺傳演算法最佳化C 與 kernel point 兩項 kernel 參數,兩項參數的搜尋範圍皆為 1 到 10000,從中找出合適的參數組合建構選股模型。

這部分本論文總共實做五十次實驗,每次實驗皆以終止條件設定為五十代的遺傳演算法 來最佳化選股模型,在每次實驗中挑選出該世代最好的收益表現(best-so-far)代表選 股模型之績效。圖 12 為五十組最佳化選股模型中的一組實例,在 1996 年到 2010 年期 間該選股模型在市場交易的累計收益表現,其 kernel 參數組合為(C, kernel point) = (8987, 2707)。結果顯示藉由遺傳演算法最佳化 kernel 參數的選股模型不僅在三種選股策略皆 優於大盤的收益表現,且最佳化 kernel 參數的方法也可打敗以固定 kernel 參數所建構的 選股模型,達到最佳化選股模型的目標。

圖 12. 大盤與選股策略累計收益比較(C, kernel point) = (8987, 2707)

26

(3) 以特徵選取並搭配固定的 kernel 參數建構選股模型

第三部分要以遺傳演算法對選股模型的特徵做篩選,搭配第一部分所得到最佳的 kernel 參數組合(C, kernel point) = (25, 100),驗證特徵選取的重要性。這部分本論文總 共實做五十次實驗,每次實驗皆以終止條件設定為五十代的遺傳演算法來最佳化選股模 型,在每次實驗中挑選出該世代最好的收益表現(best-so-far)。圖 13 為五十組最佳化 選股模型中的一組實例,在 1996 年到 2010 年期間該選股模型在市場交易的累計收益表 現。結果顯示藉由遺傳演算法對選股模型進行特徵選取所帶來的幫助遠超過對 kernel 參數進行最佳化的結果。從圖中可明顯觀察到以特徵選取最佳化的選股模型對其效能有 十分顯著的成長,與第二組實驗結果進行比較,單做 kernel 參數最佳化的選股模型在選 擇前十股做為投資目標的收益表現在實驗結束時大約成長 3.5 倍,然而以特徵選取搭配 固定的 kernel 參數實驗中選擇前十股的收益在實驗結束可成長至 20 倍的報酬。

圖 13. 大盤與選股策略累計收益比較(C, kernel point) = (25, 100),對輸入變數進行特徵 選取

27

(4) 以遺傳演算法對選股模型進行特徵選取與 kernel 參數的最佳化

透過以上兩個實驗證實遺傳演算法分別對選股模型進行特徵選取與 kernel 參數的最佳化都 可為投資策略帶來相當程度的輔助,其中又以特徵選取的效果最為明顯。因此在最後這個部份 將測試同時對選股模型進行參數最佳化與特徵選取是否也會如同先前實驗結果一般有效提升選 股模型的效能。

這部分的實驗同樣實做五十次,每次皆以終止條件五十代的遺傳演算法最佳化選股 模型,圖 14 將呈現每一世代五十次實驗的平均收益表現成果;其中垂直的線段代表 95-percent 的信任區間,從圖中可得知同時對模型進行特徵選取與參數最佳化可快速模 型找出最合適選股方式。圖 15 為五十組最佳化選股模型中的一組實例,在 1996 年到 2010 年期間該選股模型在市場交易的累計收益表現其 kernel 參數組合為(C, kernel point)

= (6951, 790)。藉由這個例子可證明此方法具備找出相當優秀選股模型的能力,其所能 夠帶來的資產成長相當可觀。

圖 14. 演化五十代的 Best-so-far 曲線

28

圖 15. 大盤與選股策略累計收益比較(C, kernel point) = (6951, 790),對輸入變數進行特 徵選取

藉由以上四組實驗證實遺傳演算法能夠達到最佳化選股模型目標,為驗證選股策略 的實用性,本論文將修改驗證方法 cross validation 加入時間順序的觀念,設計一套更符 合真實財務情況的實驗系統。上述的選股模型皆是以 1995 年到 2009 年的財務資訊進行 訓練,從中找出符合全部訓練期間的選股模型,再以該模型分析後一年各家股票的成長 潛力,挑選優秀的企業做為投資標的。有別於傳統 cross validation 以隨機將資料分成訓 練期及測試期的方法,本論文參考時間連續性的觀念,將時間序列上過去的資料做為訓 練期用以建構選股模型,再以接下來的時間做為測試期驗證該模型的可行性。這樣設計 目的在於以測試期間的資訊來驗證所訓練的選股模型之實用性,透過測試期間收益表現 用以判斷該選股模型的分析效能。圖 16 說明本實驗設計的驗證方法,其中白色部分代 表用以建構選股模型的訓練期,藍色部分則為驗證的測試期。舉例說明,在個案 1 中以 1996 年的財務資訊建構選股模型,再以該模型分析 1997 年到 2009 年各家公司資料,

選擇投資組合驗證該模型的收益表現。

29

30

Case Index.

Years

1 96 97 98 99 00 01 02 03 04 05 06 07 08 09

2 96 97 98 99 00 01 02 03 04 05 06 07 08 09

3 96 97 98 99 00 01 02 03 04 05 06 07 08 09

4 96 97 98 99 00 01 02 03 04 05 06 07 08 09

5 96 97 98 99 00 01 02 03 04 05 06 07 08 09

6 96 97 98 99 00 01 02 03 04 05 06 07 08 09

7 96 97 98 99 00 01 02 03 04 05 06 07 08 09

8 96 97 98 99 00 01 02 03 04 05 06 07 08 09

9 96 97 98 99 00 01 02 03 04 05 06 07 08 09

10 96 97 98 99 00 01 02 03 04 05 06 07 08 09

11 96 97 98 99 00 01 02 03 04 05 06 07 08 09

12 96 97 98 99 00 01 02 03 04 05 06 07 08 09

13 96 97 98 99 00 01 02 03 04 05 06 07 08 09

圖 16. 實驗設計模型,白色為訓練期,深藍色為測試期

圖 16 設計十三組不同訓練組合驗證本論文所提出的選股策略在真實投資環境中是 否具備可行性,在現實情況下只能參考過去資料,並套用所訓練的模型進行獲利分析,

驗證模型在下一階段時間的實用性。本論文針對這部份實驗再分成兩種不同情況進行比 較:(1) 使用原始財務資料建構選股模型;(2) 運用模糊理論重新調整財務資料建構選 股模型;驗證模糊理論對所建構模型之精確度是否具備提升效果。分別以兩種資訊建構 選股模型,再細分成以前十股、前二十股及前三十股做為投資組合目標,以三種不同目 標建構選股模型,並以改良後的實驗系統驗證本論文所提出的選股模型是否具備應付真 實世界投資環境的可行性。

31

1 1996 1.272615 1.533070 0.005956 1997-2009 1.030998 1.042006 0.001042 2 1996-1997 1.501712 1.743054 0.033821 1998-2009 0.985499 1.013631 0.001439 3 1996-1998 1.203519 1.335845 0.007963 1999-2009 1.007499 1.058239 0.001568 4 1996-1999 1.152308 1.326968 0.004982 2000-2009 1.007112 1.053569 0.001739 5 1996-2000 1.075984 1.213870 0.003960 2001-2009 1.030655 1.069195 0.002387 6 1996-2001 0.979111 1.128301 0.001269 2002-2009 1.100290 1.137858 0.001679 7 1996-2002 1.011956 1.182605 0.000831 2003-2009 1.082473 1.071756 0.002256 8 1996-2003 1.032321 1.205808 0.001408 2004-2009 1.065995 1.053051 0.002021 9 1996-2004 1.028885 1.219243 0.001737 2005-2009 1.079320 1.034641 0.000922 10 1996-2005 1.033265 1.211333 0.001388 2006-2009 1.080770 1.009633 0.001054 11 1996-2006 1.044655 1.230217 0.001161 2007-2009 1.053859 0.902424 0.000847 12 1996-2007 1.074861 1.220507 0.000692 2008-2009 0.892096 0.842929 0.000930 13 1996-2008 1.044458 1.166711 0.000542 2009 1.075146 0.989523 0.004252

32

1 1996 1.272615 1.451544 0.001206 1997-2009 1.030998 1.064942 0.001189 2 1996-1997 1.501712 1.827545 0.019570 1998-2009 0.985499 1.038424 0.000639 3 1996-1998 1.203519 1.363017 0.003801 1999-2009 1.007499 1.065379 0.000900 4 1996-1999 1.152308 1.371220 0.001677 2000-2009 1.007112 1.062986 0.000890 5 1996-2000 1.075984 1.249054 0.000483 2001-2009 1.030655 1.082074 0.001089 6 1996-2001 0.979111 1.145359 0.000593 2002-2009 1.100290 1.136017 0.001486 7 1996-2002 1.011956 1.177289 0.000552 2003-2009 1.082473 1.112375 0.001565 8 1996-2003 1.032321 1.201993 0.000396 2004-2009 1.065995 1.092341 0.000524 9 1996-2004 1.028885 1.201831 0.000935 2005-2009 1.079320 1.077192 0.000637 10 1996-2005 1.033265 1.197368 0.000790 2006-2009 1.080770 1.056203 0.000657 11 1996-2006 1.044655 1.216109 0.000564 2007-2009 1.053859 0.970190 0.000615 12 1996-2007 1.074861 1.212540 0.000273 2008-2009 0.892096 0.878181 0.001121 13 1996-2008 1.044458 1.166708 0.000323 2009 1.075146 1.037623 0.004451

表 4. 大盤與 SVM-GA 選股策略(選擇前 30 股)統計結果

1 1996 1.272615 1.392566 0.001387 1997-2009 1.030998 1.074815 0.000387 2 1996-1997 1.501712 1.817002 0.017011 1998-2009 0.985499 1.045235 0.000250 3 1996-1998 1.203519 1.369032 0.003591 1999-2009 1.007499 1.069122 0.000564 4 1996-1999 1.152308 1.359654 0.001960 2000-2009 1.007112 1.056321 0.000536 5 1996-2000 1.075984 1.235796 0.000678 2001-2009 1.030655 1.080895 0.000617 6 1996-2001 0.979111 1.133677 0.000416 2002-2009 1.100290 1.135284 0.000788 7 1996-2002 1.011956 1.163003 0.000551 2003-2009 1.082473 1.116887 0.000907 8 1996-2003 1.032321 1.187849 0.000383 2004-2009 1.065995 1.093035 0.000553 9 1996-2004 1.028885 1.187777 0.000664 2005-2009 1.079320 1.074548 0.000331 10 1996-2005 1.033265 1.182146 0.000312 2006-2009 1.080770 1.067056 0.000549 11 1996-2006 1.044655 1.197381 0.000271 2007-2009 1.053859 0.998326 0.000807 12 1996-2007 1.074861 1.193889 0.000176 2008-2009 0.892096 0.897341 0.000580 13 1996-2008 1.044458 1.150045 0.000227 2009 1.075146 1.068356 0.004290

33

1 1996 1.272615 1.687435 0.006655 1997-2009 1.030998 1.030002 0.002957 2 1996-1997 1.501712 2.249706 0.117711 1998-2009 0.985499 1.036011 0.001985 3 1996-1998 1.203519 1.603009 0.031082 1999-2009 1.007499 1.046092 0.003125 4 1996-1999 1.152308 1.559214 0.021467 2000-2009 1.007112 1.043269 0.001598 5 1996-2000 1.075984 1.390452 0.008505 2001-2009 1.030655 1.069848 0.003598 6 1996-2001 0.979111 1.252544 0.004547 2002-2009 1.100290 1.124959 0.004115 7 1996-2002 1.011956 1.293485 0.005124 2003-2009 1.082473 1.094058 0.004762 8 1996-2003 1.032321 1.318391 0.005833 2004-2009 1.065995 1.082704 0.002884 9 1996-2004 1.028885 1.355652 0.005425 2005-2009 1.079320 1.072467 0.002260 10 1996-2005 1.033265 1.343936 0.007785 2006-2009 1.080770 1.045561 0.003158 11 1996-2006 1.044655 1.360265 0.004852 2007-2009 1.053859 0.922324 0.001842 12 1996-2007 1.074861 1.309132 0.004194 2008-2009 0.892096 0.873215 0.002166 13 1996-2008 1.044458 1.261718 0.001909 2009 1.075146 1.068136 0.010628

34

1 1996 1.272615 1.554720 0.001908 1997-2009 1.030998 1.042500 0.001668 2 1996-1997 1.501712 2.108629 0.055287 1998-2009 0.985499 1.046589 0.001759 3 1996-1998 1.203519 1.528479 0.012720 1999-2009 1.007499 1.070417 0.002519 4 1996-1999 1.152308 1.471036 0.006447 2000-2009 1.007112 1.054357 0.001496 5 1996-2000 1.075984 1.358964 0.005793 2001-2009 1.030655 1.072785 0.001633 6 1996-2001 0.979111 1.210635 0.001863 2002-2009 1.100290 1.136346 0.003485 7 1996-2002 1.011956 1.252214 0.002449 2003-2009 1.082473 1.114300 0.002644 8 1996-2003 1.032321 1.266317 0.003408 2004-2009 1.065995 1.097808 0.001733 9 1996-2004 1.028885 1.296451 0.003172 2005-2009 1.079320 1.087529 0.001180 10 1996-2005 1.033265 1.298126 0.002415 2006-2009 1.080770 1.050412 0.001006 11 1996-2006 1.044655 1.308053 0.002517 2007-2009 1.053859 0.956178 0.001760 12 1996-2007 1.074861 1.276751 0.002265 2008-2009 0.892096 0.899116 0.000942 13 1996-2008 1.044458 1.228933 0.001600 2009 1.075146 1.083443 0.002318

表 7. 大盤與 Fuzzy-SVM-GA 選股策略(選擇前 30 股)統計結果

1 1996 1.272615 1.484672 0.001476 1997-2009 1.030998 1.061143 0.002299 2 1996-1997 1.501712 2.035834 0.017419 1998-2009 0.985499 1.047062 0.001199 3 1996-1998 1.203519 1.499685 0.006300 1999-2009 1.007499 1.066879 0.001160 4 1996-1999 1.152308 1.444746 0.006766 2000-2009 1.007112 1.056372 0.000963 5 1996-2000 1.075984 1.321734 0.002294 2001-2009 1.030655 1.081631 0.001521 6 1996-2001 0.979111 1.181165 0.001143 2002-2009 1.100290 1.152027 0.001652 7 1996-2002 1.011956 1.212785 0.001874 2003-2009 1.082473 1.126180 0.001493 8 1996-2003 1.032321 1.252070 0.002250 2004-2009 1.065995 1.095831 0.000681 9 1996-2004 1.028885 1.266070 0.002804 2005-2009 1.079320 1.071705 0.000647 10 1996-2005 1.033265 1.252699 0.001490 2006-2009 1.080770 1.056733 0.000619 11 1996-2006 1.044655 1.270802 0.001308 2007-2009 1.053859 0.972073 0.000410 12 1996-2007 1.074861 1.255631 0.001077 2008-2009 0.892096 0.897166 0.000477 13 1996-2008 1.044458 1.197652 0.001062 2009 1.075146 1.090510 0.002344

藉由以上實驗方法驗證本論文所提出的最佳化選股模型可透過基本分析指標挑選投 資標的帶來相當可觀的資產成長;在實用性的論證上,本論文的選股方法同樣可在大部 份的情況下打敗大盤挑選合適的投資目標。

圖 18 為本論文選股方法的三種投資策略以 boxplot 作統計比較,圖中顯示選擇較少 的投資標的做為選股策略其結果分佈範圍較廣,代表該交易策略收益表現不夠穩定,可 能承受較高的投資風險;反之,選擇較多投資標的策略將有助於降低投資風險,獲得更 穩定的投資收益。此外在選擇前十股的投資策略在實驗中皆出現較高的最大值,說明在 承受高風險的危機之下,交易策略也同時具備可能出現較高投資獲利的選股模型。

圖 17. Boxplot

35

36

5. 結論

本論文運用人工智慧方法處理財務領域中相當重要的課題─選股問題。運用支援向 量機的學習能力作為主軸,分析台灣股市每年前兩百家公司的十五項基本分析指標。藉 由模糊理論重新調整各項基本分析指標,使其充分發揮真實含意,並針對支援向量機的 輸入訊息進行特徵選取與調整其 kernel 參數建構合適的選股模型。將下一年度的資訊帶 入所建構之模型進行分析,從中挑選出相對優秀的公司作為投資標的。

透過遺傳演算法同時對於模糊函數的建構、特徵選取以及 kernel 參數的挑選進行最 佳化,藉由演化能力對可能的最佳解進行全域式搜索。由實驗結果證實本論文所提出的 選股策略可有效地找出在收益表現上相當傑出的選股模型,在實用性的驗證上此方法也 可在大部分的情形下超越大盤帶來更好的投資獲利。

然而仍有少部份情形在實用性驗證中無法對資訊做出正確的分析,其可能原因在於 本論文尚未考量市場趨勢,將股市資料視為單一趨勢會受到整體市場走向影響導致分析

然而仍有少部份情形在實用性驗證中無法對資訊做出正確的分析,其可能原因在於 本論文尚未考量市場趨勢,將股市資料視為單一趨勢會受到整體市場走向影響導致分析

相關文件