• 沒有找到結果。

基於支持向量回歸的選股模型實證研究 —以台股市場爲例 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "基於支持向量回歸的選股模型實證研究 —以台股市場爲例 - 政大學術集成"

Copied!
48
0
0

加載中.... (立即查看全文)

全文

(1)國立政治大學金融學系研究所 碩士學位論文. 基於支持向量回歸的選股模型實證研究 —以台股市場爲例 政 治. 大. 立 of Stock Selection Model Based on An Empirical Study. ‧ 國. 學. Support Vector Regression - Taiwan Stock Market as An. ‧. Example. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 指導教授:廖四郎 博士 研究生:卓越 撰 中華民國一零八年陸月. June, 2019. DOI:10.6814/NCCU201900250.

(2) 謝辭 今年是我來到政大的第二年。在政大的兩年,遇見了很多有趣、認真、溫暖 的人們,感謝有你們陪伴我度過這不長不短的兩年。感謝在政大遇見的老師們,感 謝我的指導教授廖四郎老師的教導,因為有你們的教導,我才能夠完成這篇論文。 今年也是我來臺灣的第六年。不知不覺在這裡生活了六個年頭。來之前一直 在期待會在這邊開始怎麽樣的新生活,現在這些曾經的新生活已經成爲了我的日 常。畢業之後,要開始面對另一段新生活,不一樣的是,我已經從剛來的時候的 18. 政 治 大 這六年的時間,看了很多大陸不會引進的電影,聽了很多不會去我所在城市 立 開演唱會的歌手的演唱會,追了很多次喜歡了很多年的蘇打綠和陳綺貞,學會了騎 嵗少年成長成了即將奔三的青年。對新生活也沒有那麽多幻想和期待了。. ‧ 國. 學. 摩托車,學會了騎重機。遇到了,體驗到了太多太多美好的東西,這些都會留在我 的記憶中。. ‧. 即使到現在,我依然不喜歡很多吃的東西。比如爲什麽羹都那麽稠,爲什麽. sit. y. Nat. 筍是那樣一個味道……但是這些不喜歡的東西也會和那些美好的東西一起,一直留. io. er. 在我的記憶中,成為我在這裡生活過的證明,成爲對臺灣的回憶的一部分。 感謝那些在臺灣陪伴過我的人們,和我從大一開始就認識,結果研究所又同. n. al. Ch. i n U. v. 校了兩年,有了六年孽緣的金壘。教我打出了前兩行代碼,讓我茅塞頓開打出剩下. engchi. 的五百行代碼的張玄。在臺灣當了六年網友從來沒有同校過,總是一起去聽陳綺貞 的嘎嘎馮。一起在宿舍老年 Disco 的許琳、方東傑,一起奔跑在絕地海島的吳志龍、 陳哈哈。和我去看 LOL 的官方賽事決賽中首次歐美大戰,還一起討論吃些什麽好吃 的來放鬆心情的徐語辰。還有同為臺中畢業,對著臺中有著共同回憶的舞后溫琰 筠。新生説明會坐在我的右邊,覺得我非常冷漠的吳海棠。一樣喜歡看演唱會的簡 歡。 是你們讓我在政大有了很多很多美好的回憶,謝謝你們。 卓越 2019 年 6 月 i. DOI:10.6814/NCCU201900250.

(3) 摘要 當今世界的發展下,隨著信息技術的快速發展,計算機進行資料處理越來越 流行。近幾年來機器學習技術的火爆,更加催生了將機器學習用在金融、經濟等領 域的熱潮。本文選擇了機器學習領域的成熟算法支持向量機的分支——支持向量回 歸,當作基礎的算法,搭配以網格搜索、主成分分析法對模型進行參數尋優和對資 料進行降維處理。選取 2009 年第一季度到 2018 年第四季度的財報資料共 170 個指 標和收盤價資料,利用 2009 年到 2015 年的資料對上述的支持向量回歸模型進行訓. 政 治 大. 練,再利用 2016 年到 2018 年的資料進行回測。回測結果表明,支援向量回歸模型. 立. 對於台股市場有一定的預測能力,當使用主成分分析法提取特徵個數為十個的時. ‧ 國. 學. 候,整體模型的報酬率表現最好,當特徵個數增加或者減少時,一定程度上可以增 加模型的擬合程度,但是會增加樣本內和樣本外的𝑅 的差,導致模型的一般化能力. ‧. 減弱。. n. al. er. io. sit. y. Nat. 關鍵字:機器學習、支持向量回歸、支持向量機、量化交易、選股模型. Ch. engchi. i n U. v. ii. DOI:10.6814/NCCU201900250.

(4) ABSTRACT Since the great development of today's world, computer data processing has become more and more popular with the rapid development of information technology. In recent years, the popularity of Machine Learning technology has spawned a boom in applications of finance and economy. This paper chooses the Support Vector Regression (SVR) as the basic algorithm, a branch of the mature Machine Learning approach, Support Vector Mchine (SVM). With the application of grid search and principal component analysis method, the parameters of the model are optimized and the data dimension is reduced. 170 indicators and close price data from Q1 2009 to Q4 2018 are selected, when data from 2009. 政 治 大 testing. The back test result shows 立 that SVR model has predictive ability for the Taiwan to 2015 is used to train the SVR model, and data from 2016 to 2018 is used for back. stock market. When ten features are extracted by principal component analysis, the return. ‧ 國. 學. of overall model reaches the best. When the number of features increases or reduces, the fitting degree of the model can be increased to some extent, but the difference of R. ‧. between sample and out of sample increases, resulting in a weakness of the model. er. io. sit. y. Nat. generalization ability.. Keywords: Machine Learning, Support Vector Regression, Support Vector. n. al. Ch. Machine, Quant Trade, Stock Selection Model. engchi. i n U. v. iii. DOI:10.6814/NCCU201900250.

(5) 目錄 謝辭 ............................................................................................................................. i 中文摘要 .................................................................................................................... ii ABSTRACT .............................................................................................................. iii. 目錄 ........................................................................................................................... iv 表目錄 ....................................................................................................................... vi 圖目錄 ...................................................................................................................... vii 第一章. 政 治 大. 緒論 ........................................................................................................... 1. 立. 第一節 研究動機 ................................................................................................ 1. ‧ 國. 學. 第二節 研究背景 ................................................................................................ 1. ‧. 第三節 研究目的 ................................................................................................ 2 第四節 研究架構 ................................................................................................ 4. y. Nat. 文獻回顧 ................................................................................................... 5. io. sit. 第二章. er. 第一節 機器學習相關文獻回顧 ........................................................................ 5. al. n. v i n ........................................ 6 支持向量機和支持向量回歸相關文獻回顧 Ch engchi U. 第二節. 第三節 文獻回顧總結 ........................................................................................ 7 第三章. 研究方法 ................................................................................................... 8. 第一節 支持向量機 ............................................................................................ 8 支持向量機原理 ............................................................................ 8 支持向量機的求解 ...................................................................... 11 核函數 .......................................................................................... 14 第二節 支持向量回歸 ...................................................................................... 15 iv. DOI:10.6814/NCCU201900250.

(6) 第三節 交叉驗證 .............................................................................................. 17 第四章. 模型建構與實證分析 ............................................................................. 18. 第一節 資料來源與資料預處理 ...................................................................... 18 資料來源 ...................................................................................... 18 選取因子 ...................................................................................... 18 資料預處理 .................................................................................. 18 第二節 模型設置與訓練 .................................................................................. 19. 政 治 大. SVR 參數優化 ............................................................................. 19. 立. SVR 模型訓練 ............................................................................. 20. ‧ 國. 學. 第三節. SVR 模型回測結果 ............................................................................. 20. 第四節 小結 ...................................................................................................... 28. ‧. 第五章. 總結與改進方向 ..................................................................................... 29. y. Nat. io. sit. 第一節 研究總結 .............................................................................................. 29. n. al. er. 第二節 改進方向 .............................................................................................. 30. Ch. i n U. v. 參考文獻 .................................................................................................................. 31. engchi. 附錄 .......................................................................................................................... 32. v. DOI:10.6814/NCCU201900250.

(7) 表目錄 表 1 常用核函數表 .................................................................................................. 19 表 2 尋參結果表 ...................................................................................................... 20 表 3 10 折交叉驗證樣本内外測試集結果對比 ..................................................... 20 表 4 五個特徵年化報酬 .......................................................................................... 22 表 5 五個特徵每季度累計報酬率 ......................................................................... 22 表 6 十個特徵年化報酬 .......................................................................................... 23 表 7 十個特徵每季度累計報酬率 ......................................................................... 23. 政 治 大. 表 8 十五個特徵年化報酬 ...................................................................................... 24. 立. 表 9 十五個特徵每季度累計報酬率 ...................................................................... 25. ‧ 國. 學. 表 10 二十個特徵年化報酬 .................................................................................... 25 表 11 二十個特徵每季度累計報酬率 .................................................................... 26. ‧. 表 12 二十五個特徵年化報酬 ................................................................................ 27 表 13 二十五個特徵每季度累計報酬率 ................................................................ 27. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. vi. DOI:10.6814/NCCU201900250.

(8) 圖目錄 圖 1 研究架構圖 ........................................................................................................ 4 圖 2 支持向量機目的示意圖 .................................................................................... 8 圖 3 支持向量機原理示意圖 .................................................................................... 9 圖 4 軟分隔支持向量機原理示意圖 ...................................................................... 10 圖 5 核方法示意圖 .................................................................................................. 14 圖 6 支持向量回歸示意圖 ...................................................................................... 15 圖 7 交叉驗證示意圖 .............................................................................................. 17. 政 治 大. 圖 8 持倉流程示意圖 .............................................................................................. 21. 立. 圖 9 五個特徵累計報酬率 ...................................................................................... 22. ‧ 國. 學. 圖 10 十個特徵累計報酬率 .................................................................................... 23 圖 11 十五個特徵累計報酬率 ............................................................................... 24. ‧. 圖 12 二十個特徵個數累計報酬率 ........................................................................ 26 圖 13 二十五個特徵個數累計報酬率 .................................................................... 27. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. vii. DOI:10.6814/NCCU201900250.

(9) 第一章 緒論 第一節. 研究動機. 股票自發源於西方至今已經 400 多年歷史,伴隨著世界經濟發展,股票市場 已經成爲世界經濟發展的不可或缺的一部分,吸引了無數投資者。 股票市場具有高風險高回報的特徵,因此如何在股票市場獲取穩定的收益成. 政 治 大 析。而近年隨著機器學習技術的火爆,將機器學習技術應用於股市也成爲了一個值 立 得研究的方向。 第二節. 研究背景. 學. ‧ 國. 爲了一個值得研究的方向。而人們通常使用的方法大致分爲技術分析和基本面分. ‧. 量化投資主要是指應用信息技術、數學、統計等方法來實現投資理念和投資. sit. y. Nat. 策略的方法。量化投資與傳統投資方法的最大區別在於量化投資更加依賴數學模型. io. er. 和資料,來尋找投資標的,從而實現投資策略尋求穩固而連續的收益。. al. 量化投資的發展,主要是從 20 世紀 50 年代 Markwiz 提出的投資組合理論開. n. v i n 始。那時 Markwiz 提出了投資組合理論第一次使得風險和收益數量化,從而標志著 Ch engchi U 量化投資在理論領域的萌芽。 而後在 1971 年,Barclays 公司發行了第一支量化基金,標志著量化投資在實 踐領域開始應用。但是之後從 20 世紀 80 年代開始,由於受制於信息技術的發展, 量化投資這種需要處理大量資料以及强大的計算能力的方法始終得不到突破性的發 展。 隨著近年來信息技術的飛速發展,量化投資也得到了迅猛的發展。藉助電腦 的高運算速度,量化投資可以在短時間内分析市場產生的大量資料,從而產生合適 的量化模型。 1. DOI:10.6814/NCCU201900250.

(10) 在當前的金融行業中,量化選股由於以下的幾個優點,變得越來越重要:1) 快速性:依靠電腦,可以比人腦更快的挖掘市場信息。2)紀律性:由於量化投資不 受人的感情干預,因此其紀律性比起會受主觀干擾的主觀投資好上很多。3)客觀 性:量化投資是通過對市場上相關的資料進行分析,不會受到人的主觀偏好的影 響。 同時,由於進行股票的投資價值分析與判斷非常複雜,其中需要掌握投資、 經濟、財會等理論知識,也要對企業的業務、管理等方方面面有所瞭解,同時還需 要對證券市場具有深入的認識。因此使用價值投資,來構建一套依靠分析資料選取. 政 治 大. 投資標的的選股模型,具有非常重要的意義。. 立. 在當今,隨著資訊以及資料越來越多,傳統的統計學對於大資料的分析已經. 學. ‧ 國. 不能滿足,從而在應用統計學基礎上發展的機器學習更適合大量資料的信息挖掘。 由於傳統的量化投資策略通常建立在金融數學模型的基礎上,有可能實現的僅僅是. sit. y. Nat. 題上非常有效。. ‧. 局部最優解(Local optimum),而通過人工智慧(AI)在探究複雜的非綫性規律問. io. er. 支持向量機(Support Vector Machine)模型基於統計理論、機器學習等理論 的優異特性。同時引入核方法(Kernel method)將綫性不可分的資料,引向高維,. n. al. Ch. i n U. v. 轉化爲綫性可分,并且保證了模型在對於高維度空間的運算能力。在國内外已有衆. engchi. 多研究者,對於其在選股模型方面的應用進行了應用,而支持向量回歸(Support Vector Regression)是在支持向量機的基礎上產生的回歸模型,因此藉助核方法,對 於高維度的資料具有優越的處理和擬合能力,而國内外使用支持向量回歸進行的選 股應用則還比較少。. 第三節. 研究目的. 本文將使用支持向量回歸(Support Vector Machine)搭配網格搜索(Grid Search)結合以往研究使用的支持向量回歸的相關參數,對參數進行遍歷,從而找出 最適參數。再使用最適參數的支持向量回歸模型使用台股公司的多維度財報資料藉 2. DOI:10.6814/NCCU201900250.

(11) 助支持向量回歸對高維度資料的優秀處理能力對台股的收盤價進行預測,從而獲取 股票的預測報酬率來進行量化投資模型的構建。希望能夠通過支持向量回歸方法, 在一定時間内穩定戰勝大盤,賺取超額收益。 本文系統闡述了與支持向量機與支持向量回歸相關的理論,同時利用 2016 年 第一季度到 2018 年第二季度共十個季度的資料當作實驗樣本進行回測測試,從而探 討基於財報基本面資料的支持向量回歸模型對於台股市場的適應度。. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 3. DOI:10.6814/NCCU201900250.

(12) 第四節. 研究架構. 確立研究動機及目的. 蒐集相關資料. 立. 確立研究主題 治 政 大. ‧. ‧ 國. 學. 文獻探討、SVR技術研究. 建構交易策略. n. 實證結果. Ch. engchi. er. io. sit. y. Nat. al. i n U. v. 結論與改進方向. 圖 1 研究架構圖. 4. DOI:10.6814/NCCU201900250.

(13) 第二章 文獻回顧 股票作爲一種高風險高回報的投資標的,自從誕生以來,就一直受到關注。 國内外有衆多研究者前仆後繼的探索股票的價格波動。股票的分析方法也基本分成 了基本面分析和技術面分析。而現在,由於人工智慧理論的不斷發展,在模式識別 以及複雜的系統控制方面取得巨大突破。并且誕生了諸多著名的應用,例如在圍棋 領域的 AlphaGo 接連戰勝了衆多圍棋高手,還戰勝了當時的圍棋世界冠軍柯潔。在 游戲領域的 Dota2 的 AI 戰隊 OpenAI,在接連戰勝職業戰隊之後開放全民挑戰。在 與人類的 7000 多場對戰之中戰績達到了恐怖的 99.4%勝率。. 治 政 大 而這一在其他領域十分有效的方法,也被應用進了金融、經濟等領域。支持 立 向量機在股票的選擇上,主要產生了兩個方向的應用,一個是利用支持向量機對股 ‧ 國. 學. 票的漲跌概率進行預測,將股票利用漲跌情況來進行分類,至今的大多數研究也都 是應用的支持向量機的方法對股票進行分類。另一種就是利用支持向量回歸對股票. ‧. 的未來價格進行數值上的預測。. y. 機器學習相關文獻回顧. io. sit. Nat. 第一節. n. al. er. 除支持向量機與支持向量回歸外,其他主要應用於選股的機器學習理論大多 是模糊理論、神經網絡等。. Ch. engchi. i n U. v. F.S.Wong 和 P.Z.Wang 等(1992)提出了一套基於模糊神經網絡的選個股模 型。Zargham M.R 和 Sayeh M.R(1999)將模糊理論用於股票選擇和價值評估,應用 中得到了良好的效果,但是缺乏學習以及一般化能力。同一時間,Quah 和 Srinivasan(1999)利用神經網絡建立了選股系統挑選市場上的股票,結果表明其建 立的投資組合具有良好的報酬率,并且多期戰勝市場。Kuo 等(2001)將遺傳算法 和模糊理論相結合,建立了股價追蹤系統,用來選擇投資組合。Chapados 和 Bengio (2001)將神經網絡用於資產估計和預測,從而進行資產的優化以及資產的配置。 Dennis Olson 和 Charles Mossman(2003)則使用 2352 家加拿大上市公司當作研究對 象,使用財務比率指標構建股票報酬率預測的指標體系,同時使用神經網絡、 5. DOI:10.6814/NCCU201900250.

(14) OLS、Logistic 回歸模型進行回測,回測結果表明,與 OLS 和 Logistic 兩種綫性模型 相比,神經網絡在非綫性上優秀的處理能力,使得神經網絡獲得了更好的效果。. 第二節. 支持向量機和支持向量回歸相關文獻回顧. 在 1995 年,Cortes 和 Vapnik 正式發表了了基於統計理論發展而誕生的新方 法,支持向量機,用以解決分類和回歸預測的問題。在 1998 年的時候,Joachims 則 發現了支持向量機在文本分類任務中的卓越性能,迄今爲止,綫性核函數下的支持 向量機,依然是文本分類任務中的首選技術。. 政 治 大 (2001)首次將支持向量機用在股票選擇當中,當時以澳洲證券交易所上市的所有 立. 在此之後,支持向量機成爲了機器學習領域的主流技術。Fan 和 Palaniswami. ‧ 國. 學. 公司為研究對象,以 1992 到 2000 年的年度財報資料為依據構建選股模型,得到了 遠超大盤的超額報酬。張玉川,張作泉,黃珍(2008)利用主成分分析法,對資料. ‧. 進行特徵變量的篩選,使用 1999 到 2005 年上市公司的財務資料,對每股收益建立 支持向量機選股模型,對優質股票進行識別,從而構建投資組合。全林(2009)則. y. Nat. sit. 使用改進之後的主成分分析法進行特徵提取,提取之後將其應用於支持向量機算. n. al. er. io. 法,從而建立模型來分析中國股票市場。. i n U. v. Yeh 等人(2011)使用多個核函數的支持向量回歸模型對股價走勢進行了預. Ch. engchi. 測。徐囯祥等(2011)建立使用主成分分析和遺傳算法改進的支持向量機模型,對 滬深 300 指數進行了短期的走勢預測,為支持向量機的參數動態尋優提供了解決思 路。Huang(2012)則使用遺傳算法,對支持向量回歸進行參數優化,以 1996-2011 年臺灣股市每年市值排名前 200 的股票為研究對象,建立了以遺傳算法改進的支持 向量回歸模型,分別選取 10、20、30 支股票建立回測模型,以市值前 200 的股票的 加權指數為比較基準,回測中,使用遺傳算法改進的支持向量回歸模型都取得了不 錯的報酬率。 蘇治與傅曉媛(2013),則以核方法結合主成分分析法,將主成分分析法進 行非綫性拓展,使用非綫性的方法提取特徵,之後再以遺傳算法進行支持向量回歸 6. DOI:10.6814/NCCU201900250.

(15) 的參數尋優,對其短期和長期的選股性能進行了評價和對比,實證的結果表明,模 型具有很高的預測精度。Yu,Chen 和 Zhang(2014)則使用了主成分分析法搭配支 持向量機模型,以上證 2009 和 2010 的公司為研究對象進行實證分析,結果表明使 用主成分分析法的支持向量機模型能夠獲得優於上證指數的超額報酬。. 第三節. 文獻回顧總結. 根據以上的文獻回顧,發現機器學習的發展由來已久,而衆多研究者將機器 學習理論與傳統統計理論建立的投資模型進行對比,結果機器學習理論中無論是神. 政 治 大 模型。而在支持向量機和支持向量回歸中,對於股票市場的研究者大多使用的是支 立 持向量機來對股票的性質進行分類,從而劃分出優質股票以及劣質股票,再從優質 經網絡還是支持向量機、支持向量回歸得到的結果均好過傳統統計理論建立的投資. ‧ 國. 學. 股票中挑選股票,來組成投資組合。而雖然支持向量回歸模型在以往的研究者的研 究當中使用的比較少,但是從少數的研究中看,支持向量回歸模型也能夠獲得較爲. ‧. 不錯的超額報酬,同時支持向量回歸模型并非單純將股票進行分類,而是直接獲得. sit. y. Nat. 因變量的數值,無論預測對象是股價還是報酬率,都有較爲直觀的反饋,減少了支. io. al. n. 後再挑選股票的過程。. er. 持向量機模型中從優質股票之中利用支持向量機返回的上漲機率值進行股票排序然. Ch. engchi. i n U. v. 7. DOI:10.6814/NCCU201900250.

(16) 第三章 研究方法 第一節. 支持向量機. 支持向量機原理 首先給定一個集合𝐷 = {(𝑥 , 𝑦 ), (𝑥 , 𝑦 ), … , (𝑥 , 𝑦 ))} ,𝑦 ∈ {1, −1},分類學習 中,最基本的思想就是在樣本空間中,找出一條直綫,將不同類別的樣本完全區分 開。. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. i n U. C h圖 2 支持向量機目的示意圖 engchi. v. 而可以將不同兩類樣本劃分成兩部分的直綫衆多,那麽要想選中其中一條性 能最好的,就不能僅僅關注於對於當前樣本的區分性,還要關注對於即將出現的新 樣本的容忍度。因此劃分的直綫距離兩側樣本的距離要選在一個適當值,此時就要 藉助支持向量。 首先我們給定那條用來分類樣本的“直綫 公式為: 𝛚𝐓 𝒙 + 𝑏 = 0. (3.11). 8. DOI:10.6814/NCCU201900250.

(17) 由於特徵個數有可能不是二維,可能是更高維度,因此此時我們稱呼這條 “直綫 為超平面。其中𝜔 = (𝑤 ; 𝑤 ; … ; 𝑤 )是超平面的法向量;𝑏為位移項,決定 超平面與原點之間的距離。 樣本空間中任意點𝑥到該超平面的距離為 𝑟=. |𝝎𝑻 𝒙 + 𝑏|. (3.12). |𝝎|. 同時給定. 政 治 大. 𝜔 𝑥 + 𝑏 ≥ 1,𝑦 = 1 𝜔 𝑥 + 𝑏 ≤ −1 , 𝑦 = −1. 立. (3.13). 𝜔 𝑥+𝑏 = 1. 學. ‧ 國. 則其中使得等號成立的點為支持向量。 𝜔 𝑥+𝑏 =0. ‧. 𝜔 𝑥 + 𝑏 = −1. n. er. io. sit. y. Nat. al. 2 𝑟= ||𝝎||. Ch. engchi. i n U. v. 圖 3 支持向量機原理示意圖. 其中兩個支持向量之間的距離則為 𝑟=. 2 |𝝎|. (3.14). 這個距離稱之爲間隔(margin)。 這時支持向量機的所求的約束條件則為尋找最大間隔的約束條件,即 9. DOI:10.6814/NCCU201900250.

(18) 2 , |𝝎| 𝑠. 𝑡. 𝑦 (𝜔 𝑥 + 𝑏) ≥ 1, 𝑓𝑜𝑟 𝑖 = 1,2, … , 𝑚. (3.15). 1 |𝝎| , 2 𝑠. 𝑡. 𝑦 (𝜔 𝑥 + 𝑏) ≥ 1, 𝑓𝑜𝑟 𝑖 = 1,2, … , 𝑚. (3.16). max. 上式等價於 𝑚𝑖𝑛. (soft margin)概. 由於現實任務中的樣本很難完全分開,因此引入“軟間隔 念,即允許在分類時候在一些分類樣本上出錯。. 政 治 大 𝜔 𝑥+𝑏 =1 𝜔 𝑥+𝑏 =0 立 ‧. ‧ 國. 學. 𝜔 𝑥+𝑏. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 4 軟分隔支持向量機原理示意圖. 如圖所示,圖中空心圖形則爲劃分錯誤的分類,軟間隔允許這些樣本不滿足 約束條件,對其有一定的容忍度。 雖然引入軟間隔概念,但是對於分類錯誤樣本依然希望盡可能少,所以引入 懲罰係數𝐶 ,滿足𝐶 > 0 ,引入至優化目標則為. 𝑚𝑖𝑛 ,. 1 |𝝎| + 𝐶 2. (𝑦 (𝝎 𝑥 + 𝑏) − 1). (3.17). 10. DOI:10.6814/NCCU201900250.

(19) 其中 為損失函數,一般常用的有三種損失函數,如下 Hinge 損失函數: (𝑧) = max(0,1 − 𝑧). (3.18 − 1). 指數損失函數(exponential loss): (z) = exp(−z). (3.18 − 2). 政 治 大. 對率損失函數(logistic loss):. 立. (𝑧) = log(1 + exp(−𝑧)). (3.18 − 3). ‧ 國. 學. 顯然當𝐶 越大時,代表著模型對錯誤的容忍度越低,當𝐶 趨向於無窮大時,迫 使所有樣本滿足條件,此時則為支持向量機的基本型。. ‧. 此時使用 hinge 損失函數此時優化目標為. y (3.19 − 1). er. n. al. max 0,1 − 𝑦 (𝝎𝑻 𝒙𝒊 + 𝑏). sit. 1 |𝝎| + 𝐶 2. io. ,. Nat. 𝑚𝑖𝑛. Ch. i n U. engchi. v. 然後引入一個“鬆弛變量 (slack variables)ξ ≥ 0,表示每一個樣本點不滿 足約束條件的程度。進而可將式(3.7)改寫為. 𝑚𝑖𝑛 ,. 1 |𝝎| + 𝐶 2. 𝜉. 𝑠. 𝑡. 𝑦 (𝝎 𝑥 + 𝑏) ≥ 1 − 𝜉 𝜉 ≥ 0, 𝑖 = 1,2, … , 𝑚. (3.19 − 2). 支持向量機的求解 支持向量機的求解,需要藉助拉格朗日乘子法(Lagrange Multiplier)來構造 對偶問題(dual problem)進行求解。 11. DOI:10.6814/NCCU201900250.

(20) 希望求解的目標超平面為 𝑓 (𝑥) = 𝝎𝑻 𝒙 + 𝑏. (3.21). 對式(3.16)的約束條件,添加拉格朗日乘子 α ≥ 0,則式(3.16)可轉化爲. 𝐿(𝝎, 𝑏, 𝛼) =. 1 |𝝎| + 2. 𝛼 1 − 𝑦 (𝝎 𝒙𝒊 + 𝑏). (3.22). 其中𝜶 = (𝛼 ; 𝛼𝟐 ; … ; 𝜶 ) ,令𝐿(𝝎, 𝑏, 𝛼)對𝝎 和𝑏的偏導數為 0 則可以得到 𝒎. 𝝎= 𝛼治 𝑦𝒙 政 大. (3.23). 𝒊. 立. 𝒊 𝟏. ‧ 國. 學. 𝛼𝑦 =0. (3.24). ‧. 考慮式(3.24)以及將(3.23)代入(3.22),得到式(3.16)的對偶問題. n. 𝑠. 𝑡.. 𝛼 𝛼 𝑦 𝑦 𝒙𝑻𝒊 𝒙𝒋. y. 1 2. sit. io. al. 𝛼 −. 𝛼𝑦 =0. er. Nat. max. C𝛼 h≥ 0, 𝑖 = 1,2, … , 𝑚U n i engchi. v. (3.25). 從而可以解出𝜶,即可得到模型. 𝑓 (𝒙) =. 𝛼 𝑦 𝒙 𝒙+𝑏. (3.26). 對於引入了鬆弛變量的支持向量機的求解過程類似使用两个乘子𝛼 ≥ 0, 𝜇 ≥ 0,利用朗格朗日乘子法得到. 12. DOI:10.6814/NCCU201900250.

(21) 𝐿(𝝎, 𝑏, 𝜶, 𝝃, 𝝁) =. 1 |𝜔| + 𝐶 2. 𝛼 1 − 𝜉 − 𝑦 (𝝎𝑻 𝒙𝒊 + 𝑏). 𝜉 +. −. (3.27). 𝜇𝜉. 同理,令𝐿(𝝎, 𝑏, 𝜶, 𝝃, 𝝁)對𝝎, 𝑏, 𝜉 的偏導數為 0,得到條件,進而求得(3.192)的對偶問題為. 𝛼 −. max. 立. 1 2. 𝛼 𝛼 𝑦 𝑦 𝒙𝑻𝒊 𝒙𝒋. 政 治 大. 𝑠. 𝑡.. 𝛼𝑦 =0. ‧ 國. 學 (3.28). 0 ≤ 𝛼 ≤ 𝐶, 𝑖 = 1,2, … , 𝑚. ‧. 與(3.25)的唯一不同僅在於約束條件,因此可以使用相同的方法進行求解。. 𝛼 𝑦 𝒙 𝒙+𝑏. n. al. 𝑓 (𝒙) =. Ch. engchi. er. io. sit. y. Nat. 得到解為. i n U. v. (3.26). 13. DOI:10.6814/NCCU201900250.

(22) 核函數 由於并非所有樣本都綫性可分,存在綫性不可分的樣本,因此定義一個映射𝜙 可以將低維向量映射到更高維度,從而達到綫性可分的目的。. 𝑥 → 𝜙(𝑥). 政 治 大. 立. ‧ 國. 學. io. n. al. 1 2 𝑠. 𝑡.. 𝛼 𝛼 𝑦 𝑦 𝜙 (𝒙𝒊 )𝜙 𝒙𝒋. sit. 𝛼 −. 𝛼𝑦 =0. C𝛼h≥ 0, 𝑖 = 1,2, … 𝑚 engchi. er. Nat. max. y. ‧. 因此此時. 圖 5 核方法示意圖. i n U. v. (3.31). 為原問題的對偶問題,但是此時𝜙 (𝒙𝒊 )𝜙(𝒙𝒋 )涉及到高維度内積運算,所以引 入核函數𝑘(·,·),使得 𝑘 𝒙𝒊 , 𝒙𝒋 = 𝜙 (𝒙𝒊 )𝜙 𝒙𝒋. (3.32). 這樣就避免了在高維度空間的計算,使得可以在原始維度的空間通過計算得 出得到結果,此時的解為. 𝑓(𝑥) =. 𝛼 𝑦 𝑘 (𝒙, 𝒙 ) + 𝑏. (3.33). 14. DOI:10.6814/NCCU201900250.

(23) 第二節. 支持向量回歸. 支持向量回歸就是將目標函數 𝑓 (𝑥) = 𝝎𝑻 𝒙 + 𝑏. (3.41). 當作一個回歸模型,使資料盡量擬合在模型周圍。與其他回歸模型不同的 是,支持向量回歸會給出一個誤差項𝜖 代表著函數對於預測偏差的容忍程度,使得當 真實值𝑦 介於𝑓 (𝒙𝒊 ) − 𝜖到𝑓 (𝒙𝒊 ) + 𝜖 之間時都不去計算回歸函數的損失,當作預測正 確。 因此 SVR 問題則表述為. ,. 2. (𝑓(𝒙 ) − 𝑦 ). |𝝎| + 𝐶. (3.42). 是𝜖-不敏感損失函數(𝜖-insensitive loss function). y. 0 if |𝑧| ≤ 𝜖 |𝑧| − 𝜖 otherwise.. (3.43). n. al. er. io. sit. Nat. (𝑧) =. ‧. 𝐶是懲罰係數,. min. 學. ‧ 國. 立1. 政 治 大. Ch. engchi. 𝑓(𝑥 ) + 𝜖. i n U. v. error. 𝑓(𝑥) 𝑓(𝑥) − 𝜖. 圖 6 支持向量回歸示意圖. 15. DOI:10.6814/NCCU201900250.

(24) 如圖三-5,圖中虛綫内的實心樣本點不計算 error,等於對於回歸模型沒有影 響,虛綫外的空心點的 error 則是垂直方向上到虛綫的距離。 鑒於間隔帶兩側鬆弛程度可以不同,因此引入兩個鬆弛變量𝜉 和𝜉 ,式 (3.42)變成. min ,. 1 |𝝎| + 𝐶 2. (𝜉 + 𝜉 ). 𝑠. 𝑡. 𝑓(𝒙𝒊 ) − 𝑦 ≤ 𝜖 + 𝜉 , 𝑦 − 𝑓(𝑥 ) ≤ 𝜖 + 𝜉 , 𝜉 , 𝜉 ≥ 0, 𝑖 = 1,2, … , 𝑚. 政 治 大. 立. ‧ 國. 學. 類似式(3.27),引入拉格朗日乘子. (3.44). 𝐿 𝝎, 𝑏, 𝜶, 𝜶, 𝝃, 𝝃, 𝝁, 𝝁 𝜉 +𝜉 −. 𝜇𝜉 −. 𝜇̂ 𝜉. sit. y. Nat. 𝛼 (𝑦 − 𝑓 (𝒙 ) − 𝜖 − 𝜉 ) .. er. 𝛼 (𝑓 (𝒙𝒊 ) − 𝑦 − 𝜖 − 𝜉 ) +. io. +. 1 |𝝎| + 𝐶 2. ‧. =. al. (3.45). n. v i n C h SVR 的解的形式是 參照之前的求解方法可以求解出 engchi U 𝑓 (𝒙) =. (𝛼 − 𝛼 )𝒙𝑻𝒊 𝒙 + 𝑏. (3.46). 結合核函數之後,SVR 的形式為. 𝑓 (𝑥) =. (𝛼 − 𝛼 )𝑘(𝒙, 𝒙𝒊 ) + 𝑏. (3.47). 16. DOI:10.6814/NCCU201900250.

(25) 第三節. 交叉驗證. 網格搜索是一種非常實用的調參方法,通過窮舉列舉出的參數的所有可能, 遍歷所有參數組合,來測試出效果最好的參數組合。 在進行模型評估時,使用了交叉驗證的方法,即對於一個資料集𝐷將其分爲𝑘 個大小相似的互斥子集,然後每次使用其中的𝑘 − 1個子集的聯集作爲訓練集,剩下 的一個作爲驗證集。最後再返回這𝑘 個測試結果的均值,來評估模型的性能。. 驗 證 集. 立. ‧. ‧ 國. 學. io. sit. y. Nat. n. al. er. 訓 練 集. 政 治 大. 結果 1. 結果 2. C h結果 3 engchi. i n U. v. 結果 8. 最終結果=mean(結果 1+結果 2+…+結果 8) 圖 7 交叉驗證示意圖. 17. DOI:10.6814/NCCU201900250.

(26) 第四章 模型建構與實證分析 第一節. 資料來源與資料預處理. 資料來源 本文資料從 TEJ 選取 2009 年-2018 年台股所有上市上櫃股票的單季度財務資 料以及季度收盤價、季度報酬率等資料。同時使用 TSE 對於台股的行業編號當作行 業劃分依據。. 治 政 大 本文選取了 TEJ 的財報資料庫中一共 170 個因子,在對模型進行訓練和使用 立 模型進行預測的過程中,爲了消除資料之間共綫性的問題,對於 170 個因子使用主 選取因子. ‧ 國. 學. 成分分析方法提取特徵,進行降維處理。. ‧. 資料預處理. 基於股市存在的新公司上市、公司退市等情況,本文在使用資料時,只會使. y. Nat. io. sit. 用預測的當前時間點前一個季度有發佈財報的公司財務資料。. n. al. er. 四.一.三.一 空值處理:. i n U. v. 對於財報資料中的空值,參考他人的做法,使用行業均值進行填補,若行業. Ch. engchi. 均值不存在,則使用全行業均值進行填補。對於報酬率為空值的資料則采取直接刪 除的處理方式。然後再對財務資料以及收益資料中的所有股票取交集,獲得當前季 度的選股備選池。. 四.一.三.二 數值範圍處理: 由於機器學習對於資料高度敏感,同時不同資料之間差異較大,容易導致機 器學習模型性能下降,因此對資料進行標準化處理。 首先,對財務資料采取縮尾處理對於資料位置大於 97.5%和小於 2.5%的部分 用 97.5%以及 2.5%位置的數值代替,防止離群值對於模型性能產生較大影響,之後 再使用 18. DOI:10.6814/NCCU201900250.

(27) X−X 𝑋. (4.11). 對資料進行標準化,其中 X 是資料的數值,X. 和X. 分別為資料的平均值. 以及標準差。 之後對於股票的收盤價進行同樣的標準化處理,而不進行縮尾處理。. 第二節 SVR 參數優化. 模型設置與訓練. 政 治 大. 首先確定所要使用的核函數,常用核函數如下. io. 2𝜎. 1 ,𝜎 > 0 2𝜎. 𝛽 > 0, 𝜃 < 0. = tanh(𝛽𝒙 𝒙 + 𝜃). n. al. 𝛾=. er. 𝑘 𝒙 ,𝒙. = exp −. 𝒙 −𝒙. y. 𝑘 𝒙 ,𝒙. 𝑑 ≥ 1,為多項式次數. = 𝒙 𝒙. sit. 𝑘 𝒙 ,𝒙. 參數. ‧. Sigmoid 核. 表達式 𝑘 𝒙 , 𝒙𝒋 = 𝒙 𝒙. Nat. 径向基函数(RBF) 核. 表 1 常用核函數表. 學. 名稱 綫性核 多項式核. ‧ 國. 立. Ch. i n U. v. 應用最廣泛的就是 RBF 核,RBF 核對於大樣本、小樣本,高維、低維資料都. engchi. 具有良好的適應性。與多項式核函數相比,多項式核函數所需要設置的參數多,而 且多項式階數較高的時候,運算難度大,速度較慢,而 RBF 核函數所需確定參數 少,運算速度較快。因此在本文中采用 RBF 核。 本文通過 python3.6 軟件的 sklearn 包來實現 SVR 模型的訓練與預測,針對径 向基函数核的主要參數𝐶 和𝛾 使用網格搜索法進行參數尋優,使用的𝐶 和𝛾的範圍分別 為{ 0.01,0.03,0.1,0.3,1,3,10}和{ 1e-4,3e-4,1e-3,3e-3,0.01,0.03,0.1,0.3,1} 使用五折交叉驗 證進行參數尋優。. 19. DOI:10.6814/NCCU201900250.

(28) 分別使用主成分分析方法對資料降維到 5、10、15、20、25 維之後,使用 2009 第一季度到 2015 第四季度的資料當作訓練集,利用網格搜索采用 5 折交叉驗證. 對𝐶 和γ進行參數尋優。之後再次利用 10 折交叉驗證對最佳參數進行檢驗。 尋參結果和 10 折交叉驗證結果如下(結果保留四位小數) 表 2 尋參結果表. 核函數 RBF RBF RBF RBF RBF. 最佳參數 C=10,gamma=0.3 C=10,gamma=0.03 C=10,gamma=0.03 C=10,gamma=0.01 C=10,gamma=0.01. 樣本内測試集𝑹𝟐 0.5874 0.4831 0.6009 0.4721 0.5222. 政 治 大. 立. 樣本外測試集𝑹𝟐 0.3305 0.3391 0.4017 0.2804 0.3003. 學. ‧ 國. 特徵個數 5 10 15 20 25. 表 3 10 折交叉驗證樣本内外測試集結果對比. 樣本内外測試集𝑹𝟐 差 0.2568 0.1440 0.1992 0.1918 0.2219. ‧. 特徵個數 5 10 15 20 25. n. er. io. sit. y. Nat. a. l SVR 模型訓練. Ch. engchi. i n U. v. 選取 2009 年第一季度到 2015 年第四季度的季報資料并且使用主成分分析分 別提取 5、10、15、20、25 個特徵作爲自變量,同時選取 2009 年第三季度到 2016 年第二季度的收盤價作爲因變量,共 28 個季度的資料當作訓練集對模型進行訓練。. 第三節. SVR 模型回測結果. 回測時,分別對資料特徵的不同個數,利用最佳參數進行回測,在某一特徵 個數下,對不同持倉股數量進行率對比,再在相同持倉股數量下,對不同特徵數量 的報酬率進行對比。 建倉步驟如下: 20. DOI:10.6814/NCCU201900250.

(29) 1. 使用當前季度最新財報資料(例如第二季度則使用第一季度財報資料)對. 下一季度(例如當前為第二季度,則預測的季度為第三季度)的股票收盤 價進行預測。 2. 預測出結果之後,使用預測結果與當前季度股票收盤價計算出預測報酬. 率。 3. 將預測報酬率進行排序,分別選取報酬率前五,前十,前十五的股票在本. 季度末,將原本持倉股票以當季度收盤價賣出之後,以本季度收盤價為成 本價進行下季度的等權重建倉。. 政 治 大 計算用於測試的 10 個季度的累計報酬率以及累計超額報酬率,以及年化 立 報酬率,與台股大盤指數的累計報酬率對比,觀察模型效果。. 4. 一直持倉到下個季度末,再將股票賣出,然後重複步驟 1 到步驟 3 。. 學. ‧ 國. 5.. 利用財報數據,跨季度進行股價預測. ‧. 季度末換倉,持倉到下一季度末. n. er. io. sit. y. Nat. al. 獲取當前季度最新財報. 上一季度. Ch. engchi. i n U. 當前季度. v. 下一季度. 圖 8 持倉流程示意圖. 由於每個季度末才進行換倉,換倉頻率較低,因此在換倉的時候忽略掉交易 手續費的影響。 接著按照上述方法進行回測,檢測模型的收益能力,計算了不同特徵數量情 況下模型的年化報酬率以及累計收益率結果如下:. 21. DOI:10.6814/NCCU201900250.

(30) 特徵個數 5: 表 4 五個特徵年化報酬. 股票數量. 年化報酬率. 大盤年化報酬率. 與大盤報酬率差. 5 10 15. 0.0235 0.0610 0.0997. 0.0995 0.0995 0.0995. -0.0760 -0.0385 0.0001. 5支 1.55. 立. 1.45. 大盤. 政 治 大. ‧ 國. 1.25 1.15. sit. 0.95. y. Nat. 1.05. ‧. io. 2016Q2 2016Q3 2016Q4 2017Q1 2017Q2 2017Q3 2017Q4 2018Q1 2018Q2 2018Q3 2018Q4. 季度. n. al. er. 纍計報酬率. 15支. 學. 1.35. 10支. Ch. engchi. i n U. v. 圖 9 五個特徵累計報酬率. 表 5 五個特徵每季度累計報酬率. 季度 2016Q2 2016Q3 2016Q4 2017Q1 2017Q2 2017Q3 2017Q4 2018Q1. 5支 1 1.030395 1.022555 1.069863 1.039735 1.117985 1.119479 1.126945. 10 支 1 1.083289 1.044225 1.106921 1.127822 1.135427 1.187825 1.187669. 15 支 1 1.096453 1.055451 1.108951 1.134644 1.168471 1.27241 1.29241. 大盤 1 1.089804 1.100336 1.166819 1.247772 1.283028 1.314912 1.348727. 22. DOI:10.6814/NCCU201900250.

(31) 2018Q2 2018Q3 2018Q4. 1.127424 1.15841 1.059912. 1.206278 1.258422 1.159768. 1.328339 1.40022 1.268084. 1.367866 1.43316 1.267752. 特徵個數 10: 表 6 十個特徵年化報酬. 股票數量. 年化報酬率. 大盤年化報酬率. 與大盤報酬率差. 5 10 15. 0.3020 0.1563 0.1083. 0.0995 0.0995 0.0995. 0.2024 0.0568 0.0087. 立. 政 治 大. 5支. 大盤. 1.9. sit. io. al. n. 1.3. er. 1.5. y. Nat. 1.7. ‧. ‧ 國. 2.1. 纍計報酬率. 15支. 學. 2.3. 10支. 1.1 0.9. Ch. engchi. i n U. v. 2016Q2 2016Q3 2016Q4 2017Q1 2017Q2 2017Q3 2017Q4 2018Q1 2018Q2 2018Q3 2018Q4. 季度. 圖 10 十個特徵累計報酬率. 表 7 十個特徵每季度累計報酬率. 季度 2016Q2 2016Q3 2016Q4. 5支 1 1.022783 1.09933. 10 支 1 1.055808 1.07765. 15 支 1 1.058323 1.057035. 大盤 1 1.089804 1.100336. 23. DOI:10.6814/NCCU201900250.

(32) 2017Q1 2017Q2 2017Q3 2017Q4 2018Q1 2018Q2 2018Q3 2018Q4. 1.319438 1.321182 1.531869 1.838256 1.905437 2.00154 2.137022 1.934255. 1.217415 1.239774 1.323796 1.48794 1.538707 1.511448 1.604553 1.437856. 1.161152 1.183841 1.23141 1.359494 1.392706 1.369735 1.436899 1.293085. 1.166819 1.247772 1.283028 1.314912 1.348727 1.367866 1.43316 1.267752. 特徵個數 15:. 政 治 大 年化報酬率 大盤年化報酬率 立 表 8 十五個特徵年化報酬. 0.0444 0.0145 -0.0172. 大盤. al. er. sit. 15支. y. ‧. 10支. n. 1.4. io. 1.5. 0.0995 0.0995 0.0995. 5支. Nat. 1.6. 0.1440 0.1140 0.0823. 與大盤報酬率差. 學. 5 10 15. ‧ 國. 股票數量. Ch. engchi. i n U. v. 1.3 1.2 1.1 1 0.9 2016Q2 2016Q3 2016Q4 2017Q1 2017Q2 2017Q3 2017Q4 2018Q1 2018Q2 2018Q3 2018Q4. 圖 11 十五個特徵累計報酬率. 24. DOI:10.6814/NCCU201900250.

(33) 表 9 十五個特徵每季度累計報酬率. 5支 1 1.034868 1.076018 1.16083 1.151727 1.225971 1.476221 1.551284 1.462439 1.542016 1.399754. 季度 2016Q2 2016Q3 2016Q4 2017Q1 2017Q2 2017Q3 2017Q4 2018Q1 2018Q2 2018Q3 2018Q4. 10 支 1 1.060631 1.124535 1.191308 1.193433 1.238935 1.38931 1.45027 1.395536 1.511058 1.309836. 15 支 1 1.064765 1.130298 1.182261 1.173864 1.215138 1.301746 1.329964 1.297155 1.379471 1.218602. 政 治 大. 立. n. al. 0.0995 0.0995 0.0995. Ch. engchi. sit. io. 0.0757 0.1013 0.1537. 與大盤報酬率差. y. 大盤年化報酬率. er. 年化報酬率. ‧. ‧ 國. 表 10 二十個特徵年化報酬. Nat. 5 10 15. 學. 特徵個數 20:. 股票數量. 大盤 1 1.089804 1.100336 1.166819 1.247772 1.283028 1.314912 1.348727 1.367866 1.43316 1.267752. i n U. -0.0239 0.0018 0.0542. v. 25. DOI:10.6814/NCCU201900250.

(34) 5支. 10支. 15支. 大盤. 1.7 1.6. 1.4 1.3 1.2 1.1 1 0.9. 立. 政 治 大. 2016Q2 2016Q3 2016Q4 2017Q1 2017Q2 2017Q3 2017Q4 2018Q1 2018Q2 2018Q3 2018Q4. 圖 12 二十個特徵個數累計報酬率. ‧. n. al. Ch. engchi. 15 支 1 1.054122 1.053987 1.138811 1.202905 1.333128 1.453657 1.461531 1.482241 1.587808 1.429776. sit. 10 支 1 1.060371 1.049198 1.114825 1.10754 1.158381 1.224847 1.253826 1.260086 1.394271 1.272816. er. io. 5支 1 1.058005 1.07397 1.161476 1.170919 1.221171 1.26605 1.285767 1.195559 1.277664 1.200018. y. 表 11 二十個特徵每季度累計報酬率. Nat. 季度 2016Q2 2016Q3 2016Q4 2017Q1 2017Q2 2017Q3 2017Q4 2018Q1 2018Q2 2018Q3 2018Q4. 季度. 學. ‧ 國. 纍計報酬率. 1.5. i n U. v. 大盤 1 1.089804 1.100336 1.166819 1.247772 1.283028 1.314912 1.348727 1.367866 1.43316 1.267752. 特徵個數 25:. 26. DOI:10.6814/NCCU201900250.

(35) 表 12 二十五個特徵年化報酬. 股票數量. 年化報酬率. 大盤年化報酬率. 與大盤報酬率差. 5 10 15. 0.0494 0.1125 0.1001. 0.0995 0.0995 0.0995. -0.0502 0.0129 0.0006. 5支. 10支. 15支. 大盤. 1.5 1.4. 立. 1. Nat. 0.9. y. 1.1. ‧. ‧ 國. 1.2. 學. io. sit. 2016Q2 2016Q3 2016Q4 2017Q1 2017Q2 2017Q3 2017Q4 2018Q1 2018Q2 2018Q3 2018Q4. 季度. n. al. er. 纍計報酬率. 1.3. 政 治 大. Ch. i n U. v. 圖 13 二十五個特徵個數累計報酬率. engchi. 表 13 二十五個特徵每季度累計報酬率. 季度 2016Q2 2016Q3 2016Q4 2017Q1 2017Q2 2017Q3 2017Q4 2018Q1 2018Q2 2018Q3. 5支 1 1.01224 1.054798 1.119794 1.059867 1.145698 1.16748 1.191798 1.144208 1.222787. 10 支 1 1.040502 1.066159 1.163959 1.205756 1.299488 1.355665 1.387843 1.361831 1.441043. 15 支 1 1.043951 1.07341 1.15925 1.175847 1.215569 1.322955 1.342701 1.322259 1.409162. 大盤 1 1.089804 1.100336 1.166819 1.247772 1.283028 1.314912 1.348727 1.367866 1.43316. 27. DOI:10.6814/NCCU201900250.

(36) 2018Q4. 1.128069. 1.305287. 第四節. 1.269456. 1.267752. 小結. 總體上來看,實證回測一共檢測了 15 種情況,其中大部分模型的回測報酬率 超過大盤,説明支持向量回歸模型對於台股市場具有一定的預測能力,其中預測效 果最差的是在特徵個數為 5 個的時候,三種情況中一共有兩種情況報酬率低於大 盤,而另一種情況也基本是與大盤持平。最好的情況是當特徵個數是 10 個的時候, 此時最高的年化報酬率達到了 30%,大大超過了大盤。而且其餘兩種情況的報酬率也. 政 治 大. 超過了大盤。當特徵個數增加或者減少時,一定程度上可以增加模型的擬合程度,. 立. 但是會增加樣本內和樣本外的𝑅 的差,導致模型的一般化能力減弱。同時在特徵個. ‧ 國. 5%左右,與特徵個數為 10 的時候的報酬率有較大的差異。. 學. 數繼續增加時,報酬率又出現了下降,最好的情況的年化報酬率僅超過了大盤大概. ‧. 在一共 5 種特徵數量的情況下,一共有兩種情況的報酬率表現最好的是 5 支. sit. y. Nat. 股票分別是 10 個特徵和 15 個特徵,還有兩種情況下報酬率表現最好的是 15 支股票. io. al. v i n Ch 結合利用網格搜索尋參時的交叉驗證,發現模型效果最好的是交叉驗證時樣 engchi U n. 徵。. er. 分別是 5 個特徵和 20 個特徵,而還有一種是 10 支股票報酬率表現最好,是 25 個特. 本内外𝑅 差距最小的。. 28. DOI:10.6814/NCCU201900250.

(37) 第五章 總結與改進方向 第一節. 研究總結. 本文以支持向量回歸為基本方法,使用網格搜索對支持向量回歸的重要參數𝐶 和𝛾進行尋參優化。同時利用主成分分析法對使用的自變量資料進行特徵提取,對其 進行降維,消除資料中的共綫性問題的同時提高模型的運算速度。之後將台股在 2009 第一季度到 2018 第四季度中的所有上市上櫃股票作爲股票池,尋找其中具有投 資價值的股票來構建投資組合。期望該投資組合能夠帶來穩定的回報,賺取一定的. 政 治 大. 超額報酬。. 立. 本文選取了 2009 年第一季度到 2018 年第四季度一共 40 個季度的資料作爲資. ‧ 國. 學. 料樣本,其中使用 2009 年第一季度到 2015 年第四季度的資料作爲訓練集,對應的 因變量則是 2009 年第三季度到 2016 年第二季度的個股收盤價。然後將 2016 年第一. ‧. 季度到 2018 年第二季度共 10 個季度的資料作爲樣本外回測,對應的投資組合持倉 時間則是 2016 年第三季度到 2018 年第四季度。實證的主要過程分爲資料預處理、. y. Nat. io. sit. 資料降維、模型參數尋優、模型建構與結果分析等五個部分。. n. al. er. 通過對比 5、10、15、20、25 共 5 種特徵個數下,持倉股票數量為 5、10、15. i n U. v. 支的模型收益狀況,來討論支持向量回歸模型對於台股市場的適應情況。其中在不. Ch. engchi. 考慮交易手續費的情況下,回測表現最好的是將資料降維到 10 個特徵的情況,10 個 季度的最高累計報酬率達到了 93.4% ,年化報酬率則達到了 30.2%。其餘持股數量 也具有比較良好的超額報酬率表現。而表現最差的則是將資料降維到只有 5 個特徵 的情況,一共三種選股數量下,有兩種未有超越大盤的表現,而剩下一種則也基本 是與大盤持平。如果考慮交易手續費的問題,則在 5 個特徵的情況下,全部情況都 無法獲得超越大盤的超額報酬。 總體上來看,支持向量回歸模型對於預測股價,賺取超額報酬有一定的作 用,在对数据进行特征提取时,特征数量过多或者过少都会影响到模型的整体预测. 29. DOI:10.6814/NCCU201900250.

(38) 能力,影响到模型的整体预测能力的主要是模型整体的一般化能力,在交叉验证中 训练集和验证集的模型的𝑅 的差。. 第二節. 改進方向. 本文使用了網格搜索搭配主成分分析法以及支持向量回歸,使用財報資料對 股價進行了預測,進而構建出投資組合。對於本文,認爲有幾個改進方向 1. 由於使用的是固定訓練模型,使用的訓練資料在之後無法反應最新的狀 況,可以嘗試使用滾動訓練模型,使得訓練集内的資料可以包含較新的財. 政 治 大 采用了固定最佳參數,沒有對模型進行動態尋參,使得參數較爲固定。同 立 報資料,從而反應出台股市場的公司的更新的狀況。. 2.. ‧ 國. 學. 時由於使用的是網格搜索法,因此搜索範圍僅限所列舉的實數範圍内,後 續改進可以利用模擬退火算法(Simulate Anneal Arithmetic,SAA)、禁忌. ‧. 搜索(Tabu Search,TS)等啓發式算法,對參數進行動態尋優。 3. 在使用資料方面,使用了財報資料,而影響大盤走向的不僅僅包括公司整. Nat. sit. y. 體的運營狀況,還包括其他例如總體經濟資料、市場新聞、甚至政客言論. er. al. n. v i n Ch 預測時使用的預測目標可以使用報酬率,排除股票價格差距可能過大造成 engchi U 的影響。 性。. 4.. io. 等等,如果將模型中包含這些資料,可能可以使得模型具有更好的擬合. 5. 換倉時間可以進行調整,不按照自然季度的最後一天進行換倉,使用財報 公佈的最後一天來進行換倉,及時利用新發佈的財報資料。. 30. DOI:10.6814/NCCU201900250.

(39) 參考文獻 全林,姜秀珍,趙俊和,汪東,(2009) 。基於 SVM 分類算法的選股研究。上海交通 大學學報,43(9):1412-1416 。 李航,(2012) 。統計學習方法。北京:清華大學出版社。 周漸,(2017)。基於 SVM 算法的多因子選股模型實證研究。未出版之碩士論文,浙 江工商大學,金融,杭州。 高雯,(2018)。基於支持向量機參數優化算法的股票智能投顧策略研究。未出版之 碩士論文,上海師範大學,金融,上海。 周志華,(2016) 。機器學習。北京:清華大學出版社。 張玉川,張作泉,黃珍 ,(2008)。支持向量機在選擇優質股票中的應用。統計與決 策,(4):163-165。 趙佳藝,(2019)。量化投資發展及我國現狀分析。現代商貿工業,2019(8):116117 。 謝東東,(2018)。量化投資的特點、策略和發展探討。時代金融,709:245、252 。 蘇治,傅曉媛,(2013)。核主成分遺傳算法與 SVR 選股模型改進。統計研究,30 (5):54-62 。 魏妹金(2015) 。支持向量机多因子选股模型。未出版之碩士論文,華僑大學,統 計學系,泉州。 Alex J.Smola, Bernhard Schölkopf, 2004. A tutorial on Support Vector Regression, Statistics and Computing, 14(3):199-222. A.Fan, M.Palaniswami, 2001. Stock Selection using Support Vector Machines. NeuralNetworks, 2001. Proceedings. IJCNN '01. International Joint Conference on. IEEE,2001:1793 - 1798. Chien-Feng Huang, 2012. A hybrid Stock Selection Model using Genetic Algorithms and Support Vector Regression. Applied Soft Computing,12(2):807-818. Chi-Yuan Yeh, Chi-Wei Huang, Shie-Jue Lee, 2011. A Multiple-Kernel Support Vector Regression approach for Stock Market price forecasting. Expert Systems with Applications,38(3):2177-2186. Dennis Olson and Charles Mossman, 2003. Neural Netword forecasts of Canadian Stock Returns using accounting ratios. International Journal of Forecasting, 19(3):453-465 F.S.Wong, P.Z.Wang, T.H.Goh, B.K.Quek, 1992. Fuzzy Neural Systems for Stock Selection. Financial Analysts Journal, 48(1):47-52. Huanhuan Yu, Rongda Chen, Guoping Zhang,2014. A SVM Stock Selection Model whithin PCA, Procedia Computer Science, 31:406-412. R.J.Kuo, C.H.Chen, Y.C.Hwang, 2001. An Intelligent Stock Trading Decision Support System through Integration of Genetic Algorithm Based Fuzzy Neural Network and Artificial Neural Network. Fuzzy Sets and Systems, 118(1):21-45 Tong-Seng Quah and Bobby Srinivasan, 1999. Improving returns on Stock Investment through Neural Network Selection. Expert Systems with Applications, 17(4):295-301. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 31. DOI:10.6814/NCCU201900250.

(40) 附錄. 尋參結果: 5 個特徵:. -0.03906383 -0.02607135 -0.00117312 0.03287805 0.07225112 0.07501713 0.06090539 0.05131695 0.04141516 -0.02590578 -0.00408205 0.02841252 0.06909328 0.10404969 0.10648987 0.09755732 0.08348211 0.06862452 -0.00195615 0.02550343 0.06079288 0.10350994 0.12678416 0.14046338 0.14757733 0.12558232 0.10525932 0.02445648 0.05023292 0.08738753 0.1265481. 政 治 大. io. n. Ch. engchi. y. Nat. al. sit. 立. -0.03847017 -0.02445047 0.00293097 0.04050648 0.08528056 0.09264771 0.08021533 0.07063742 0.06239969 -0.02427880 -0.00019883 0.03598591 0.08045245 0.12300108 0.13003556 0.12283604 0.11021617 0.09828045 0.00220720 0.03295626 0.07174181 0.12008204 0.15063047 0.16986821 0.18202925 0.16549444 0.15212583 0.03190608 0.06066469 0.10161901 0.14665864 32. rank test score. er. 0.0001 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1 0.0001 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1 0.0001 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1 0.0001 0.0003 0.001 0.003. ‧ 國. 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.03 0.03 0.03 0.03 0.03 0.03 0.03 0.03 0.03 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.3 0.3 0.3 0.3. mean_test_score mean_train_score. ‧. gamma. 學. C. i n U. v. 63 62 58 54 43 42 48 50 53 61 60 55 45 35 33 37 40 46 59 56 49 36 28 26 22 30 34 57 51 39 29. DOI:10.6814/NCCU201900250.

(41) 0.14495264 0.17245311 0.18549539 0.17020483 0.14451328 0.04869602 0.0705235 0.11468224 0.14343661 0.16568747 0.20751133 0.2180539 0.21339058 0.188247 0.06253516 0.09019578 0.13501217 0.15619392 0.18490855 0.22730263 0.23794874 0.24285831 0.22083135 0.07635344 0.11512076 0.14977995 0.16792556 0.20757763 0.23997766 0.25404935 0.25959288 0.23315642. 政 治 大. n. Ch. engchi. y. sit er. io. al. ‧. ‧ 國. 立. 0.17224172 0.20566863 0.23150347 0.23039529 0.21847879 0.05938188 0.08378063 0.13254675 0.16621037 0.19377038 0.24460411 0.28880996 0.31964541 0.32213869 0.07555729 0.10518944 0.15476853 0.18108047 0.21446068 0.27348249 0.35008961 0.42882441 0.45984440 0.09062680 0.13268535 0.17218403 0.19527014 0.24000554 0.30695844 0.44057448 0.60117079 0.66969224. 學. 0.01 0.03 0.1 0.3 1 0.0001 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1 0.0001 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1 0.0001 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1. Nat. 0.3 0.3 0.3 0.3 0.3 1 1 1 1 1 1 1 1 1 3 3 3 3 3 3 3 3 3 10 10 10 10 10 10 10 10 10. i n U. v. 23 16 14 17 24 52 44 32 25 19 12 9 10 13 47 38 27 20 15 7 5 3 8 41 31 21 18 11 4 2 1 6. 10 個特徵: C 0.01 0.01 0.01. gamma 0.0001 0.0003 0.001. mean_test_score -0.03878249 -0.02538096 0.00149359. mean_train_score -0.03787232 -0.02294464 0.00710966. rank test score 63 62 58. 33. DOI:10.6814/NCCU201900250.

(42) 0.03451452 0.06420831 0.06194392 0.05646686 0.05046323 0.02813462 -0.02511502 -0.00155877 0.03338640 0.07126885 0.10056974 0.09467769 0.08601011 0.07885297 0.05044885 0.00063401 0.02981706 0.06552595 0.10489581 0.12848345 0.13046231 0.12150470 0.11207235 0.07947797 0.02805554 0.05478842 0.08989497 0.12901324 0.15004699 0.16505254 0.15772897 0.14172299 0.10959388 0.05278694 0.07506860 0.11549980 0.14915843 0.17553453 0.20845580 0.19342686. n. Ch. y. sit. er. io. al. 政 治 大. ‧. ‧ 國. 立. 0.04494426 0.08090206 0.08106267 0.07687415 0.07240084 0.05177938 -0.02264818 0.00388256 0.04366299 0.08715343 0.12347305 0.12071325 0.11384947 0.11102466 0.08867856 0.00655252 0.04013003 0.0812516 0.1266386 0.15892054 0.16644871 0.16471457 0.1647975 0.14739028 0.03841025 0.06961427 0.10905222 0.15533175 0.18848027 0.21635816 0.22761713 0.23049914 0.22652051 0.06806484 0.09345823 0.13786251 0.18032835 0.22613321 0.2929411 0.32501142. 學. 0.003 0.01 0.03 0.1 0.3 1 0.0001 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1 0.0001 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1 0.0001 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1 0.0001 0.0003 0.001 0.003 0.01 0.03 0.1. Nat. 0.01 0.01 0.01 0.01 0.01 0.01 0.03 0.03 0.03 0.03 0.03 0.03 0.03 0.03 0.03 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 1 1 1 1 1 1 1. engchi. i n U. v. 53 46 47 48 51 56 61 60 54 43 34 35 38 41 52 59 55 45 33 27 25 28 31 40 57 49 37 26 20 14 18 23 32 50 42 30 21 12 6 9. 34. DOI:10.6814/NCCU201900250.

(43) ‧ 國. 立. 0.33801041 0.35516485 0.08576324 0.11177363 0.16353642 0.2014209 0.26588494 0.37908294 0.46087436 0.48002211 0.5154632 0.09940717 0.13780616 0.18537478 0.22524835 0.31969546 0.5023116 0.66543057 0.69898021 0.74413621. 政 治 大. sit. al. n. mean_test_score -0.03882859 -0.02548107 0.00126387 0.03413197 0.06376354 0.06173476 0.0563714 0.05045424 0.02803483 -0.02520301 -0.0017831 0.03306939 0.07062413 0.10007425 0.09451023. Ch. er. io. gamma 0.0001 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1 0.0001 0.0003 0.001 0.003 0.01 0.03. 13 22 44 36 24 15 7 3 5 10 17 39 29 19 11 4 1 2 8 16. y. Nat. 15 個特徵: C 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.03 0.03 0.03 0.03 0.03 0.03. 0.17280408 0.14222127 0.06735356 0.09165950 0.13729111 0.16376504 0.20241627 0.24525468 0.22242594 0.19233619 0.15892235 0.07968261 0.11577805 0.15503564 0.18026932 0.23398248 0.26900919 0.24744934 0.19812513 0.16080968. ‧. 0.3 1 0.0001 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1 0.0001 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1. 學. 1 1 3 3 3 3 3 3 3 3 3 10 10 10 10 10 10 10 10 10. mean_train_score -0.0379005 -0.02295802 0.00710442 0.04492631 0.08077447 0.08098762 0.07679207 0.07230088 0.0516849 -0.0226602 0.00388793 0.04375886 0.0871373 0.12348501 0.12070951. engchi U. v ni. rank test score 63 62 58 53 46 47 48 52 56 61 60 54 43 34 35. 35. DOI:10.6814/NCCU201900250.

(44) 0.0861124 0.07898613 0.05060545 0.0004183 0.0294706 0.06489421 0.1044024 0.12840721 0.13034737 0.1217009 0.11228937 0.07984504 0.02760846 0.05419961 0.08909831 0.12861952 0.14957023 0.16480736 0.15757525 0.14167837 0.10943317 0.0520582 0.07425686 0.1148045 0.14845153 0.17480868 0.20833615 0.19306596 0.17265144 0.14139156 0.06652063 0.0908486 0.13691642 0.16270047 0.20206773 0.24558251 0.22174668 0.19202512 0.1582429 0.07912758. n. Ch. y. sit. er. io. al. 政 治 大. ‧. ‧ 國. 立. 0.11385674 0.11091901 0.0884947 0.00655876 0.04015751 0.08121398 0.12664301 0.15914197 0.16644393 0.16463656 0.16486826 0.14743742 0.03838631 0.069523 0.10888632 0.15537615 0.1884388 0.21632738 0.22759385 0.23056192 0.22646612 0.06789228 0.0933501 0.13790437 0.18000308 0.22574206 0.29262929 0.32478891 0.33786832 0.35518539 0.08571963 0.11162636 0.1635869 0.20115516 0.26581526 0.37822656 0.46078853 0.48001833 0.51548437 0.09935852. 學. 0.1 0.3 1 0.0001 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1 0.0001 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1 0.0001 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1 0.0001 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1 0.0001. Nat. 0.03 0.03 0.03 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 1 1 1 1 1 1 1 1 1 3 3 3 3 3 3 3 3 3 10. engchi. i n U. v. 38 41 51 59 55 45 33 27 25 28 31 39 57 49 37 26 20 14 18 22 32 50 42 30 21 12 6 9 13 23 44 36 24 15 7 3 5 10 17 40. 36. DOI:10.6814/NCCU201900250.

(45) 10 10 10 10 10 10 10 10. 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1. 0.1148801 0.15436315 0.18013544 0.23460116 0.27048269 0.24702752 0.19805113 0.16059446. 0.13758242 0.18538038 0.2253418 0.31897997 0.50108084 0.66544436 0.69886981 0.74409718. 29 19 11 4 1 2 8 16. 20 個特徵:. n. Ch. engchi. i n U. rank test score 63 62 59 52 46 48 49 54 57 61 60 50 40 29 33 39 47 56 58 53 42 27 22 23 28 35 51. sit. y. ‧. io. al. -0.02294973 0.00679575 0.04260772 0.07065307 0.068927 0.06833491 0.05360859 0.02744681 -0.02250341 0.00460752 0.045421 0.09065712 0.1255962 0.1148893 0.10743198 0.09072518 0.05839595 0.00725931 0.04240697 0.08441976 0.13529565 0.1732057 0.16706484 0.16107397 0.14896468 0.11445408. er. 立. ‧ 國. 治 政 mean_train_score -0.03789041 大. mean_test_score -0.0388694 -0.02563693 0.0006037 0.03096898 0.0526106 0.04780046 0.04475856 0.02920086 0.00162723 -0.02521364 -0.00133585 0.03385182 0.07197507 0.09951109 0.08431704 0.07352886 0.05223142 0.01429151 0.00091475 0.03084141 0.06647079 0.10962484 0.13783594 0.12345908 0.10808439 0.08180188 0.03166529. 學. gamma 0.0001 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1 0.0001 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1 0.0001 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1. Nat. C 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.03 0.03 0.03 0.03 0.03 0.03 0.03 0.03 0.03 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1. v. 37. DOI:10.6814/NCCU201900250.

(46) 0.02873288 0.05584653 0.0915192 0.13887646 0.16744254 0.15758003 0.14074335 0.10965564 0.05420461 0.05381769 0.07555868 0.11819204 0.16502798 0.20123702 0.19497595 0.16880524 0.13812928 0.07960585 0.06815628 0.09118588 0.14203955 0.18561249 0.23248977 0.22535103 0.18302302 0.14822848 0.08867115 0.07931128 0.11492041 0.16319851 0.20684141 0.26168177 0.25529459 0.18193487 0.13988724 0.08399535. n. Ch. engchi. y. sit er. io. al. 政 治 大. ‧. ‧ 國. 立. 0.04038119 0.07247991 0.11395423 0.171617 0.21621217 0.2260466 0.23041207 0.22873987 0.20554298 0.07047263 0.09643528 0.14565818 0.20758547 0.27963701 0.3206903 0.33963824 0.36281017 0.36632223 0.08834755 0.11419465 0.17568983 0.24340851 0.36107302 0.45294101 0.48618057 0.5249986 0.56315383 0.10108439 0.14173512 0.20527628 0.2941525 0.47965457 0.6532239 0.71072687 0.75986132 0.80602668. 學. 0.0001 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1 0.0001 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1 0.0001 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1 0.0001 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1. Nat. 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 1 1 1 1 1 1 1 1 1 3 3 3 3 3 3 3 3 3 10 10 10 10 10 10 10 10 10. i n U. v. 55 43 30 20 12 15 18 26 44 45 38 24 13 6 7 11 21 36 41 31 17 8 3 4 9 16 32 37 25 14 5 1 2 10 19 34. 38. DOI:10.6814/NCCU201900250.

(47) 25 個特徵: mean_test_score -0.03886156 -0.02566078 -0.00007750 0.02822106 0.04298380 0.03994843 0.03684454 0.01871937 -0.00696381 -0.02519828 -0.00128882 0.03331693 0.07055135 0.09074070 0.07427078 0.06411690 0.03951016 0.00288549 0.00095308 0.03123654 0.06671863 0.10954361 0.13317212 0.10995820 0.09602845 0.06540283 0.01662252 0.02898349 0.05620474 0.09186523 0.14029044 0.16464171 0.14386934 0.12778338 0.09303581 0.03682843 0.05422276. Ch. y. sit. er. engchi. i n U. v. rank test score 63 62 58 53 45 46 48 54 60 61 59 50 35 31 34 40 47 56 57 51 38 26 18 25 27 39 55 52 43 29 17 13 16 20 28 49 44. ‧. io. al. 學. ‧ 國. 立. mean_train_score -0.03789541 -0.02302312 0.00614635 0.03975479 0.06032977 0.06014523 0.05932234 0.04132731 0.01606428 -0.02254877 0.00465999 0.04512249 0.08953013 0.11672455 0.10428663 0.09761719 0.07673485 0.04459196 0.00727938 0.0428209 0.08509935 0.1360061 0.16991525 0.15538645 0.15094724 0.13360663 0.09811574 0.04053509 0.07290651 0.11476767 0.1749194 0.21861714 0.21780936 0.22306737 0.21809705 0.19045896 0.07102629. 政 治 大. n. gamma 0.0001 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1 0.0001 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1 0.0001 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1 0.0001 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1 0.0001. Nat. C 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.01 0.03 0.03 0.03 0.03 0.03 0.03 0.03 0.03 0.03 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.1 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 0.3 1. 39. DOI:10.6814/NCCU201900250.

(48) 0.07565080 0.11909490 0.16779997 0.19912978 0.17897974 0.15600375 0.12089707 0.06111096 0.06789039 0.09125614 0.14414399 0.19129188 0.22876281 0.20209407 0.16920128 0.12968724 0.06800583 0.07890577 0.11552209 0.16653837 0.21468543 0.24889075 0.21441596 0.16615012 0.11976679 0.05991969. n. Ch. y. sit. er. io. al. 政 治 大. ‧. ‧ 國. 立. 0.09671995 0.14773254 0.21575667 0.29193334 0.31826038 0.34084255 0.36145488 0.36021077 0.08824345 0.11491751 0.18048304 0.26028016 0.39026841 0.45674196 0.49644447 0.53956814 0.57110403 0.10116155 0.14354179 0.21464538 0.32562124 0.53207 0.67135001 0.72841131 0.77941501 0.82425067. 學. 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1 0.0001 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1 0.0001 0.0003 0.001 0.003 0.01 0.03 0.1 0.3 1. Nat. 1 1 1 1 1 1 1 1 3 3 3 3 3 3 3 3 3 10 10 10 10 10 10 10 10 10. engchi. i n U. v. 33 23 10 6 8 14 21 41 37 30 15 7 2 5 9 19 36 32 24 11 3 1 4 12 22 42. 40. DOI:10.6814/NCCU201900250.

(49)

參考文獻

相關文件

Deep learning usually refers to neural network based model.. Shallow – Speech Recognition. ◉

for training

Random Forest: Theory and Practice Neural Network Motivation.. Neural Network Hypothesis Neural Network Training Deep

Moreover, this chapter also presents the basic of the Taguchi method, artificial neural network, genetic algorithm, particle swarm optimization, soft computing and

This study proposed the Minimum Risk Neural Network (MRNN), which is based on back-propagation network (BPN) and combined with the concept of maximization of classification margin

This study proposed the ellipse-space probabilistic neural network (EPNN), which includes three kinds of network parameters that can be adjusted through training: the variable

Sharma (1999), “An Intergrated Machine Vision Based System for Solving the Non-Covex Cutting Stock Problem Using Genetic Algorithms,” Journal of Manufacturing Systems, Vol..

Kuo, R.J., Chen, C.H., Hwang, Y.C., 2001, “An intelligent stock trading decision support system through integration of genetic algorithm based fuzzy neural network and