• 沒有找到結果。

深度學習應用於股價走勢之研究:以大陸市場為例 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "深度學習應用於股價走勢之研究:以大陸市場為例 - 政大學術集成"

Copied!
63
0
0

加載中.... (立即查看全文)

全文

(1)國立政治大學風險管理與保險學系研究所 碩士學位論文. 深度學習應用於股價走勢之研究:. 政 治 大 立以大陸市場為例. ‧ 國. 學. An Empirical Study of Deep Learning. ‧. to the Trend of Stock Price in China Market. n. er. io. sit. y. Nat. al. Ch. i n U. v. e n g c h i 博士 指導教授:黃泓智 研究生:張力元 撰. 中華民國一零七年七月. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(2) 摘要 股價的未來走勢一直是一個未知且令人充滿興趣的研究領域,過去已有許多 學者提出各種理論以論述其觀點,如今我們身處於人工智慧的時代,各種機器學 習的應用已顛覆我們對生活方式的認知。本文建構一套神經網路的簡單序列模 型,以幾種常見的技術指標為主要特徵,並選定未來二十日的股價漲跌作為預測 目標,同時考慮交易成本,使用定錨式移動視窗的方式,將兩者之間的關係透過 神經網路進行深度學習,藉以預測未來一年股價走勢的分類情況,從而挑選出具 有上漲潛力的股票,以其分類結果作為判斷買賣時機的依據,將模型預測上漲機. 政 治 大. 率較高的前幾檔股票納入投資組合,以實現自動化的資產配置,同時也考慮不同. 立. 情境下的配置方式。實證結果顯示本文的主要策略相比大盤績效,其年化報酬率. ‧ 國. 學. 在大多數的年度皆有不錯表現,在七年回測期間的年化報酬率達 13.67%,惟其. ‧. 標準差也稍高。. sit. y. Nat. n. al. er. io. 關鍵字:大陸股市、深度學習、股價走勢、技術指標. Ch. engchi. i n U. v. I. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(3) Abstract The future trend of stock prices has always been an unknown and interesting research field. Many scholars have proposed various theories to discuss their views. Now we are in the era of artificial intelligence, and the various application of machine learning has subverted our perception of lifestyle. This paper constructs a simple sequential model of neural network, with several common technical indicators as the main features, and selects the rise or fall of the stock prices in the next twenty days as the predicting target, while considering the transaction cost and using the anchored. 政 治 大. moving window method. The relationship between this two is deep learning through. 立. the neural network to predict the classification of stock price movements in the coming. ‧ 國. 學. year, so as to select stocks with rising potential, and use the classification results as a basis for judging the timing of trading. The model predicting the first few stocks with. ‧. higher probability are included in the portfolio to achieve automated asset allocation,. y. Nat. sit. while considering the configuration in different scenarios. The empirical results show. n. al. er. io. that the main strategy of this paper has a good performance in most years compared to. i n U. v. the market performance. The annualized rate of return during the seven-year back-. Ch. engchi. testing period is 13.67%, but the standard deviation is also slightly higher.. Keywords: China Stock Market, Deep Learning, Stock Price Trend, Technical Indicators. II. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(4) 目錄 第一章、緒論................................................................................................................ 1 第一節、研究動機與背景.................................................................................... 1 第二節、研究目的................................................................................................ 4 第三節、研究流程................................................................................................ 5 第二章、文獻回顧........................................................................................................ 6 第三章、研究方法...................................................................................................... 11 第一節、前言...................................................................................................... 11. 政 治 大. 第二節、深度學習概述...................................................................................... 12. 立. 第三節、模型變數.............................................................................................. 19. ‧ 國. 學. 第四節、投資策略.............................................................................................. 23 第五節、績效指標.............................................................................................. 25. ‧. 第四章、實證結果分析.............................................................................................. 27. y. Nat. sit. 第一節、實證分析樣本來源.............................................................................. 27. n. al. er. io. 第三節、情境分析.............................................................................................. 35. i n U. v. 第五章、結論與建議.................................................................................................. 45. Ch. engchi. 第一節、結論...................................................................................................... 45 第二節、未來研究方向建議.............................................................................. 46 參考文獻...................................................................................................................... 47 附錄.............................................................................................................................. 49. III. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(5) 表目錄 表 1、神經網路參數設定.......................................................................................... 18 表 2、技術指標變數.................................................................................................. 21 表 3、績效指標.......................................................................................................... 25 表 4、各年度預測誤差值與準確率.......................................................................... 29 表 5、預測分類結果(2011 年) .................................................................................. 30 表 6、技術指標_20 天出場_門檻 0.6_權重 0.2....................................................... 33 表 7、技術指標_20 天出場_門檻 0.7_權重 0.2....................................................... 49. 政 治 大. 表 8、技術指標_20 天出場_門檻 0.6_權重 0.1....................................................... 50. 立. 表 9、技術指標_20 天出場_門檻 0.6_權重 0.05..................................................... 51. ‧ 國. 學. 表 10、技術指標_10 天出場_門檻 0.6_權重 0.2..................................................... 52 表 11、技術指標_5 天出場_門檻 0.6_權重 0.2 ....................................................... 53. ‧. 表 12、股價_20 天出場_門檻 0.6_權重 0.2............................................................. 54. y. Nat. n. al. er. io. sit. 表 13、技術指標_技術分析出場_門檻 0.6_權重 0.2.............................................. 55. Ch. engchi. i n U. v. IV. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(6) 圖目錄 圖 1、各國交易所市值與佔比(2018 年 5 月) ............................................................ 1 圖 2、國內上市櫃公司歷年赴陸投資情形................................................................ 2 圖 3、機器學習應用於各領域產值佔比.................................................................... 3 圖 4、定錨式移動視窗.............................................................................................. 11 圖 5、深度學習發展史.............................................................................................. 13 圖 6、神經網路架構.................................................................................................. 14 圖 7、神經網路運算過程.......................................................................................... 15. 政 治 大. 圖 8、激活函數.......................................................................................................... 16. 立. 圖 9、神經網路配置方式.......................................................................................... 19. ‧ 國. 學. 圖 10、技術分析出場策略........................................................................................ 24 圖 11、神經網路可視化訓練過程(2000~2010 年) .................................................. 29. ‧. 圖 12、機率值門檻與勝率關係(技術指標_20 日) .................................................. 31. y. Nat. sit. 圖 13、各年度預測機率分佈.................................................................................... 31. n. al. er. io. 圖 14、大盤指數每日收盤價走勢............................................................................ 32. i n U. v. 圖 15、主策略與大盤之年化報酬率比較................................................................ 34. Ch. engchi. 圖 16、主策略與大盤之夏普比率比較.................................................................... 34 圖 17、主策略門檻之基金走勢比較........................................................................ 35 圖 18、主策略門檻之年化報酬率比較.................................................................... 36 圖 19、主策略門檻之夏普比率比較........................................................................ 36 圖 20、主策略權重之基金走勢比較........................................................................ 37 圖 21、主策略權重之年化報酬率比較.................................................................... 38 圖 22、主策略權重之夏普比率比較........................................................................ 38 圖 23、主策略天數之基金走勢比較........................................................................ 39 V. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(7) 圖 24、主策略天數之年化報酬率比較.................................................................... 40 圖 25、主策略天數之夏普比率比較........................................................................ 40 圖 26、主策略變數之基金走勢比較........................................................................ 41 圖 27、主策略變數之年化報酬率比較.................................................................... 42 圖 28、主策略變數之夏普比率比較........................................................................ 42 圖 29、主策略出場之基金走勢比較........................................................................ 43 圖 30、主策略出場之年化報酬率比較.................................................................... 44 圖 31、主策略出場之夏普比率比較........................................................................ 44. 政 治 大 圖 33、機率值門檻與勝率關係(技術指標_5 日) .................................................... 56 立 圖 32、機率值門檻與勝率關係(技術指標_10 日) .................................................. 56. 圖 34、機率值門檻與勝率關係(股價_20 日) .......................................................... 56. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. VI. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(8) 第一章、緒論 第一節、研究動機與背景 2017 年 7 月,鴻海董事長郭台銘於美國威斯康辛州投資一百億美元時曾說: 「市場就是我的祖國,但也別忘了我在哪裡繳稅。」有市場的地方總能帶來錢潮, 自然吸引一大群投資人爭相前往,而全世界最大的市場就屬中美兩國。根據自由 的全球總經百科(Stock-ai)統計,2018 年 5 月各國交易所佔全球總市值比率,如 圖 1 所示,大陸(上海和深圳)總計排名第二僅次於美國,其佔比為 10.25%。大陸. 政 治 大 廠形象,到現在各種行動支付品牌的盛行,物聯網的應用無所不在,超級高鐵的 立 近年來正以飛快的腳步逐漸崛起,從早期落後的經濟開發,勞動力低廉的製造工. ‧ 國. 學. 研發獨步全球,科技發展突飛猛進,昨天還在學習技術,今日已成創新熔爐,產 業轉型之快有如一日九遷,也帶來更多商機。根據金管會統計國內上市櫃公司歷. ‧. 年赴陸投資情形,如圖 2 所示,不論是赴陸投資的上市櫃公司家數、累計投資金. sit. y. Nat. 額和投資收益皆是每年成長,且在 2017 年赴陸投資家數佔整體上市櫃公司總家. 20,000,000. al. n. 25,000,000. er. io. 數 1,562 家的 76.31%,顯示大陸市場對我們而言是不可忽視的一塊。. Ch. engchi. i n U. v. 30% 25% 20%. 15,000,000. 15% 10,000,000. 10%. 5,000,000. 5%. 0. 0%. 市值(百萬美元). 佔比. 圖 1、各國交易所市值與佔比(2018 年 5 月) 1. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(9) 1,250. 25,000. 1,200 赴. 累 20,000 計 投 資 15,000 金 額 10,000. 1,150 1,100. (. 億 元. 1,050. ). 5,000. 1,000. 0. 陸 投 資 上 市 櫃 公 司 家 數. 950 2011. 2012. 2013. 2014. 2015. 累計投資金額(億元). 2016. 2017. 上市櫃家數. 圖 2、國內上市櫃公司歷年赴陸投資情形. 政 治 大 另一方面,當今人工智慧的發展和技術成果已遠遠超出我們想像。根據史丹 立. 佛大學團隊 Shoham1等人在 2017 年發表的人工智能指數(AI Index)報告中所述,. ‧ 國. 學. 自 1996 年以來,每年發表的電腦科學學術論文和研究數量增加了 9 倍以上,說. ‧. 明人工智慧的蓬勃發展背後是由各領域專家的研究所驅動;自 2000 年以來,美. y. Nat. 國人工智慧初創公司的數量增加了 14 倍,且投資人每年投入人工智慧公司的投. er. io. sit. 資額增加了 6 倍,顯示人工智慧在未來的應用面向有許多被看好的潛力;自 2013 年以來,要求具備人工智慧技能的工作職位增加了 4.5 倍,表示公司對程式系統. al. n. v i n 開發的人才需求倍增,這些演算法的架構都需要依賴人類的創意所設計。此外, Ch engchi U 來自人工智慧應用的公司營收也將預計成長 50%以上,無論是從人臉識別、醫療 影像診斷,到自動駕駛的定位都是應用人工智慧的場景,而機器學習、深度學習 和自然語言處理也將成為最重要的三項技能,各種機器學習技術和程式開發環境 的經驗都將成為建立人工智慧應用程式最核心的必備條件。. 1. Shoham, Y., Perrault, R., Brynjolfsson, E., Clark, J., & LeGassick, C. (2017). AI Index 2017 Annual. Report. Retrieved from http://cdn.aiindex.org/2017-report.pdf 2. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(10) 人工智慧的技術與時俱進,擴及領域也不計其數,當然也為各行各業帶來不 同程度的衝擊和影響。根據集邦科技(TrendForce)旗下拓墣產業研究所在 2017 年 對機器學習應用領域的產值佔比調查,如圖 3 所示,機器學習應用最大宗就是金 融與資訊安全,佔比 20%,其次是數位廣告科技,佔比 18%,這兩大產業都與大 量數據的採集息息相關,也成為人工智慧最快、也最容易切入的領域。正如谷歌 (Google)資深院士 Dean (2016)於美國舊金山舉行的數據管理國際會議(Special Interest Group on Management Of Data, SIGMOD)發表專題演說時所言: 「隨著時 間不斷向前邁進,我們看到越來越多使用機器學習技術來解決各種問題的成功案. 政 治 大 的語音識別開發團隊透過神經網路將字詞錯誤率降低 30%。」既然機器學習是如 立 例,這使得谷歌內部數百個開發團隊對相關技術的使用出現大幅度的成長,谷歌. 其他 6%. 金融與資訊安全 20%. ‧. 天然資源 7%. 學. ‧ 國. 此神奇,我們是否也能將這些方法應用於股票市場預測呢?. sit. n. al. er. io. 國防 7%. y. Nat. 汽車 7%. 健康醫療 9%. Ch. engchi. 製造 12%. i n U. v數位廣告科技 18%. 零售 14%. 圖 3、機器學習應用於各領域產值佔比 傳統上分析股票市場走勢大致有三種方法:基本面、技術面及籌碼面分析, 基本面是以公司財報資訊的揭露為主,反映公司的資產負債情況;技術面是以公 司股價走勢為主,透過各種指標法、K 棒及型態來反映股票的價量情況;籌碼面. 3. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(11) 則是參考外資、投信及自營商的買賣資訊,反映市場主力的交易情況。然而股票 市場通常是複雜且易變的,即便是優秀的基金經理人也未必能總是打敗大盤績 效,過去這些分析方法在處理資料的過程也相當耗時,且深受個人投資風格所影 響。在人工智慧時代的來臨,我們擁有足夠的運算資源,以及規模足夠大的資料 庫,而我們真正需要的是去理解那些資料,為此金融市場可以透過機器學習,以 期能掌握數據、分析數據,並從新穎的角度切入和解讀數據,進而產生全新的商 業價值,相較傳統採用定性定量的資訊輔助投資策略擬定,人工智慧的引入將有 效提高投資模型的精準度,且可以有紀律性的操作,避免心理層面的影響導致人. 政 治 大 器預測的準確度有限,現階段投資人仍不放心完全交給理財機器人操作,只能將 立 為錯誤。然而金融市場非理性因素和首發事件多,對於過去沒有發生的經驗,機. 其運算結果當作參考依據,最終如何調整投資組合還是由投資人決定,期能透過. ‧ 國. 學. 機器學習改善投資人對資產配置的選擇,進而獲得良好的投資績效。. Nat. y. ‧. 第二節、研究目的. er. io. sit. 截至目前,股價的未來走勢一直是一個未知且令人充滿興趣的研究領域。過 去已有許多學者提出各種理論以論述其觀點,從 1827 年 Brown 的隨機漫步理. al. n. v i n 論、1900 年 Dow 的道氏理論、1938 1970 年 Fama 的 C h 年 Elliott 的波浪理論,到 engchi U. 效率市場假說,都一再說明股價走勢存在許多分析面向。過去投資人預測股價走 勢的方法不外乎以三大面向為主,即基本面、技術面和籌碼面分析,這三大面向 從不同觀點考慮影響股價報酬的因子,然而這些因子在過去大多已被充分討論, 且使用的指標和方式幾乎大同小異,在經濟發展愈趨複雜的現在,很難找到一套 方法能夠持續在股票市場中獲得超額報酬。 本文以建構大陸股票市場的投資組合為目標,搭配時下流行的神經網路學習 方法,希望透過各種技術指標作為模型觀察值,用以學習與未來一段期間股價漲 4. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(12) 跌的關係,並藉此預測股價未來的漲跌走勢,以及判斷進出場時機以建立投資策 略,同時使用模型預測結果的機率值作為股票投資的篩選排序,最後建立一套資 產配置組合,以期在整段投資期間獲得良好的投資績效。. 第三節、研究流程 在確立研究目的後,本文將依據研究動機與背景進行相關資料的收集與統 整,並從 MySQL 資料庫抓取大陸股票市場的歷史資料進行處理,最後依照研究 方法進行分析,並從實證結果提出結論與建議。本文將分為以下五個章節討論,. 政 治 大 用於大陸股價走勢之研究動機、目的及流程;第二章為文獻回顧,針對過去國內 立 第一章為緒論,敘述大陸市場與人工智慧的現況,並說明本文將深度學習方法應. 外相關文獻進行統整及探討,包括深度學習與技術指標在股價走勢的應用,參考. ‧ 國. 學. 其他學者的研究方法和結果,試圖找出適合的研究方法;第三章為研究方法,介. ‧. 紹深度學習的基本概念,以及敘述本文如何建構神經網路模型以用於預測股價走. y. Nat. 勢,並說明本文的投資策略以用於挑選股票,並建立資產配置,以尋找最適年化. er. io. sit. 報酬率;第四章為實證結果分析,使用 MySQL 資料庫的歷史股價資料對大陸股 市進行實證分析,並以圖表與情境分析比較及說明研究結果;第五章為結論與建. al. n. v i n 議,針對第四章的實證結果進行討論,並對未來研究方向提出建議。 Ch engchi U. 5. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(13) 第二章、文獻回顧 深度學習是近年來相當熱門的詞彙,從 2011 年國際商業機器超級電腦(IBM Waston)贏得益智問答、2016 年谷歌圍棋程式(Google AlphaGo)擊敗世界棋王,到 2017 年臉書聊天機器人(Facebook Chatbot)都可看見其足跡,各大科技公司如微 軟、蘋果和百度等紛紛進軍該領域。然而深度學習並不是一個全新的概念,早在 1950 年代自電腦發明以來便已興起,人們思考如何運用電腦來解決問題,而礙 於當時硬體儲存和效能不足,且資料量更是不夠,加上僅能處理一些代數題和數 學證明,難以在實務上有所應用,人工智慧便以泡沫化收場,一直到最近科技進. 政 治 大. 步促使計算成本下降才終於死灰復燃。. 立. 透過深度學習的興起,機器變得越來越聰明,而人工智慧的應用也更加廣泛,. ‧ 國. 學. 主要領域可分為語音辨識、影像辨識和自然語言處理,其應用面向更是無遠弗屆,. ‧. 在過去文獻中已有許多學者就其領域進行研究。Sun et al. (2014)使用一系列高層. y. Nat. 次的特徵資料進行深度學習,其稱為深度隱藏身分特徵(Deep hidden IDentity. er. io. sit. features, DeepID),亦即透過大量不同但具有少量隱含特徵的身分,以用於人臉辨 識,使用一萬組臉部類別作為訓練樣本,在僅簡單對齊好臉部輪廓後,該模型的. al. n. v i n 準確率甚至可高達 97.45%;而其模型的預測結果除了能處理身分驗證的工作, Ch engchi U 甚至隨著臉部類別在訓練資料的數量增加,該模型的泛化能力也能隨之增加,從. 而推廣到訓練資料看不到的新面孔,包括登機前的報到手續幫助加速檢查流程, 或在社群平台標記照片中的朋友和家人,簡化使用者對照片的管理。其他類似的 生物辨識系統,例如指紋和虹膜辨識等,其應用也是指日可待。 深度學習也可應用於醫療領域,協助醫療專家在診斷過程中更精確且更有效 率。過去在診療期間往往需要花費時間詳看 X 光片、電腦斷層影像或核磁共振 等報告,且通常需要專家親自執行,人力成本相當高,是一項耗時又容易誤判的 6. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(14) 過程。Wang et al. (2016)使用卷積神經網路(Convolutional Neural Network, CNN) 從淋巴組織圖像中自動偵測轉移性乳癌,其目標包括該圖像是否包含轉移性細 胞,以及確定該腫瘤在圖像中的位置;該模型在評估分類準確率的曲線下面積 (Area Under roc Curve, AUC)為 0.925,而病理學家獨立判斷的曲線下面積為 0.966,若將兩者相結合則曲線下面積將提高至 0.995,表示人為錯誤率約降低 85%。這些結果證明深度學習在病理診斷方面提供顯著的改善能力,不但能加速 檢測流程,讓醫師利用更多時間進行醫學診斷,在將來面臨醫療人才汰換時,也 能透過科技方法讓寶貴的醫療經驗傳承下去。. 政 治 大 題。自從美國研發機構(Defense 立 Advanced Research Projects Agency, DARPA)透過. 在探討人工智慧如何提升生活品質時,自動駕駛無疑是最受到熱烈關注的話. ‧ 國. 學. 無人汽車挑戰賽掀起自動駕駛技術的浪潮,各大公司爭相投入無人汽車的研發, 安全性是自動駕駛能否普及的重要關鍵,而讓車輛本身變聰明,透過車上各種感. ‧. 測器和計算硬體以預測交通環境的變化,自主判斷路況以即時分析,是加速自動. sit. y. Nat. 駕駛發展最有效的助力;而相比城市街道,高速公路往往具有更多的可預測性,. al. er. io. 其路面的規律性促進自動駕駛的領先應用。Huval et al. (2015)使用卷積神經網路. v. n. 在真實系統所行使的速率偵測車輛和車道情況,收集大量高速公路行駛環境的圖. Ch. engchi. i n U. 像樣本,除了描述車輛和車道的位置,也測量車輛之間的距離和相對速度,以用 於偵側車道邊界的範圍,偵測結果以交聯率(Intersection Over Union, IOU)作為評 估指標,並以雷達系統作為偵測結果的基準;其結果顯示該模型在偵測車輛之間 距離的準確性明顯優於雷達系統。深度學習的技術有望為自動駕駛帶來相對便宜 並穩健的解決方案,並改善更多疲勞駕駛和交通事故的情況,甚至將來自動駕駛 領域還能加入汽車駕駛習慣的學習,讓汽車成為駕駛人的行車管家。 而人工智慧與金融界的關係更是密不可分,甚至相比其他行業,金融界擁有 更好的應用潛力。金融市場擁有大量完整且有時間序列的股價資料,過去投資人 7. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(15) 通常利用這些歷史資料,透過圖表和公式進行分析,並以各式各樣的迴歸模型預 測金融資產的波動性或價格的未來走勢,以獲得正確的交易訊號,這些方法在資 料整理方面相當耗時,且判斷規則深受個人投資風格而異,若不了解股票的運作 方式和目前趨勢,想要擊敗市場將會相當困難;而深度學習的誕生正是為了擺脫 投資人對分析模型的侷限,不需要事先假定具體的分析模型,而是根據給出的訓 練資料對其參數進行自我調整,所得的最終模型便是對訓練資料內含規律的最佳 描述,雖然無法解釋輸入變數對輸出變數的影響,但在股票分析中更關心的是預 測的準確性,這也是深度學習大量應用於演算法交易的原因。. 政 治 大 路來模擬標準普爾 500 立 指數(S&P 500)的波動率走勢,其參考谷歌國內動態. Xiong et al. (2016)使用長短期記憶(Long Short-Term Memory, LSTM)神經網. ‧ 國. 學. (Google Domestic Trends)提供的各項指標作為神經網路的特徵資料,谷歌國內動 態是谷歌財經頻道(Google Finance)一項經濟分析功能,其建立 23 種指標來追蹤. ‧. 特定經濟領域的搜尋流量;另以嶺(Ridge)迴歸和套索(Lasso)迴歸兩種線性迴歸模. sit. y. Nat. 型,以及廣義自迴歸條件異方差模型(Generalized AutoRegressive Conditional. al. er. io. Heteroskedasticity, GARCH) 作 為 基 準 模 型 , 並 以 平 均 絕 對 百 分 比 誤 差 (Mean. v. n. Absolute Percentage Error, MAPE)作為預測能力好壞的評估指標。其結果表明神. Ch. engchi. i n U. 經網路在預測指數波動率的誤差表現上明顯優於傳統模型,顯示深度學習對於具 有大量干擾因素、呈現高度複雜且非線性關係的金融市場是較為適用的模型。 除了透過股價等數值資料轉化為指標作為特徵資料,深度學習也能對文本資 料進行學習,透過從新聞事件或市場消息萃取相關資訊,以反映投資人對股價的 預期心理,並快速對其走勢做出判斷。Poulos (2016)使用深度循環神經網路 (Recurrent Neural Network, RNN)來預測道瓊工業平均指數(Dow Jones Industrial Average, DJIA)收盤價的方向,其特徵資料採用資料科學社群平台(Kaggle)提供的 一項專案(主題為 Daily News for Stock Market Prediction)資料集,包含每日從社 8. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(16) 交平台(Reddit)世界新聞版挑選討論度前二十五名的新聞標題,藉以預測每日指 數收盤價的漲跌情況,並與基準模型(三層門控循環單元(Gated Recurrent Unit, GRU))做比較。結果顯示使用十二層門控循環單元的深度循環神經網路,其分類 準確度和曲線下面積皆優於基準模型或其他使用者所提供的模型。 深度學習的特徵資料也能同時對文本資訊和數值資訊兩種特徵資料進行學 習。Akita et al. (2016)使用長短期記憶神經網路來預測選自日經 225 指數(Nikkei 225)的十家公司收盤價,其特徵資料同時考慮新聞標題和公司開盤價資訊,而該 十家公司來自相同行業,以便透過文本資訊學習公司之間的交互關係,例如日產. 政 治 大 豐田(Toyota)的股價上升;另將預測的收盤價納入交易策略,並與其他分類模型 立 (Nissan)宣布原廠「召回」檢修行動的事件,可能會使日產的股價下跌,然而卻使. ‧ 國. 學. ( 多 層 感 知 器 (Multi-Layer Perceptron, MLP) 、 支 援 向 量 迴 歸 (Support Vector Regression, SVR)和循環神經網路)做比較。結果顯示長短期記憶神經網路有較好. ‧. 的獲利能力,且更能捕獲時間序列資料所帶來的影響;此外,納入文本資訊的特. sit. y. Nat. 徵資料比起只考慮數值資訊,其預測結果較為準確。. n. al. er. io. 而深度學習也為交易策略的改進奠定基礎,提供較為客觀的識別和預測股價. i n U. v. 走勢的方法,其交易訊號的差異也產生不同的資產配置方法和交易時機選擇。. Ch. engchi. Nelson et al. (2017)使用長短期記憶神經網路來預測十五分鐘後收盤價的變動方 向,其股票選自巴西聖保羅指數(IBovespa)的五檔 成分 股(BOVA11, BBDC4, CIEL3, ITUB4, PETR4),特徵資料除了考慮歷史價格(開盤價、收盤價、最低價、 最高價和成交量),也加入一系列來自技術分析資料庫(Technical Analysis Library, TA-Lib)的技術指標,總計多達 175 個指標;此外,該模型使用移動視窗(Moving Window)的方式,亦即將每個交易日的前十個月作為訓練期間,並使用過去一周 資料來驗證模型績效,而在交易日當天便使用該模型進行預測,並與其他基準方 式比較其交易績效,包括使用其他機器學習演算法(多層感知器、隨機森林 9. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(17) (Random Forest)、偽隨機(Pseudo-Random))和簡單投資策略(買入持有(Buy and hold))。結果顯示該模型在準確率表現皆優於其他模型,且在每次的買賣交易中 獲得較高的報酬率,而在觀察最大損失時也顯示該模型提供較少的風險。總結來 說,神經網路對於股票走勢的分類和策略建構相當具有優勢,且能根據選取的特 徵自動調整參數和權重,有時甚至能分析出我們未曾預料的影響。 至於就其神經網路特徵資料的選取種類,過去研究並無一套標準說明何種指 標有顯著能力預測股價走勢,這是因為神經網路對於輸入值和輸出值之間的關係 並無像傳統迴歸模型有很好的解釋能力,如何挑選有效的變數使得神經網路的準. 政 治 大 和有效性,技術指標是最常使用的方式。Khan et al. (2015)使用自組織映射圖(Self立 確率有更好的表現,是在該領域的一大課題,然而依據資料收集及計算的簡單性. ‧ 國. 學. Organizing Map, SOM),其也是一種神經網路的分類方法,搭配幾種技術指標作 為特徵資料,包括相對強弱指標(Relative Strength Index, RSI)、威廉指標(Williams. ‧. %R)、終極指標(Ultimate Oscillator)、移動平均收斂發散指標(Moving Average. sit. y. Nat. Convergence Divergence, MACD)、隨機指標(Stochastic Oscillator)和能量潮指標. al. er. io. (On Balance Volume, OBV),使用印度孟買交易所(Bombay Stock Exchange, BSE). v. n. 的股價資料進行分析,並透過該模型從中挑選股票及決定買進時點,實證結果顯. Ch. engchi. i n U. 示該投資組合在一個月內的報酬表現比孟買敏感 30 指數(BSE 30)高出 19.1%; Sezer et al. (2017)使用道瓊工業平均指數的股價資料,透過大數據運算平台 (Apache Spark)分析各股的投資表現,將預測類別根據過去股價走勢的峰谷點分 類為買入、賣出和持平,並使用相對強弱指標、移動平均收斂發散和威廉指標作 為神經網路的特徵資料,實證結果顯示大多數股票在十年的投資期間,使用神經 網路的預測相比買入持有策略皆有較好的表現。. 10. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(18) 第三章、研究方法 第一節、前言 本文欲以神經網路預測股價未來走勢,找出具有潛在上漲能力的股票,並藉 此判斷買賣時點,以建構股票投資組合。神經網路的優勢即在於其擁有大量的訓 練樣本及龐大的計算能力,不受限於模型變數和參數的數量,且不須添加任何限 制即能從資料間推斷出未知關係。故本文以技術指標為主體,預測未來二十天後 的股價走勢,並採取定錨式移動視窗(Anchored Moving Window)的方式,如圖 4. 政 治 大 建構出各段期間的神經網路,藉此預測未來一年內各個股價走勢的結果,將其結 立 所示,將訓練期間的起始點固定,隨著時間推移有更多的訓練資料進入學習,並. ‧ 國. 學. 果作為買賣時點的依據,並將這些交易期間進行回測,以觀察整體的投資績效表 現。本文資料收集期間為 2000 年 1 月 3 日至 2017 年 12 月 29 日,其中測試期間. ‧. 為 2011 年到 2017 年,回測期間為該段測試期間,總共長達七年。. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 4、定錨式移動視窗 以下章節將分別敘述神經網路模型的歷史和基本概念,以及如何將其應用於 股價走勢的預測,包括說明模型的特徵變數和預測目標的設定,以及投資組合策 略的選取,最後說明本文評估交易績效的指標。. 11. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(19) 第二節、深度學習概述 深度學習(Deep Learning)近年來已是相當熱門的機器學習方法之一,許多實 務上的應用也不斷的推陳出新,熟悉深度學習的概念與其應用原理是一個好的開 始,因為這些機器學習方法正在一步一步改變我們的生活。 深度學習並不是一個全新的概念,其淵源最早可追溯自 1950 年代,人類自 從電腦發明以來,便渴望讓電腦擁有類似人類的智慧,模擬人類具有思維的行為 表現,並針對我們所提出的問題準確回答,人工智慧時代正式揭開序幕。人們期. 政 治 大 時電腦的計算速度尚未提升,儲存空間也小,數據量更是不夠,這使得人工智慧 立 待透過電腦超強的運算能力,為我們解決生活周遭各種繁瑣的問題,然而礙於當. 的研究發展相當受限,只能解決一些簡單的代數題和數學證明,在實務上難以有. ‧ 國. 學. 所應用。隨後電腦硬體開始以指數型的方式在進步,歸功於電腦運算能力的爆炸. ‧. 性成長,儲存成本下降使得更多數據能做處理,自 1980 年代逐漸興起人工智慧. y. Nat. 的一個分支,讓電腦能夠自行從大量資料中找出規律並加以學習,各種機器學習. er. io. sit. 的理論就此誕生,包括支援向 量 機(Support Vector Machine, SVM)、 決 策 樹 (Decision Tree)和隨機森林(Random Forest)等,而類神經網路(Artificial Neural. al. n. v i n Network, ANN)也一度興起,然而相比其他淺層的機器學習算法,其理論不夠嚴 Ch engchi U 謹完備,加上神經網路在進行反向傳播算法(Back Propagation)時遇到瓶頸,只要 超過三層以上幾乎沒有效果,多層神經網路並不被主流學術界所正視。直到 2006 年代深度學習之父 Hinton 成功訓練多層神經網路,並命名為深度學習,加上輝 達(NVIDIA)推出全新圖形處理器(Graphics Processing Unit, GPU)的運算架構,深 度學習才真正開始火熱起來。. 12. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(20) 政 治 大. 圖 5、深度學習發展史. 立. 簡單來說,深度學習就是一個函數集,透過一群函數的集合以模仿人類的神. ‧ 國. 學. 經網路,因此其深度意謂著神經網路的層層堆疊架構,當我們丟給機器一堆數值, 機器就會將這些數值透過神經網路不斷傳遞更多訊息,從而找出最好的結果,而. ‧. er. io. sit. Nat. 三個步驟:建構網路、設定目標、開始學習。. y. 我們也能從機器的建議中做出最適當的決策。在進行深度學習時,我們需要準備. 深度學習的神經網路結構不盡相同,常見的神經網路包括卷積神經網路. al. n. v i n (Convolutional Neural Network, Neural Network, CCNN)、循環神經網路(Recurrent hengchi U. RNN)和長短期記憶神經網路(Long Short-Term Memory, LSTM)等,卷積神經網路 善於處理圖像辨識,循環神經網路適合處理有時間序列和語意結構的資料,而長 短期記憶神經網路是循環神經網路的改良版,可以成功回顧更多循環前的結果。 本文僅討論深度學習的入門模型,亦即簡單的序列模型(Sequential Model),其透 過多個神經網路層的線性堆疊以傳遞數據。 神經網路模型一般可分為三層,包括輸入層、隱藏層和輸出層,如圖 6 所示。 輸入層的神經元數量即是我們觀察的特徵變數,輸出層的神經元數量則是欲預測 13. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(21) 的目標變數,我們給予輸入層和輸出層之間的關係,並渴望機器透過這樣的關係 從中找出規則,用以判斷在新的樣本資料中其所對應的關係為何;而從大量的樣 本資料中萃取特徵並找出規則的方式,便是透過隱藏層進行一連串的函數運算, 這些隱藏層包含許多神經網路層和各種數量的神經元,透過隱藏層的層層運算以 傳遞輸入層和輸出層之間的關係,並透過反向傳播算法反覆計算各神經元的權重 和誤差,最後得到一組最適合用於預測的神經網路模型。這些層數和神經元數的 選擇目前並無一套準則,僅是仰賴試誤法(Try and Error)決定該模型配置的參數 能得到最佳的預測效果。. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. i 圖 6、神經網路架構 n C hengchi U. v. 細看神經網路的計算方式,神經網路是由一群神經元所構成,每個神經元都 是一個激活函數(Activation Function),當輸入值(x)進入到神經元時,這些輸入值 會與誤差值(b)進行加權線性組合,再經過激活函數的轉換輸出一個值(z),這個 輸出值會繼續傳入下一個神經元,成為該神經元的輸入值,如圖 7 所示。如此循 序傳遞下去,從第一層的特徵向量作為輸入值,直到最後一層輸出預測結果。 𝑧 = 𝑓(𝑦) = 𝑓(. 𝑤 𝑥 + 𝑏),. 𝑘為向量 x 的維度. 1. 14. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(22) 政 治 大. 圖 7、神經網路運算過程. 立. 激活函數的目的是為神經網路加入一些非線性因素,使得神經網路可以任意. ‧ 國. 學. 的逼近任何非線性函數,得以更好的處理較複雜的問題,常見的激活函數包括 S 型函數(Sigmoid)、雙曲正切函數(Hyperbolic Tangent, Tanh)和斜坡函數(Rectified. ‧. Linear Unit, Relu)等,如圖 8 所示,而實務上最常使用的是斜坡函數,其能有效. y. Nat. sit. 克服梯度消失的問題,其他兩者函數在接近飽和區(例如 S 型函數在[-5, +5]以外). er. io. 時,經過轉換後的輸出值趨近於零,也就是所謂的梯度消失,造成更新參數訊息. n. al. i n U. v. 時無法藉由反向傳播算法傳遞,是神經網路加深時產生的訓練障礙之一,而斜坡. Ch. engchi. 函數在資料值為正的情形下不存在飽和問題,故可用於股價或正規化後的指標進 行分析。此外,輸出層的激活函數也格外重要,根據我們所欲預測問題的類別, 選擇相對應的激活函數,例如在迴歸問題使用線性函數(Linear),在分類問題使用 歸一化指數函數(Softmax),其中歸一化指數函數能將線性組合後的輸入值等比例 壓縮至[0, 1]之間,且該層所有輸出值總和為 1,可視為機率值以用於分類。 z =. 𝑒 ∑. 1. 𝑒. ,. z = 1,. n 為分類數量. 1. 15. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(23) 立. 政 治 大. ‧. ‧ 國. 學 圖 8、激活函數. y. Nat. sit. 在定義完神經網路的架構後,我們需要設定學習目標,讓神經網路得以根據. n. al. er. io. 此目標進行訓練。一般來說,需要設定的參數包括訓練神經網路使用的優化器. i n U. v. (Optimizer)和用於評價網路通過優化器產生最小誤差結果的損失函數(Loss)。常. Ch. engchi. 見的優化器包括隨機梯度下降(Stochastic Gradient Descent, SGD)、適應性動量估 計 (Adaptive Moment Estimation, Adam) 和 均 方 根 傳 播 (Root Mean Square propagation, RMSprop),Kingma et al. (2015)說明適應性動量估計對參數的計算效 率高,對儲存記憶體的要求低,且適合用於資料或參數相當大,以及所欲預測的 目標會隨時間變化的問題,在實務上比起其他優化方法其運作良好且收斂速度相 當快。而根據欲預測問題的種類,也有幾種相對應的損失函數,例如迴歸問題使 用均方差(Mean square error, MSE),分類問題使用分類交叉熵(Categorical CrossEntropy),其方法皆是用來計算預測值與目標值之間的距離。此外,在隱藏層之 16. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(24) 中也能加入許多方法以改善訓練效率,資料正規化不只在輸入層需要使用,以解 決輸入值在通過激活函數時所遇到的飽和問題,在隱藏層同樣也需要使用,由於 輸入值在與每一層的權重和誤差進行線性組合,並通過神經元的激活函數後,其 輸出值可能進入飽和區,即所謂的內部變數偏移(Internal Covariate Shift),Ioffe et al. (2015)透過在隱藏層額外添加批次正規層(Batch Normalization),將每一層的輸 入值加以正規化,使得該方法能夠在達到相同準確率的情形下減少 14 倍的訓練 次數。另一方面,擁有大量參數的神經網路是非常強大的機器學習系統,然而過 度訓練(Overfitting)同樣也是神經網路所遇到的問題之一,當機器學習到的規則. 政 治 大 Srivastava et al. (2014)在每一層引進丟失比率(Dropout),在訓練過程依照特定比 立. 過於貼近訓練資料時,便會導致其規則用於測試資料時,誤差將會變得相當大,. 率將神經元隨機從神經網路中丟棄,以此對同一個神經網路訓練不同的子網路,. ‧ 國. 學. 以避免對同一個網路訓練過多,並證實其方法能改善神經網路的預測效果。. ‧. 在設定完神經網路的各種參數後,我們的目標即是讓神經網路從這些訓練樣. sit. y. Nat. 本中尋找規則,而其學習的方式便是透過反向傳播算法,其概念類似於梯度下降. al. er. io. (Gradient Descent),也就是透過損失函數找出預測值和真實值之間的差距,為了. v. n. 讓此差距達到最小,神經網路便將誤差結果反向傳遞回去,重新調整神經元的權. Ch. engchi. i n U. 重和誤差,以此尋找損失函數的最小值。我們可以把深度學習想像成有一百萬個 學生同時在寫答案,他們每個人都有不同的思考方式,最後每個人都交出一個不 同的答案,將所有的答案與標準答案相減後得到誤差,並將誤差畫成一個平面圖 形,離標準答案最接近的那個答案,就會在這張圖的最低點;而深度學習的目標 便是找到這個最低點,最低點代表寫出這個答案的學生,擁有最接近正確答案的 思考方式,而我們讓其他學生向這位學生學習,並繼續測試是否都能回答正確, 隨著學習次數越多,準確率就會逐漸提升。此外,反向傳播算法需要指定訓練的 期數(Epoch)和批次數量(Batch Size),一個期數是指一個完整資料集通過神經網 17. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(25) 路一次並反向傳遞一次,而批次數量是指將資料集分割為多少數量的批次樣本, 同一批次所有樣本都將輸入神經網絡進行計算,並用這些樣本的平均誤差值來更 新模型的權重;批次大小也是優化神經網路訓練效率的方法之一,越大的批次數 量意味著需要等待更長的時間來完成每次的更新,而批次數量越小,則神經網絡 從每個批次獲得的數據訊息也越少,批次數量的選取在實務上仍未有一套準則, 僅能透過試誤法選擇預測效果最佳的參數。最後,如果我們對訓練後模型的效果 滿意的話,便能使用該模型對新的資料進行預測。 本文引用 R 語言中的 Keras 套件,使用其內建的序列模型函數以建構神經網. 政 治 大. 路,並設定幾種參數進行模型訓練,如表 1 及圖 9 所示。. 激活函數. Relu. n. al. Categorical Cross-Entropy. er. io. 損失函數. sit. y. ‧. 設定. Nat. 參數. 學. ‧ 國. 立表 1、神經網路參數設定. Ch. 優化函數. i n U. v. i e n g c hAdam. 丟失比率. 0.5. 訓練期數. 10. 批次數量. 1024. 18. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(26) 政 治 大 圖 9、神經網路配置方式 立. ‧ 國. 學. 第三節、模型變數. ‧. 過去分析股票市場走勢大致有三種方法:基本面、技術面和籌碼面分析,. y. Nat. 然而對於國外的交易在國內很難取得有關籌碼面的訊息,加上大陸上市公司. er. io. sit. 的流通股數較低,公司本身通常兼具國家企業的特性,分析基本面相比政策 面較不具參考價值,因此本文僅考慮使用技術指標作為變數。技術分析並非. al. n. v i n 像基本分析和籌碼分析試圖理解股價走勢背後的驅動因素,而僅僅是觀察過 Ch engchi U 去的股價走勢,並從這些資訊中分析未來股價的潛在走勢,以及時提供精確. 的買賣時機,且適合用於短線操作。在超過上百種的技術指標中,過去學者 和投資人通常較頻繁的使用某些指標,原因在於其方法上的簡單性或有效 性,故本文參考 R 語言中的 TTR 套件,使用以下四種指標。. 一、移動平均(Moving Average, MA) ★𝑀𝐴(𝑛) = 過去𝑛日內收盤價的算術平均,. 𝑛 = 5, 20. 19. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(27) 𝐸𝑀𝐴(𝑛) =. 2 𝑛−1 × 今日收盤價 + × 昨日𝐸𝑀𝐴(𝑛) 𝑛+1 𝑛. 二、相對強弱指標(Relative Strength Index, RSI) 若今日收盤價 > 昨日收盤價,則𝑈𝑝 = 今日收盤價 − 昨日收盤價,𝐷𝑛 = 0 若今日收盤價 < 昨日收盤價,則𝑈𝑝 = 0,𝐷𝑛 = |今日收盤價 − 昨日收盤價| 𝑈𝑝𝐴𝑣𝑔 = 過去14日內𝑈𝑝的𝑀𝐴 𝐷𝑛𝐴𝑣𝑔 = 過去14日內𝐷𝑛的𝑀𝐴 ★𝑅𝑆𝐼 =. × 100. 立. 政 治 大 日內最低的最低價. 日內最高的最高價 過去. 日內最低的最低價. n. al. Ch. sit er. io. ★𝑆𝑙𝑜𝑤%𝐷 = 過去 3 日內𝐹𝑎𝑠𝑡%𝐷的𝑀𝐴. y. Nat. ★𝐹𝑎𝑠𝑡%𝐷 = 過去 3 日內𝐹𝑎𝑠𝑡%𝐾的𝑀𝐴. × 100. ‧. ‧ 國. 收盤價 過去. ★𝐹𝑎𝑠𝑡%𝐾 = 過去. 學. 三、隨機指標(Stochastic Oscillator, KD). i n U. v. 過去 13 日內最高的最高價 + 過去 13 日內最低的最低價 𝐶𝑀 = 收盤價 − 2. engchi. 𝐻𝐿 = 過去 13 日內最高的最高價 − 過去 13 日內最低的最低價 𝐶𝑀𝐴𝑣𝑔 = 過去25日內之「過去2日內𝐶𝑀的𝐸𝑀𝐴」的𝐸𝑀𝐴 𝐻𝐿𝐴𝑣𝑔 = 過去25日內之「過去2日內𝐻𝐿的𝐸𝑀𝐴」的𝐸𝑀𝐴 ★𝑆𝑀𝐼 =. ⁄. × 100. ★Signal = 過去9日內𝑆𝑀𝐼的𝐸𝑀𝐴 20. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(28) 四 、 移 動 平 均 收 斂 發 散 (Moving Average Convergence Divergence, MACD) ★𝐷𝐼𝐹 = 過去 12 日內收盤價的𝐸𝑀𝐴 − 過去 26 日內收盤價的𝐸𝑀𝐴 ★𝑀𝐴𝐶𝐷 = 過去 9 日內𝐷𝐼𝐹的𝐸𝑀𝐴 本文使用以上四種類型的技術指標,並納入各種指標間變動率的概念作為模 型變數,如表 2 所示,以滿足後續在將變數進行標準化時,不會因為股票標的不 同使得指標有極大差異,較不易受到極端值的影響。. KD. 𝑅𝑆𝐼. 𝐹𝑎𝑠𝑡%𝐾. 100. 今日收盤價. sit. 5日前𝑅𝑆𝐼. Ch. 今日𝑅𝑆𝐼 5日前收盤價. 𝐹𝑎𝑠𝑡%𝐷. er. al. n. 𝑀𝐴(20). io. 今日𝑅𝑆𝐼. 今日收盤價. MACD. 𝐷𝐼𝐹. 𝑀𝐴𝐶𝐷. y. Nat. 𝑀𝐴(5). RSI. ‧. 今日收盤價. 學. MA. ‧ 國. 立. 政 治 大. 表 2、技術指標變數. engchi U. 20日前𝑅𝑆𝐼. 今日收盤價. 5日前𝐷𝐼𝐹. v ni. 𝑆𝑙𝑜𝑤%𝐷. 𝑆𝑀𝐼 20日前收盤價. 今日𝑀𝐴(5). 今日𝐷𝐼𝐹. 今日𝐷𝐼𝐹 20日前𝐷𝐼𝐹. Signal. 今日𝑆𝑀𝐼 5日前𝑀𝐴(5). 5日前𝑆𝑀𝐼. 今日𝑀𝐴(5). 今日𝑆𝑀𝐼 20日前𝑀𝐴(5). 20日前𝑆𝑀𝐼 21. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(29) 今日𝑀𝐴(20) 5日前𝑀𝐴(20). 今日𝑀𝐴(20) 20日前𝑀𝐴(20). 在確定變數的選擇後,仍需對上述二十種變數進行標準化和正規化,使得資 料範圍皆介於[0, 1]之間,以消除不同資料間的不齊性,並滿足神經網路計算的有 效性,即當激活函數選擇使用斜坡函數時,輸入值需為正值,使得輸入值經過函 數轉換後不會進入飽和區,防止神經網路在訓練時產生梯度消失的問題。此外,. 政 治 大. 在對變數進行標準化時,仍須注意不能使用到未來資料做計算,以符合實務上在. 立. 做預測時僅有過去資料能參考,故本文在標準化時僅使用訓練期間的變數計算期. ‧ 國. 學. 望值和標準差,並用該值對訓練期間和測試期間的變數進行標準化,最後再將標 準化後的值經過標準常態的累積分配函數轉換為機率值,即[0, 1]之間。. y. 訓練資料的𝑠𝑑. er. io. sit. 𝑥 − 訓練資料的𝑚𝑒𝑎𝑛. ‧. Nat. 𝑧 =. n. a𝑦 l = 𝑃(𝑧 < 𝑧 ), 𝑧~𝑁(0, 1)i v n Ch U engchi 將變數做好資料處理後,本文目標即是希望透過這些技術指標,以預測未來 二十日後的股價走勢,其走勢主要分為兩個類別:上漲或下跌,並納入交易成本, 大陸股市的交易在買入和賣出時須付給券商手續費 0.3%,且賣出時須額外多付 印花稅(即我國所稱證交稅)0.1%,故本文的股價走勢主要判斷隔日開盤價與二十 日後開盤價的比值是否超過 1.007 倍,以此判斷該股票在未來的上漲潛力。 若二十一日後收盤價 明日收盤價 > 1.007,則為 1(上漲) 若二十一日後收盤價 明日收盤價 ≤ 1.007,則為 0(下跌). 22. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(30) 此外,在進行預測前須注意類別佔比是否有過大差異。根據 Mizuno et al. (1998)所述,在訓練樣本所欲預測的類別佔比差異過大時,神經網路在反向傳播 算法訓練時傾向只去改善主要類別的預測準確率,且對次要類別將預測較少的訊 號,若是類別佔比差異過大時,需要利用相關方法(例如根據類別的重要性來複 製樣本數)將樣本資料重新做平衡,以期能讓神經網路同等的對各類別進行學習 和預測。本文在檢視上漲和下跌的樣本數時,發現兩類別佔比均在五成左右,故 無須再做類別平衡處理。 另一方面,本文額外考慮另一種變數選取方法,也就是不使用技術指標,而. 政 治 大 收盤價的比值,並同樣考慮標準化和正規化處理,以期從單純的過去股價走勢預 立. 僅考慮過去二十日內每日股價的日報酬作為變數,每個變數為今日收盤價和昨日. ‧ 國. 學. 測未來股價走勢的關係。. ‧. 第四節、投資策略. sit. y. Nat. 有了各種技術指標作為模型變數,以及給定相對應的預測目標類別後,我們. al. er. io. 即可透過神經網路進行訓練,學習兩者之間的隱含關係,並透過這樣的關係,對. v. n. 未來觀察到的特定變數預測其分類是屬於上漲或下跌走勢,以判斷該支股票未來. Ch. engchi. i n U. 的上漲潛力,進而確定買賣時機,亦即若二十日後的股價漲幅超過交易成本,則 於隔日以開盤價買進,並持有二十日後再以開盤價賣出,從而在扣除交易成本後 仍能獲得正報酬。 本文樣本資料期間為 2000 年 1 月 3 日至 2017 年 12 月 29 日,其中測試期 間為 2011 年至 2017 年,並以該段期間的選股結果用於投資組合的績效回測,以 觀察該模型的投資策略是否表現良好。基金初始金額設置為一百萬元,每檔股票 的配置權重可做調整,本文主要設置為 20%,並搭配神經網路對上漲和下跌類別 的預測機率值,在買進時點從高到低進行排序,再依此順序將基金進行配置,並 23. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(31) 逐項計算每次交易的買入金額(包括買進股票的金額和交易成本),以此判斷是否 有充足的閒置資金得以投資,若無則取消該筆交易;而成交量限制設為 10%,亦 即每日各檔股票的成交張數不得高於該檔當日成交張數的 10%,以符合實務上 投資人的持股比例情況。 此外,本文亦考慮使用技術分析方法,搭配原先神經網路預測的進場時點, 進一步判斷出場時點,而非僅使用固定天數作為出場依據,以及早在市場出現下 跌訊號時進行停利,或是在二十日後仍有上漲空間則繼續持有。一般來說,每個 技術指標產生的訊號不同,搭配使用可以得到更強大的效果,Chong et al. (2008). 政 治 大 據,使用 MACD 作為股價波段趨勢的確認,並使用 RSI 判斷股價上漲力道強弱, 立 分別使用 RSI 和 MACD 作為交易策略,本文將兩者結合作為判斷出場條件的依. ‧ 國. 學. 以找出適當的賣出時機;當 MACD 小於零,或 RSI 介於 30 至 50 之間(30 以下 視為超賣區)時,股價通常呈現空頭走勢,故本文使用上述兩個條件,加上考慮. ‧. MACD 和 RSI 各自都小於過去前五日的觀察值時,則在隔日以開盤價賣出,如. sit. y. Nat. 圖 10 所示。需要注意出場條件不宜太寬鬆,否則在買進股票後沒多久便滿足出. n. al. er. io. 場條件,使得股票持有期間較短,交易次數也過於頻繁。. Ch. engchi. i n U. v. 圖 10、技術分析出場策略. 24. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(32) 第五節、績效指標 在決定完投資策略後,本文使用以下幾種績效指標,以衡量投資組合的回測 績效,如表 3 所示。 表 3、績效指標. 指標. 公式. 期末基金淨值. 累積報酬率. −1 治 政 大 期初基金淨值. 立 年化報酬率. ∑(基金淨值日報酬 − 𝑚𝑒𝑎𝑛(基金淨值日報酬)). 年化標準差. 總經過天數 − 1. sit 年化報酬率 − 無風險利率2. n. al. er. io. 最大回撤率3. × √252. y. Nat 夏普比率. ‧. ‧ 國. 學. (1 + 累積報酬率)總經過天數 − 1. Ch. i n U. v. 年化標準差. engchi. −𝑚𝑎𝑥(基金淨值 − 基金淨值 ). 基金淨值. 2. 參考大陸四大銀行(工商銀行、建設銀行、中國銀行、農業銀行)一年期人民幣定存利率 1.75%. 3. 基金自過去第 i 天來看,投資到過去第 j 天時,該段期間的最大跌幅 25. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(33) 報酬率 > 0 的交易次數. 勝率. 總交易次數. 獲利 > 0 的平均利潤. 獲利因子. 獲利 < 0 的平均損失. ∑(交易獲利). 平均獲利金額. 總交易次數. 平均閒置資金比率. 立. 治 /當日基金淨值) 政 ∑(當日閒置資金 大 總經過天數. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 26. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(34) 第四章、實證結果分析 第一節、實證分析樣本來源 本文使用 MySQL 資料庫抓取大陸股票市場之每日股價資料,包括每日開盤 價、最高價、最低價、收盤價和成交量,其中成交量單位為每手 100 股。大陸公 司可在上海、深圳兩個證券交易所掛牌,依其交易對象可分為 A、B 兩股,A 股 交易對象為大陸投資人,B 股則為國外投資人;而深圳交易所股票依其交易場所 又可分為主板、中小板和創業板,其中中小板的發行規模較小,而創業板的上市. 政 治 大 統計年鑑 所示,創業板指數的市盈率在 2015 年 5 月甚至高達 133 倍,然而其蘊 立 門檻較低,市盈率(即我國所稱的本益比)較高,根據深圳證券交易所 2015 年市場 4. ‧ 國. 學. 藏的風險也相對較高;此外,大陸股市也存在停牌制度,亦即公司由於某種消息 或活動引起股價的連續下跌,得向交易所申請暫停交易,而其暫停交易的期間也. ‧. 長短不一。故本文僅考慮上海、深圳交易所的 A 股,且在主板交易的股票,並刪. sit. y. Nat. 除停牌交易日及隔日報酬(即今日收盤價/昨日收盤價-1)超過 20%的股票,以確實. al. er. io. 反映技術指標變數和漲跌期間的計算;考慮陸股於 1997 年前並無漲跌幅限制(而. v. n. 後則為 10%),且其面額並不統一,故本文收集資料期間為 2000 年 1 月 3 日至. Ch. engchi. i n U. 2017 年 12 月 29 日,該段期間的總股數為 1,794 股。. 4. 宋 麗 萍 等 人 (2015) , 深 圳 證 券 交 易 所 2015 年 市 場 統 計 年 鑑 , Retrieved from. http://docs.static.szse.cn/www/market/periodical/year/W020180328429080512759.pdf 27. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(35) 第二節、投資組合績效分析 本文欲以技術指標為主體,預測未來股價走勢的方向。首先設定預測目標為 未來二十日的股價漲幅是否超過交易成本,以及選定技術指標作為變數,納入變 動率的概念,以消除股票間差異所帶來的影響,並建構一套包含各種參數的神經 網路模型,以此模型學習技術指標與股價漲幅之間的關係,並採用定錨式移動視 窗的方式,逐年進行預測。神經網路在訓練過程中,可透過可視化圖表觀察在給 定的訓練期數間,訓練資料和驗證資料的誤差值和準確率情況,如圖 11 所示, 其中左圖為誤差值訓練結果,右圖為準確率訓練結果,藍線為訓練期間訓練結果,. 政 治 大. 綠線為驗證期間訓練結果,可以發現隨著訓練期數越多,訓練資料的誤差值逐漸. 立. 下降,而準確率逐漸上升。. ‧ 國. 學. 神經網路的目標即是優化損失函數,故觀察誤差值相比準確率更為重要。本. ‧. 文將訓練期間最後一年的資料作為驗證資料,觀察驗證資料的誤差情況,以判斷. y. Nat. 該神經網路是否適合用於未來一年的預測,可以發現驗證資料的誤差值較訓練資. er. io. sit. 料稍大,且其值並沒有像訓練資料呈下降趨勢,對於未知的預測年度確實容易有 所波動;此外,由於批次數量、丟失比率等參數效果,神經網路對於同樣的訓練. al. n. v i n 期間有不同的權重更新,使得驗證資料可能會有稍微不同的結果。故本文使用試 Ch engchi U. 誤法選擇最合適的神經網路,亦即驗證資料的誤差值較小且波動率也較小的神經 網路,以確保未來預測的測試資料有足夠的穩定性,表 4 列出每次移動視窗期間 神經網路預測出來的結果,其中誤差值和準確率的計算包含所有類別。. 28. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(36) 圖 11、神經網路可視化訓練過程(2000~2010 年). 政 治 大. 表 4、各年度預測誤差值與準確率. 立. 預測年. 誤差值. 準確率. 2012. 0.6757. 0.5937. a l2013 Ch. 0.7142. 0.5105. n. 2014. er. io. sit. y. 0.5863. ‧. ‧ 國. 學 0.6709. Nat. 2011. i n U. v. e n0.7663 g c h i 0.4171. 2015. 0.7086. 0.4910. 2016. 0.7228. 0.5075. 2017. 0.6749. 0.5814. 29. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(37) 神經網路在訓練結束及挑選後,我們便可將該模型應用於未來實際觀察到的 指標,並藉此預測未來股價走勢是屬於上漲或是下跌的類別。表 5 使用混淆矩陣 (Confusion Matrix)來評估神經網路的分類效果,將預測類別和測試資料的實際類 別進行對比,可以發現在實際下跌類別較多的情況下,神經網路也傾向預測下跌 類別,而準確率是神經網路正確預測下跌和上漲類別的比率,以機率值門檻 0.5 作為判斷漲跌類別的依據。然而我們真正關心的是預測上漲的股票中,實際也上 漲的比率,以判斷股票未來是否具有上漲潛力,從而正確的將資金做投資分配, 以獲得該段投資期間的報酬,可以發現表 5 在預測上漲的類別中,實際上漲的比. 政 治 大 經網路的預測上漲準確率是否隨著機率值門檻的提高而亦有所提高,如圖 12 所 立. 率不到 50%。為了提高投資組合的勝率,我們可以將機率值門檻提高,以檢驗神. 示,可以發現大多數的神經網路在門檻提高至 0.5 以上皆呈現上升趨勢,然而部. ‧ 國. 學. 分神經網路在門檻 0.7 以上開始下降,且在門檻 0.9 時不一定會有預測機率值;. ‧. 究其原因如圖 13 所示,可以發現大多數年度的預測機率值落在 0.5 附近,在 0.7. io. er. 本文以機率值門檻 0.6 作為判斷漲跌類別的依據。. sit. y. Nat. 以上的分類結果較少,且準確率較不穩定,容易隨著分類數量而有明顯差異,故. n. a表l 5、預測分類結果(2011 年)i v n Ch U engchi 實際類別. 預 測 類 別. 下跌. 上漲. 下跌. 117,513. 59,649. 上漲. 49,280. 36,885. 30. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(38) 100% 80% 60% 40% 20% 0% 0.1. 0.2. 0.3. 0.4. 0.5. 0.6. 0.7. 0.8. 0.9. 機率值門檻 2011. 2012. 2013. 2014. 2015. 2016. 2017. 政 治 大. 圖 12、機率值門檻與勝率關係(技術指標_20 日). 立. 學 ‧. ‧ 國 io. sit. y. Nat. n. al. er. 勝 率. Ch. engchi. i n U. v. 圖 13、各年度預測機率分佈. 31. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(39) 本文使用二十個技術指標,預測未來二十日的收盤價漲跌走勢是否大於交易 成本,故主要策略為若股價漲幅大於交易成本,則以隔日開盤價買進,並持有該 段期間,再以開盤價賣出;亦考慮機率值門檻為 0.6,以提高神經網路的預測勝 率,以及每檔股票投資權重為 0.2,也就是在股票買進日將預測機率值從高至低 依序排列,將閒置資金的 20%依序配置於每檔股票,以符合投資人實際的持股情 況。表 6 列出主策略在各年度和全年度的所有績效評估情況,可以發現在預測勝 率較高的情況下(如 2014、2015 年),該策略的年化報酬率較高,而在預測勝率較 低的情況下(如 2011、2017 年),其年化報酬率較低,可以推論神經網路的預測勝. 政 治 大 如圖 14、15 和 16 所示,可以發現除了 2011 和 2017 年外,其餘年度的年化報酬 立. 率和年化報酬率似乎存在正向關係;另與大盤指數(上海綜指、深圳成指)相比較,. 率皆優於大盤指數,惟其標準差雖然也稍高,但從夏普比率來看依然優於大盤指. ‧ 國. 學. 數,可能由於持有股數較少使得基金較容易波動,可透過增加投資股數來解決標. ‧. 準差的問題。此外,約在 2015 年大陸股市出現一波瘋牛行情,神經網路在此期. 4000. y. sit. al. n. 5000. io. 6000. er. 7000. Nat. 間表現較為突出,而在市場走跌的情況下,其表現則較為一般。. Ch. engchi. i n U. v. 3000 2000 1000 0 1998/7/24 2001/4/19 2004/1/14 2006/10/10 2009/7/6 2012/4/1 2014/12/272017/9/22 2020/6/18 上海綜指. 深圳成指. 圖 14、大盤指數每日收盤價走勢. 32. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(40) 表 6、技術指標_20 天出場_門檻 0.6_權重 0.2 累積報. 年化報. 年化標. 夏普比. 最大回. 酬率. 酬率. 準差. 率. 撤率. 7.30%. 28.85%. 2013. 41.23%. 44.13%. 27.01%. 2014. 92.25%. 95.88%. 24.97%. 109.31% 114.44%. 52.77%. 2015. 平均持. 交易次. 子. 利金額. 金比率. 有期間. 有股數. 數. -3365. 4.34%. 31. 7. 87. 513. 4.22%. 31. 12. 137. 4739. 7.21%. 31. 8. 87. 1.5690. -14.46%. 60.92%. 1.0947. 3.7697. -12.00%. 69.01%. 2.3042. 12994. 7.77%. 34. 6. 71. 2.1355. -46.44%. 72.29%. 0.8915. 13170. 8.20%. 33. 8. 83. -24.43%. 55.93%. 0.9333. 973. 6.15%. 32. 5. 59. -5354. 5.76%. 32. 6. 69. 2246. 6.62%. 31. 7. 600. 5.74%. 5.94%. 41.70%. 0.1005. 2017. -36.94%. -37.89%. 33.43%. -1.1858. All. 134.74%. 13.74%. 35.13%. 0.3336. io. 2016. y. 7.03%. 平均持. sit. 2012. 閒置資. er. 30.68%. 平均獲. ‧. -30.08%. 獲利因. 學. -29.28%. Nat. 2011. 勝率. 治 政 -1.0375 -50.24% 42.53% 0.9739 大 立 0.5171 -30.96% 45.26% 1.4196 ‧ 國. 預測年. n. 33.33% 0.9321 a-46.26% iv l C n -53.52% U h e 55.50% n g c h i 1.0194. 33. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(41) 年化報酬率 140% 120% 100% 80% 60% 40% 20% 0% -20%. 2011. 2012. 2013. 2014. 2015. 2016. 2017. all. -40% -60% 主策略. 上海綜指. 深圳成指. 政 治 大. 圖 15、主策略與大盤之年化報酬率比較. 學. 夏普比率. ‧. n. al. er. io. sit. y. Nat. 4.5 4.0 3.5 3.0 2.5 2.0 1.5 1.0 0.5 0.0 -0.5 -1.0 -1.5. ‧ 國. 立. 2011. 2012. Ch. 2013. 主策略. e2014 hi n g c2015 上海綜指. i n U2016. v. 2017. all. 深圳成指. 圖 16、主策略與大盤之夏普比率比較. 34. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(42) 第三節、情境分析 本文接下來將討論五種情境分析方法,分別為機率值門檻、股票投資權重、 預測期間天數、神經網路特徵變數和出場規則,以比較各組之間的差異情況。. 一、機率值門檻情境 本文使用機率值門檻 0.7 與原策略進行比較,如圖 17、18、19 和附錄(表 7) 所示。可以發現除了 2011 和 2017 年,其餘年度的表現皆明顯劣於主策略,且從 閒置資金比率和交易次數來看,其資金運用的空窗期較多,可能與門檻 0.7 以上. 政 治 大. 的股數較少有關,雖然預測勝率稍高,但亦有可能因為股數較少使得準確率較不. 立. 學. ‧ 國. 穩定,且在股數選完後有更大機會選到較差的股票。. 基金走勢. ‧. 5,000,000 4,500,000 4,000,000 3,500,000 3,000,000 2,500,000 2,000,000 1,500,000 1,000,000 500,000 0 2011/1/4 2012/1/4 2013/1/4 2014/1/4 2015/1/4 2016/1/4 2017/1/4. n. er. io. sit. y. Nat. al. Ch. engchi. 主策略. i n U. v. 門檻0.7. 圖 17、主策略門檻之基金走勢比較. 35. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(43) 年化報酬率 140% 120% 100% 80% 60% 40% 20% 0% -20%. 2011. 2012. 2013. 2014. 2015. 2016. 2017. all. -40% -60% 主策略. 門檻0.7. 政 治 大. 圖 18、主策略門檻之年化報酬率比較. 學. 夏普比率. ‧. n. al. er. io. sit. y. Nat. 4.5 4.0 3.5 3.0 2.5 2.0 1.5 1.0 0.5 0.0 -0.5 -1.0 -1.5. ‧ 國. 立. 2011. 2012. Ch. 2013. e2014 hi n g c2015 主策略. i n U2016. v. 2017. all. 門檻0.7. 圖 19、主策略門檻之夏普比率比較. 36. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(44) 二、股票投資權重情境 本文使用股票投資權重 0.1 和 0.05 與原策略進行比較,如圖 20、21、22 和 附錄(表 8、9)所示。可以發現三者的表現差異不大,且趨勢幾乎一致,除了 2011 和 2017 年呈現負的年化報酬率,其餘年度皆為正值,而三者中以主策略表現稍 優;從年化標準差和最大回撤率來看,主策略的基金波動較多,可能與其每次持 有股數較少有關,使得基金走勢高度依賴於特定股票,導致平均獲利金額較不穩 定,時常有大起大落的情況。. 基金走勢 治 政 大. 5,000,000 4,500,000 4,000,000 3,500,000 3,000,000 2,500,000 2,000,000 1,500,000 1,000,000 500,000 0 2011/1/4 2012/1/4 2013/1/4 2014/1/4 2015/1/4 2016/1/4 2017/1/4. 立. ‧. ‧ 國. 學. n. Ch. 權重0.1. engchi. er. io. sit. y. Nat. 主策略. al. 權重0.05. i n U. v. 圖 20、主策略權重之基金走勢比較. 37. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(45) 年化報酬率 140% 120% 100% 80% 60% 40% 20% 0% -20%. 2011. 2012. 2013. 2014. 2015. 2016. 2017. all. -40% -60% 主策略. 權重0.1. 權重0.05. 政 治 大. 圖 21、主策略權重之年化報酬率比較. 學. 夏普比率. ‧. n. al. er. io. sit. y. Nat. 4.5 4.0 3.5 3.0 2.5 2.0 1.5 1.0 0.5 0.0 -0.5 -1.0 -1.5 -2.0. ‧ 國. 立. 2011. 2012. Ch. 2013. 主策略. 2014. 2015. engchi 權重0.1. i n 2016 U. v. 2017. all. 權重0.05. 圖 22、主策略權重之夏普比率比較. 38. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(46) 三、預測天數情境 本文使用預測期間 10 天和 5 天與原策略進行比較,如圖 23、24、25 和附錄 (表 10、11 和圖 32、33)所示。可以發現 10 天和 5 天的基金走勢大致相同,且表 現皆明顯劣於 20 天,而三者各年度的年化報酬率方向大致相同,以 20 天的變化 程度較大;從最大回撤率、勝率和交易次數來看,持有期間只有 10 天和 5 天的 交易次數較為頻繁,使得投資報酬容易被交易成本抵銷,導致勝率較低,且換股 次數頻繁,使得基金走勢更容易受到特定股票的波動影響,究其原因可以發現 10 天和 5 天在門檻 0.6 以上的預測勝率並未像主策略有明顯的上升趨勢,可能推論. 政 治 大. 該神經網路使用的技術指標比較適合用於 20 天的預測期間。. 立. ‧ 國. 學. 基金走勢. ‧. 5,000,000 4,500,000 4,000,000 3,500,000 3,000,000 2,500,000 2,000,000 1,500,000 1,000,000 500,000 0 2011/1/4 2012/1/4 2013/1/4 2014/1/4 2015/1/4 2016/1/4 2017/1/4. n. er. io. sit. y. Nat. al. Ch. 主策略. engchi 預測5天. i n U. v. 預測10天. 圖 23、主策略天數之基金走勢比較. 39. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(47) 年化報酬率 140% 120% 100% 80% 60% 40% 20% 0% -20% -40% -60% -80%. 2011. 2012. 2013. 2014. 主策略. 預測10天. 2015. 2016. 2017. all. 預測5天. 政 治 大. 圖 24、主策略天數之年化報酬率比較. 學. 夏普比率. ‧. n. al. er. io. sit. y. Nat. 4.5 4.0 3.5 3.0 2.5 2.0 1.5 1.0 0.5 0.0 -0.5 -1.0 -1.5 -2.0 -2.5. ‧ 國. 立. 2011. 2012. Ch. 2013. 主策略. 2014. 2015. engchi 預測10天. i n U 2016. v. 2017. all. 預測5天. 圖 25、主策略天數之夏普比率比較. 40. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(48) 四、特徵變數情境 本文使用過去二十日股價日報酬變數與原策略進行比較,如圖 26、27、28 和附錄(表 12、圖 34)所示。可以發現兩者基金走勢差異不大,且各年度年化報酬 率的方向大致相同;從最大回撤率和交易次數來看,基金走勢波動和股票交易次 數大致相同,且神經網路在門檻 0.6 以上的預測勝率同樣呈現上升趨勢,惟其勝 率和獲利因子較主策略稍差,且閒置基金比率稍高,使得每次交易獲得的投資報 酬相對較少,究其原因可能推論受限於投資股數的影響,在股票預期能獲得正報 酬卻無足夠的閒置資金能進行投資,或是在買進股票當日較少有高報酬的股票。. 政 治 大. 然而整體來說神經網路對於同樣二十日的預測期間,不論是使用技術指標或股價. 立. 學. ‧ 國. 作為特徵變數都有不錯的效果。. 基金走勢. ‧. 5,000,000 4,500,000 4,000,000 3,500,000 3,000,000 2,500,000 2,000,000 1,500,000 1,000,000 500,000 0 2011/1/4 2012/1/4 2013/1/4 2014/1/4 2015/1/4 2016/1/4 2017/1/4. n. er. io. sit. y. Nat. al. Ch. engchi 主策略. i n U. v. 股價. 圖 26、主策略變數之基金走勢比較. 41. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(49) 年化報酬率 140% 120% 100% 80% 60% 40% 20% 0% -20%. 2011. 2012. 2013. 2014. 2015. 2016. 2017. all. -40% -60% 主策略. 股價. 政 治 大. 圖 27、主策略變數之年化報酬率比較. 學. 夏普比率. ‧. n. al. er. io. sit. y. Nat. 4.5 4.0 3.5 3.0 2.5 2.0 1.5 1.0 0.5 0.0 -0.5 -1.0 -1.5 -2.0. ‧ 國. 立. 2011. 2012. Ch. 2013. 2014. 2015. engchi 主策略. i n 2016 U. v. 2017. all. 股價. 圖 28、主策略變數之夏普比率比較. 42. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(50) 五、出場規則情境 本文使用結合 MACD 和 RSI 的技術分析出場方式與原策略進行比較,如圖 29、30、31 和附錄(表 13)所示。將原有策略搭配技術分析出場的方式,目的是希 望在投資期間若已達到出場條件,則盡早獲利了結以避免多餘損失,或是在投資 期間屆滿時,若無達到出場條件則繼續持有股票,從而在未來預期的上漲空間持 續獲得報酬,以避免因為固定期間出場而產生二度交易的情況。然而可以發現, 在約 2015 年後不論是基金走勢和各年度年化報酬率皆明顯劣於主策略,且從勝 率和獲利因子來看,其勝率較低,然而獲利因子卻有明顯提升,顯示雖然較多股. 政 治 大. 票提早出場,但在投資期間獲得正報酬的股票,搭配出場條件更能提升其獲利能. 立. 力。就其整體報酬率較低的原因,可能推論大多數股票在預測期間內即以達到出. ‧ 國. 學. 場條件,交易頻繁使得交易成本因素導致賠付比率較高,若是額外考慮進場策略 則有失神經網路預測的初衷,且可投資股數將明顯下降許多,有些股票亦可能呈. ‧. 先下跌後上漲的走勢,技術分析的出場方式似乎不適合用於本策略。. io. sit. y. Nat. 基金走勢. n. al. er. 5,000,000 4,500,000 4,000,000 3,500,000 3,000,000 2,500,000 2,000,000 1,500,000 1,000,000 500,000 0 2011/1/4 2012/1/4 2013/1/4 2014/1/4 2015/1/4 2016/1/4 2017/1/4. Ch. engchi. 主策略. i n U. v. 技術分析出場. 圖 29、主策略出場之基金走勢比較. 43. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

(51) 年化報酬率 140% 120% 100% 80% 60% 40% 20% 0% -20%. 2011. 2012. 2013. 2014. 2015. 2016. 2017. all. -40% -60% 主策略. 技術分析出場. 政 治 大. 圖 30、主策略出場之年化報酬率比較. 學. 夏普比率. ‧. n. al. er. io. sit. y. Nat. 4.5 4.0 3.5 3.0 2.5 2.0 1.5 1.0 0.5 0.0 -0.5 -1.0 -1.5 -2.0. ‧ 國. 立. 2011. 2012. Ch. 2013. 2014. 2015. engchi. 主策略. i n 2016 U. v. 2017. all. 技術分析出場. 圖 31、主策略出場之夏普比率比較. 44. DOI:10.6814/THE.NCCU.RMI.009.2018.F08.

參考文獻

相關文件

 develop a better understanding of the design and the features of the English Language curriculum with an emphasis on the senior secondary level;..  gain an insight into the

Wang, Solving pseudomonotone variational inequalities and pseudocon- vex optimization problems using the projection neural network, IEEE Transactions on Neural Networks 17

In this paper, we have studied a neural network approach for solving general nonlinear convex programs with second-order cone constraints.. The proposed neural network is based on

volume suppressed mass: (TeV) 2 /M P ∼ 10 −4 eV → mm range can be experimentally tested for any number of extra dimensions - Light U(1) gauge bosons: no derivative couplings. =&gt;

One of the technical results of this paper is an identifi- cation of the matrix model couplings ti(/x) corresponding to the Liouville theory coupled to a

Define instead the imaginary.. potential, magnetic field, lattice…) Dirac-BdG Hamiltonian:. with small, and matrix

incapable to extract any quantities from QCD, nor to tackle the most interesting physics, namely, the spontaneously chiral symmetry breaking and the color confinement.. 

• Formation of massive primordial stars as origin of objects in the early universe. • Supernova explosions might be visible to the most