卷積神經網路預測時間序列能力分析 - 政大學術集成

全文

(1)國立政治大學金融學系研究所碩士學位論文. 卷積神經網路預測時間序列能力分析. 政治大 Convolutional Neural Network 立. Analysis of the Predictive Ability of Time Series Using. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 指導教授：廖四郎博士研究生：賴嘉蔚撰. 中華民國一零七年六月 DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(2) 卷積神經網路預測時間序列能力分析研究生：賴嘉蔚. 指導教授：廖四郎博士. 國立政治大學金融系摘要. 政治大網路化等過程。而現階段，金融則是正處於自動化和智能化的階段。在本研究中，立. 金融發展與科技一直以來都是密切相關的。整體來看，金融歷經了電子化、. ‧ 國. 學. 我們試圖將深度學習的概念與技術，應用於金融商品價格走勢的預測。主要概念是將金融商品一段時間的開盤價、最高價、最低價、收盤價一維時間序列資料二. ‧. 維化，從過去傳統一維測度的角度研究時間序列走勢，到本研究將視角提升到二. sit. y. Nat. 維的測度。接著利用在圖像辨識有著卓越表現的卷積神經網路(CNN)進行特徵的. io. er. 萃取，進行金融商品未來漲跌的分類，藉此達到預測走勢的效果，進而建構一套可以穩定擊敗大盤的交易策略。實證發現，透過將時間序列二維化的方法，模型. al. n. v i n Ch 能比單純輸入時間序列數值學習到更多的資訊，績效也更穩定。而在預測金融商 engchi U. 品價格走勢之外，我們一樣可以透過利用人工智慧的技術，創新金融商品和服務的模式，改善客戶體驗、提高服務效率。因此，在台灣開始發展金融科技之際，以期本研究有助於往後的研究者、金融機構和監理機關研發相關的技術。. 關鍵字：深度學習、卷積神經網路、二維化、時間序列預測、演算法交易. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(3) Analysis of the Predictive Ability of Time Series with Convolutional Neural Network Student：Chia-Wei Lai. Advisor Dr. Szu-Lang Liao. Department of Money and Banking, National Chengchi University. Abstract Financial development and technology are always closely related. On the whole,. 政治大. finance has gone through the process of electronicization and networking. At the. 立. present stage, finance is in the process of automatization and intelligentization. In this. ‧ 國. 學. paper, we try to apply the concepts and techniques of deep learning to the forecast of. ‧. price trend of financial products. The main concept is that we transform onedimensional time-series data of opening price, highest price, lowest price, closing price. y. Nat. io. sit. into two-dimensional planes. From the past, most researchers used one-dimensional. n. al. er. measure to study time-series. Now we use two-dimensional measure to study time-. Ch. i n U. v. series. Then, we use the convolution neural network (CNN), which has excellent. engchi. performance in image recognition to capture features and make the classification of price trend, so as to achieve the effect of forecasting price trend and construct a trading strategy which can stably beat the market. The empirical result show that deep learning models can learn better by using the method of visualization than simply inputting time series values and the performance is more stable. Therefore, as Taiwan begins to develop FinTech, it is hoped that this paper will help future researchers, financial institutions, and supervision agencies develop related technologies. Keywords: Deep learning, Convolutional neural network,Visualization, Prediction of Time series, Algorithmic Trading. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(4) 謝辭時光荏苒，不知不覺就到了要即將畢業的季節。在政大這兩年的期間，非常感謝廖四郎老師給予的指導與幫助，讓我在兩年的研究生涯中總是保持著滿滿的能量。從碩一下開始結構債評價的專案以及美國 QE 政策對亞洲股匯市波動度之影響的研究計畫，除了在每次的討論中總是能對金融市場有新的體悟，更重要的是了解如何將書本上的理論轉化成分析市場的工具。到碩二開始花費整整一年的時間致力於研究機器學習和深度學習。雖然廣泛的研究範圍再加上實習的工作讓我體力有點吃不消，但在經過這些訓練後也讓我穫益良多，以及對我未來的職涯皆有很大的幫助。. 政治大. 立. 這篇論文花了近一年的時間研究，當中碰到許多難題，感謝資管系的劉文卿. ‧ 國. 學. 老師在課堂上給予寶貴的建議，不管是在機器學習技術以及在使用的觀念上，對於並無資訊背景的我皆有相當大的助益。同時也要感謝同門師兄的柏宇、采駿、. ‧. 綿綿、唐寧、宇軒，一起挺過艱難的研究時光。還有要感謝同為做機器學習在交. y. Nat. sit. 易上應用論文的 Jackal，我們常常討論到半夜兩三點，隔天還要昏昏沉沉的去上. n. al. er. io. 班，爆肝研究的日子令人難忘。. i n U. v. 謝謝在我實習時遇到的好夥伴，Frank、馬丁以及同為實習生的 Evan，在工. Ch. engchi. 作之餘還要聽我介紹我的研究，並在市場上進行大量的實驗及測試，以便我更能透視機器學習的能力，進而加以改進在應用上的觀念。同時也是在研究之餘閒聊的對象，在背後承受研究壓力時也能一同歡笑。最後要感謝我的家人，不斷的在背後支持我，讓我可以無後顧之憂的依照我的興趣探索和學習，沒有你們，就沒有今日的我。我會不斷地追求卓越，以不辜負你們對我的期待。. 賴嘉蔚謹誌 2018 年 6 月. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(5) 目錄第一章緒論 ....................................................................................................... 1 第一節研究動機.................................................................................................. 1 第二節研究目的.................................................................................................. 2 第三節研究背景.................................................................................................. 3 第四節研究架構.................................................................................................. 5. 第二章文獻回顧 ............................................................................................... 6 第一節計量方法預測時間序列之相關文獻...................................................... 6 第二節機器學習方法預測時間序列之相關文獻.............................................. 6 第三節文獻回顧總結.......................................................................................... 7. 治政大第一節卷積神經網路.......................................................................................... 8 立 .................................................................................. 8 第二節卷積神經網路架構. 第三章研究方法 ............................................................................................... 8. ‧ 國. 學. 第三節研究對象................................................................................................ 17 第四節一維時間序列資料二維化.................................................................... 20. ‧. 第五節實驗架構................................................................................................ 22. 第四章實證分析 ............................................................................................. 26. sit. y. Nat. 第一節建構交易策略及績效評估因子............................................................ 26. io. er. 第二節實證結果................................................................................................ 28 一、 GASF 搭配 (10k+15k+30k) ............................................................. 29. n. al. i n U. v. 二、 GADF 搭配 (10k+15k+30k) ............................................................ 33. Ch. engchi. 三、 GASF 搭配 (15k+30k+60k) ............................................................. 37 四、 GADF 搭配 (15k+30k+60k) ............................................................ 41 五、 GASF 搭配 (30k+60k+日 k) ............................................................ 45 六、 GADF 搭配 (30k+60k+日 k) ........................................................... 49 七、對照組 Neural Network 之結果比較 ................................................ 53. 第五章結論與建議 ......................................................................................... 57 第一節結論........................................................................................................ 57 第二節未來展望................................................................................................ 58. 附錄 59 參考文獻 66. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(6) 表目錄表 1 台灣證券交易所股價指數期貨契約規格......................................... 18 表 2 敘述統計............................................................................................. 19 表 3 樣本外獲利比較................................................................................. 30 表 4 交易統計............................................................................................. 30 表 5 混淆矩陣............................................................................................. 31 表 6 樣本外獲利比較................................................................................. 34 表 7 交易統計............................................................................................. 34 表 8 混淆矩陣............................................................................................. 35. 政治大. 表 9 樣本外獲利比較................................................................................. 38. 立. 表 10 交易統計........................................................................................... 38. ‧ 國. 學. 表 11 混淆矩陣........................................................................................... 39 表 12 樣本外獲利比較............................................................................... 42. ‧. 表 13 交易統計........................................................................................... 42. y. Nat. 表 14 混淆矩陣........................................................................................... 43. io. sit. 表 15 樣本外獲利比較............................................................................... 46. n. al. er. 表 16 交易統計........................................................................................... 46. i n U. v. 表 17 混淆矩陣........................................................................................... 47. Ch. engchi. 表 18 樣本外獲利比較............................................................................... 50 表 19 交易統計........................................................................................... 50 表 20 混淆矩陣........................................................................................... 51 表 21 樣本外獲利比較............................................................................... 54 表 22 交易統計........................................................................................... 54 表 23 混淆矩陣........................................................................................... 55 表 24 策略之績效比較............................................................................... 57. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(7) 圖目錄圖 1 LeNet 架構 ............................................................................................ 9 圖 2 池化層................................................................................................. 11 圖 3 感知器(Perceptron) ............................................................................ 12 圖 4 多層感知器......................................................................................... 12 圖 5 類神經網路架構................................................................................. 13 圖 6 台指期交易制度................................................................................. 17 圖 7 台指期走勢......................................................................................... 18 圖 8 GASF 二維化範例 ............................................................................... 21. 政治大. 圖 9 3 種不同分 k 代表紅綠藍三原色 ..................................................... 23. 立. 圖 10 不同分 k 時間序列及 GASF 金融影像 ............................................ 23. ‧ 國. 學. 圖 11 GASF 作圖及對應標籤 ..................................................................... 24 圖 12 訓練、驗證(Validation)及測試資料集............................................ 25. ‧. 圖 13 交易邏輯........................................................................................... 26. y. Nat. 圖 14 模型架構與參數............................................................................... 29. io. sit. 圖 15 策略績效與回檔............................................................................... 30. n. al. er. 圖 16 多空單績效比較............................................................................... 31. i n U. v. 圖 17 日損益分析....................................................................................... 32. Ch. engchi. 圖 18 月損益分析....................................................................................... 32 圖 19 年損益分析....................................................................................... 32 圖 20 模型架構與參數............................................................................... 33 圖 21 策略績效與回檔............................................................................... 34 圖 22 多空單績效比較............................................................................... 35 圖 23 日損益分析....................................................................................... 36 圖 24 月損益分析....................................................................................... 36 圖 25 年損益分析....................................................................................... 36 圖 26 模型架構與參數............................................................................... 37 圖 27 策略績效與回檔............................................................................... 38 圖 28 多空單績效比較............................................................................... 39. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(8) 圖 29 日損益分析....................................................................................... 40 圖 30 月損益分析....................................................................................... 40 圖 31 年損益分析....................................................................................... 40 圖 32 模型架構與參數............................................................................... 41 圖 33 策略績效與回檔............................................................................... 42 圖 34 多空單績效比較............................................................................... 43 圖 35 日損益分析....................................................................................... 44 圖 36 月損益分析....................................................................................... 44 圖 37 年損益分析....................................................................................... 44 圖 38 模型架構與參數............................................................................... 45. 政治大. 圖 39 策略績效與回檔............................................................................... 46. 立. 圖 40 多空單績效比較............................................................................... 47. ‧ 國. 學. 圖 41 日損益分析....................................................................................... 48 圖 42 月損益分析....................................................................................... 48. ‧. 圖 43 年損益分析....................................................................................... 48. y. Nat. 圖 44 模型架構與參數............................................................................... 49. io. sit. 圖 45 策略績效與回檔............................................................................... 50. n. al. er. 圖 46 多空單績效比較............................................................................... 51. Ch. i n U. v. 圖 47 日損益分析....................................................................................... 52. engchi. 圖 48 月損益分析....................................................................................... 52 圖 49 年損益分析....................................................................................... 52 圖 50 模型架構與參數............................................................................... 53 圖 51 策略績效與回檔............................................................................... 54 圖 52 多空單績效比較............................................................................... 55 圖 53 日損益分析....................................................................................... 56 圖 54 月損益分析....................................................................................... 56 圖 55 年損益分析....................................................................................... 56 圖 56 兩層類神經網路、四個神經元....................................................... 59 圖 57 反向傳播........................................................................................... 62 圖 58 反向傳播........................................................................................... 64. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(9) 第一章緒論. 第一節研究動機時間序列的分析與預測一直是國內外許多學者研究的課題，尤其在資本市場裡股價行為分析、資產定價和證券投資等等多年來一直是研究領域的熱點。本研究試圖利用深度學習的技術與概念，套用到金融市場的資料上，進行時間序列的分析與預測。. 政治大在 2012 年，Krizhevsky 提出 Alexnet [18]並在 ILSVR（ImageNet Large Scale 立. ‧ 國. 學. Visual Recognition Competition）由 ImageNet 所舉辦的年度大規模視覺識別挑戰賽獲得冠軍，以極大差距擊敗當時火紅的機器學習技術，例如 SVM、KNN…。. ‧. 自此之後深度學習技術開始吸引全球關注。在 2016 年，Google 團隊所研發的圍. sit. y. Nat. 棋人工智慧 Alpha Go 與世界棋王李世石的對決中拿下四勝一敗的成績，該機器. io. er. 其中有部分利用圖形辨識的深度學習技術框架所組成，其棋力遠遠勝過過去所有的圍棋軟體，也掀起世界一股深度學習的浪潮。而 2017 年，Google 團隊又發表. al. n. v i n CZero，該版本不須依靠人類玩家的數據，透過自了 Alpha Go 的最新版 AlphaGo hengchi U 我對弈，在訓練三天後以 100 比 0 的比數擊敗李世石版本的 Alpha Go。不再受限於人類認知，對於人工智慧的開發具有重大意義。深度學習雖然不是新的概念，但最近才成為熱門的研究對象。目前主流且基礎的深度學習演算法為 NN(Neural Network)、CNN(Convolution Neural Network) 以及 RNN(Recurrent Neural Network)等。由於近幾來年來深度學習概念成功的創舉，因此本研究嘗試將深度學習的概念引入金融領域。. 1. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(10) 第二節研究目的本研究中，將使用深度學習 CNN(Convolution Neural Network)對台灣加權股價指數期貨的未來走勢進行預測，以評估深度學習之概念套用於金融商品價格走勢預測的可行性，進而建構可以穩定擊敗大盤的交易策略。透過各種大量市場的分鐘資料，例如不同分 k 中的開盤價、最高價、最低價、收盤價，讓類神經網路反覆地進行訓練，擷取出可以決定未來走勢的特徵。然而卷積神經網路其卓越的能力為圖形辨識，因此勢必要將一維的時間序列資料轉換. 政治大. 為二維的圖像資料。Wang and Oates (2015)提出格拉姆角場(Gramian Angular Field,. 立. GAF)的概念[29]，GAF 的作法是發想自線性代數裡格拉姆矩陣(Gramian Matrix)，. ‧ 國. 學. 其重要的應用為計算在一個向量的集合裡每個向量是否兩兩線性獨立。在本研究中，將會針對兩種 GAF 作圖方法進行實證分析。. ‧. sit. y. Nat. 以往因為時間序列通常具有自我相關的性質，因此在深度學習領域許多時間. io. er. 序列預測上的研究是用遞迴式神經網路(RNN)作為研究方法。然而將時間序列經過二維化的轉換後，原本一段的時間序列可以從原本單純數值的觀點轉換到空間. al. n. v i n Ch 的概念，得到任兩兩時間點數值間的關係。本研究試圖從不同的角度來看時間序 engchi U 列的關係，企圖從二維的圖像裡找出在時間序列裡可以決定未來走勢的因素。. 2. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(11) 第三節研究背景從 1950 年代，經濟領域開始使用電腦進行分析，當時研究景氣循環及股價走勢的學者認為，若能掌握幾個較重要的總體經濟指標，將有助於了解經濟繁榮與蕭條的交替變化，甚至能夠進行預測。而因股價常被視為能夠反映公司前景及景氣循環的領先指標，因此股市的表現遂成為許多學者觀察及研究的對象。 Kendall (1953)是率先從事相關研究的學者之一，他發現股價變化的隨機性。換言之，投資人其實很難根據過去的資料來預測未來的股價。因此 Kendall (1953). 政治大. 認為股價呈現隨機漫步[15]。新資訊隨機產生，而股價迅速反映新資訊，因此股. 立. 價走勢也隨機波動，不具可預測性。Fama (1970)提出了效率市場假說[9]，意即股. ‧ 國. 學. 價反映了所有可以獲得的資訊。根據效率市場假說，投資人無法藉由其擁有的公開資訊獲得超額報酬。. ‧. sit. y. Nat. 然而，在效率市場假說提出後，受到許多學者的挑戰。學界曾觀察某些財務. io. er. 變數，來檢測是否具有解釋及預測市場報酬的能力。Keim and Stambaugh (1986) 發現，來自債券市場的資訊有助於預測股市[14]。Fama and French (1988)指出，. al. n. v i n Ch 當股利收益率(現金股利除以股價)愈高時，整體股票市場的報酬也越高[10]。 engchi U Campbell and Shiller (1987)發現，盈餘率可以有效預測市場報酬[5]。Jegadeesh and Titman (1993)觀察股價中期(三至十二月)走勢，指出前期股價表現較好的公司，其未來表現也較佳，這種強者恆強的現象稱為動能效應(momentum effect)[13]。 Basu (1997)發現，本益比效應(P/E effect)，低本益比投資組合的平均報酬，高於高本益比投資組合的平均報酬[3]。Banz (1981)發現規模效應(size effect)，他指出若投資人將 NYSE 的股票一事質大小分成十組，市值規模較小的公司會產生較高的報酬[2]。Fama and French (1992)發現，公司的帳面價值和市值之間的比率 (book to market ratio)可形成一個具有正報酬的投資組合，Fama and French 將公司 3. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(12) 分為十個群組，結果發現帳面市值比高的群組平均報酬高於帳面市值比低的平均報酬，這種現象稱為帳面市值比效應(book to market effect)[11]。綜上所述，在財務領域中，規模效應、本益比效應、動能效應和帳面市值比效應等無法被效率市場假說解釋，因為這些超額報酬的存在隱含市場不具效率性。Moskowitz et al. (2012)提出時間序列自身的動能效應，不管是在證券、商品、債券和外匯都有動能的現象，其建構的動能策略投資組合即使是經過系統性風險因子的控制後依然存在超額報酬[23]。AQR 資產管理公司創辦人 Asness et al. (2013)發現價值策略除了可以用在股票，其他無法衡量價值商品如外匯、債券一樣可以用論文裡所定. 政治大在上述基本分析外(fundamental analysis)，技術分析(technical analysis)也是許立. 義的價值方式取得超額報酬[1]。. ‧ 國. 學. 多學者研究的領域，而部分學者認為技術分析確實有其價值，Lu et al. (2015)利用 8 種 k 棒特徵、3 種定義趨勢方式以及 4 種出場策略在美國股市獲得超額報酬. ‧. [22]。技術分析是研究股價的週期性和預測股價走勢的線形圖，利用股價的歷史. sit. y. Nat. 資料取出不同的特徵來預測股價的走勢，例如由價、量等資料計算出各種技術指. n. al. er. io. 標(MA、RSI、KD、MACD…)，供投資人作為進出場參考的依據。由於部分投資. v. 人仰賴技術指標執行交易策略，影響了他們的交易行為，也會進而影響到股市的. Ch. engchi. i n U. 表現。近年來，程式交易興起，透過電腦軟體，並利用市場上常用之技術指標建構出投資策略，讓交易邏輯系統化、一致化，達到快速交易的目的，使得技術指標能在市場上更有效地被利用。. 4. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(13) 第四節研究架構. 確立研究動機與目的. 蒐集資料. 文獻探討. 政治大. 確立研究架構. 學. ‧ 國. 立. 研究方法. ‧. Nat. CNN 技術研究. er. io. sit. y. 時間序列二維化. n. al. i n C 建構交易策略及績效評估因子 hengchi U. v. 實證結果. 結論與建議. 5. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(14) 第二章文獻回顧. 第一節計量方法預測時間序列之相關文獻金融市場的價格是由投資人買賣雙方所決定的。在行為財務學的觀點，市場價格並不只由證券的內在價值所決定，在很大程度上受到投資者主體行為的影響, 即投資者心理與行為對金融市場的價格決定及其變動具有重大影響。與效率市場假說不同，行為財務學家認為，投資人是非理性的，其容易受到公開資訊所影響，. 政治大. 如財經新聞，過去的價格走勢等等。因此，以計量方法和資料探勘技術對金融市. 立. 場做預測開始被認為是有可能做到的。. ‧ 國. 學. 在傳統財務領域，一直有許多學者嘗試利用各種計量模型預測股票市場的報. ‧. 酬。Bengio et al. (2001)利用 Input/Output Hidden Markov Models 預測未來報酬分. sit. y. Nat. 配並和其他模型做比較[4]。Xu et al. (2007)建立 Bayesian copula models，並使用. io. er. 調整後的 GARCH model 分析股價指數報酬的時間序列[30]。Platanios and Chatzis (2014)利用 GPMCH model 針對市場報酬的時間序列做波動度的建模[24]。. n. al. Ch. engchi. i n U. v. 第二節機器學習方法預測時間序列之相關文獻機器學習方法也有許多學者應用於金融市場價格的預測，其中以向量支持機 (SVM)強大的分類學習能力最常被用來作為金融市場價格預測的技術。Chen and Kao (2013)運用向量支持機(SVM)結合粒子群聚演算法(PSO)和 Fuzzy time series 對台灣加權股價指數進行預測[7]。Kercheval and Zhang (2013)利用 SVM 方法分析限價委託單價量關係的動態過程並分類，並對短期市場走勢進行預測[16]。. 6. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(15) 此外，在深度學習中神經網路的概念也很早就被應用在財務領域，並在金融市場的預測佔有一席之地。Tino et al. (2011)使用神經網路模型 Recurrent Neural Network 預測市場指數的波動度，並建構選擇權跨式(straddle)交易策略[28]。同樣使用 Recurrent Neural Network，Kwon and Moon (2007).利用技術指標作為輸入值，並利用基因演算法(GA)訓練神經網路的參數，對 NASDAQ 指數以及其他 36 間公司的股價以文字探勘進行預測[19]。Chapados and Bengio (2001).建構神經網路模型預測多倫多 300 綜合指數報酬，並搭配 VaR 模型做資產配置[6]。Sitte and Sitte (2000).將 Time Delay Neural Network 應用於 S&P500 價格的預測[26]。Gencay. 政治大比較[12]。Takeuchi (2013)將神經網路方法搭配傳統財金領域橫斷面以及縱斷面立 and Gibson (2007).運用神經網路模型預測 S&P 歐式選擇權價格，並和 BS 模型做. 的動能策略，在美國股票的實證上有優異的表現[27]。黃君平(2016)同樣利用卷. ‧ 國. 學. 積神經網路進行台指期未來走勢的預測，並取得不錯的準確度[32]。. ‧. 第三節文獻回顧總結. io. sit. y. Nat. n. al. er. 綜上所述，不管是使用較傳統的計量模型，或是較新的機器學習和深度學. i n U. v. 習技術，都不乏有學者應用於金融市場的預測領域，由此可知大眾對於金融市. Ch. engchi. 場的預測興致盎然。然而，以往的研究主要是人類主觀意識決定會影響未來金融市場走勢的變數，進而進行市場預測。本研究嘗試從不同的角度來預測金融市場，我們將利用卷積神經網路卓越的圖形辨識能力，讓深度學習本身自我提取可以有效預測市場走勢的特徵，找出市場可能潛在的規則，觀察是否能得到相較以往金融市場預測更好的結果。. 7. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(16) 第三章研究方法. 第一節卷積神經網路卷積神經網路(Convolution Neural Network，CNN)最初是為了解決圖像辨識等問題設計的，其現在的應用已不僅限於圖像或影片，也可用於時間序列訊號。例如，聲音訊號、文字資料等。卷積神經網路概念最早出自於 1860 年科學家提出的感受區(Receptive Field)。當時科學家在研究貓的視覺皮層細胞時發現，每一. 政治大. 個視覺神經元只會處理一小塊區域的視覺圖像，稱為感受區。而卷積神經網路. 立. (CNN)的概念[20]是由 LeCun et al. (1995)率先提出，接著 LeCun et al. (1998)確立. ‧ 國. 學. 了卷積神經網路(CNN)的架構[21]，並用於手寫數字辨識取得卓越的成果。而在金融市場的預測領域，以往的研究主要是人類主觀意識決定會影響未來金融市場. ‧. 走勢的變數，進而進行市場預測。本研究嘗試從不同的角度來預測金融市場。投. y. Nat. sit. 資人在研究股價行為時，很難同時進行多個技術分析、財務指標和總經指標等一. n. al. er. io. 維時間序列的資料裡找出可以在市場上獲利的規則。而本研究透過將原本多個一. i n U. v. 維時間序列的資料轉換為二維圖像資料，將視角提升到二維的測度，再利用卷積. Ch. engchi. 神經網路卓越的圖形辨識能力，讓深度學習本身自我提取可以有效預測市場走勢的特徵，找出有可能存在市場中的規則，企圖萃取出能夠決定金融商品未來走勢決定性的因素。. 第二節卷積神經網路架構本研究中，將使用深度學習 CNN(Convolution Neural Network)對台灣加權指數期貨的未來走勢進行預測，以評估深度學習之概念套用於金融商品價格走勢預測的可行性，進而建構可以穩定擊敗大盤的交易策略。所使用的卷積神經網路架 8. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(17) 構為參考[21]的內容。如圖 1 所示，包含兩層卷積層(Convolution layer)、兩層池化層(pooling)、兩層隱藏層(hidden layer)和一層輸出層(Output layer)。本篇不同的是只使用一層隱藏層，而激勵函數使用 Krizhevsky (2012)在 AlexNet 架構裡提出的 relu 函數，並使用 RMSProp 作為參數最佳化的演算法。. 政治大. 圖 1 LeNet 架構1. 立. ∞. ∫ 𝑓(𝜏)𝑔(𝑥 − 𝜏)𝑑𝜏. 學. ‧ 國. (1) 卷積(convolution). (1). −∞. ‧. y. Nat. 上述式子是在定義域連續的卷積定義，直觀的解釋是函數𝑔從左到右掃過函. er. io. sit. 數𝑓所重疊面積的量，並且有滑動平均的效果。我們可以將函數𝑔想像成濾鏡，將函數𝑓掃過一遍後，若得到新的函數與𝜏軸所夾的面積較大，則代表函數𝑔和函數. al. n. v i n 𝑓具有相似的形狀，也可以說函數𝑔補捉到函數𝑓的特徵。在卷積式類神經網路的 Ch engchi U 卷積層裡。就是利用這種概念，提取圖片中某些重要的特徵，不僅大幅減少所需要訓練的參數，也提高圖形辨識的準確度。在卷積神經網路中，第一個卷積層會直接接受圖像像素級的輸入，每一個卷積的操作只處理一小塊圖像，進行卷積變化後再傳到後面的神經網路，每一層卷積(濾鏡)都會提取資料中最有效的特徵。這種方法可以提取到圖像中最基礎的特徵，例如不同方向的邊或者拐角，而後再進行組合形成更高階的特徵，因此 CNN. 1. LeCun, Y., L. Bottou, Y. Bengio, and P. Haffner, (1998). Gradient-based learning applied to document recognition. p.7 9. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(18) 可以應對各種情況，理論上具有對圖像縮放、平移和旋轉的不變性。一般的卷積神經網路由多個卷積層所構成，以下將詳細說明 CNN 裡卷積的運算。 (1.a) 卷積層在影像處理的卷積運算，相當於濾鏡運算，以下舉例說明： 0 5 ( 2 1. 1 0 3 2. 0 1 4 8. 2 3 3 ) ⊗ (3 0 0 0. 1 2 37 0 1) = (𝑎 21 2 5. 𝑎12 ) 𝑎22. 𝑎11 = (0 × 3 + 1 × 3 + 0 × 0) + (5 × 1 + 0 × 0 + 1 × 2). 政治大. (2). (3). + (2 × 2 + 3 × 1 + 4 × 5) = 3 + 7 + 27 = 37. 立. 如上述所示，卷積運算是在輸入資料透用濾鏡，而輸入資料是擁有垂直、水. ‧ 國. 學. 平形狀的資料，濾鏡也同樣擁有垂直、水平方向的維度，輸入大小為(4,4)，濾鏡. ‧. 大小為(3,3)，輸出大小為(2,2)。透過卷積運算，可以提取出圖片裡重要的特徵。在卷積神經網路中，可以設定多個濾鏡，分別用來提取圖片中不同的特徵。. sit. y. Nat. io. n. al. er. (1.b) 填補(padding). i n U. v. 進行卷積運算之前，可以在輸入資料的周圍填上固定的數值(例如 0)，這個. Ch. engchi. 動作稱為填補(padding)，也是在卷積運算中常用的處理，目的是為了避免輸入的圖片在經過反覆的卷積後變得極小，而無法再進行卷積運算。 (1.c) 步幅(stride) 濾鏡移動的位置間隔稱作步幅(stride)，上述例子設定的步幅為 1。若步幅變大，輸出就會變小。 (1.d) 池化層(polling) 池化層是縮小垂直、水平空間的運算，以下以最大池化舉例說明： 10. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(19) 1. 2. 0. 5. 0. 2. 6. 4. 2. 6. 4. 3. 0. 1. 4. 3. 1. 0. 3. 2. 圖 2 池化層圖八是以2 × 2的最大池化進行處理，步幅為 2。最大池化是用來取得最大值，. 政治大. 2 × 2是代表成為處理對象的區域大小。如圖所示，針對2 × 2區域，取出最大元. 立. 素，並設定步幅為 2，因此(4,4)大小的輸入資料經由池化層的作用，輸出變為(2,2)。. ‧ 國. 學. 池化層的功能為吸收資料中的偏差值，即使輸入資料出現小偏差，池化層仍會回傳相同結果，具有穩健性的效果。另外經過池化層的作用，會保留圖片中最顯著. ‧. 的特徵，會更專注於圖片中是否存在相符的特徵，而非圖片中哪裡存在這些特徵，. y. Nat. n. al. er. io. 平均值。. sit. 提升模型訓練的速度。除了最大池化外，還有平均池化，效果是計算目標區域的. (2) 感知器(perceptron). Ch. engchi. i n U. v. 感知器(perceptron)，又被稱作人工神經元(artificial neuron)或單純感知器 (simple perceptron)，是美國研究員 Rosenblatt 在 1957 年提出的概念，而感知器為造就類神經網路(深度學習)的重要演算法，以下將詳細說明何謂感知器。感知器是收到多個輸入訊號後，經由感知器內部的函數作用，而得到一個新的訊號，接下來以接收兩個輸入訊號的感知器為例來說明：. 11. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(20) 圖 3 感知器(Perceptron) 圖 3 中的感知器可用以下式子表達： −1, { 1,. 立. 政治大. 𝑖𝑓 𝑤0 + 𝑤1 𝑥1 + 𝑤2 𝑥2 ≥ 0 𝑖𝑓 𝑤0 + 𝑤1 𝑥1 + 𝑤2 𝑥2 < 0. (4). ‧ 國. 學. 其中𝑥1 、𝑥2 為輸入訊號，經過𝑤1 、𝑤2的加權並加上偏移項(bias) 𝑤0，經過激勵函數(Active function)非線性的轉換，如果加總大於等於 0 輸出 1，小於 0 則輸. ‧. 出 0，以上即為感知器運作原理。. y. Nat. sit. 然而單一感知器其極限在於只能用一條直線表現劃分的區域，若是處理非線. n. al. er. io. 性分類問題則無法用單一感知器解決，而解決的辦法是可以將多個單一感知器疊. i n U. v. 層，利用疊層的方式，即可執行非線性的分類。如圖 4 所示。. Ch. engchi. 圖 4 多層感知器. 12. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(21) 類神經網路的概念與多層感知器(multilayer perceptron, MLP)相似，其概念可由圖 5 表示：. 政治大. 學. ‧ 國. 立. 圖 5 類神經網路架構2. ‧. (3) 激勵函數(Active function). sit. y. Nat. 而其中類神經網路和感知器不同的地方在激勵函數的種類，在感知器中選擇. al. n. sigmoid 函數以及 relu 函數，以下分別說明： (3.a) sigmoid 函數：. Ch. engchi. ℎ(x) =. er. io. 的激勵函數為階梯函數(unit step function)，在類神經網路中，常見的激勵函數為. i n U. v. 1 1 + 𝑒𝑥𝑝(−𝑥). (5). 在神經網路中，使用屬於激勵函數的 sigmoid 函數轉換訊號，轉換後的訊號就會傳給下一個神經元，其輸出會介於 0 到 1 之間的實數。在 LeCun et al. (1998) 所提出的 CNN 架構中即使用 sigmoid 函數做為神經元的激活函數。. 2. J.P. Morgan. Big Data and AI Strategies - Machine Learning and Alternative Data Approach to Investing. p. 103 13. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(22) (3.b) relu 函數： ℎ(𝑥) = 𝑚𝑎𝑥 (𝑥, 0). (6). relu 函數為當今類神經網路使用最多的激活函數，最早在 Krizhevsky et al. (2012)所提出的 AlexNet 架構中所使用，其原因為可以減少在訓練過程中運算的速度以及解決梯度消失的問題。 (4) Softmax 函數經網路可以用來解決分類問題與迴歸問題，而在本計畫則是用來解決上漲下. 政治大 𝑒𝑥𝑝(𝑎 ). 跌的分類問題，因此在輸出層的設計會使用 softmax 函數，是以下列算式表示：. 立. 𝑦𝑘 =. 𝑘 𝑛 ∑𝑖=1 𝑒𝑥𝑝(𝑎𝑖 ). (7). ‧ 國. 學. 如上式(7)所示，softmax 函數的輸出是 0 到 1 之間的實數，此外，softmax 函數輸. ‧. 出的總合為 1，這是 softmax 函數非常重要的性質。因為這個性質的關係，使得. sit. n. er. io. (5) 損失函數(Loss function). al. y. Nat. softmax 函數的輸出可以解釋為機率的概念。. i n U. v. 在神經網路的學習中，即是一個最佳化的問題，因此需要設計一個目標函. Ch. engchi. 數，而神經網路中所使用的指標稱作損失函數(loss function)，而最常被使用的損失函數即為交叉熵誤差(cross entropy error)，可以使用以下式子表達： 𝑚. 𝑘. 1 (𝑖) (𝑖) (𝑖) (𝑖) 𝐽(𝑤) = − ∑ ∑(𝑦𝑗 𝑙𝑜𝑔𝑦̂𝑗 + (1 − 𝑦𝑗 )log(1 − 𝑦̂𝑗 )) 𝑚 𝑖=1 𝑗=1. (𝑖). (8). (𝑖). m 為樣本數，k 為輸出層神經元的數量。𝑦̂𝑗 為預測值，𝑦𝑗 為實際值，若兩者不同會使得損失函數有較大的值。. 14. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(23) (6) 梯度下降法(Gradient Descent) 在神經網路中，更新參數的方法通常利用的是梯度下降法來進行參數權重的訓練，其參數更新的方法可以用下列式子表示：. 𝑤 ←𝑤−α. 𝜕 𝐽(𝑤) 𝜕𝑤. (9). 𝜕. 其中𝑤以向量形式表示，α為學習速率(learning rate)，若𝜕𝑤 𝐽(𝑤)為負，代表增加 𝑤可以降低損失函數，因此根據上述疊代方法會增加𝑤，反之同理，即可達到降低損失函數的效果。. 政治大. (7) 反向傳播演算法(Backpropagation) [25]. 立. 在做感知器學習時，可以使用梯度下降法來更新參數，而類神經網路本身即. ‧ 國. 學. 是多層感知器所構成的，因此也可以使用梯度下降法來做訓練。但類神經網路在. ‧. 訓練的過程中，需要分為兩個步驟，前向傳播(Propagation Forward)和反向傳播 (Backpropagation)。也就是要先給參數初值，再從輸入層(Input layer)把輸入值傳. y. Nat. io. sit. 送到輸出層(Output layer)，再根據損失函數從輸出層往回傳遞誤差(Error)到每一. n. al. er. 層神經元，去更新層與層之間權重的參數。詳細計算可參照附錄。 (8) 最佳化(Optimization). Ch. engchi. i n U. v. (8.a) 隨機梯度下降法(stochastic gradient descent, SGD). 𝑤 ←𝑤−α. 𝜕 𝐽(𝑤) 𝜕𝑤. (10). 隨機梯度下降法公式如上所示，與梯度下降法的公式相同，不同的地方是在更新權重時只會隨機挑選部分樣本，目的是為了可以提升訓練速度，但因為只看部份的樣本，所以帶來的缺點是前進的方向不一定是正確的，而造成在訓練的過程中卡在區域最佳解而非全域最佳解。. 15. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(24) (8.b) 動量(momentum). 𝑤 ←𝑤−α. 𝜕 𝐽(𝑤) + 𝑣 𝜕𝑤. (11). 應用物理的觀念，我們讓𝑣對應物理的速度，將物體往梯度方向的受力加上物體的速度，藉此降低參數在訓練過程中卡在區域最佳解的機率。 (8.c) AdaGrad[8]. ℎ←ℎ+. 立. 𝜕 𝜕 𝐽(𝑤) ⊙ 𝐽(𝑤) 𝜕𝑤 𝜕𝑤. (12). 1 𝜕 政治 𝐽(𝑤) √ℎ + 𝜀 𝜕𝑤大. 𝑤 ←𝑤−α. (13). ‧ 國. 學. 在神經網路的學習中，學習速率α的值非常重要。學習速率太小，會花費太多時間在學習上；相對來說，若學習速率太大，就會向外擴散，無法正確學習。. ‧. 上述公式的ℎ代表的是過去訓練梯度值得平方，因此在更新參數時，會藉由ℎ來調. sit. y. Nat. 整學習規模，經常變動的參數，學習速率會下降，讓在訓練的過程中慢慢降地學. al. n. (8.d) Adam[17]. io. 母為 0。. er. 習速率，避免在靠近最佳解時因速率太大而跑過頭。其中𝜀的設定是為了避免分. Ch. engchi. i n U. v. 此優化方法式結合了動量(momentum)和 AdaGrad 的優點，可以有效探索參數空間。 (8.e) RMSProp RMSProp 優化方法是對 AdaGrad 加以改良，由於過去梯度的平方可能會有很大的變化，RMSProp 利用移動平均法的概念，將過去梯度的平方作移動平均，如此一來可以解決 AdaGrad 學習速率忽大忽小的情況，並且更加穩定。本研究將使用 RMSProp 作為最佳化的演算法。 16. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(25) (9) 正規化(Regularization) (9.a) Ridge regression 𝑚. 𝑘. 𝑛. 1 (𝑖) (𝑖) (𝑖) (𝑖) 𝐽(𝑤) = − ∑ ∑(𝑦𝑗 𝑙𝑜𝑔𝑦̂𝑗 + (1 − 𝑦𝑗 )log(1 − 𝑦̂𝑗 )) + 𝛼 ∑ 𝑤𝑘2 𝑚 𝑖=1 𝑗=1. 𝑘=1. (14). 由於深度學習參數較多，因此很容易發生過擬合的情形(overfitting)。透過上式，當在優化參數時，損失函數會慢慢變小，在過程當中即會逞罰過大的參數，如此一來就可以解決過擬合的情形。. 治. 政研究對象大第三節. 立. ‧. ‧ 國. 的交易制度：. 學. 本研究所研究的標的為台灣加權指數期貨，以下先簡介台灣加權指數期貨. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 6 台指期交易制度在 1998/7 台指期貨上市，交易時間為早上 9:00 至下午 12:15，一天交易時間共 3 小時 15 分鐘，成交方式為集中競價。2001/1 延長交易時間，交易時間為早上 8:45 到下午 1:45，一天交易時間共 5 小時。在 2002/7 月，成交制度方面有重大改革，從原本集中競價的方式改為逐筆搓合，迎合國際趨勢。2017/5 新增夜盤交易，交易時間由下午 3:00 至早上 5:00，因此一天之交易時間增加為 19 小時。. 17. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(26) 為了避免實證結果受到不同交易制度所影響，本研究使用 2003/1/2 至 2017/12/29 日盤交易時間由早上 8:45 到下午 1:45 約 15 年之分鐘資料，共 110,6996 筆，其中包含每分鐘之開盤價、最高價、最低價和收盤價。期間的資料發展走勢於下圖展示。. 立. 政治大. ‧. ‧ 國. 學圖 7 台指期走勢. y. Nat. sit. 圖 7 展示本研究標的之價格總體走勢，以每分鐘收盤價繪製而成，從圖中. n. al. er. io. 可以看出四段大跌，分別是 2003 年台灣爆發 SARS 危機、2008 年全球金融海嘯、. i n U. v. 2011 年歐債危機及 2015 年中國股災。其餘則大多呈現上漲走勢。. Ch. engchi. 臺灣期貨交易所目前共上市 30 種商品，總計有近 300 項商品在臺灣期貨交易所掛牌交易。以下為台灣加權指數期貨契約規格簡介：表 1 台灣證券交易所股價指數期貨契約規格3 項目交易標的. 3. 內容臺灣證券交易所發行量加權股價指數. 台灣期貨交易所 18. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(27) 中文簡稱. 臺股期貨. 英文代碼. TX. 交易時間 . 1. 本契約交易日同臺灣證券交易所交易日 2. 一般交易時段之交易時間為營業日上午 8:45~下午 1:45；到期月份契約最後交易日之交易時間為上午 8:45~下午 1:30 3. 盤後交易時段之交易時間為營業日下午 3:00~次日上午 5:00；到期月份契約最後交易日無盤後交易時段.  . 契約價值. 臺股期貨指數乘上新臺幣 200 元. 契約到期 . 1. 自交易當月起連續二個月份，另加上三月、六月、九月、十二月中三個接續的季月契約在市場交易 2. 新交割月份契約於到期契約最後交易日之次一營業日一般交易時段起開始交易. 交割月份 . 立. 各交易時段最大漲跌幅限制為前一一般交易時段每日結算價. ‧ 國. 學. 漲跌幅限制. 政治大. 上下百分之十指數 1 點（相當於新臺幣 200 元）. Nat. y. 各契約的最後交易日為各該契約交割月份第三個星期三. io. 以現金交割，交易人於最後結算日依最後結算價之差額，以. n. al. er. 交割方式. sit. 最後交易日. 淨額進行現金之交付或收受保證金. ‧. 最小升降單位.  . Ch. engchi. 原始保證金：83,000 維持保證金：64,000. i n U. v. 本研究使用 2003/1/2 至 2017/12/29 日盤交易時間由早上 8:45 到下午 1:45 約 15 年之台股期貨，在此樣本空間下進行敘述統計，結果請見下表。表 2 敘述統計平均值. 標準差. 中位數. 最大值. 最小值. 全距. 每日漲跌. 1.6. 94.29. 5. 543. -567. 1110. 每日成交量. 7,8419.07. 4,3444.34. 7,7693. 38,3062. 2305. 38,0757. 19. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(28) 第四節一維時間序列資料二維化卷積神經網路其卓越的能力為影像辨識，因此勢必要將一維的時間序列資料轉換為二維的圖像資料。Wang and Oates (2015)提出格拉姆角場(Gramian Angular Field, GAF)的概念[29]，GAF 的作法是發想自線性代數裡格拉姆矩陣(Gramian Matrix)，其重要的應用為計算在一個向量的集合裡每個向量是否兩兩線性獨立。 GAF 的概念和作法是先將時間序列資料𝑋 = {𝑥1 , 𝑥2 , … , 𝑥𝑛 }透過下面兩種公式進行標準化： 𝑖 𝑥̃−1. 政治大. (𝑥𝑖 − 𝑚𝑎𝑥(𝑋)) + (𝑥𝑖 − 𝑚𝑖𝑛(𝑋)) = 𝑚𝑎𝑥(𝑋) − 𝑚𝑖𝑛(𝑋). 立. (16). ‧. ‧ 國. 𝑥𝑖 − 𝑚𝑖𝑛(𝑋) 𝑚𝑎𝑥(𝑋) − 𝑚𝑖𝑛(𝑋). 學. 𝑥̃0𝑖 =. (15). sit. y. Nat. 透過(15)(16)式可將其值落在[-1,1]和[0,1]之間，本研究採用[0,1]區間。接者將調. io. n. al. er. 整過後的時間序列資料X̃ 透過下式轉換為極座標(Polar coordinate system)的形式：. i n U. 𝜑𝑖 = 𝑎𝑟𝑐𝑐𝑜𝑠(𝑥̃𝑖 ) , 0 ≤ 𝑥̃𝑖 ≤ 1, 𝑥̃𝑖 ∈ X̃ { 𝑖 𝑟𝑖 = , 𝑖 ∈ 1,2, … , 𝑛 𝑛. Ch. engchi. v. (17). 其中𝜑𝑖 ，𝑟𝑖 分別為極座標系統裡角座標和半徑座標。而𝑐𝑜𝑠(𝜑)在[0, π]區間裡是一個單調遞減(monotonic decreasing)函數，因此在此區間具有映射(bijection)性質，可將轉換後的角度還原為調整後時間序列X̃ 。當我們將調整後時間序列資料X̃ 轉換成極座標後，就可以利用角度的相加和相減，來透視任意兩兩時間點時間序列的關係(temporal correlation)。下個步驟 Wang and Oates 提出兩種二維化方式，分別是 Gramian Summation Angular Field (GASF)和 Gramian Difference Angular Field (GADF)，以下為其定義方式： 20. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(29) ′. 𝐺𝐴𝑆𝐹 = [𝑐𝑜𝑠(𝜑𝑖 + 𝜑𝑗 )] = 𝑋̃ ′ 𝑋̃ − √𝐼 − 𝑋̃ 2 √𝐼 − 𝑋̃ 2 ′. 𝐺𝐴𝐷𝐹 = [𝑠𝑖𝑛(𝜑𝑖 − 𝜑𝑗 )] = √𝐼 − 𝑋̃ 2 𝑋̃ − 𝑋̃ ′ √𝐼 − 𝑋̃ 2. (18). (19). 其中𝐼為單位向量。以𝐺𝐴𝑆𝐹為例，更具體的表達方式如下所示： 𝑐𝑜𝑠(𝜑1 + 𝜑1 ) 𝑐𝑜𝑠(𝜑1 + 𝜑2 ) 𝑐𝑜𝑠(𝜑2 + 𝜑1 ) 𝑐𝑜𝑠(𝜑2 + 𝜑2 ) 𝐺𝐴𝑆𝐹 = ( ⋮ ⋮ 𝑐𝑜𝑠(𝜑𝑛 + 𝜑1 ) 𝑐𝑜𝑠(𝜑𝑛 + 𝜑2 ). ⋯ 𝑐𝑜𝑠(𝜑1 + 𝜑𝑛 ) ⋯ 𝑐𝑜𝑠(𝜑2 + 𝜑𝑛 ) ) ⋱ ⋮ ⋯ 𝑐𝑜𝑠(𝜑𝑛 + 𝜑𝑛 ). (20). 治政大利用這兩種二維化方式有幾項優勢。第一，保存時間序列相依性(temporal 立 dependency)，因為隨著時間增加，時間序列資料對於矩陣中的位置會從右下往左 ‧ 國. 學. 上推移，保持著時間序列資料的連續性，讓我們在二維化時不失原本時間序列的. ‧. 特性。第二，保存時間序列相關性(temporal correlations)，因為𝐺(𝑖,𝑗||𝑖−𝑗|=𝑘) 表達的是在時間差距 k 之下，藉由角度的相加或相減表示相對的時間序列資料關係。第. y. Nat. io. sit. 三，保存一維時間序列資料的資訊，矩陣的對角線𝐺𝑖,𝑖 保存著原始時間序列的角. n. al. er. 度資訊，也可透過 cos 函數將角度資訊還原為調整後時間序列資料X̃ 。. Ch. engchi. i n U. v. 圖 8 GASF 二維化範例圖 8 為 GASF 二維化範例，左圖是過去 60 分鐘台指期收盤價的時間序列，透過二維化的方式，可以形成右圖60 × 60的影像。. 21. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(30) 第五節實驗架構本篇所使用的卷積神經網路架構為參考[21]的內容，如圖 1 所示，包含兩層卷積層(Convolution layer)、兩層池化層(pooling)、兩層隱藏層(hidden layer)和一層輸出層 (Output layer) 。本篇不同的是只使用一層隱藏層，而激勵函數使用 Krizhevsky (2012)在 AlexNet 架構裡提出的 relu 函數，並使用 RMSProp 作為參數最佳化的演算法。而研究流程主要由資料預處理、資料訓練、資料測試與績效檢測所組成。其. 政治大. 中資料預處理的部分除了會將原始資料二維化之外，同時會讓原始時間序列資料. 立. 資料之值限縮於[0,1]的範圍。. ‧ 國. 學. 在資料訓練的部分，首先會將資料通過卷積層和池化層進行資料的卷積和池. ‧. 化，在此以非監督式的方式進行特徵的提取，接著送入神經網路得到輸出值，此. sit. y. Nat. 為前向傳播法(Forward Propagation)的過程；下一步為將輸出值對應實際的資料. io. er. 標籤，進行反向傳播法(Back Propagation)的步驟，調整神經網路與卷積層的權重及偏值(bias)，調整完後再讓下一批(batch)資料輸入。直到所有資料訓練完畢，視. n. al. Ch. 為一次的訓練(epoch)，接著重複多次訓練。. engchi. i n U. v. 資料測試的部分，會將測試資料作為輸入，得到的輸出會和實際資料做比對，最後得出模型混淆矩陣(confusion matrix)與精確度(accuracy) (1) 時間刻度本研究最小可使用的時間刻度為 1 分鐘，但為了避免無效訊號過多以及節省計算效能，本篇以投資人常用的 10 分 k、15 分 k、30 分 k、60 分 k 和日 k 做為實證測試之時間刻度。 (2) 圖片生成方式及二維資料大小 D 圖片的生成方式與品質為最後決定模型結果好壞的關鍵因素。本篇將各種分 22. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(31) k 之開盤價，最高價，最低價和收盤價取平均，形成這分 k 之時間序列，此步驟可降低資料誤差以及市場價格異常所造成的負面影響。為了能在一張圖片裡容納更多資訊，本研究參考 Zheng et al. (2014)多重通道卷積神經網路(Multi-Channels Convolutional Neural Networks)的概念[31]，再利用彩色圖片為三原色構成的原理，將原來二維矩陣加上色版方向形成三維矩陣。而以三種不同分 k 代表紅綠藍三原色，企圖讓一張圖片容納不同分 k 性質的資訊，最後形成一張金融影像。. 學. 圖 9 3 種不同分 k 代表紅綠藍三原色. ‧. ‧ 國. 立. 政治大. 展示 3 種不同分 k，分別是 30 分 k，60 分 k，日 k 代表著紅綠藍三原色。. n. er. io. sit. y. Nat. al. Ch. engchi. v. i n U. 圖 10 不同分 k 時間序列及 GADF 金融影像圖 10 中左圖的部分即為圖 9 中三種圖片的原始時間序列，經由格拉姆角場 (Gramian Angular Field)的轉換形成圖 9，而右圖為將圖 9 中三張圖片疊加起來所形成的一張金融影像，作為最後輸入模型的輸入值。而決定使用過去多少時間來生成一張圖片，本篇設定 D=60，以 10 分 k、15 分 k 和 30 分 k 所形成的一張金融影像為例，即一張圖片在不同色版分別包含過 23. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(32) 去兩天、三天和六天的資訊。為了測試一張金融影像裡放多少長度的分 k 可以讓模型有較好的準確度以及在實際交易時考慮手續費後依然有穩定的績效，本篇實證會測試 3 種不同分 k 組合，分別為(10k+15k+30k)、(15k+30k+60k)和(30k+60k+日 k)。 (3) 預測未來時間長度 F 本研究設定讓模型預測下一個時間刻度走勢。以 10 分 k、15 分 k 和 30 分 k 組合為例，模型每 10 分鐘會發出一次買賣訊號，即預測的是 10 分鐘後的漲跌走勢。15k 和 30k 以此類推。. 政治大本研究將時間序列走勢預測問題設計為分類問題，分別讓每張圖片配對相對立. (4) 標籤. 應的標籤。若未來 F 時間上漲則設為 1，也就是買進；若未來 F 時間下跌則設為. ‧ 國. 學. 0，也就是賣出，共分為 2 類。. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 11 GASF 作圖及對應標籤. 24. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(33) (5) Epoch、Batch size 和 Iteration 由於當數據量龐大時，一次性的將數據輸入模型是不可能的，因此我們需要將數據區分成一小塊一小塊，而每塊的大小就是 Batch size。當一個完整的數據集全被神經網路學習過一次後，稱作一個 Epoch。然而在神經網路中數據集只被學習一次是不夠的，通常需要完整訓練多次才能讓 loss function 有機會達到全域最小值(Global minimum)。Iteration 是 Batch 需要完才一個 Epoch 的次數，舉例來說，對於一個有 2000 個訓練樣本的數據集，若將 Batch size 設定為 100，那麼完成一個 Epoch 需要 20 次 Iteration。而每次的 Iteration 都是神經網路更新參數的. 政治大. 時候。本篇每個實驗皆預設 Epoch 為 15 次，Batch size 設定為 200。. 立. (6) 訓練、驗證(Validation)及測試資料集. ‧ 國. 學. 市場上的表現變化多端，背景環境和投資人的習慣也隨著時間有著不同的變化。然而為了讓 CNN 模型能夠學習到市場的多空交替，設定 2003/1/2-2012/12/31. ‧. 為訓練資料集，當中包含 3 次主要下跌期，分別是 2003 年 SARS 危機、2008 年. y. Nat. sit. 全球金融海嘯以及 2011 年歐債危機；以 2013/1/1-2013/12/31 做為驗證資料集調. n. al. er. io. 整模型參數；最後以 2014/1/1-2017/12/29 做為測試資料集，其中包含 2015 年中. i n U. v. 國股災 1 次下跌期，作為模型的壓力測試，觀察模型是否能通過下跌期的考驗。. Ch. engchi. 圖 12 為訓練、驗證(Validation)及測試資料集示意圖。. 圖 12 訓練、驗證(Validation)及測試資料集 25. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(34) 第四章實證分析. 第一節建構交易策略及績效評估因子本篇一共對 3 種不同時間刻度以及兩種不同作圖方式做實證分析，檢測在何種時間刻度下以及何種作圖方式能讓 CNN 模型較有效率的學習並萃取出市場可能存在的規則。因此總共有 6 種實驗，最後實驗七為單純 Neural Network 之對照組。在每種實驗下皆會建構相同邏輯的交易策略，如圖 13 所示。. 立. 政治大. ‧. ‧ 國. 學. n. 圖 13 交易邏輯. Ch. engchi. er. io. sit. y. Nat. al. i n U. v. 上圖為本篇建構的交易邏輯，在時間 t 之下，CNN 模型將會預測 t+1 時為上漲或下跌，圖 13 以上漲為例，就會在 t 時買進一口台股期貨。接著進到時間 t+1 時，模型依然預測上漲，因此原本手上的多單就維持不動。進入到 t+2 時，模型預測下跌，此時會將手上的一口多單平倉並賣出一口，往後以此類推。此交易策略並無加減碼及停損停利機制，顯示的是最單純直覺的交易邏輯，目的是在此交易邏輯下可以完全體現出 CNN 模型的預測能力，不受其他因素干擾。手續費設定為交易一次 0.5 點(100 新臺幣)，買進賣出皆會計算，來回一趟 (先買進後賣出平倉或先賣出後買進平倉)共 1 點(200 新臺幣)。此外，得出回測績效後會計算績效評估因子來檢測策略品質，主要有以下 7 個： 26. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(35) (1) 回檔(drawdown) 在交易策略執行期間，出現負的報酬就被稱作回檔，回檔是一個連續虧損的概念，若出現連續的負報酬會被累積記錄。 (2) 最大策略虧損報酬(NP/MDD) 最大策略虧損報酬為策略執行期間之淨利(Net Profit, NP) /最大回檔(Max Drawdown, MDD)，用於衡量權益曲線的平滑程度，概念類似夏普值(Sharpe ratio)。 (3) 多空單績效比較將多空單績效拆開並比較，檢視策略績效來源為多單較多、空單較多或多空單平均貢獻。 (4) 日損益分析. 立. 政治大. 將每日損益以機率密度函數呈現，計算交易策略 VaR 以及 Expected Shortfall，. ‧ 國. 學. 衡量策略出現尾端事件風險的大小。. ‧. (5) 月損益分析. y. Nat. 以月度來看策略報酬，在相對長的時間裡檢視策略報酬是否穩定，從心理層. n. (6) 年損益分析. al. er. io. 心。. sit. 面來說若連續虧損數月，例如連續虧損 3 個月 4 個月以上即會對策略逐漸失去信. Ch. engchi. v. i n U. 以年度來看策略報酬，在相對更長的時間下檢視策略是否年年賺錢，或是在其中幾年是虧損的。 (7) 總交易次數、勝率、賺賠比、多空單平均持有時間檢測 CNN 模型發出訊號的頻率多寡以及有效訊號是否足夠。賺賠比定義為每個交易平均賺的錢除以平均賠的錢。. 27. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(36) 第二節實證結果實驗一到六皆包含兩層卷積層(Convolution layer)、兩層池化層(pooling)、一層隱藏層(hidden layer)和一層輸出層(Output layer)。激勵函數使用 Krizhevsky (2012)在 AlexNet 架構裡提出的 relu 函數，並使用 RMSProp 作為參數最佳化的演算法。在時間序列圖形化的部分，本研究實證兩種作圖方法，分別是 GASF 以及 GADF，而這兩種作圖方法在傳達時間序列關係的本質有些差異。. 政治大 𝑐𝑜𝑠(𝜑 + 𝜑 ) 𝑐𝑜𝑠(𝜑 + 𝜑 ) ⋯ 𝑐𝑜𝑠(𝜑 立 𝑐𝑜𝑠(𝜑 + 𝜑 ) 𝑐𝑜𝑠(𝜑 + 𝜑 ) ⋯ 𝑐𝑜𝑠(𝜑. ⋮ ⋮ 𝑐𝑜𝑠(𝜑𝑛 + 𝜑1 ) 𝑐𝑜𝑠(𝜑𝑛 + 𝜑2 ). + 𝜑𝑛 ) 2 + 𝜑𝑛 )) ⋱ ⋮ ⋯ 𝑐𝑜𝑠(𝜑𝑛 + 𝜑𝑛 ). 𝑠𝑖𝑛(𝜑1 − 𝜑1 ) 𝑠𝑖𝑛(𝜑1 − 𝜑2 ) 𝑠𝑖𝑛(𝜑2 − 𝜑1 ) 𝑠𝑖𝑛(𝜑2 − 𝜑2 ) 𝐺𝐴𝐷𝐹 = ( ⋮ ⋮ 𝑠𝑖𝑛(𝜑𝑛 − 𝜑1 ) 𝑠𝑖𝑛(𝜑𝑛 − 𝜑2 ). ⋯ 𝑠𝑖𝑛(𝜑1 − 𝜑𝑛 ) ⋯ 𝑠𝑖𝑛(𝜑2 − 𝜑𝑛 ) ) ⋱ ⋮ ⋯ 𝑠𝑖𝑛(𝜑𝑛 − 𝜑𝑛 ). 1. 1. 2. 2. 1. 2. 2. 1. (21). 學. n. engchi. sit. io. Ch. (22). er. Nat. al. y. ‧. ‧ 國. 𝐺𝐴𝑆𝐹 = (. 1. i n U. v. GASF 為一對稱矩陣，由於 GASF 是由𝑐𝑜𝑠函數生成的關係，因此會無法表達時間序列先後的關係，但在矩陣對角線的部分可以保留原時間序列的資訊。在另一方面，GADF 是由𝑠𝑖𝑛函數所生成的矩陣，有辦法傳遞時間序列先後的關係，但因對角線都是 0 的關係，因此其缺點為喪失將時間序列還原的能力。以下共有 7 種實驗結果，前 6 種實驗由 3 種時間刻度 10 分 k、15 分 k 和 30 分 k，以及配上兩種作圖方式來檢測模型準確度和交易績效是否有明顯差異。實驗七為單純 Neural Network 之對照組，檢測將時間序列二維化是否有其價值。. 28. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(37) 一、 GASF 搭配 (10k+15k+30k) 選用的時間刻度為 10 分 k、15 分 k 以及 30k，取用過去 60 個時間單位，再根據 GADF 轉換公式將 3 種時間序列二維化(圖形化)，結合成一張金融影像。每往後一個時間單位(10 分鐘)生成一張圖片，分別標上未來一個時間單位(10 分鐘) 後的漲跌 1 或 0，最後進入 CNN 模型做訓練。 (1) 模型架構與參數模型參數如圖 14 所示，第一層卷積設計 70 個濾鏡，第二層卷積層設有 40 個濾鏡，接著進入隱藏層一共有 550 個神經元，同時用 Ridge regression 懲罰過. 政治大. 大參數，超參數 α 設定為 0.01，最後輸出層有兩個神經元做為漲跌的分類。模. 立. 型一共包含 497,8852 個參數需要訓練。. ‧ 國. 學 ‧. Convolution layer: 70 Max pooling. Nat. sit. n. al. er. io Hidden layer: 550 Ridge regression. y. Convolution layer: 40 Max pooling. Ch. engchi. i n U. v. Output layer: 2 圖 14 模型架構與參數 (2) 策略績效與回檔如圖 15 所示，策略在過去 15 年的表現並不穩定而且與大盤相比並沒有特別傑出，最大策略虧損報酬和最大回檔分別是 1.14 和 82,4600，原因是因為在 10 分 k 的時間刻度下買賣訊號出現頻繁，因此需要付出龐大的手續費，導致拖累整個策略績效。如表 4 所示總交易次數為 1,9095 次，平均一天需交易 5 次，在 CNN 模型精準度沒有達到一定水準之上是無法承擔過多的交易次數。. 29. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(38) 治政圖 15 策略績效與回檔大. 2014. 4,9200. 2015. -16,7800. Nat. 24,5000. al. -14,5000. n 總和. -20,2200. Ch. -1,8600. engchi. sit. io. 2017. 13,0000. er. 2016. 買進持有策略. y. CNN 策略. ‧. 年份. 學. ‧ 國. 立表 3 樣本外獲利比較. v. i n U. 19,8000 24,2800 36,8600. (3) 總交易次數、勝率、賺賠比、多空單平均持有時間表 4 交易統計多單. 空單. 所有交易. 總交易次數. 9548. 9547. 1,9095. 勝率. 59%. 47%. 53%. 賺賠比. 0.73. 0.92. 0.85. 平均持有時間(分鐘). 97.6. 18.6. 58.1. 30. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(39) (4) 混淆矩陣(Confusion matrix) 如表 5 所示，在樣本外漲與跌的精準度分別為 56% 和 52% ，召回率的部分漲有 86% ，跌的部分表很差僅僅只有 18%，表示模型對於下跌的情況較難辨識。表 5 混淆矩陣. 0. 立. 1 政治大. Precision. Recall. 52%. 18%. 56%. 86%. Accuracy : 54.82%. ‧ 國. 學. (5) 多空單績效比較. 如圖 16 所示，多單在 2015 空頭期仍承受大量虧損，空單則是表現極差，. ‧. 原因是因為模型對下跌辨識力較差，再加上手續費龐大的關係。. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 16 多空單績效比較 (6) 日損益分析、月損益分析、年損益分析由日損益分析來衡量 CNN 策略的尾端風險，如圖 17 所示。在 5%和 1% 下的 VaR 分別是-3,0200 和-5,9200，代表每天會有 5%和 1%的機率分別虧損 3,0200 和 5,9200 以上。在另一方面，在 5% 和 1% 下的 Expected shortfall 分別是4,8689.73 和-7,7675.68。代表每天會有 5%和 1%的機率分別平均虧損 4,8689.73 和 7,7675.68。 31. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(40) 圖 17 日損益分析. 立. 政治大. ‧. ‧ 國. 學. n. al. er. io. sit. y. Nat. 圖 18 月損益分析. Ch. engchi. i n U. v. 圖 19 年損益分析 32. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(41) 二、 GADF 搭配 (10k+15k+30k) 選用的時間刻度一樣為 10 分 k、15 分 k 以及 30k，取用過去 60 個時間單位，再根據 GADF 轉換公式將 3 種時間序列二維化(圖形化)，結合成一張金融影像。每往後一個時間單位(10 分鐘)生成一張圖片，分別標上未來一個時間單位(10 分鐘) 後的漲跌 1 或 0，最後進入 CNN 模型做訓練。 (1) 模型架構與參數模型參數如圖 20 所示，第一層卷積設計 70 個濾鏡，第二層卷積層設有 40 個濾鏡，接著進入隱藏層一共有 550 個神經元，同時用 Ridge regression 懲罰過. 政治大. 大參數，超參數 α 設定為 0.01，最後輸出層有兩個神經元做為漲跌的分類。模. 立. 型一共包含 497,8852 個參數需要訓練。. ‧ 國. 學 ‧. Convolution layer: 70 Max pooling. Nat. sit. n. al. er. io Hidden layer: 550 Ridge regression. y. Convolution layer: 40 Max pooling. Ch. engchi. i n U. v. Output layer: 2 圖 20 模型架構與參數 (2) 策略績效與回檔如圖 21 所示，策略在過去 15 年的表現依然不穩定而且與大盤相比並沒有特別傑出，結果與實驗一類似，最大策略虧損報酬和最大回檔分別是 1.05 和 76,0000，原因也是因為在 10 分 k 的時間刻度下買賣訊號出現頻繁，因此需要付出龐大的手續費，導致拖累整個策略績效。如表 7 所示總交易次數為 2,5407 次，平均一天需交易 7 次，在 CNN 模型精準度沒有到一定水準之上是無法承擔過多的交易次數。 33. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(42) 治政圖 21 策略績效與回檔大. 2014. 16,7000. 2015. -35,8400. Nat. 29,5000. al. -5,2600. n 總和. -20,2200. Ch. 5,1000. engchi. sit. io. 2017. 13,0000. er. 2016. 買進持有策略. y. CNN 策略. ‧. 年份. 學. ‧ 國. 立表 6 樣本外獲利比較. v. i n U. 19,8000 24,2800 36,8600. (3) 總交易次數、勝率、賺賠比、多空單平均持有時間表 7 交易統計多單. 空單. 所有交易. 總交易次數. 1,2704. 1,2703. 2,5407. 勝率. 59%. 47%. 53%. 賺賠比. 0.69. 0.97. 0.83. 平均持有時間(分鐘). 69.9. 17.4. 43.7. 34. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(43) (4) 混淆矩陣(Confusion matrix) 如表 8 所示，在樣本外漲與跌的精準度分別為 56% 和 52% ，召回率的部分漲有 83%，跌的部分表現較差只有 22%，表示模型依然對於下跌的情況較難辨識。表 8 混淆矩陣. 0. 立. 1 政治大. Precision. Recall. 52%. 22%. 56%. 83%. Accuracy : 55.15%. ‧ 國. 學. (5) 多空單績效比較. 如圖 22 所示，多單在樣本外有獲利但波動很大，空單則是表現極差，原因. ‧. 是因為模型對下跌辨識力較差，再加上手續費龐大的關係。. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 22 多空單績效比較 (6) 日損益分析、月損益分析、年損益分析由日損益分析來衡量 CNN 策略的尾端風險，如圖 23 所示。在 5%和 1% 下的 VaR 分別是-2,8800 和-5,6200，代表每天會有 5%和 1%的機率分別虧損 2,8800 和 5,6200 以上。在另一方面，在 5% 和 1% 下的 Expected shortfall 分別是4,6170.81 和-7,4443.24。代表每天會有 5%和 1%的機率分別平均虧損 4,6170.81 和 7,4443.24。 35. DOI:10.6814/THE.NCCU.MB.005.2018.F06.


(45) 三、 GASF 搭配 (15k+30k+60k) 選用的時間刻度為 15 分 k、30 分 k 以及 60k，取用過去 60 個時間單位，再根據 GASF 轉換公式將 3 種時間序列二維化(圖形化)，結合成一張金融影像。每往後一個時間單位(15 分鐘)生成一張圖片，分別標上未來一個時間單位(15 分鐘) 後的漲跌 1 或 0，最後進入 CNN 模型做訓練。 (1) 模型架構與參數模型參數如圖 26 所示，第一層卷積設計 70 個濾鏡，第二層卷積層設有 40 個濾鏡，接著進入隱藏層一共有 550 個神經元，同時用 Ridge regression 懲罰過. 政治大. 大參數，超參數 α 設定為 0.005，最後輸出層有兩個神經元做為漲跌的分類。模. 立. 型一共包含 497,8852 個參數需要訓練。. ‧ 國. 學 ‧. Convolution layer: 70 Max pooling. Nat. sit. n. al. er. io Hidden layer: 550 Ridge regression. y. Convolution layer: 40 Max pooling. Ch. engchi. i n U. v. Output layer: 2 圖 26 模型架構與參數 (2) 策略績效與回檔如圖 27 所示，策略在過去 15 年的表現並不穩定而且與大盤相比並沒有特別傑出，最大策略虧損報酬和最大回檔分別是 0.57 和 100,4200，原因是因為就算在在 15 分 k 的時間刻度下買賣訊號出現依然頻繁，因此需要付出龐大的手續費，導致拖累整個策略績效。如表 10 所示總交易次數為 2,1326 次，平均一天需交易 6 次，在 CNN 模型精準度沒有達到一定水準之上是無法承擔過多的交易次數。 37. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(46) 政治大表 9 樣本外獲利比較. 圖 27 策略績效與回檔. -22,4800. 2016. 12,6400. io. -9,6400. al. -1,5800. n. 總和. 19,8000. er. 2017. -20,2200. y. 2015. Ch. 13,0000. ‧. 17,9000. Nat. 2014. 買進持有策略. 學. ‧ 國. CNN 策略. sit. 立. 年份. engchi U. v ni. 24,2800 36,8600. (3) 總交易次數、勝率、賺賠比、多空單平均持有時間表 10 交易統計多單. 空單. 所有交易. 總交易次數. 1,0663. 1,0663. 2,1326. 勝率. 55%. 50%. 53%. 賺賠比. 0.80. 0.91. 0.86. 平均持有時間(分鐘). 71.3. 32.9. 52.1. 38. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(47) (4) 混淆矩陣(Confusion matrix) 如表 11 所示，在樣本外漲與跌的精準度分別為 56% 和 50% ，召回率的部分漲有 72% ，跌的部分表現較差只有 34%，表示模型對於下跌的情況較難辨識。表 11 混淆矩陣. 立. Precision. Recall. 0. 50%. 34%. 1. 56%. 72%. 政治大. ‧ 國. 學. (5) 多空單績效比較. Accuracy : 54.19%. 如圖 28 所示，多單在樣本外有獲利但波動很大，空單則是表現極差，原因. ‧. 是因為模型對下跌辨識力較差，再加上手續費龐大的關係。. n. er. io. sit. y. Nat. al. Ch. engchi. i n U. v. 圖 28 多空單績效比較 (6) 日損益分析、月損益分析、年損益分析由日損益分析來衡量 CNN 策略的尾端風險，如圖 29 所示。在 5%和 1% 下的 VaR 分別是-2,8800 和-5,3200，代表每天會有 5%和 1%的機率分別虧損 2,8800 和 5,3200 以上。在另一方面，在 5% 和 1% 下的 Expected shortfall 分別是4,4276.76 和-7,1000.0。代表每天會有 5%和 1%的機率分別平均虧損 4,4276.76 和 7,1000.0。. 39. DOI:10.6814/THE.NCCU.MB.005.2018.F06.


(49) 四、 GADF 搭配 (15k+30k+60k) 選用的時間刻度與實驗三一樣為 15 分 k、30 分 k 以及 60k，取用過去 60 個時間單位，再根據 GASF 轉換公式將 3 種時間序列二維化(圖形化)，結合成一張金融影像。每往後一個時間單位(15 分鐘)生成一張圖片，分別標上未來一個時間單位(15 分鐘) 後的漲跌 1 或 0，最後進入 CNN 模型做訓練。 (1) 模型架構與參數模型參數如圖—所示，第一層卷積設計 70 個濾鏡，第二層卷積層設有 40 個濾鏡，接著進入隱藏層一共有 550 個神經元，同時用 Ridge regression 懲罰過大. 政治大. 參數，超參數 α 設定為 0.005，最後輸出層有兩個神經元做為漲跌的分類。模型. 立. 一共包含 4,978,852 個參數需要訓練。. ‧ 國. 學 ‧. Convolution layer: 70 Max pooling. Nat. sit. n. al. er. io Hidden layer: 550 Ridge regression. y. Convolution layer: 40 Max pooling. Ch. engchi. i n U. v. Output layer: 2 圖 32 模型架構與參數 (2) 策略績效與回檔如圖 33 所示，策略在過去 15 年的表現不如大盤，整體績效依然不是很穩定，最大策略虧損報酬與最大回檔分別是 0.58 和 114,6000。原因同樣是在是因為在 15 分 k 的時間刻度下買賣訊號出現頻繁，因此需要付出龐大的手續費，導致整個策略績效不穩定。如表 13 所示總交易次數為 2,1414 次，平均一天需交易約 6 次，在 CNN 模型精準度沒有在一定水準之上是無法承擔過多的交易次數。. 41. DOI:10.6814/THE.NCCU.MB.005.2018.F06.

(50) 政治大表 12 樣本外獲利比較圖 33 策略績效與回檔. -31,5200. 2016. 23,6800. io. 5,4800. al. 2,5400. n. 總和. 19,8000. er. 2017. -20,2200. y. 2015. Ch. 13,0000. ‧. 4,9000. Nat. 2014. 買進持有策略. 學. ‧ 國. CNN 策略. sit. 立. 年份. engchi U. v ni. 24,2800 36,8600. (3) 總易次數、勝率、賺賠比、多空單平均持有時間表 13 交易統計多單. 空單. 所有交易. 總交易次數. 1,0707. 1,0707. 2,1414. 勝率. 58%. 49%. 53%. 賺賠比. 0.72. 0.93. 0.83. 平均持有時間(分鐘). 75.45. 28.2. 51.8. 42. DOI:10.6814/THE.NCCU.MB.005.2018.F06.