一個基於籌碼面動能指標之智慧型選股模型的研究

(1)

國立高雄大學資訊工程研究所

碩士論文

一個基於籌碼面動能指標之

智慧型選股模型的研究

A Study of Intelligent Chip Momentum-based

Systems for Stock Selection

研究生：陳厚傑

撰

指導教授：黃健峯

博士

(2)

(3)

II

一個基於籌碼面動能指標之

智慧型選股模型的研究

指導教授：黃健峯博士國立高雄大學資訊工程研究所學生：陳厚傑國立高雄大學資訊工程研究所

摘要

隨著時代的前進，於金融投資的領域從基本面分析、技術分析到籌碼面分析的各種方法不斷的在創新，在本論文中我們以台灣股市為研究對象採用人工智慧的方法以運用籌碼面分析而提出一個基於籌碼分析的智慧型選股系統的研究，本研究的貢獻在於我們順利整合籌碼分析及動態選股模式並運用遺傳演算法而找出最佳的進出場時機以達到報酬率最佳化的目標。在本研究中我們透過時間驗證法檢驗所提出的選股模型之可行性。實驗結果顯示在大部分的時間中我們的模型的投資績效可優於大盤，但在時間較短的情況中則會出現極端的高報酬或低報酬的現象，這多半受到一些重大的國際形勢影響或是訓練與測試時間過短所導致的現象。我們希望這些研究結果能進一步推進在投資領域中使用籌碼面分析的相關研究。關鍵字：籌碼面分析、動能投資法、人工智慧、遺傳演算法、選股

(4)

III

A Study of Intelligent Chip Momentum-based

Systems for Stock Selection

Advisor: Dr. Chien-Feng Huang

Institute of Computer Science and Information Engineer National University of Kaohsiung

Student: Hou-Jie Chen

Institute of Computer Science and Information Engineer National University of Kaohsiung

ABSTRACT

Along with the advancement in financial research and applications, various investment methods using fundamental analysis, technical analysis as well as chip analysis have been proposed and studied. In this thesis we develop a chip analysis-based artificial intelligence (AI) method for the construction of stock selection models. We mainly employ the genetic algorithms (GA) for the optimization task of model parameters designed for the chips analysis and timing for buying and selling stocks in order to optimize the return on investment. We use thousands of stocks in the stock market in Taiwan for this empirical study. The experimental results show that the investment performance of our proposed models outperforms the benchmark in most cases. We thus expect these proposed methods to further advance AI research for the real-world investment applications.

Keywords: Chip analysis, momentum investing, artificial intelligence, genetic algorithms, stock selection

(5)

IV

致謝

在這段碩士生涯中，受到了許多人的幫助，而這篇論文之所以能夠完成，則要特別感謝我的指導教授黃健峯老師，無論是在論文、研究、處事態度都給予了很大的幫助，同時也提供了許多國內的報告與比賽機會，讓我有辦法磨練我的能力，並且在人生的態度上更加的成熟。感謝張志向老師及陳志忠老師於百忙之中抽空前來擔任我的口試委員，並給予了我在金融方面及人工智慧方面的建議及指正，讓我有辦法針對這些問題來將論文更加完善。感謝大學教授提供的各種知識讓我能夠應用在研究方面上。感謝奇炫在我實作能力及觀念不足時給予的幫助，也感謝奇炫為實驗室付出這麼多心力；感謝良宇大哥以業界的觀點來教導我們如何在職場上有正確的處事態度；感謝淑真在行政流程及事務上幫了很多的忙，讓我有辦法專心在學業上，同時在這段生涯也給了很多的鼓勵；感謝緒智、立偉與柏均學長在我進入實驗室後帶我了解該領域以快速進入狀況；感謝尚益在實驗室創造新遠端潮流的風氣，感謝星宇及致凱在外送拿波里、肯德基缺人的時候會跟我們一起搭配；感謝冠宇、銘蔚、佳駿以及實驗室的其他人在我完成這份論文的期間幫忙分擔實驗室的各種事務。最後要特別感謝我的家人給予的支持與鼓勵讓我有辦法在這段求學的過程中心無旁鶩的完成學業。陳厚傑謹誌國立高雄大學資訊工程所中華民國一百零八年七月

(6)

V

摘要 ... II 致謝 ... IV 圖目錄 ... VII 表目錄 ... VIII 1. 導論 ... 1 1.1 研究背景 ... 1 1.2 研究目的... 2 1.3 論文架構... 2 2. 文獻探討 ... 3 2.1 技術分析、籌碼、動能相關文獻探討 ... 3 2.2 人工智慧方法及其運用於股市相關文獻 ... 6 3. 研究方法 ... 8 3.1 籌碼面分析方法... 8 3.2 選股模型 ... 14 3.2.1 動態選股 ... 16 3.3 績效指標... 17 3.4 遺傳演算法 ... 18 3.4.1 基因編碼... 20 3.4.2 解碼 ... 21 3.4.3 選擇及淘汰方法... 21 3.4.4 交配 ... 21 3.4.5 突變 ... 22 3.4.5 遺傳演算法範例... 23 4. 實驗結果 ... 27 4.1 資料來源... 27 4.2 研究區間... 27

(7)

VI 4.3 時間驗證(Temporal Validation) ... 28 4.4 演算法演化設定... 29 4.5 比較基準 ... 29 4.6 實驗結果 ... 30 4.6.1 Model 1 訓練期 ... 31 4.6.2 Model 1 測試期 ... 32 4.6.3 Model 2 訓練期 ... 34 4.6.4 Model 2 測試期 ... 36 4.6.5 Model 3 訓練期 ... 39 4.6.6 Model 3 測試期 ... 41 4.6.7 三種 Model 比較 ... 44 5. 結論 ... 48 6. 參考文獻 ... 49

(8)

VII

圖目錄

圖一、三大法人買賣超原始數值震盪圖... 12 圖二、三大法人買賣超原始數值與MA 後比較圖 ... 13 圖三、股票價格與三大法人買賣超趨勢關係圖... 15 圖四、基因演算法演化流程圖... 19 圖五、遺傳演算法編碼示意圖... 20 圖六、遺傳演算法交配示意圖... 22 圖七、遺傳演算法突變示意圖... 23 圖八、 Cross validation 之圖示 ... 28 圖九、 Temporal validation 之圖示 ... 28 圖十、訓練期Model 1 與 TWII 比較圖 ... 31 圖十一、測試期 Model1 與 TWII 比較圖 ... 32 圖十二、訓練期 Model 2 與 TWII 比較圖 ... 35 圖十三、測試期 Model2 與 TWII 比較圖 ... 36 圖十四、 Model 3 訓練期與 TWII 比較圖 ... 40 圖十五、 Model 3 測試期與 TWII 比較圖 ... 42

圖十六、訓練期的 Model 1、Model 2、 Model 3 與大盤比較圖 ... 45

(9)

VIII

表目錄

表一、籌碼分析Method 2 評分範例 ... 10 表二、方法開關定義... 10 表三、動態選股示意圖... 17 表四、染色體 x 之四位元編碼 ... 23 表五、隨機染色體族群之適應值... 24 表六、在時間 𝑡𝑡 時染色體族群之適應值 ... 24 表七、交配前後示意圖... 25 表八、突變前後示意圖... 26 表九、在時間 𝑡𝑡 + 1 時新的染色體族群之適應值 ... 26 表十、最佳化演算法參數演化值域範圍... 29 表十一、訓練期Model 1 之 TV1 其中的二檔股票 ... 32 表十二、測試期Model 1 之 TV30 的其中二檔股票 ... 33 表十三、 Model 1 各 TV 最佳的參數 ... 33 表十四、訓練期Model 2 之 TV5 的其中二檔股票 ... 35 表十五、測試期Model 2 之 TV10 的其中四檔股票 ... 37 表十六、測試期Model 2 之 TV15 的其中五檔股票 ... 37 表十七、測試期Model2 之 TV11 的其中七檔股票 ... 37 表十八、 Model 2 各 TV 最佳的參數 ... 38 表十九、訓練期Model 3 之 TV1 的其中四檔股票 ... 40 表二十、訓練期Model 3 之 TV5 的其中八檔股票 ... 41 表二十一、 Model 3 之 TV30 所選的其中十檔股票 ... 42 表二十二、 Model 3 各 TV 最佳的參數 ... 43 表二十三、各Model 訓練期與測試期報酬率、勝率比較 ... 47 表二十四、各種方法被使用次數與平均進出場時機比較... 47

(10)

1

1. 導論

1.1 _研究背景

在金融市場上因各種事件導致股票市場激烈震盪，從 2008 年金融海嘯至今台灣股市大盤漲了2.5 倍之多，其中還發生過歐債危機、英國脫離歐盟、日本福島大地震、川普當選美國總統以及近期中備受高度關注的中美貿易大戰關稅問題，一則發文使得股市瞬間蒸發上千億元，每當事件發生時股市總是免不了來回震盪數百點甚至破千點，在投資領域中只靠傳統的統計學及財務知識恐已不足應付如此龐大的風險。伴隨大數據分析與人工智慧的興起使得各個領域有了新的突破與進展，在金融方面也出現了許多種類型的程式交易，包含了預測模型、選股模型、風險管理模型等等，而這些新模型將開啟新的時代與認知並可提供多種投資領域問題的更佳解決方案。證券分析方法可以分成兩大主要類別：基本面分析 ( Fundamental analysis )

與技術指標分析( Technical index analysis )。基本面分析是以股票的基本價值為依

據以分析影響股票價格及其走勢的各項因素，進而決定投資何種股票。例如本益比、股價淨值比、資產報酬率等等。技術指標分析則主要是使用股價及交易量而衍生出之各種技術性指標的分析，主要以移動平均線、KD、MACD 等來決定何時購買何股票。但在股票分析研究上，大多以技術面、基本面等資訊對動態的股票市場做預測與投資，但這些屬於落後之資訊不但常常出現過慢反應市場趨勢，導致其判斷準確率降低與過多的投資損失，因此本研究本著「量先價行」之理論，運用籌碼面分析買賣雙方交易行為對未來股價趨勢影響之探討，期望找出更具參

考性之投資決策依據。籌碼面分析又稱資金分析( Fund flow analysis )其為技術分

析的一種，主要透過分析三大法人的資金流向以從中取得獲利，我們透過籌碼面分析做指標並運用其動能來進行選股，由於外資、投信及自營商所組成的三大法人具有主導台灣金融交易市場的地位，三大法人所操作的資金在股票市場進出的

(11)

2 動向經常受到投資人的高度矚目。機構投資人可被認為是主動交易、交易資訊充足且具有影響力的交易者，交易時擁有足夠的資訊，並對股價有一定影響性。本研究採用人工智慧遺傳演算法以幫助我們進行投資組合的最佳化問題，主要研究目的為透過遺傳演算法直接對各項參數進行最佳化並找出具有較佳投資報酬的籌碼分析之投資組合，例如最佳化分析方法、選股、買賣壓力比重與進出場時機等。

1.2 研究目的

現今的金融市場蓬勃發展與電腦計算能力的進步相輔相成，使得財務計算成為相當重要的領域，近年三大法人對股市影響力越來越大，散戶逐漸趨於弱勢，加上大量的財務交易資訊出現後，法人所採用的傳統方法亦已逐漸無法跟上新訊息增加的速度。隨著電腦出現到硬體設備突破使得其計算能力快速飛躍，人工智慧藉由大量的計算能力超越傳統統計線性分析方法而開發出新的研究方向，如今人工智慧已成功運用在各個科學領域中，於金融市場也出現「金融科技」、「智慧理財機器人」、「自動程式交易」的領域，本研究將以籌碼面分析與人工智慧之遺傳演算法結合作出選股模型，並以台灣股票市場的普通股為研究對象以測試籌碼面分析於台灣股市的選股效能。我們將運用籌碼面的不同指標進行分析，從中選出具潛力之股票，藉由遺傳演算法以在不同的條件下自動演化出最佳報酬的選股模型，並以台灣股市加權指數來比較驗證模型的優劣性。最後我們將探討不同的籌碼面分析指標對選股模型的影響。

1.3 論文架構

本論文共分為五個章節，首先第一章為導論，敘述本文的研究背景、研究目的及論文架構。第二章為文獻探討，主要探討技術指標、籌碼面分析與遺傳演算

(12)

3 法的相關文獻。在第三章我們會詳細介紹本研究所使用的研究方法與其定義，包含籌碼面分析股票優劣與選股方法，進出場機制的運作方式，以及遺傳演算法的最佳化應用。第四章會呈現本研究所使用的籌碼面分析選股模型在訓練期與測試期實際選股後的報酬率與大盤比較，分析投資組合獲利情形與遺傳演算法最佳化後的參數。最後第五章以結論及未來展望，作為本文的總結。

2. 文獻探討

本章節分為兩個小節，首先根據本研究所需進行領域探討技術分析相關文獻，以了解目前應用於技術分析之範疇與特性以及外國金融市場於技術分析的應用範例。接下來是探討運用人工智慧方法所建構的預測模型或是選股模型於股市的應用案例，其大多數研究結果指出使用人工智慧方法後都能增加預測能力或增強投資組合的報酬率或穩定度。

2.1 技術分析、籌碼、動能相關文獻探討

Yakov [3] 發現股票籌碼收益會隨時間的推移與非流動性指標呈現負相關，而市場非流動性指標則與股票籌碼超額收益呈現正面影響，這表示股票的部分超額收益為非流動性指標的溢價。Asness et al. [8] 研究在八個不同的市場和資產類別中找到了一致的價值和籌碼動能報酬溢價，並在其報酬中找到了強大的共同因素結構。與資產類別的被動風險相比，價值和籌碼動能報酬在資產類別中的相關性更強，但價值和籌碼動能在資產類別內和跨資產類別之間呈負相關。 Bandarchuk et al. [28] 研究中表示運用股票的籌碼特徵以及它過去的報酬對股票進行分類，這種籌碼動能只通過交易來分析股票具有更多高報酬利潤的來增強其策略。Barber et al. [5] 研究指出個人投資者為短期交易支付巨額的損失。在

(13)

4 1991 年至 1996 年期間有 66,465 戶家庭擁有較優折扣的交易賬戶，但交易最多的家庭每年的報酬率為11.4%，而市場報酬率為 17.9%。其投資傾向小型股票、價值股票與高波動型股票，這表示過度自信導致個人投資者表現不佳。 Barberis et al. [27] 研究基於消費的資產定價模型，且發現該模型找到了實際價格和報酬的許多特徵，重要的是它與投資者期望一致，而其中一些投資者是通過推斷過去的價格變化形成對股票市場未來價格變化的信念。 Barroso et al. [29] 最近的研究討論了贏家和輸家的形成過程，以提高籌碼之動量策略的利潤和夏普比率。通過從形成期間的過去實現提取補充定價信息來建立結果中的報酬。 Blitz et al. [9] 證明根據過去的差值對股票進行分類會產生更穩定的籌碼動量而不是總報酬。Chan et al. [24] 研究是否可預測或影響未來報酬，其結果指出幾乎沒有證據表明未來趨勢與過去消息和報酬有直接影響，且分析師的預測也與過去的消息預測成反向，結果表明市場只對新資訊有較直接影響。

Chordia and Shivakumar [32]分析籌碼之動能策略的盈利能力是否與商業周期有關，研究結果發現一些落後的總體經濟變數可以解釋其效果的利潤，且調整這些總體經濟變數的預測能力時，動能效果的利潤會消失。

Chordia and Shivakumar [33] 研究通貨膨脹錯覺假說，其假說為股票市場投資者未能將通貨膨脹納入預測未來報酬增長率，這導致盈利增長與通貨膨脹呈現正相關的公司被低估且相反之則高估。並發現控制通貨膨脹對未來預測報酬能力

會使得用standardized unexpected earnings ( SUE )預測報酬能力下降。

Cooper et al. [26] 研究發現籌碼之動量利潤取決於市場狀況，從 1929 年到 1995 年市場收益率為正的月均利潤為 0.93%，而負市場收益後的平均利潤為-0.37%。此外從整體經濟因素無法解釋動量利潤。Da et al. [36] 測試 Frog-in-the-pain（FIP）方法於動能上，並發現對於具有連續信息的股票在其形成期間，動量

(14)

5 Daniel et al. [21] 根據心理因素提出了證券市場不足和過度反應的理論，投資者對個人信息的準確性過度自信，導致投資者信心的不對稱變化作為其投資策略的函數。其發現過度自信意味著過度波動，以及不當管理行為與股票錯誤定價，基於共同金融事件的資訊可預測性相關時。有偏見的自信投資策略因而增加了長短期的籌碼動能收益。

Daniel and Moskowitz [22] 研究指出籌碼動能策略在眾多資產類別中具有強烈的正平均報酬率，但其策略可能會經歷不常見且持續的負報酬，這些動量崩潰是部分可預測的。它們出現在恐慌狀態中，由於市場下跌和市場波動性很大，並與市場反彈同時發生。基於每個籌碼動量策略的均值和變數預測，可實用的動態動量策略產生的夏普比率大約是靜態動量策略的兩倍。此外恐慌狀態下的動能報酬與波動風險相關且在八個不同的市場和資產類別以及多個時間段內都很穩健。

Charles et al. [6] 使用每日的資料與 VAR (vector autoregression ) 的方法研發現共同基金流向與市場波動率呈現負相關，且當日沖銷對市場波動率的影響會隨著時間越接近收盤越來越小。這對於追蹤資金流向的籌碼分析來說資金的流入等於是預期上漲但有時卻下跌，在此研究中透露出相關的訊息。 Chen et al. [7] 研究指出美股股票的歷史價格之上漲或下跌模式可預測未來籌碼之動能策略所帶來的報酬率，且贏家在歷史價格的上漲模式下可獲得更高的報酬率，而輸家則會表現出更差的結果，贏家跟輸家更是相差了 51.47%的動能利潤。 John et al. [25] 在總體經濟風險是否與國際上的動能利潤的研究中發現不管經濟狀況良好或不良，都有動能利潤在1 至 5 年會有反轉的現象，但此現象卻沒與總體經濟風險有強健的關聯性。技術分析常利用股票市場的價量歷史數據以計算相關的指標，如開盤價、最高價、最低價、收盤價，以及成交量、成交值等等；透過公式將這些數值加以運算以決定進／出場時機。江吉雄 [1] 則採用了四項基本分析指標(季資產報酬率、季營收成長率、季

(15)

6 流動比率與季負債比率)，作為評估選股的標準，另外選用了其他技術指標來評估進出場策略與時機，結合遺傳演算法的編碼與移動視窗( sliding windows )機制學習應用，經實驗發現此整合性的交易模型確實有它的可行性。

2.2 人工智慧方法及其運用於股市相關文獻

Allen [11] 以 1928 年至 1998 年間以標準 500 普爾指數( SP500 )資料作為研究對象，運用遺傳規劃法( Genetic Programming )來產生進場及出場的決策交易法則，研究結果顯示考量交易成本後投資績效並不佳，若能再加入其他指標作為輸入變數，應該能有效提升投資績效。Korcazk [17] 以 1997/01/02 至 1999/11/10 期間的法國股市中 24 檔股票為標的，以遺傳演算法加上四種技術指標來訓練 261 天的資料，測試7 天資料的結果，研究結果顯示遺傳演算法的投資策略其報酬高於一般的買入持有策略。

Jiang [30] 以 1990/01/01 至 2002/08/30 期間 Microsoft、Intel 及 Oracle 三家股票交易資料為標的，以遺傳演算法加上移動平均指標等四種技術指標來進行預測，研究結果顯示遺傳演算法的投資策略其報酬亦高於一般的買入持有策略。 Huang et al. [13] 以 2003 年至 2012 年台灣股票市場中屬於半導體產業相關的十檔個股，採用遺傳演算法來尋找交易策略及配對交易之最佳組合，於傳統的統計方法，採用逐步回歸方法來選擇適合成對交易的股票組合，其研究結果顯示出，基於遺傳演算法的模型能夠贏過傳統的回歸模型。 Huang, et al. [14] 則以 2005 年至 2011 年台灣股票市場初次公開發行的基本面數據( IPOs )，採用遺傳演算法來最佳化選股參數用來比較新股首日收益的獲利能力，其研究結果顯示出遺傳演算法來最佳化選股參數在最佳 5 檔與最佳 10 檔的選股策略下都勝過新股首日收益的獲利能力。 Huang et al. [15] 以 1995 年至 2009 年的台灣股票市場股票市值 200 大的個

(16)

7 股中進行選股，由傳統線性回歸與遺傳演算法來做參數最佳化和特徵選取方法進行比較，其結果顯示套用遺傳演算法所找出的最佳化參數，所選取的股票大勝傳統線性回歸所選取的股票。 Pereira [31] 提到遺傳演算法十分適合應用在金融市場等複雜度較高的最佳化問題上，並且特別提到一個特點: 在編碼時使用二進制( binary representation ) 的方式進行，效果會比使用其他方式來的好，二進制編碼是以表示介於 0 到 1 之間的個別指標的權重值，並更有能力來表示某些特殊範圍的數值，以此期望演算法能於搜尋最佳化的權重值時獲得良好的成效。

Orito and Yamazaki [34] 將各投資組合所計算出來的貢獻率( contribution rate )

加上適當風險權重( weight of proper risk )當成適應值，而以遺傳演算法進行演化

以求出最佳的投資組合。

劉慧敏 [2] 利用如「單次選股最高報酬率」、「單次選股最低報酬率」、

「Sharpe 指標」等選股目標，搭配 Multi-objective Genetic Algorithms ( MOGA )

的多目標最佳化能力而得到新的選股策略，並利用移動視窗的訓練方式使得其選股策略的表現更為穩定。

Lai et al. [20] 使用 double-stage 遺傳演算法，以上海股市交易所 2001 至 2004 年的股市資料來研究最佳投資組合的方法。Lai et al. 指出 double-stage 遺傳演算法比起其他如模糊理論或類神經網絡更適合拿來處理財務方面的問題，以達到選擇最佳投資組合的目的。

Hoklie et al. [12] 根據 Markowitz (1952)的投資組合理論以遺傳演算法尋找投資組合最佳化之方法，以該方法將資產分散，並用遺傳演算法評估每項投資比例。以報酬率和風險為判斷依據尋找最高風險及最低報酬的投資策略。

Becker et al. [35] 的改良模型則是以遺傳規劃法建構線性及非線性的選股模

型。他們的研究證明其線性模型可以較為精確的分析不同指標於選股的效果。

(17)

8

3. 研究方法

本章節分為四個小節來介紹我們的投資模型整體架構，首先開始介紹是本研究所使用的籌碼面分析方法，利用不同的籌碼面分析方法進行投資組合選擇、進出場時間點的判斷，最後使用不同的績效指標來判斷回測模型的優劣。

3.1 籌碼面分析方法

籌碼面分析是追

蹤

股市裡的大戶，根據大戶的動向所形成的策略，而大戶又分為自然人大戶、三大法人(外資、投信、自營商)，其中證交所公開的籌碼面資料也以三大法人為主。我們將依據這些資料定義對股票的不同評分方法如下所示： Method 1: 𝑍𝑍𝑘𝑘(𝑡𝑡) = 𝐷𝐷𝑘𝑘,𝑓𝑓(𝑡𝑡) + 𝐷𝐷𝑘𝑘,𝑖𝑖(𝑡𝑡) + 𝐷𝐷𝑘𝑘,𝑑𝑑(𝑡𝑡), 𝑘𝑘 ∈ 1, 2, ⋯ , 𝑚𝑚, (1) 此方法為最基本的籌碼面分析，其只結合三大法人買賣超張數並也是以下所有分析方法的基礎。 Method 2: 𝑍𝑍𝑘𝑘(𝑡𝑡) = �𝐷𝐷𝑘𝑘,𝑓𝑓(𝑡𝑡) + 𝐷𝐷𝑘𝑘,𝑖𝑖(𝑡𝑡) + 𝐷𝐷𝑘𝑘,𝑑𝑑(𝑡𝑡)� 𝑝𝑝𝑘𝑘(𝑡𝑡), 𝑘𝑘 ∈ 1, 2, ⋯ , 𝑚𝑚, (2) Method 2 是以三大法人買賣超交易金額的角度來分析股票上漲的趨勢。 Method 3: 𝑍𝑍𝑘𝑘(𝑡𝑡) =𝐷𝐷𝑘𝑘,𝑓𝑓(𝑡𝑡)+𝐷𝐷_�_{𝑀𝑀𝑘𝑘(𝑡𝑡)}𝑘𝑘,𝑖𝑖(𝑡𝑡)+𝐷𝐷𝑘𝑘,𝑑𝑑(𝑡𝑡) 𝑀𝑀𝑇𝑇(𝑡𝑡)�𝑂𝑂𝑇𝑇(𝑡𝑡) , 𝑘𝑘 ∈ 1, 2, ⋯ , 𝑚𝑚, (3)

(18)

9 Method 3 以三大法人買賣超佔交易金額的比例來分析股票是否有上漲的趨勢。 Method 4: 𝑍𝑍𝑘𝑘(𝑡𝑡) =𝐷𝐷_𝑆𝑆𝑘𝑘,𝑓𝑓(𝑡𝑡)+𝐷𝐷𝑘𝑘,𝑖𝑖(𝑡𝑡)+𝐷𝐷𝑘𝑘,𝑑𝑑(𝑡𝑡) 𝑘𝑘,𝑓𝑓(𝑡𝑡)+𝑆𝑆𝑘𝑘,𝑖𝑖(𝑡𝑡)+𝑆𝑆𝑘𝑘,𝑑𝑑(𝑡𝑡) , 𝑘𝑘 ∈ 1, 2, ⋯ , 𝑚𝑚, (4) Method 4 以三大法人買賣超佔三大法人總交易量的比重來分析該股票是否有上漲的趨勢。在上述方法中， 𝑍𝑍_𝑘𝑘_{(𝑡𝑡) 代表股票 𝑘𝑘 在時間 𝑡𝑡 時所獲得的評分，𝐷𝐷}_{𝑘𝑘,𝑓𝑓}_{(𝑡𝑡) 代} 表股票 𝑘𝑘 在時間 𝑡𝑡 時的外資買賣超差額(即買超-賣超之張數差值)，𝐷𝐷_{𝑘𝑘,𝑖𝑖}(𝑡𝑡) 代表股票 𝑘𝑘 在時間 𝑡𝑡 時的投信買賣超差額，𝐷𝐷_{𝑘𝑘,𝑑𝑑}_{(𝑡𝑡) 代表股票 𝑘𝑘 在時間 𝑡𝑡 時的} 自營商買賣超差額，𝑝𝑝_𝑘𝑘(𝑡𝑡)為股票 𝑘𝑘 在時間 𝑡𝑡 時的調整後收盤價，𝑀𝑀_𝑘𝑘(𝑡𝑡) 為股票 𝑘𝑘 在時間 𝑡𝑡 時的市值，𝑀𝑀_𝑇𝑇_{(𝑡𝑡) 為大盤在時間 𝑡𝑡 時的市值，𝑂𝑂}_𝑇𝑇_{(𝑡𝑡) 為大盤在} 時間 𝑡𝑡 時的成交金額，𝑆𝑆_{𝑘𝑘,𝑓𝑓}(𝑡𝑡) 為股票 𝑘𝑘 在時間 𝑡𝑡 時的外資買賣超總和(即買超 +賣超之張數加總值)，𝑆𝑆𝑘𝑘,𝑖𝑖(𝑡𝑡) 為股票 𝑘𝑘 在時間 𝑡𝑡 時的投信買賣超總和，𝑆𝑆𝑘𝑘,𝑑𝑑(𝑡𝑡) 為股票 𝑘𝑘 在時間 𝑡𝑡 時的自營商買賣超總和，我們根據以上不同種的方法或是結合各種方法來達到我們對股票的評分，進而選出我們要的績優股。下表一顯示一個使用籌碼分析Method 2 (上述之 Eq. (2))的評分範例。

(19)

10 表一、籌碼分析Method 2 評分範例日期股票代號外資買賣超投信買賣超自營商買賣超調整後收盤價 M2 評分 2010/10/15 1101 1347 158 44 23.53 36447.97 2010/10/15 2317 4242 79 162 55.66 249537.78 2010/10/15 2330 8460 -13 916 49.13 4203710.19 2010/10/15 2891 14619 1125 1125 10.31 173919.39 2010/10/15 2881 274 0 -513 26.62 -6362.18 在這些方法中，每個方法都有它所要觀測的重點，如 Method 1 主要以成交量為主，而 Method 2 則以成交金額為主要因素，兩種分析方法都有其優點，因此我們將其結合成一個可複合的方法並運用人工智慧演算法去挑出最佳組合或是最佳的比重，進一步讓我們了解成交量與成交金額與股票上漲的重要關係。我們定義每個方法是否啟動的代號如下(於本研究第 3.4.1 章做是否啟動之詳細說明)：表二、方法開關定義

Method 2 Method 3 Method 4

代號 _𝑚𝑚₂ _𝑚𝑚₃ _𝑚𝑚₄

啟動時值 1 1 1

不啟動時值 0 0 0

(20)

11 𝑍𝑍𝑘𝑘(𝑡𝑡) = 𝛿𝛿1(𝑡𝑡) + 𝛿𝛿2(𝑡𝑡) + 𝛿𝛿3(𝑡𝑡), (5) 其中 𝛿𝛿₁(𝑡𝑡) 、𝛿𝛿₂(𝑡𝑡) 與 𝛿𝛿₃(𝑡𝑡) 公式定義如下： 𝛿𝛿1(𝑡𝑡) = �_𝑍𝑍𝑍𝑍𝑘𝑘(𝑡𝑡) = 𝑤𝑤𝑠𝑠ℎ(𝑤𝑤𝑓𝑓(𝐷𝐷𝑘𝑘,𝑓𝑓(𝑡𝑡)) + 𝑤𝑤𝑖𝑖(𝐷𝐷𝑘𝑘,𝑖𝑖(𝑡𝑡)) + 𝑤𝑤𝑑𝑑(𝐷𝐷𝑘𝑘,𝑑𝑑(𝑡𝑡))), 𝑖𝑖𝑖𝑖 𝑚𝑚2= 0 𝑘𝑘(𝑡𝑡) = 𝑤𝑤𝑣𝑣(𝑤𝑤𝑓𝑓(𝐷𝐷𝑘𝑘,𝑓𝑓(𝑡𝑡)) + 𝑤𝑤𝑖𝑖(𝐷𝐷𝑘𝑘,𝑖𝑖(𝑡𝑡)) + 𝑤𝑤𝑑𝑑(𝐷𝐷𝑘𝑘,𝑑𝑑(𝑡𝑡)))𝑝𝑝𝑘𝑘(𝑡𝑡), 𝑖𝑖𝑖𝑖 𝑚𝑚2 = 1, (6) 𝛿𝛿2(𝑡𝑡) = � 𝑍𝑍𝑘𝑘(𝑡𝑡) = 𝑤𝑤𝑠𝑠ℎ(𝑤𝑤𝑓𝑓(𝐷𝐷𝑘𝑘,𝑓𝑓(𝑡𝑡)) + 𝑤𝑤𝑖𝑖(𝐷𝐷𝑘𝑘,𝑖𝑖(𝑡𝑡)) + 𝑤𝑤𝑑𝑑(𝐷𝐷𝑘𝑘,𝑑𝑑(𝑡𝑡))), 𝑖𝑖𝑖𝑖 𝑚𝑚3= 0 𝑍𝑍𝑘𝑘(𝑡𝑡) = 𝑤𝑤𝑣𝑣𝑤𝑤𝑓𝑓(𝐷𝐷𝑘𝑘,𝑓𝑓(𝑡𝑡))+𝑤𝑤_�_{𝑀𝑀𝑘𝑘(𝑡𝑡)}𝑖𝑖(𝐷𝐷𝑘𝑘,𝑖𝑖(𝑡𝑡))+𝑤𝑤𝑑𝑑(𝐷𝐷𝑘𝑘,𝑑𝑑(𝑡𝑡)) 𝑀𝑀𝑇𝑇(𝑡𝑡)�𝑂𝑂𝑇𝑇(𝑡𝑡) , 𝑖𝑖𝑖𝑖 𝑚𝑚3 = 1, (7) 𝛿𝛿3(𝑡𝑡) = � 𝑍𝑍𝑘𝑘(𝑡𝑡) = 0, 𝑖𝑖𝑖𝑖 𝑚𝑚4 = 0 𝑍𝑍𝑘𝑘(𝑡𝑡) = 𝑤𝑤𝑠𝑠ℎ�𝑤𝑤_𝑤𝑤𝑓𝑓�𝐷𝐷𝑘𝑘,𝑓𝑓(𝑡𝑡)�+𝑤𝑤𝑖𝑖�𝐷𝐷𝑘𝑘,𝑖𝑖(𝑡𝑡)�+𝑤𝑤𝑑𝑑�𝐷𝐷𝑘𝑘,𝑑𝑑(𝑡𝑡)� 𝑓𝑓�𝑆𝑆𝑘𝑘,𝑓𝑓(𝑡𝑡)�+𝑤𝑤𝑖𝑖�𝑆𝑆𝑘𝑘,𝑖𝑖(𝑡𝑡)�+𝑤𝑤𝑑𝑑�𝑆𝑆𝑘𝑘,𝑑𝑑(𝑡𝑡)�� , 𝑖𝑖𝑖𝑖 𝑚𝑚4= 1, (8) 其中 𝑍𝑍_{𝑘𝑘,𝑡𝑡} 代表股票 𝑘𝑘 在時間 𝑡𝑡 時所獲得的評分，𝑤𝑤_𝑣𝑣為成交量的權重，_𝑤𝑤_𝑓𝑓為外資買賣超的權重，𝐷𝐷_{𝑘𝑘,𝑓𝑓}(𝑡𝑡) 代表股票 𝑘𝑘 在時間 𝑡𝑡 時的外資買賣超，𝑤𝑤_𝑖𝑖為投信買賣超的權重，_𝐷𝐷_{𝑘𝑘,𝑖𝑖}_{(𝑡𝑡) 代表股票 𝑘𝑘 在時間 𝑡𝑡 時的投信買賣超，𝑤𝑤}_𝑑𝑑為自營商買賣超的權重，𝐷𝐷_{𝑘𝑘,𝑑𝑑}(𝑡𝑡) 代表股票 𝑘𝑘 在時間 t 時的自營商買賣超，𝑝𝑝_𝑘𝑘(𝑡𝑡)為股票 𝑘𝑘 在時間 𝑡𝑡 時的調整後收盤價，𝑚𝑚₂ 為是否啟動 Method 2 之方法加入，𝑀𝑀_𝑘𝑘(𝑡𝑡)股票 𝑘𝑘 在時間 𝑡𝑡 時的市值，𝑀𝑀_𝑇𝑇(𝑡𝑡) 大盤在時間 𝑡𝑡 時的市值，𝑂𝑂_𝑇𝑇(𝑡𝑡) 大盤在時間 𝑡𝑡 時的成交金額，_𝑚𝑚₃ 為是否啟動 Method 3 之方法加入，𝑤𝑤_𝑠𝑠ℎ為成交金額的的權重， 𝑆𝑆𝑘𝑘,𝑓𝑓(𝑡𝑡) 代表股票 𝑘𝑘 在時間 𝑡𝑡 時的外資買賣超總和，𝑆𝑆𝑘𝑘,𝑖𝑖(𝑡𝑡) 代表股票 𝑘𝑘 在時間 𝑡𝑡 時的投信買賣超總和，𝑆𝑆𝑘𝑘,𝑑𝑑(𝑡𝑡) 代表股票 𝑘𝑘 在時間 𝑡𝑡 時的自營商買賣超總和， 𝑚𝑚4 為是否啟動 Method 4 之方法加入。以下舉個實例來說明公式當 Method 3 不啟動、Method 2、Method 4 皆啟動，其評分公式如下：

(21)

12 𝑍𝑍𝑘𝑘(𝑡𝑡) = 𝑤𝑤𝑣𝑣(𝑤𝑤𝑓𝑓(𝐷𝐷𝑘𝑘,𝑓𝑓(𝑡𝑡)) + 𝑤𝑤𝑖𝑖(𝐷𝐷𝑘𝑘,𝑖𝑖(𝑡𝑡)) + 𝑤𝑤𝑑𝑑(𝐷𝐷𝑘𝑘,𝑑𝑑(𝑡𝑡)))𝑝𝑝𝑘𝑘(𝑡𝑡) + 𝑤𝑤𝑠𝑠ℎ� 𝑤𝑤𝑓𝑓�𝐷𝐷𝑘𝑘,𝑓𝑓(𝑡𝑡)� + 𝑤𝑤𝑖𝑖�𝐷𝐷𝑘𝑘,𝑖𝑖(𝑡𝑡)� + 𝑤𝑤𝑑𝑑�𝐷𝐷𝑘𝑘,𝑑𝑑(𝑡𝑡)� 𝑤𝑤𝑓𝑓�𝑆𝑆𝑘𝑘,𝑓𝑓(𝑡𝑡)� + 𝑤𝑤𝑖𝑖�𝑆𝑆𝑘𝑘,𝑖𝑖(𝑡𝑡)� + 𝑤𝑤𝑑𝑑�𝑆𝑆𝑘𝑘,𝑑𝑑(𝑡𝑡)� �. (9) 由於每日買賣超資料極為震盪如下頁圖一所示，此現象可視為訊號中有太多的雜訊進而影響對股票的評分以致選股後誤判進出場導致報酬率欠佳，因此我們使用移動平均線的概念來解決其震盪問題。圖一、三大法人買賣超原始數值震盪圖

移動平均線又簡稱為MA (Moving Average)，是由 Granville [18] 所提出，其

主要概念是運用統計學上平均數，將振盪較大的數列轉換成波動較平滑的數列類

似通訊裝置的低通濾波器的概念，藉以降低雜訊干擾。MA 計算方式為：計算過

去一段時間的平均值。本研究中採用「簡單移動平均線」 (simple Moving Average,

(22)

13 假設欲求取第 𝑑𝑑 天的 𝑀𝑀𝑀𝑀，則取自 𝑃𝑃(𝑑𝑑 − 𝑖𝑖) 起連續 𝑛𝑛 天收盤價至 𝑃𝑃(𝑑𝑑) 日止，收盤價的和除以 𝑛𝑛，其公式為： 𝑀𝑀𝑀𝑀(𝑑𝑑 − 𝑛𝑛) = 1_𝑛𝑛∑𝑛𝑛−1𝑖𝑖=0 𝑃𝑃(𝑑𝑑 − 𝑖𝑖), (10) 其中 𝑃𝑃(𝑑𝑑 − 𝑖𝑖) 為第 𝑑𝑑 − 𝑖𝑖 天的收盤價，而 𝑛𝑛 為過去的一段區間的時間大小，通常又以5、20、60 天為主簡稱 MA5、MA20、MA60，其意義又可以代表週均線、月均線及季均線。為何會被稱之「移動平均」是因為每天都能計算出一個新的平均值來，且計算出的平均值呈現出一種向上或向下移動的態勢。它也反映出在特定時間內商品的平均成交價位，也就是投資人投入商品的平均成本。而我們可以在買賣超數值中看到其振幅相當大，圖二將比較正常的買賣超數值與使用移動平均線後的買賣超數值。圖二、三大法人買賣超原始數值與MA 後比較圖

(23)

14 經過移動平均線的概念我們將其值的曲線變緩和後較能看出買賣壓力的走勢，接下來我們將運用以上所介紹的方法選出可能的績優股票或是即將上漲的股票。

3.2 選股模型

我們透過評分指標來分析股票的買賣壓力，接下來將模擬股票進出場時所要觀測進場時買力道和出場時賣力道佔買力道的比重以及買力道可支撐價格上漲多久，我們可解釋為進場後該股票的持股時間長度，公式如下： 𝐵𝐵(𝑛𝑛) = ∑𝑛𝑛𝑡𝑡=𝐵𝐵𝑡𝑡𝑍𝑍𝑘𝑘(𝑡𝑡), (11) 𝑆𝑆𝑆𝑆(𝑚𝑚) = �𝑚𝑚_{𝑡𝑡=𝑆𝑆𝑡𝑡+𝑛𝑛+𝐼𝐼𝑡𝑡}𝜎𝜎𝑍𝑍𝑘𝑘(𝑡𝑡), (12) 其中 𝐵𝐵(𝑛𝑛) 表示進場觀測時間內買壓的力道加總，_𝑍𝑍_𝑘𝑘 為股票 𝑘𝑘 的評分，𝐵𝐵𝑡𝑡 代表進場觀測天數，𝑆𝑆𝑆𝑆(𝑚𝑚) 為出場觀測時間內賣壓的力道加總，𝑆𝑆𝑡𝑡 代表出場觀測天數，_{𝐼𝐼𝑡𝑡 代表持有某股票的時間，𝜎𝜎為賣壓佔買壓的比重，我們依據進場觀測時} 間內的買壓力道進行排序並且選出我們要進場的股票，當進場後我們將尋找其出場的時機點，由於買賣超震盪激烈在尋找股票出場時機點常會遇到較多的雜訊導致誤判出場時機點，因此在尋找出場時機前我們加入持股時間來減少誤判出場次數，當出場觀測時間內的賣壓力達到買壓力的某個值我們將作出場的動作。我們根據上述的方法在選股前給予股票評分，且在進場時依據買超天數加總評分排序完後再始選股，依照方法的不同選出不同的區間，大部分的選股評分都以越高分代表股票的上漲潛力越好，但不同的評分指標對於股票的詮釋不一樣，由於本研究所設計股票評分指標在反映股票上漲與下跌上具有某種相關性，換句話說評分

(24)

15 越高的股票表示它的買壓力以無法在支撐其上漲，這一來它下跌的機率也會相對於其它股票來的高，而越低分的股票上漲機率也會相對於其它股票來的高，但由於持續下跌的股票風險也相對高，為了避免我們選到評分指標過高股價無法上漲的股票或是評分指標過低股票風險過高的股票並找到正在上漲或未來上漲的可能性較高的股票，我們將此選股區間的公式定義如下： 𝑍𝑍𝑚𝑚(𝑡𝑡) ≤ 𝑆𝑆𝑆𝑆(𝑡𝑡) ≤ 𝑍𝑍𝑚𝑚(𝑡𝑡) + 𝑟𝑟 ∗ 𝑠𝑠𝑑𝑑(𝑡𝑡), (13) 其中 𝑆𝑆𝑆𝑆(𝑡𝑡) 表示在某時段 𝑡𝑡 之選擇股票評分區間介於在某時段 𝑡𝑡 股票評分的平均值到平均值加上 𝑟𝑟 倍的標準差，𝑍𝑍𝑚𝑚(𝑡𝑡) 為某時段 𝑡𝑡 的方法之股票評分平均值，_{𝑠𝑠𝑑𝑑(𝑡𝑡) 為某時段 𝑡𝑡 的方法之股票評分標準差值，由選股區間來幫助我們尋} 找即將要上漲的績優股，同時也可避免選到高估價格的股票，盡可能避免掉下跌中且風險較高的股票，以下圖三為單一股票之股價與買賣超之關係圖。圖三、股票價格與三大法人買賣超趨勢關係圖

(25)

16 從圖三中可分析出股價與三大法人買賣超之相關趨勢非常相近，但根據上述之 Eq. (13) 未必能選到較佳要上漲的區間且有可能會選到的股票已上漲到高峰的時段，因此本研究中再提出另一個選擇選股區間的方法，我們將隨機取一個百分比數值與某時間點上的最佳股票分數相乘，我們取其值與該值減去一個股票分數的標準差為最佳的選股區間，取其區間的用意在於是否找到更佳的進場位置，以提升出場的報酬率。其選股區間定義如下： 𝑟𝑟 ∗ 𝑍𝑍𝑍𝑍(𝑡𝑡) − 𝑠𝑠𝑑𝑑(𝑡𝑡) ≤ 𝑆𝑆𝑆𝑆(𝑡𝑡) ≤ 𝑟𝑟 ∗ 𝑍𝑍𝑍𝑍(𝑡𝑡), (14) 其中 𝑆𝑆𝑆𝑆(𝑡𝑡) 表示在某時段 𝑡𝑡 之選擇股票評分區間介於在某時段 𝑡𝑡 股票評分的 r 百分比到該比率減去一個標準差的區間，𝑟𝑟 ∗ 𝑍𝑍𝑍𝑍(𝑡𝑡)為某時段 t 的方法之股票評分的r 百分比，𝑠𝑠𝑑𝑑(𝑡𝑡)為某時段 𝑡𝑡 的方法之股票評分的標準差值。

3.2.1 動態選股

在本研究中換股的動作中我們採用動態的方式，每檔股票出場後將會補上新的一檔股票直到時間結束，維持在同一時間內持有的股票數量相等的原則，在大多數的選股過程中於某個時段內我們只選一組投資組合，但是在相同的時段內可能也有其他不錯的投資組合，在股票出場後是否有某一檔股票可進場，也就是進行類似換股的動作。以下舉個例子來說明動態選股。

(26)

17 表三、動態選股示意圖英文字母代表不同的股票，從T 開始起初為五檔股票且到T’為時間內的任一時刻都維持五檔，但是當時間越接近T’須考慮到剩餘的時間是否滿足一個進出場的週期，如不符合將不再進場。

3.3 績效指標

在本研究中所用到的績效指標有兩種，第一個為 GA 在訓練中產出多種投資模型，其演化過程中需要績效指標來作為回測以衡量模型之優劣。第二個是當GA 演化出最佳的模型後，將其用在測試一段時間內的未知市場，於此是要測試最佳模型之績效時所需的績效指標，藉由相同的績效指標來衡量最佳模型的優劣。年均化報酬率為廣為使用的模型績效指標，其定義為總報酬以年為單位算出每年的平均報酬，常用方法有兩種分別為算數平均(arithmetic)和幾何平均 (geometric)。底下分別說明其意義： 𝑅𝑅𝑎𝑎 =1_𝑛𝑛∑𝑛𝑛𝑖𝑖=1R𝑖𝑖, (15) 𝑅𝑅𝑔𝑔 = (∏ (1 + 𝑅𝑅𝑛𝑛𝑖𝑖=1 𝑖𝑖)) 1 𝑛𝑛− 1, (16) A F K B G L C H M D I N E J T T’

(27)

18 其中 𝑛𝑛 表示投資期間的年數，𝑅𝑅_𝑖𝑖 為在時間點第 𝑖𝑖 年的投資報酬率。舉例來說，投資的總報酬率為15%，投資的時間共 3 年，則算術平均年化報酬率𝑅𝑅_𝑎𝑎為 5%，而幾何平均年化報酬率𝑅𝑅𝑔𝑔約為4.768%。而本研究中採用的為月均化報酬率，即是以月為單位的每月平均報酬，公式跟年均化報酬率差別在於 R_𝑖𝑖 為在時間點第 𝑖𝑖 月的投資報酬率。

3.4 遺傳演算法

為了在本研究中選出最適當的權重與各項閾值，我們運用了 Holland[19]所提出之基因演算法（Genetic Algorithm），來最佳化我們所提出的各項問題。基因演算法又稱之為遺傳演算法，而基因演算法的主要核心理念為達爾文所提出的物競天擇學說，因此演算法本身也透過模仿生物演化過程進行演化與淘汰。我們透過問題本身之可能影響的參數，將其編譯成染色體並藉由選擇染色體進行交配產生子代，以及利用突變讓子代更加適應環境，相當於提升我們解答的品質。如何選擇染色體則由基因演算法中的適應性函數來決定，通過適應性函數來檢驗個體對於環境的適應程度，有良好適應性的個體會有較高的機會產生後代並將優良的基因傳給下一代。基因演算法的主要流程如下 Step 1. 隨機產生一組初始族群，總共有 𝑍𝑍 染色體，每條染色體以 𝑙𝑙 個 bit 示其基因，定義如下： 𝐺𝐺 = {𝑆𝑆1, 𝑆𝑆2, 𝑆𝑆3, ⋯ , 𝑆𝑆𝑥𝑥}, 𝑍𝑍 ∈ 𝑁𝑁 𝑆𝑆𝑖𝑖 = {𝑏𝑏1, 𝑏𝑏2, 𝑏𝑏3, ⋯ , 𝑏𝑏𝑖𝑖}, 𝑖𝑖 = 1,2,3, ⋯ 𝑍𝑍, 𝑏𝑏𝑙𝑙 ∈ {0,1} 其中 𝐺𝐺 表示由 𝑍𝑍 條染色體所組成的群組，𝑆𝑆_𝑖𝑖 為第 𝑖𝑖 條染色體，𝑏𝑏_𝑙𝑙 為某一條染色體上的其中一個基因編碼，只有1 個 bit 其值為 0 或 1。 Step 2. 藉由適應性函數，計算每條染色體的適應性。

(28)

19 Step 3. 演化過程，選擇親代、交配、突變以產生 𝑍𝑍 條子代染色體。 Step 4. 將新的 𝑍𝑍 條子代染色體取代原有的族群，成為一個新族群。 Step 5. 重複 Step 2，直到滿足終止條件為止。終止條件的判斷依據一般常見為下列三種： (1). 限制演化次數，當演化子代的次數到達演化次數限制即停止。 (2). 判斷子代與親代的差異是否過低，設定一個門檻值以決定是否停止演化。 (3). 限制執行時間，當演算法超過執行時間限制則停止。整體演化流程如下圖所示。圖四、基因演算法演化流程圖

是否滿足

終止條件

隨機產生

初始族群

解碼基因編碼

適應值計算

選擇與淘汰

交配與突變

近似最佳解

是

否

(29)

20

3.4.1 基因編碼

在本研究中遺傳演算法編碼採用二進制的位元字串 Huang and Li [16] 來表示，我們將編碼分為13 個，如下圖所示： … 圖五、遺傳演算法編碼示意圖其中 𝑚𝑚₂ 代表方法 Method 2 的啟動開關於基因編碼中用 1 bit、𝑚𝑚₃ 代表方法

Method 3 的啟動開關於基因編碼中用 1 bit、𝑚𝑚4 代表方法 Method 4 的啟動開關

於基因編碼中用1 bit、𝑤𝑤_𝑓𝑓 為外資買賣的權重值於基因編碼中用 20 bits、𝑤𝑤_𝑖𝑖 為投信買賣的權重值於基因編碼中用20 bits、𝑤𝑤_𝑑𝑑 為自營商買賣的權重值於基因編碼中用20 bits、𝑤𝑤_𝑠𝑠 為成交量的權重值於基因編碼中用 20 bits、𝑤𝑤_𝑣𝑣 為成交價的權重值於基因編碼中用20 bits、𝐵𝐵𝑡𝑡 為買超天數於基因編碼中用 5 bits、𝑆𝑆𝑡𝑡 為賣超天數於基因編碼中用5 bits、𝐼𝐼𝑡𝑡 為最佳持股天數於基因編碼中用 6 bits、𝑟𝑟_𝑠𝑠 為出場比率於基因編碼中用7 bits、𝑟𝑟_𝑐𝑐 為選股比率於基因編碼中用 7 bits，該染色體長度總共136 個基因，我們將各方法開關與方法中各項重要參數權重以及進出場時間點、持股時間、買賣壓力比重、選股區間編入染色體，是為了讓 GA 從分析股票到選擇股票最後至買賣進出時機都最佳化以期獲得最大的獲利。 Bits 1 2 3 4~23 24~43 44~63 64~83

On/off On/off On/off Weights Weights Weights Weights

Rules 𝑚𝑚2 𝑚𝑚3 𝑚𝑚4 𝑤𝑤𝑓𝑓 𝑤𝑤𝑖𝑖 𝑤𝑤𝑑𝑑 𝑤𝑤𝑠𝑠

Bits 84~103 104~108 109~113 114~119 120~126 127~136

Weights Integer Integer Integer Weights Weights

(30)

21

3.4.2 解碼

在解碼的過程中，染色體必須由我們所編成的 genotype(基因型)轉換至 phenotype(表現型)，依照比例進行二進位轉十進位的換算步驟，即可完成該染色體參數的解碼作業，其中 y 値為單條基因序列對應的表現型參數， 𝑚𝑚𝑚𝑚𝑍𝑍_𝑦𝑦 與 𝑚𝑚𝑖𝑖𝑛𝑛𝑦𝑦 表示參數的最大與最小數値，i 表示所對應的十進位數値，j 表示對單一變 數編碼時所用的長度(即位元的數量)，其公式如下所示。 𝑦𝑦 = 𝑚𝑚𝑖𝑖𝑛𝑛𝑦𝑦+_�2𝑗𝑗𝑖𝑖_−1�× �𝑚𝑚𝑚𝑚𝑍𝑍𝑦𝑦− 𝑚𝑚𝑖𝑖𝑛𝑛𝑦𝑦�. (17)

3.4.3 選擇及淘汰方法

由於動能計算與利用GA 尋找最佳解的計算量非常大，為了減少實驗的計算

成本，我們採用由 Goldberg and Deb [10] 提出的競賽選擇法 (Tournament

Selection) ，此方法再產生下一代個體的計算成本較低，可以有效的減少計算量，因此採用競賽選擇法對於本實驗是具有非常大的助益，競賽選擇法之演算法流程如下： Step 1. 從所有染色體中隨機且可重複的選擇 2 條染色體相互比較，並留下較優秀的一方最為親代，直到選出 2 個親代。 Step 2. 將選出來的親代進行交配與突變，產生 2 個子代。

Step 3. 重複Step 1 與 Step 2 直到子代的數量與親代相同。

3.4.4 交配

遺傳演算法中的交配是為了產生更優秀的子代，讓 2 個優秀的染色體彼此進行交換訊息的動作，因此新的子代會具有部分親代的特徵，也可能繼承其優缺點，若新的子代的適應性較差將會在下一次疊代時被競賽選擇法給淘汰掉。本研究所

使用的交配方法為De Jong and Spears [23]所提出的單點交配法，交配發生的機

(31)

22 Step 1. 有 2 條優良的染色體，將其設定為親代個體以 𝐺𝐺𝑥𝑥 與 𝐺𝐺𝑦𝑦 表示，定義如下： 𝐺𝐺𝑥𝑥 = {𝑔𝑔1𝑥𝑥, 𝑔𝑔2𝑥𝑥, ⋯ 𝑔𝑔𝑛𝑛−1𝑥𝑥 , 𝑔𝑔𝑛𝑛𝑥𝑥}, 𝑔𝑔𝑛𝑛𝑥𝑥∈ {0,1}, 𝑛𝑛 ∈ 𝑁𝑁; 𝐺𝐺𝑦𝑦 = �𝑔𝑔1𝑦𝑦, 𝑔𝑔2𝑦𝑦, ⋯ 𝑔𝑔𝑛𝑛−1𝑦𝑦 , 𝑔𝑔𝑛𝑛𝑦𝑦�, 𝑔𝑔𝑛𝑛𝑦𝑦 ∈ {0,1}, 𝑛𝑛 ∈ 𝑁𝑁; Step 2. 產生交配點 i，將兩親代 𝐺𝐺𝑥𝑥 與 𝐺𝐺𝑦𝑦 互相交換基因訊息以產生子代 𝐺𝐺𝑥𝑥′ 與 𝐺𝐺_𝑦𝑦′，定義公式如下，交配方式如下圖所示： 𝐺𝐺𝑆𝑆𝑛𝑛𝑥𝑥′ = �𝑔𝑔1𝑥𝑥, 𝑔𝑔2𝑥𝑥, ⋯ , 𝑔𝑔𝑧𝑧𝑥𝑥, 𝑔𝑔𝑧𝑧+1𝑦𝑦 , … 𝑔𝑔𝑛𝑛−1𝑦𝑦 , 𝑔𝑔𝑛𝑛𝑦𝑦�; 𝐺𝐺𝑆𝑆𝑛𝑛𝑦𝑦′ = �𝑔𝑔1𝑦𝑦, 𝑔𝑔2𝑦𝑦, ⋯ , 𝑔𝑔𝑧𝑧𝑦𝑦, 𝑔𝑔𝑧𝑧+1𝑥𝑥 , … 𝑔𝑔𝑛𝑛−1𝑥𝑥 , 𝑔𝑔𝑛𝑛𝑥𝑥�. 𝐺𝐺𝑥𝑥 1 0 0 1 0 0 1 0 0 1 1 𝐺𝐺𝑦𝑦 1 0 1 0 1 1 0 1 0 0 1 𝐺𝐺𝑥𝑥′ 1 0 0 0 1 1 0 1 0 0 1 𝐺𝐺𝑦𝑦′ 1 0 1 1 0 0 1 0 0 1 1 i 交配點 圖六、遺傳演算法交配示意圖

3.4.5 突變

突變的主要目的是防止染色體於演化過程中陷入局部最佳解的現象，但是突變的機率過高，反而會使求解過程太過隨機失去演算法本身的意義，突變的機率是依照設定的突變機率來決定是否發生突變，相較於交配機率的值低，其過程為隨機選取一條染色體的字串，並隨機選取突變點，將選中的位元資訊進行改變產生出新的染色體字串，對於二進制的字串位元來說就是將字串中的 1 變成 0 或者 0 變成 1，如圖七所示：

(32)

23 突變點 𝐺𝐺′𝑥𝑥 0 0 1 0 1 1 0 1 突變後 𝐺𝐺′𝑥𝑥 0 0 1 0 1 0 0 1 突變點圖七、遺傳演算法突變示意圖

3.4.5 遺傳演算法範例

為了將遺傳演算法實際的運作方式解釋更為詳細，以下將設計一個範例，若有一需要最佳化之問題定義為𝑖𝑖(𝑍𝑍) = 19𝑍𝑍 + 𝑍𝑍2，其中染色體 𝑍𝑍 的編碼長度為4 個位元，其產生的染色體如表四所示 : 表四、染色體 𝑍𝑍 之四位元編碼 Binary code Integer Binary code Integer Binary code Integer Binary code Integer 0001 0 0100 4 1000 8 1100 12 0001 1 0101 5 1001 9 1101 13 0010 2 0110 6 1010 10 1110 14 0011 3 0111 7 1011 11 1111 15 我們假設某一個世代的族群含十支染色體 𝑔𝑔₁~𝑔𝑔₁₀，將其還原成整數並計算他們的適應性數值(chromosome fitness)後如表五 :

(33)

24 表五、隨機染色體族群之適應值 Chromosome label Chromosome string Decoded integer Chromosome fitness 𝑔𝑔1 1000 8 216 𝑔𝑔2 1011 11 330 𝑔𝑔3 0100 4 92 𝑔𝑔4 1100 12 372 𝑔𝑔5 0001 1 20 𝑔𝑔6 0000 0 0 𝑔𝑔7 1011 11 330 𝑔𝑔8 1010 10 290 𝑔𝑔9 1110 14 462 𝑔𝑔10 1100 12 372 因此，本小節的遺傳演算法範例流程可以用表六至表九表示 : 表六、在時間 𝑡𝑡 時染色體族群之適應值 Chromosome label Chromosome string Decoded integer Chromosome fitness 𝒈𝒈1𝑡𝑡 1000 8 216 𝑔𝑔2𝑡𝑡 1011 11 330 𝑔𝑔3𝑡𝑡 0100 4 92 𝑔𝑔4𝑡𝑡 1100 12 372 𝑔𝑔5𝑡𝑡 0001 1 20 𝑔𝑔6𝑡𝑡 0000 0 0

(34)

25 𝑔𝑔7𝑡𝑡 1011 11 330 𝑔𝑔8𝑡𝑡 1010 10 290 𝑔𝑔9𝑡𝑡 1110 14 462 𝑔𝑔10𝑡𝑡 1100 12 372 在第 𝑡𝑡 個世代中，我們利用競賽法從表六的染色體族群中選出5 對親代染色體進行單點交配。表七中我們假設其中第三對親代染色體 𝑔𝑔3𝑡𝑡 與 𝑔𝑔9𝑡𝑡 他們未通過預設之交配機率，因此不做交配，僅複製雙方的染色體至突變階段。表七、交配前後示意圖交配前 𝑔𝑔7𝑡𝑡 1011 1110 𝑔𝑔9𝑡𝑡 𝑔𝑔10𝑡𝑡 1100 1000 𝑔𝑔1𝑡𝑡 𝑔𝑔3𝑡𝑡 0100 1110 𝑔𝑔9𝑡𝑡 𝑔𝑔4𝑡𝑡 1100 1110 𝑔𝑔9𝑡𝑡 𝑔𝑔9𝑡𝑡 1110 1011 𝑔𝑔2𝑡𝑡 交配後 𝑔𝑔7𝑡𝑡′ 1010 1111 𝑔𝑔9𝑡𝑡′ 𝑔𝑔10𝑡𝑡′ 1100 1000 𝑔𝑔1𝑡𝑡′ 𝑔𝑔3𝑡𝑡 0100 1110 𝑔𝑔9𝑡𝑡 𝑔𝑔4𝑡𝑡′ 1110 1100 𝑔𝑔9𝑡𝑡′ 𝑔𝑔9𝑡𝑡′ 1011 1110 𝑔𝑔2𝑡𝑡′

(35)

26 表八中的突變階段，我們假設僅 𝑔𝑔9𝑡𝑡′、𝑔𝑔3𝑡𝑡 與 𝑔𝑔4𝑡𝑡′ 有通過突變機率的檢驗，因此將這兩個位元翻轉後形成新的染色體 𝑔𝑔9_𝑡𝑡"、_𝑔𝑔3_𝑡𝑡′′ 與 _𝑔𝑔4_𝑡𝑡"。表八、突變前後示意圖突變 𝑔𝑔9𝑡𝑡′ 1111 𝑔𝑔1𝑡𝑡′ 1000 𝑔𝑔9𝑡𝑡 1110 𝑔𝑔9𝑡𝑡′ 1100 𝑔𝑔9𝑡𝑡" 1101 𝑔𝑔2𝑡𝑡′ 1110 𝑔𝑔7𝑡𝑡′ 1010 𝑔𝑔10𝑡𝑡′ 1100 𝑔𝑔3𝑡𝑡 0100 𝑔𝑔3𝑡𝑡′′ 1100 𝑔𝑔4𝑡𝑡′ 1110 𝑔𝑔4𝑡𝑡" 1111 𝑔𝑔9𝑡𝑡′ 1011 表九中最後由這些染色體形成第 𝑡𝑡 + 1 個世代的新族群，繼續進行往後之適應性演化至滿足終止條件。表九、在時間 𝑡𝑡 + 1 時新的染色體族群之適應值 Chromosome label Chromosome string Decoded integer Chromosome fitness 𝑔𝑔9𝑡𝑡′ 1111 15 510 𝑔𝑔1𝑡𝑡′ 1000 8 216 𝑔𝑔9𝑡𝑡 1110 14 462

(36)

27 𝑔𝑔9𝑡𝑡" 1101 13 416 𝑔𝑔2𝑡𝑡′ 1110 14 462 𝑔𝑔7𝑡𝑡′ 1010 10 290 𝑔𝑔10𝑡𝑡′ 1100 12 372 𝑔𝑔3𝑡𝑡′′ 1100 12 372 𝑔𝑔4𝑡𝑡" 1111 15 510 𝑔𝑔9𝑡𝑡′ 1011 11 330

4. 實驗結果

本章將分成六個小節，首先說明本實驗的資料來源與使用的時間範圍，接下來介紹本實驗所用的時間驗證法，並且說明本實驗的比較基準及其選股模型，最後討論本實驗的實驗結果。

4.1 資料來源

本研究以台灣證券交易所之公開資料與台灣經濟新報( TEJ ) 為資料來源，並做交叉比對以確保資料完整性。本研究主要以上市普通股為主，資料包含基本的開盤價、收盤價、法人買賣超等除權息後資料共84 種資料欄位。

4.2 研究區間

本研究以民國 97 年 1 月 1 日至民國 106 年 12 月 31 日中臺灣上市公司的普通股票類股為研究對象，共928 間上市公司 2003706 筆資料作分析，其中使用的資料包括：個股市值、大盤市值、大盤成交金額、個股收盤價、外資買賣超、投信買賣超、自營商買賣超、外資買賣超總合、投信買賣超總合、自營商買賣超總合，外資持股比重等，使用這 11 項指標進行技術分析，並在選股時對 928 支股

(37)

28 栗進行評分。依據上3.1 節的說明，根據某特定方法最佳的股票排序以及選股方法選出最佳的十檔股票。

4.3 時間驗證

(Temporal Validation)

一般的交叉驗證(Cross validation)是將不同區段的資料作測試，而其餘的資料為訓練如圖八所示，因此我們再進行訓練的同時會因為交叉驗證的法則讓我們使用到未來的資料，但基於財務領域的實驗資料是具有時間性，演算法是不能事先知道未來的測試數據，因此我們採用了如圖九所示的時間驗證法(Temporal validation, TV) [16]做為我們檢驗模型效能的方法。它可解決訓練期的測試資料的時間軸必須早於測試期的資料之問題。 TV\Period 1 2 … 30 31 1 Training Testing

2 Training Testing Training

… Training Testing Training

29 Training Testing Training

30 Testing Training 圖八、 Cross validation 之圖示 TV\Period 1 2 … 30 31 1 2 Training Testing … … 29 30 圖九、 Temporal validation 之圖示

(38)

29

4.4 演算法演化設定

在遺傳演算法的迭代計算中，於每一個 TV 中 GA 皆會進行 30 個回合的計算，藉此找出1 個較優秀的交易模型。同時每一個回合讓 GA 演化 50 代，而每一代有30 支個體(染色體)進行演化，因此每回合的目標值計算(function evaluation) 次數為1500 次。本實驗的演化參數為三大法人買賣超的權重及個股成交價與成交量的權重，個體演化中單點交配的機率為 0.7，突變機率為每個位元 0.005，每一個變數於染色體上以8 個位元長度被編碼，各參數演化的值域範圍如下表十所示：演化參數名稱最小值最大值參數資料型態方法開關 0 1 布林數進出場觀測時間 2 10 布林數持股天數 1 64 布林數 𝑤𝑤𝑓𝑓, 𝑤𝑤𝑠𝑠𝑖𝑖𝑡𝑡, 𝑤𝑤𝑑𝑑 -1.0 1.0 浮點數 𝑤𝑤v, 𝑤𝑤s -1.0 1.0 浮點數 𝑟𝑟𝑤𝑤1, 𝑟𝑟𝑤𝑤2 0.0 1.0 浮點數表十、最佳化演算法參數演化值域範圍

4.5 比較基準

在本研究中我們將多種預測模型的效能差異做比較。在比較前我們先定義比

較基準(Benchmark)，其是由 Perold and Sharpe [4]所提出的構想，並以買進持有

策略(Buy-and-Hold)做為各個策略比較的基準。此策略可減少頻繁交易所帶來的交易成本且有效的看出投資目標的長期成長性，所以在投資開始時便將所有的資金投入，直到時間結束才結算出場。買進持有策略在其他投資領域中也常做為

(39)

30 Benchmark 來與其他投資模型進行比較。本實驗 Benchmark 是用台灣股市大盤作為比較基準。3.1 節之籌碼面分析方法將分為沒運用 MA 以及運用 MA 的兩種我們將其簡稱為M1 與 M2，3.2 節之選股區間的選法也分為兩種其一為使用 mean 另一則是使用隨機取樣點我們將其簡稱為 R1 與 R2，另外在該節裡所提出的動態選股我們將期間稱為D，因此我們提出組合上述的規則而得到下列三個選股模型： Model 1：使用 M1 分析 R1 選股加上動態選股 D 並運用 GA 以月均化為適應性函數而進行演化。 Model 2：使用 M2 分析 R1 選股加上動態選股 D 並運用 GA 以月均化為適應性函數而進行演化。 Model 3：使用 M2 分析 R2 選股加上動態選股 D 並運用 GA 以月均化為適應性函數而進行演化。

在本研究中提出使用Model 1、Model 2 及 Model 3 三個由 GA 所演化的新

選股模型，並用來比較以台灣股市大盤作為Benchmark 做評估的結果，以檢驗是

否可經由不同的分析方法配合不同的選股方法以提升最終的報酬並且贏過大盤。

4.6 實驗結果

實驗結果為透過遺傳演算法啟動不同的方法組合以及最佳化進出場與持股

天數配合 Model 1、Model 2 及 Model 3 三個選股模型，分別在計算訓練期與測

(40)

31

4.6.1 Model 1 訓練期

圖十是 Model 1 配合遺傳演算法運用於訓練期的月均化結果，在訓練期 Model 1 中 30 個 TV 中有 25 個贏過大盤勝率約 83%，由圖可看出 Model 1 在 TV1 到 TV5 的訓練期間內報酬率震盪較大，由於訓練時間較短且該期間正處於台灣股市受金融海嘯影響前後因而出現震盪較大的報酬率，我們在下表十一以 TV1 為例進一步說明其原因，在此 30 個 TV 中出現負報酬率的時間在於遇到了台灣股市受金融海嘯及歐債危機影響所導致，整體而言模型於訓練期間的效能是可勝過大盤。圖十、訓練期Model 1 與 TWII 比較圖表十一中訓練期Model 1 的 TV1 最好的股票報酬率高達 146%，而最差的報酬率只到-16%，且所選中的股票中有八成以上是正報酬，因此造就在 TV1 模型報酬率高達50%以上。

(41)

32 表十一、訓練期Model 1 之 TV1 其中的二檔股票股票代號買價賣價報酬率 2536 11.5 28.29 146% 2374 31.94 26.77 -16%

4.6.2 Model 1 測試期

圖十一是 Model 1 配合遺傳演算法運用於測試期的月均化結果，圖的結果顯示Model 1 於 30 個 TV 中有 29 個比大盤表現較優，只有 1 個 TV 輸給了大盤，勝率高達97%，且在接近 TV25 至 TV30 時也出現了與訓練期相同的極值報酬，此原因是受到測試時間較短影響所導致，我們在下面表十二以TV30 為例說明。圖十一、測試期Model1 與 TWII 比較圖

(42)

33 表十二中我們發現測試期 TV30 與訓練期 TV1 都因測試時間過短且剛好選中高報酬的股票，其中有一檔就高達 85%的報酬率以至模型產生的最終報酬極高。表十二、測試期Model 1 之 TV30 的其中二檔股票股票代號買價賣價報酬率 2455 59.2 109.5 85% 1476 359.5 291 -19% 表十三為Model 1 重要參數表，我們統計了 M2 方法使用次數為 13 次，M3 方法使用次數為18 次，M4 方法使用次數為 8 次，進場觀測時間平均為 5.20 交易日，出場觀測時間平均為 5.56 交易日，持股天數平均為 29.36 交易日(其代號與說明請參考本研究的第3.1 與 3.2 章節)，因此平均的股票進出週期為 40.13 個交易日相當於兩個月的時間，在方法方面M2 與 M3 的使用率較高代表買賣超金額相較於買賣超量是比較有效。表十三、Model 1 各 TV 最佳的參數 TV M2 M3 M4 _{𝐵𝐵𝑡𝑡} _{𝑆𝑆𝑡𝑡} _{𝐼𝐼𝑡𝑡} 1 0 0 0 2 3 63 2 1 0 1 3 6 15 3 0 1 0 2 6 16 4 1 0 1 3 8 57 5 1 1 0 7 9 32 6 0 0 0 4 6 13 7 0 1 0 9 7 25 8 0 1 1 5 7 12 9 1 1 1 3 2 18 10 1 0 0 3 4 36 11 0 1 0 5 7 41

(43)

34 12 1 1 0 6 2 52 13 0 1 0 5 8 3 14 0 1 0 8 9 43 15 1 1 1 7 9 44 16 1 1 0 6 6 10 17 0 1 0 8 7 53 18 0 1 1 3 3 14 19 0 1 0 9 9 5 20 0 1 0 4 2 26 21 1 1 0 8 4 2 22 0 1 1 8 2 30 23 1 0 0 4 5 6 24 1 0 0 6 8 14 25 0 0 1 3 4 26 26 1 0 0 3 7 58 27 0 0 0 2 3 16 28 1 0 0 3 4 60 29 0 1 0 9 3 39 30 0 0 0 8 7 52

4.6.3 Model 2 訓練期

下頁圖十二是Model 2 配合遺傳演算法運用於訓練期的月均化結果，在訓練期Model 2 中 30 個 TV 中有 23 個贏過大盤勝率約 77%，由圖可看出 Model 2 與 Model 1 一樣在 TV1 到 TV5 的訓練期間內報酬率震盪較大，且 TV12 至 TV14 因台灣股市受歐債危機影響與同時期的 Model 1 比獲利較差，我們在下表十四以 TV5 為例說明其負報酬原因。

(44)

35 圖十二、訓練期Model 2 與 TWII 比較圖表十四中訓練期TV5 最好的股票報酬率高達 60%，而最差的報酬率到-53%，這證明在台灣股市受金融海嘯影響時我們的方法依舊能找到高報酬的股票，但伴隨其風險也相對的高且受大環境影響所導致。表十四、訓練期Model 2 之 TV5 的其中二檔股票股票代號買價賣價報酬率 2915 14.96 24 60% 8046 126.94 59.1 -53%

(45)

36

4.6.4 Model 2 測試期

圖十三是 Model 2 配合遺傳演算法運用於測試期的月均化結果，圖的結果顯示Model 2 於 30 個 TV 中有 27 個比大盤表現較優，只有 3 個 TV 輸給了大盤勝率約90%，其中 Model 2 與 Model 1 不同點在於報酬率震盪較小且輸給大盤的差距較小也未出現較高的報酬率，Model 2 測試期中股票輸贏較為平均，因此只要報酬率正的股票相較於報酬率負的股票賺的多就能在總股票勝率近乎五成的組合中總報酬呈現正成長，以下的表十五、表十六、表十七來解釋此情形。圖十三、測試期Model2 與 TWII 比較圖下頁表十五中測試期的 TV10 因最差股票負報酬率過高與最佳正報酬率相差20%以至於最終報酬呈現負的。

(46)

37 表十五、測試期Model 2 之 TV10 的其中四檔股票股票代號買價賣價報酬率 1477 90.57 124.5 37% 2344 4.07 5.42 33% 4144 80.16 34.55 -57% 6176 98.14 43.97 -55% 表十六中測試期的 TV15 報酬率呈現正的多贏了一些其報酬率最終為正但是略輸給了大盤一些。表十六、測試期Model 2 之 TV15 的其中五檔股票股票代號買價賣價報酬率 8016 66.1 92.53 40% 3665 90.94 125.28 38% 3035 46.65 63 35% 2439 90.68 55.86 -38% 2459 38.01 23.83 -37% 表十七中發現測試期的TV11 中獲利的股票大於損失的股票多且最佳報酬率高達216%，最終得以贏過大盤。表十七、測試期Model2 之 TV11 的其中七檔股票股票代號買價賣價報酬率 2439 43.07 136.25 216% 2062 41.6 69.48 67%

(47)

38 8039 33.05 48.4 46% 9914 92.33 133.19 44% 4141 47.23 28.23 -40% 3037 43.05 29.9 -31% 3383 60.42 42.58 -30% 表十八為 Model 2 重要參數表，我們統計了 M2 方法使用次數為 3 次，M3 方法使用次數為24 次，M4 方法使用次數為 4 次，進場觀測時間平均為 7.03 交易日，出場觀測時間平均為 5.47 交易日(其代號與說明請參考本研究的第 3.1 與 3.2 章節)，持股天數平均為 32.00 交易日因此平均的股票進出週期為 44.50 個交易日相當於兩個月又4 天的時間，在這個 Model 裡 M3 方法的使用率高於其他兩種代表買賣超金額與標準化後的重要性。表十八、Model 2 各 TV 最佳的參數 TV M2 M3 M4 _{𝐵𝐵𝑡𝑡} _{𝑆𝑆𝑡𝑡} _{𝐼𝐼𝑡𝑡} 1 0 1 0 8 2 54 2 1 0 1 4 9 7 3 0 0 0 2 9 11 4 0 0 1 2 10 39 5 0 0 1 5 2 41 6 0 1 0 7 3 44 7 0 1 0 6 4 28 8 0 1 0 6 4 16 9 0 1 0 10 4 7 10 0 1 0 9 4 29 11 0 1 0 10 10 8 12 1 1 1 5 10 57 13 0 1 0 10 5 8 14 0 1 0 9 8 28 15 1 0 0 5 5 26

(48)

39 16 0 1 0 3 3 52 17 0 1 0 10 3 31 18 0 1 0 10 3 20 19 0 1 0 10 3 42 20 0 1 0 3 4 51 21 0 1 0 5 8 34 22 0 1 0 10 8 34 23 0 1 0 10 3 15 24 0 1 0 9 8 34 25 0 0 0 5 7 41 26 0 1 0 7 2 33 27 0 1 0 7 5 3 28 0 1 0 8 3 53 29 0 1 0 9 7 60 30 0 1 0 7 8 54

4.6.5 Model 3 訓練期

下頁圖十四是 Model 3 於訓練期的月均化結果，在訓練期中 Model 3 於 30

個TV 中有 28 個贏過大盤(勝率約 93%)，由圖可看出 Model 3 與 Model 1、Model

2 一樣在 TV1 到 TV5 的訓練期間內報酬率震盪較大，我們在下表十九以 TV1 為

(49)

40 圖十四、Model 3 訓練期與 TWII 比較圖表十九中訓練期的 TV1 中獲利的股票都有不錯的報酬率，最佳的股票達到 102%以至於最終報酬高達近乎 60%。表十九、訓練期Model 3 之 TV1 的其中四檔股票股票代號買價賣價報酬率 2520 8.35 16.88 102% 2892 _11.08 _16.39 _48% 2414 _6.46 _9.55 _48% 2823 _7.55 _10.24 _36%

(50)

41 表二十中訓練期的 TV5 中獲利最佳的股票有 65%報酬率，最差只有-35%報酬率可見大多數股票都因台灣股市受金融海嘯的影響所導致，最終獲利呈現負報酬。表二十、訓練期Model 3 之 TV5 的其中八檔股票股票代號買價賣價報酬率 2485 26.94 44.48 65% 3041 26.8 41.05 53% 2903 13.57 19.3 42% 8081 68.75 90.52 32% 2369 5.23 3.4 -35% 2345 9.16 6.54 -29% 5706 31.51 24.82 -21% 1722 105.13 83.11 -21%

4.6.6 Model 3 測試期

下頁圖十五是 Model 3 於測試期的月均化結果，結果顯示 Model3 於 30 個 TV 中有 27 個比大盤表現較優，只有 3 個 TV 輸給了大盤勝率 90%，跟 Model 1 模型極其相似，因此在測試時間較短的TV25 至 TV30 中同樣的出現了較高報酬與極值報酬的現象，但我們發現Model 3 之 TV30 與 Model1 之 TV30 有所不同， Model3 之 TV30 所有股票報酬為正有七成一左右，這表示有找到較優的規則，但由於測試時間過短無法確認用於更長的資料之後是否能創造如此可觀的報酬，我們於下表二十一展示Model3 中 TV30 所選的股票。

(51)

42 圖十五、Model 3 測試期與 TWII 比較圖表二十一中測試期 TV30 的股票獲利較佳最高有 30%且損失都不過 10%，其可靠性比Model 1 高許多，但也因測試時間短不確定因素多。表二十一、 Model 3 之 TV30 所選的其中十檔股票股票代號買價賣價報酬率 1313 16.2 19.05 18% 3706 36.9 35.1 -05% 2399 15 13.8 -08% 1210 34.45 33.05 -04% 2353 16.2 15.05 -07%

(52)

43 3645 63.7 80.4 26% 6278 27.2 35.6 31% 2376 45.05 53.2 18% 9911 40.5 37.35 -08% 1313 16.15 19.05 18% 表二十二為 Model 3 重要參數表，我們統計了 M2 方法使用次數為 5 次，M3 方法使用次數為29 次，M4 方法使用次數為 9 次，進場觀測時間平均為 7.43 交易日，出場觀測時間平均為6.17 交易日(其代號與說明在本研究的第 3.1 與 3.2 章節)，持股天數平均為 30.27 交易日因此平均的股票進出週期為 43.87 個交易日相當於兩個月又3 天的時間，Model 3 與 Model 2 相似，其 M3 方法的使用率高於其他兩種代表MA 的使用後只分析買賣超金額會較為準確。表二十二、 Model 3 各 TV 最佳的參數 TV M2 M3 M4 _{𝐵𝐵𝑡𝑡} _{𝑆𝑆𝑡𝑡} _{𝐼𝐼𝑡𝑡} 1 0 1 0 8 3 48 2 1 1 1 8 4 50 3 1 1 0 6 8 24 4 0 1 1 6 8 57 5 1 1 0 6 7 3 6 0 1 1 9 5 39 7 0 1 1 9 6 3 8 0 1 0 8 6 11 9 0 1 0 8 5 51 10 0 1 0 9 6 9 11 0 1 0 3 9 38 12 0 1 0 7 5 2 13 0 1 1 7 9 38 14 1 1 1 8 8 45 15 0 1 0 4 6 61

(53)

44 16 0 1 1 4 9 42 17 0 1 0 10 6 52 18 0 1 0 9 6 1 19 0 1 0 6 7 8 20 0 1 0 9 4 56 21 0 1 0 9 4 49 22 0 1 0 8 7 3 23 0 1 0 7 4 9 24 0 1 0 9 7 49 25 0 1 1 8 8 30 26 1 0 1 8 8 56 27 0 1 0 7 9 1 28 0 1 0 9 3 32 29 0 1 0 9 3 39 30 0 1 0 5 5 2

4.6.7 三種 Model 比較

在此小節我們比較三種模型於訓練期與大盤的差異，從下頁圖十六中可看出訓練時間越短震盪幅度越大且報酬非常不穩定，隨著訓練時間增加震盪幅度越小報酬率也相較穩定，由於TV1~TV5 期間因台灣股市受到金融海嘯的影響導致訓練出來的模型差異過大，且 TV5 時不論哪一個模型都難逃台灣股市受金融海嘯之影響呈現負報酬，而 TV11~15 期間也因台灣股市受到歐債危機的影響模型報酬率降低且略輸大盤，由此情況可解釋特殊風險發生時模型也難以避免，但在長遠的情況來說本研究的模型以達到近八成至九成的情形下贏過大盤。

(54)

45

圖十六、訓練期的Model 1、Model 2、 Model 3 與大盤比較圖

在下頁圖十七的測試結果中三個模型都有近乎九成的 TV 贏過大盤，其中 Model 1 相較於其他兩個模型報酬較佳只有 1 個 TV 輸給大盤，Model 2 的報酬震幅較其他兩者大這表示出其使用的方法較差，最後不管在訓練期或測試期都反映出因訓練或測試時間過短所出現模型報酬高度震盪。

(55)

46

圖十七、測試期的Model 1、Model 2、 Model 3 與大盤比較圖

另外我們可以再從數據方面來比較三個模型在訓練期與測試期中表現差異，

從 standard deviation 可看出 Model 報酬率的穩定性，其值越小代表 Model 越穩

健，以及針對每個Model 中 30 個 TV 贏過大盤之勝率(Winning Percentage, WPCT)

來比較Model 在不同時間點上是否有一樣的效果，我們也藉由解碼來分析 GA 所

選的參數，如方法使用次數、進出時間點判斷、持股時間，由這些參數我們可以推測最佳資金的流動週期，在日後實際操作上有相當大的幫助，下面表二十三與