• 沒有找到結果。

一個高速交易的自動演化預測系統的研究

N/A
N/A
Protected

Academic year: 2021

Share "一個高速交易的自動演化預測系統的研究"

Copied!
67
0
0

加載中.... (立即查看全文)

全文

(1)

國立高雄大學資訊工程研究所

碩士論文

一個高速交易的自動演化預測系統的研究

A Study of Autonomous Evolutionary Forecasting

System for High Speed Trading

研究生:陳柏均 撰

指導教授:黃健峯 博士

(2)
(3)
(4)

II

一個高速交易的自動演化預測系統的研究

指導教授:黃健峯 博士 國立高雄大學資訊工程研究所 學生:陳柏均 國立高雄大學資訊工程研究所

摘要

本論文提出一個運用遺傳演算法來演化最佳的預測模型組合而建構一個高 速股價預測系統。透過台灣股市盤中即時揭露的資訊,並挑選了 10 間證交所當 月交易量排名前 20 的公司為標的,組合出了多種高頻交易環境中量價關係之法 則以預測股價的變化,其中還包含了 Huang 及 Li 以及 Huang 及 Lin 於其研究中 提出的三種法則,本研究同時藉由中間價的觀察提出了另外兩種法則,最後的實 驗結果顯示我們提出的方法在自動組合這五種法則後所建構出的自動演化模型 能夠有效改良之前 Huang 及 Li 以及 Huang 及 Lin 的運用遺傳演算法所建構的預 測模型。因此希望這些研究結果能擴展機器學習運用於預測高頻交易領域的相關 股市投資的研究。

(5)

III

A Study of Autonomous Evolutionary Forecasting

System for High Speed Trading

Advisor: Dr. Chien-Feng Huang

Institute of Computer Science and Information Engineer National University of Kaohsiung

Student: Po-Chun Chen

Institute of Computer Science and Information Engineer National University of Kaohsiung

ABSTRACT

In this thesis, we propose an intelligent system using genetic algorithms to evolve prediction models for the construction of a high-speed trading forecasting system. In order to construct the models, we used the disclosed micro-structure data for stock price and volume of 10 companies of the top trading volume in the Taiwan Stock Exchange. By using these datasets, we proposed two rules through the observation of the middle price, and also used three rules in Huang and Li and Huang et al.'s study, which were defined by the relationship between volume and price. By encoding the prediction rules into GA's chromosome and allow the GA to automatically select the rules to construct the best combined model, our experimental results showed that this self-evolving system can improve upon Huang and Li, and Huang et al.'s methods. Therefore, we expect to advance the current state of the study for price forecasting in the call auction market and high-speed trading environment for computational finance.

Keywords: High-frequency trading, autonomous evolutionary forecasting system,

(6)

IV

致謝

在這段碩士生涯中,受到了許多人的幫助,而這篇論文之所以能夠完成, 則要特別感謝我的指導教授黃健峯老師,無論是在論文、研究、處事態度都給 予了很大的幫助,同時也提供了許多國外及國內的報告機會,讓我有辦法磨練 我的能力,並且在人生的態度上更加的成熟。感謝張志向老師及陳志忠老師於 百忙之中抽空前來擔任我的口試委員,並給予了我在金融方面及人工智慧方面 的建議及指正,讓我有辦法針對這些問題來將論文更加完善。感謝大學教授提 供的各種知識讓我能夠應用在研究方面上。 感謝奇炫在我實作能力及觀念不足時給予的幫助,也感謝奇炫為實驗室付 出這麼多心力;感謝良宇大哥以業界的觀點來教導我們如何在職場上有正確的 處事態度;感謝淑真在行政流程及事務上幫了很多的忙,讓我有辦法專心在學 業上,同時在這段生涯也給了很多的鼓勵;感謝緒智及立偉在我進入實驗室後 帶我了解該領域以快速進入狀況;感謝厚傑在星巴克買一送一的時候會跟我們 一起搭配;感謝星宇及致凱在我口試期間也一起幫忙;感謝冠宇、銘蔚、尚益 以及實驗室的其他人在我完成這份論文的期間幫忙分擔實驗室的各種事務。 最後要特別感謝我的家人給予的支持與鼓勵讓我有辦法在這段求學的過程 中心無旁鶩的完成學業。 柏均 謹誌 國立高雄大學 資訊工程所 中華民國一百零八年一月

(7)

V

目錄

摘要... II 致謝 ... IV 圖目錄... VII 表目錄... IX 1. 導論 ... 1 1.1 研究背景 ... 1 1.2 研究目的... 2 1.3 研究架構圖... 2 2. 文獻探討 ... 4 2.1 高頻交易及股票量價關係相關文獻... 4 2.2 智慧型計算及其應用之相關文獻... 5 3. 研究方法 ... 7 3.1 台灣股市交易機制之集合競價... 7 3.1.1 集合競價交易範例... 7 3.2 預測規則與模型... 10 3.2.1 成交價與最佳買價及最佳賣價之法則... 10 3.2.2 最佳五檔委託量權重法則... 11 3.2.3 最佳一檔委買量、委賣量壓力法則... 12 3.2.4 買賣壓與中間價之關係法則... 15 3.2.5 最佳五檔買賣壓與中間價之關係法則... 16 3.2.6 自動演化之模型... 17 3.2.7 觀測方式... 17 3.3 效能評估指標... 19 3.4 遺傳演算法... 20 3.4.1 基因編碼... 21 3.4.2 解碼... 22

(8)

VI 3.4.3 選擇及淘汰方法... 23 3.4.4 交配與突變... 23 3.4.5 遺傳演算法範例... 25 4. 研究結果 ... 27 4.1 資料來源... 27 4.2 研究區間... 27 4.3 時間驗證(Temporal Validation) ... 28 4.4 演算法演化設定... 29 4.5 比較基準... 30 4.6 實驗結果... 32 4.6.1 三種模型於各家公司分別在 O1 及 O2 的表現 ... 32 4.6.2 三種模型各自在 25TV 中的獲勝比率 ... 43 4.6.3 M3 在 25 個 TV 中所挑選到的各 Rule 的總次數統計結果 ... 44 4.6.4 三種模型各自在 25TV 中的平均值及標準差 ... 50 5. 結論 ... 52 6. 參考文獻 ... 53

(9)

VII

圖目錄

圖一、 研究架構圖... 3 圖二、 基因演算法演化流程圖... 21 圖三、 自動演化模型之基因編碼示意圖... 22 圖四、 遺傳演算法交配示意圖... 24 圖五、 遺傳演算法突變示意圖... 24 圖六、 遺傳演算法範例流程圖... 26 圖七、 Temporal Validation 之圖示 ... 29 圖八、 日月光在 O1 及 O2 於 2015/09/15~2015/10/28 期間預測結果 ... 33 圖九、 台積電在 O1 及 O2 於 2015/09/15~2015/10/28 期間預測結果 ... 34 圖十、 兆豐金在 O1 及 O2 於 2015/09/15~2015/10/28 期間預測結果 ... 35 圖十一、 富邦金在 O1 及 O2 於 2015/09/15~2015/10/28 期間預測結果 ... 36 圖十二、 鴻海在 O1 及 O2 於 2015/09/15~2015/10/28 期間預測結果 ... 37 圖十三、 中信金在 O1 及 O2 於 2015/09/15~2015/10/28 期間預測結果 ... 38 圖十四、 友達在 O1 及 O2 於 2015/09/15~2015/10/28 期間預測結果 ... 39 圖十五、 玉山金在 O1 及 O2 於 2015/09/15~2015/10/28 期間預測結果 ... 40 圖十六、 旺宏在 O1 及 O2 於 2015/09/15~2015/10/28 期間預測結果 ... 41 圖十七、 聯電在 O1 及 O2 於 2015/09/15~2015/10/28 期間預測結果 ... 42 圖十八、 日月光半導體以 M3 在訓練期間所挑選到的各 Rule 總數 ... 44 圖十九、 台積電以 M3 在訓練期間所挑選到的各 Rule 總數 ... 45 圖二十、 兆豐金以 M3 在訓練期間所挑選到的各 Rule 總數 ... 45 圖二十一、中信金以 M3 在訓練期間所挑選到的各 Rule 總數 ... 46 圖二十二、富邦金以 M3 在訓練期間所挑選到的各 Rule 總數 ... 47 圖二十三、鴻海以 M3 在訓練期間所挑選到的各 Rule 總數 ... 47 圖二十四、友達以 M3 在訓練期間所挑選到的各 Rule 總數 ... 48

(10)

VIII

圖二十五、玉山金以 M3 在訓練期間所挑選到的各 Rule 總數 ... 48 圖二十六、旺宏以 M3 在訓練期間所挑選到的各 Rule 總數 ... 49 圖二十七、聯電以 M3 在訓練期間所挑選到的各 Rule 總數 ... 49

(11)

IX

表目錄

表一、 最大成交量範例 (T-1 盤) ... 8 表二、 集合競價撮合結果範例(T 盤)... 9 表三、 成交價同最佳買一價格之下一盤漲跌變化... 10 表四、 成交價同最佳賣一價格之下一盤漲跌變化... 11 表五、 最佳五檔價量資訊揭露資訊案例... 13 表六、 成交價與最佳買價之法則加入最佳一檔委買量、委賣量壓力法則.. 14 表七、 成交價與最佳賣價之法則加入最佳一檔委買量、委賣量壓力法則.. 14 表八、 買賣價(最佳買一、賣一)所決定的中間價 ... 15 表九、 最佳五檔買賣價所決定的中間價... 16 表十、 O1 之判斷方式(下一刻成交價有產生變化) ... 17 表十一、 O1 之判斷方式(下一刻成交價並未變化) ... 18 表十二、 O2 之判斷方式(成交價於 T+3 盤產生了變化) ... 18 表十三、 模型預測結果分類... 19 表十四、 染色體 x 之四位元編碼 ... 25 表十五、 隨機染色體族群之適應值... 25 表十六、 臺灣上市公司的個股研究對象... 27 表十七、 最佳化演算法參數演化值域範圍... 30 表十八、 三種模型在 25 個 TV 中分別於十家公司中各自的勝率佔比 ... 43 表十九、 三種模型在 25 個 TV 中以 O1 所進行的測試之平均值及標準差 . 50 表二十、 三種模型在 25 個 TV 中以 O2 所進行的測試之平均值及標準差 . 51

(12)

1

1. 導論

1.1 研究背景

機器學習與人工智慧近幾年於科技上的應用已是越來越頻繁,而將此技術應 用在股市預測及投資上也衍生出了多個以電腦科技執行自動交易的應用項目,例 如「演算法交易」、「程式交易」、「高頻交易」等等, 這些技術在國外相當的盛 行,主要是因為國際上眾多主要股市所使用的交易機制為「逐筆交易」,這也是 台灣證券交易所預計於 2020 年 3 月 23 日正式跟進的機制[1],相較於以往的「集 合競價」交易機制,雖撮合頻率已從 82 年每 120 秒撮合一次調降至今日的 5 秒 撮合[2],但與國外的「逐筆交易」隨到隨撮的模式相比還是有段距離。 人工下單與電腦自動交易的差別在於,以手動電子下單來的方式處理每一筆 交易,扣除下單時間後一個人僅有短暫的時間再檢視之前的決策,等思考完成, 欲再改變訂單時該盤可能早已成交;再加上未來將改為逐筆交易的方式進行,屆 時以人工方式取得揭露資訊並判斷局勢且快速下單等類的作業方式已經不是人 工可以負荷,這也代表著迅速的反應及操作可能帶來更多的優勢以產生利潤。 為了促成台股與國際股市接軌,「逐筆交易」將會是未來台股的交易模式, 其中高頻交易的技術勢必顯得特別重要,若沒有一個良好的預測模型,在投資上 可能產生巨大的影響,像是 2017 年 8 月 3 號,統一證券因期貨程式交易所造成 的巨額虧損,而這也說明了若沒有一個強健的模型,屆時自動交易的演算法相互 影響所產生的連鎖反應而造成股市瞬間巨量下跌也是一大問題,這時如何去建立 一個於高頻交易的環境中的良好預測模型將顯得特別重要。

(13)

2

1.2 研究目的

本研究將探討委託量與成交價相關的高速股價預測模型。我們主要將以 Huang and Li [3]的植基於遺傳演算法(Genetic Algorithm—GA)的方法並根據 Huang and Li [3]及 Huang et. al [4]所提出的智慧型高速交易預測模型以延伸而建 構更進階的預測模型。 我們希望藉由遺傳演算法進一步地能夠在不同的條件及情況下自動演化出 最佳的預測模型組合,以同時驗證過去及本論文所提出的各個法則之有效性。而 藉由其挑選的法則在不同的組合關係下所產生出的結果預期應能優於僅使用單 一法則的情況,以驗證此自動演化模型能否進一步找出更為強健的模型組合而改 良其預測效能。因此本研究希望能夠藉由多種較原始的預測法則以此而自動建構 出更適用於高頻交易應用領域之預測模型。

1.3 研究架構圖

本研究的架構如圖一所示,資料來源為台股即時揭露的資訊包括各股成交價、 成交量、最佳五檔委託量、最佳一檔買賣壓力的資料、買賣壓與五檔買賣壓之中 間價的關係。藉由結合這些量價關係,並利用遺傳演算法挑選適用的法則來改良 於高頻交易環境下所建構的預測股價上漲或下跌的模型,並提昇預測模型的強健 性。相關的細節我們將於本論文的第三章詳細討論。

(14)

3 圖一、 研究架構圖 本論文的架構為第二章提供相關的文獻探討,第三章討論 Huang and Li [3] 及 Huang et al. [4]提出的預測方法及我們所提出的更進階的自動演化的預測模型, 第四章為實驗結果,第五章為結論。

價量關係

成交價、成交量

最佳五檔委託量

最佳買一、賣一

委託量

買賣壓與中間價

五檔買賣壓及中

間價

程式交易

遺傳演算法

高頻交易

自動演化模型

適應性函數

Precision

結果

預測能力

推升強健性

新的模型組合

(15)

4

2. 文獻探討

本章節將從高速交易領域的應用進行探討,在股票的價量關係中,可以由 Huang et al. [4] 的研究中發現,在已知的文獻中大多數皆認為台灣股市的委託簿 中的委託量的增減與成交價的漲跌呈現某種程度的正相關,為了讓自動演化模型 演化出最適切的模型組合,我們也將 Huang et al. [4]在其研究中所提出的兩個委 託量與成交價相關的預測模型放入自動演化的模型組合中。最後則是探討利用遺 傳演算法所搜尋到之應用在股價預測或金融相關的案例。本研究主要將以 Huang et al. [4]的方法為基礎並運用 GA 以自動產生更複雜的預測模型。為了瞭解高速 交易應用的範疇、特性和國外股市應用高速高易,以及智慧型計算應用在金融方 面之應用的範例,以下將分兩小節來介紹相關的文獻探討。

2.1

高頻交易及股票量價關係相關文獻

在現今的金融市場中,高頻交易者在提供市場流動性方面有著重要的作用 [5-7],而高頻交易者的增加往往伴隨著交易成本的降低以及價格有效性的提高 [8-13],Brogaard et al. [12]以 NASDAQ 所提供的學術用資料集中 2008 年至 2009 年的 HFTs 子集來分析高頻交易在價格發現上的作用,其結果發現高頻交易並沒 有 直 接的 證據 可 以 證 明 高頻交 易 直接 導致 市場價 格不穩定 。Jovanovic and Menkveld [14]對 Chi-x 交易所中的交易資料作分析以了解高頻交易對於市場的影 響,作者發現某一特定交易人之交易單數佔了 Chi-x 約 30%的交易量,在多數時 間並不持有證券且下單非常的頻繁,因此判斷與高頻交易的特性完全相符。 本研究的方法組合了各種以股市微觀架構下之量價關係所產生的法則,其中 股票價量關係的相關研究如下: Karpoff [15]研究價量的關聯性而提出四個有關價量關係的重要論點: (1)透 過價量關係可瞭解該金融市場的結構; (2)運用價量的資料以推論事件的研究結

(16)

5 論時,價量關係時常屬於重要的關鍵; (3)價量關係對於價格的定位具有關鍵性的 作用; (4)釐清價量關係對於期貨市場的研究有明顯的幫助。 Ying [16]以標準 500 普爾指數與 NYSE 於 1957/01 至 1962/10 之間的交易資 料運用交叉光譜分析、變異數分析及卡方分配研究價格與成交量的關係發現: (1) 成交量少時股價下跌; (2)成交量上升時股價上漲; (3)成交量激增後隨之價格上漲; (4)成交量持續減少時會發生價格連續數日下跌; (5)成交量持續增加時會發生價 格連續數日上漲。由此現象可以發現價格與成交量有非常高的關聯性。 高士軒 [17]使用回歸模型和 t 檢定來檢驗台股集中市場 2005 年到 2007 年 間是否存有價量關係。研究結果是價格產生反彈或反轉的機率在成交量呈倍數增 加時就愈高,且台股有明顯價量齊揚和價跌量縮的特徵存在。 郭及李 [18]進行研究股票市場波動性與總體經濟波動性及市場交易量之關 係,兩位作者運用 Granger 因果關係檢驗的統計方法來分析民國 68 年至民國 87 年之間的台灣股市資料並發現交易量成長率領先股價波動性,也間接確定了「量 先價行」的現象存在於台股集中市場。 李雪 [19]為了尋找價格及成交量之間的關聯性,研究將成交量列為變數並 應用於中國股票市場,其研究發現牛市及熊市的關聯並不相同,價格在牛市時與 成交量有非常強的正相關存在,而熊市時則無法發現其關聯性。

2.2

智慧型計算及其應用之相關文獻

智慧型計算(Computational Intelligence)為一種借用自然界的生物行為作為啟 迪並根據其原理模仿設計求解問題的算法,包括了遺傳算法、DNA 計算、啟發 式算法等,而在過去幾十年中,已經有許多針對金融應用的智慧型計算方法被提 出,像是神經網路、支援向量機、混合模型的進化算法[20]以及其他的方法[21]。 其中這些研究也涵蓋了廣泛的應用,包括投資組合最佳化[22,23],套利[24, 25],

(17)

6 財務預測[26,27],破產偵測[28]以及雜訊及詐騙偵測[29,30]。 在本研究中使用到了演化式計算的其中一種方法—遺傳演算法(Genetic Algorithm),其為 Holland [31]所提出藉由模擬自然界生物演化的過程中「物競天 擇,適者生存」的演化與淘汰的概念,藉此方法模擬生物演化過程及運作方式用 以尋找最佳解,以下將介紹遺傳演算法應用在金融相關的研究: Allen [32]以 1928 年至 1998 年間以標準 500 普爾指數(SP500)資料作為研究 對象,利用遺傳規劃法(Genetic Programming)以產生進場及出場之交易法則,結 果顯示在考量交易成本後所進行的投資績效並不佳,如果能再加入其他指標作為 輸入變數,或許能較有效的提升投資績效。 Huang et al. [25]以 2003 年至 2012 年台灣股票市場中屬於半導體產業相關的 十檔個股及前十大市值個股,並利用遺傳演算法建構一個用於配對交易的穩健投 資模型,該結果顯示遺傳演算法建構出的穩健投資模型之獲利能力遠大於傳統買 入持有的方法,且該穩健投資模型用於半導體產業相關的十檔個股及前十大市值 個股其預測能力皆大於 70%。 Huang and Li [3]以 2015/09/15 至 2016/1/21 期間台灣股票市場每五秒公開的 即時揭露資料,利用遺傳演算法加上財務預測模型以建置一個高速交易環境下的 智慧型股價預測模型,其結果顯示遺傳演算法建構的預測模型其預測能力遠勝過 線性回歸及邏輯回歸的預測方法,因而建立一個將遺傳演算法應用於台灣股票市 場高頻交易資料的一個創新的研究。

Huang et al. [33,34]在 Huang and Li [3]所發表的模型基礎下,以數個不同的 基因演算法所用的適應性函數版本協助預測模型的設計以期改善出現在 Huang and Li [3]的模型預測效能不穩定的現象,其結果顯示這些新提出的方法於 GA 所 搜尋到的預測模型在多數情況中都能增強預測效能的穩定度,而在這幾篇中所提 到模型即為本研究的概念雛形,因此本研究將建立一個更完善的自動演化模型以 提升模型的預測效能。

(18)

7

3. 研究方法

本章節將介紹此實驗如何利用 GA 去進行最佳化的模型建構,第一小節將介 紹台灣股市目前所使用的撮合規則—集合競價。第二小節將介紹三個分別於 Huang and Li [3]及 Huang et al. [4]所提出的法則,並於本研究中加入另外兩種法 則一同放入本自動演化預測系統,於該小節的最後將針對觀測方式重新進行定義, 本章節最後將介紹遺傳演算法的實際運作方式,並說明 GA 如何從這五個規則中 挑選並組合出最佳的模型。

3.1 台灣股市交易機制之集合競價

台灣集中交易市場採電腦自動交易,其競價方式於 2013 年 07 月 01 日盤中 集合競價撮合秒數的 15 秒縮短至 2014 年 12 月 29 日的 5 秒撮合時間且至今仍 為保持每 5 秒進行集合競價撮合的交易機制。 台灣證券交易所的集合競價機制以一次可以滿足最大成交量為原則,每盤在 價格決定時,都互為獨立的,彼此價格並無任何關係,且皆會落在當日漲跌停限 定範圍內而依照當時買賣價、買賣量情形產生。是為一種有效率且價格決定更加 公平且合理,資訊更透明的撮合交易方式。

3.1.1 集合競價交易範例

台灣股市的交易方式,自證券交易所開業以來即為集合競價,而現行對外揭 示最佳五檔的時間間隔為 5 秒,下一盤撮合將所有未成交買進及賣出之委託,依 據價格優先與時間優先的原則做成交。集合競價的價格決定原則如下所述[35]: (一)滿足最大成交量成交,高於決定價格之買進申報與低於決定價格之賣出申 報須全部滿足。 (二)決定價格之買進申報與賣出申報至少一方須全部滿足。

(19)

8 (三)合乎前二款原則之價位有二個以上時,採用接近當市最近一次成交價格之 價位,如當市尚無成交價格者,採用接近當市開盤競價基準之價位。 集合競價之流程須由第 T-1 盤開始說明,T-1 盤指的就是上一盤的交易盤, T 盤即是當盤的交易盤。即時揭露資訊是指交易完成後公布委託簿中未成交且最 接近成交價的五檔委託買單的價量及五檔委託賣單的價量,因此本範例將從 T-1 盤之交易後揭露資訊開始說明,如表一所示: 表一、 最大成交量範例 (T-1 盤) 累計買方張數 買方張數 價格 賣方張數 累計賣方張數 160 160 107.00 94 311 160 106.50 25 217 190 30 106.00 20 192 200 10 105.50 15 172 200 105.00 46 157 257 57 104.50 55 111 257 104.00 20 56 287 30 103.50 13 36 287 103.00 3 23 386 99 102.50 20 386 102.00 20 408 22 101.50 20 413 5 ~ 20 446 33 93.00 20 20 若成交價為 107.0 元,則雙方能滿足的最大成交量為 160 張。若成交價 106.5

(20)

9 元,最大成交量同為 160 張。若成交價為 106 元則最大成交量為 190 張。由 於之後的最大成交量不會再超過 190 張,因此此盤的撮合選擇 106.0 元作為 成交價。買價高於 106.0 元,以及賣價低於 106.0 元的委託單全數成交。另 外,價格剛好等於 106.0 元的委託單中,買方累積為 190 張、賣方為 20 張, 依照時間優先原則,將會有下單時間最晚的 2 張委託單無法成交,因此撮合 後的結果以表二做表示。 表二、 集合競價撮合結果範例(T 盤) 累計買方張數 買方張數 價格 賣方張數 累計賣方張數 107.00 94 121 106.50 25 27 106.00 2 2 10 10 105.50 10 105.00 67 57 104.50 67 104.00 97 30 103.50 97 103.00 196 99 102.50 196 102.00 218 22 101.50 223 5 ~ 256 33 93.00

(21)

10

3.2 預測規則與模型

根據台灣股市的交易規範,其揭露的即時資訊僅包括成交價、量與委託簿 上的最佳五檔買賣單的價格與委託量,上述能提供投資人用以參考的資訊所產 生的投資決策非常有限,因此本實驗將探討以這些資訊設計出的五種不同規則 作為對價格的漲跌所進行預測的交易進場訊號,實驗中的部分法則沿用了 Huang and Li [3] 及 Huang et al. [4] 所提出的法則來進行改良。

3.2.1 成交價與最佳買價及最佳賣價之法則

詹場、胡星陽等人[36]進行研究台股集中市場每盤所揭露的資訊是否對於價 格漲跌具有預測的能力,他們以台灣證券交易所公佈的 9 款「行情揭示原則」建 立假說,推導當盤揭露資訊與下一盤成交價的漲跌關聯,及利用回歸模型來建構 成交價漲跌的機率分佈情形,並使用比率檢定驗證個別揭露資訊之交易盤於下一 盤之漲跌比例是否相近。這裡的價格範例我們沿用了 Huang et al.[4]於該法則所 提出的結論,結果如表三及表四所示:當盤最佳買價與最佳賣價都揭露且成交價 等於揭露之最佳買一價時,下一盤價格上揚的機率為 33%,下跌機率為 0.3%, 而當盤最佳買價與最佳賣價都揭露且成交價等於揭露之最佳賣一價時,下一盤價 格下跌的機率為 42%,上揚機率為 0.2%,因此兩個法則對於價格漲跌的預測存 在明顯的關係。 表三、 成交價同最佳買一價格之下一盤漲跌變化 證券名稱 上漲機率 上漲盤數 下跌盤數 價平盤數 日月光半導體 22.6% 24427 774 82821 台灣積體電路 27.5% 29408 93 77592

(22)

11 兆豐金 19.5% 21767 231 89114 富邦金 23.6% 23697 695 76078 鴻海精密 26.9% 29305 442 79294 表四、 成交價同最佳賣一價格之下一盤漲跌變化 證券名稱 下跌機率 下跌盤數 上漲盤數 價平盤數 日月光半導體 24.4% 24421 657 74820 台灣積體電路 28.2% 21650 76 74829 兆豐金 24.5% 21650 72 66650 富邦金 24.3% 23723 494 73287 鴻海精密 29.0% 29329 294 71206 由此兩種結果可以得知,在扣除掉平盤的情況後,當成交價相同於揭露最佳 買一價或是成交價相同於揭露最佳賣一價時,下一盤的成交價會有明顯的上漲或 下跌情形,此法則乃是沿用 Huang and Li [3]所提出的法則,於本實驗中定義為 Rule 1 (R1),後續的 GA 染色體編碼會再詳述。

3.2.2 最佳五檔委託量權重法則

本法則為 Huang and Li [3] 運用公開揭露資訊的最佳買賣五檔之委託量作 為買賣雙方拉扯力道的基礎,在假設最佳一檔至最佳五檔的影響力道皆不相同 的情況下,將不同檔位的買賣五檔之委託量乘上個別權重以計算買賣雙方拉扯 力道的影響力度,並在最佳五檔委託量權重的預測模型將最佳五檔的買賣委託 量加乘上個別權重後的方法定義為總賣壓力及總買壓力,其公式分別如下:

(23)

12 𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀(𝑡𝑡) = ∑ 𝑚𝑚𝑚𝑚5𝑖𝑖 𝑖𝑖𝑣𝑣𝑖𝑖(𝑡𝑡); (1) 𝑀𝑀𝑀𝑀𝑠𝑠𝑠𝑠𝑀𝑀(𝑡𝑡) = ∑ 𝑚𝑚𝑚𝑚′ 𝑖𝑖 5 𝑖𝑖 𝑣𝑣′𝑖𝑖(𝑡𝑡); (2) 𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀(𝑡𝑡) = ∑ 𝑎𝑎𝑚𝑚5𝑖𝑖 𝑖𝑖𝑣𝑣𝑖𝑖(𝑡𝑡); (3) 𝑀𝑀𝑀𝑀𝑠𝑠𝑠𝑠𝑀𝑀(𝑡𝑡) = ∑ 𝑎𝑎𝑚𝑚′5𝑖𝑖 𝑖𝑖𝑣𝑣′𝑖𝑖(𝑡𝑡); (4) 公式中𝑣𝑣𝑖𝑖(𝑡𝑡)與𝑣𝑣′𝑖𝑖(𝑡𝑡)代表了第 t 盤的買賣雙方的最佳五檔的委託量。𝑚𝑚𝑚𝑚𝑖𝑖、 𝑚𝑚𝑚𝑚′𝑖𝑖、𝑎𝑎𝑚𝑚𝑖𝑖與𝑎𝑎𝑚𝑚′𝑖𝑖分別代表了這些委託量的個別權重。在此則將𝑀𝑀𝑀𝑀𝑀𝑀及𝑀𝑀𝑀𝑀𝑀𝑀計 算做空及做多並判斷其上漲或下跌之行為於本實驗中定義為 Rule 2 (R2),其詳 細說明如下,於做多狀況下我們計算出總賣壓力及總買壓力的差異為𝑀𝑀𝑀𝑀𝑀𝑀值, 其𝑀𝑀𝑀𝑀𝑀𝑀值呈現正值時即買壓大於賣壓,價格呈現上漲可能性,反之𝑀𝑀𝑀𝑀𝑀𝑀值呈現 負值,價格呈現下跌可能性;相反的於做空的狀況下,總賣壓力及總買壓力的 差異為𝑀𝑀𝑀𝑀𝑀𝑀值,其𝑀𝑀𝑀𝑀𝑀𝑀值呈現正值時即賣壓大於買壓,價格呈現下跌可能性, 反之A𝑀𝑀𝑀𝑀值呈現負值,價格呈現上漲可能性,其公式如下: 𝑀𝑀𝑀𝑀𝑀𝑀(𝑡𝑡) = 𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀(𝑡𝑡) − 𝑀𝑀𝑀𝑀𝑠𝑠𝑠𝑠𝑀𝑀(𝑡𝑡); (5) 𝑀𝑀𝑀𝑀𝑀𝑀(𝑡𝑡) = 𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀𝑀(𝑡𝑡) − 𝑀𝑀𝑀𝑀𝑠𝑠𝑠𝑠𝑀𝑀(𝑡𝑡). (6) .

3.2.3 最佳一檔委買量、委賣量壓力法則

依據台灣證券交易所公佈的「行情揭示原則」得到揭露最佳五檔委託價格、 委託量資訊及成交價資訊,該法則為 Huang et al. [4] 於其研究中所提出之法則, 本研究亦將其沿用至本研究所提出之自動演化模型,並將其定義為 Rule3 (R3), 而該法則的定義可由表五推導出,成交價將在 89.15 及 89.10 之間來回擺盪,如 果要上漲至最佳賣二的價格 89.20 就只需將 89.10 的 10 張委託單消化掉,反之價

(24)

13 格要下跌至最佳買二的價格 89.05 就需消化 89.10 的 310 張委託單,由此可知其 最佳買賣第一檔的委託單量將影響成交價漲跌的機率及其變化產生所需的時間。 因此,可以推導出當最佳買一委託量大於最佳賣一委託量時,即是買力道大 於賣力道,此時呈現上漲機率大於下跌;反之,當最佳賣一委託量大於最佳買一 委託量時,即是賣力道大於買力道,此時呈現下跌機率大於上漲,在此設定 Bbidvol 為最佳買一委託量,Baskvol 為最佳賣一委託量,可計算得其差值 BVP 如下所示: 𝑀𝑀𝐵𝐵𝑀𝑀 = 𝑀𝑀𝑏𝑏𝑀𝑀𝑀𝑀𝑣𝑣𝑏𝑏𝑏𝑏 − 𝑀𝑀𝑎𝑎𝑠𝑠𝑠𝑠𝑣𝑣𝑏𝑏𝑏𝑏. (7) 表五、 最佳五檔價量資訊揭露資訊案例 買進數量 買進價格 賣出價格 賣出數量 - - 89.35 90 - - 89.30 75 - - 89.25 101 - - 89.20 35 - - 89.15 10 310 89.10 - - 106 89.05 - - 191 89.00 - - 136 88.95 - - 227 88.90 - - 藉由將買一𝑀𝑀𝑏𝑏𝑀𝑀𝑀𝑀𝑣𝑣𝑏𝑏𝑏𝑏的量 310 及賣一𝑀𝑀𝑎𝑎𝑠𝑠𝑠𝑠𝑣𝑣𝑏𝑏𝑏𝑏的量 10 代入公式 7 可得到

Baskvol

Bbidvol

(25)

14 BVP 為 300 的結果,而當 BVP 為正值時則上漲機率大,且 BVP 為正值並越 是接近 Bbidvol 則上漲機率越大,等待上漲發生的時間可能越短,但 BVP 越 是接近零時則上漲機率偏小而等待上漲發生的時間可能會較長。反之,當 BVP 為負值時則下跌機率大,且 BVP 為負值且越是接近 Baskvol 則下跌機率越大 等待下跌發生時間可能越短,但 BVP 越是接近零時則下跌機率偏小等待下跌 可能發生時間會較長。 表六及表七為 3.2.1 之成交價與最佳買價及最佳賣價之法則的結果分別加 上最佳一檔委買量、委賣量壓力法則的 BVP 值作為預測模型得到的結果,其 結果明顯可見 BVP 加入後預測能力皆有所明顯提升,平均約提升 4%的預測能 力。 表六、 成交價與最佳買價之法則加入最佳一檔委買量、委賣量壓力法則 證券名稱 上漲機率 上漲盤數 平盤及下跌盤數 日月光半導體 26% 11905 33866 台灣積體電路 35.0% 13502 25127 兆豐金 22.7% 12673 43261 富邦金 27.8% 11957 31106 鴻海精密 33.0% 15899 32254 表七、 成交價與最佳賣價之法則加入最佳一檔委買量、委賣量壓力法則 證券名稱 下跌機率 下跌盤數 平盤及下跌盤數 日月光半導體 29.1% 11771 40366 台灣積體電路 36.3% 15754 43408 兆豐金 28.2% 8758 31002 富邦金 28.0% 11123 39811 鴻海精密 35.3% 12705 35931

(26)

15

3.2.4 買賣壓與中間價之關係法則

Avellaneda and Stoikov[37]於其研究中假設市場的真實價格是由中間價(mid-price)所決定的,故本實驗將其理論分別解釋成兩種影響買賣力道的可能情況, 其一為以最佳五檔中的買一及賣一之中間價是否大於或小於成交價來決定買賣 壓力,為了驗證法則對於模型預測率提升的效益,本研究將其也編入基因編碼內 讓 GA 進行演化,此法則在此實驗中定義為 R4,公式定義如下: 𝑀𝑀𝑚𝑚𝑖𝑖𝑚𝑚 =𝑃𝑃𝑏𝑏𝑏𝑏𝑏𝑏+𝑃𝑃2 𝑎𝑎𝑎𝑎𝑎𝑎, (8) 其中𝑀𝑀𝑏𝑏𝑖𝑖𝑚𝑚代表最佳五檔的買一,𝑀𝑀𝑎𝑎𝑎𝑎𝑎𝑎則代表最佳五檔的賣一,而𝑀𝑀𝑚𝑚𝑖𝑖𝑚𝑚即是中 間價,詳細的法則運作如表八所示,從表中可以得知買一的價錢為 126,賣一為 126.5,以公式 8 計算後可以得到中間價即為 126.25,而中間價 126.25 大於成交 價 126,因此可以預期下一刻的成交價傾向於上漲。 表八、 買賣價(最佳買一、賣一)所決定的中間價 價位(元) 最佳賣五 128.5 最佳賣四 128 最佳賣三 127.5 最佳賣二 127 最佳賣一 126.5 成交價 126 中間價(mid-price) 126.25 最佳買一 126 最佳買二 125.5 最佳買三 125 最佳買四 124.5 最佳買五 124

(27)

16

3.2.5 最佳五檔買賣壓與中間價之關係法則

延續 R4 的定義,我們另外定義最佳五檔買價及最加五檔賣價之中間價是否 大於或小於成交價來決定買賣壓力,在此實驗中定義為 R5,公式定義如下: 𝑀𝑀𝑎𝑎𝑎𝑎𝑎𝑎(𝑡𝑡) =∑ 𝑃𝑃𝑏𝑏𝑏𝑏𝑏𝑏(𝑡𝑡,𝑖𝑖) 5 𝑏𝑏=1 +∑5𝑏𝑏=1𝑃𝑃𝑎𝑎𝑎𝑎𝑎𝑎(𝑡𝑡,𝑖𝑖) 10 , (9) 其中𝑀𝑀𝑏𝑏𝑖𝑖𝑚𝑚代表最佳五檔的買價,𝑀𝑀𝑎𝑎𝑎𝑎𝑎𝑎代表最佳五檔的賣價,(𝑡𝑡, 𝑀𝑀)代表了第 t 盤的最佳買賣五檔的價格,𝑀𝑀𝑎𝑎𝑎𝑎𝑎𝑎(𝑡𝑡)即為買賣五檔的中間價,詳細的法則運作如表 九所示,經由公式 9 計算後,可得知𝑀𝑀𝑎𝑎𝑎𝑎𝑎𝑎的值為 430.45,從表中可以看到該盤成 交價為 430.5,所以這邊將預測下盤成交價將下跌,但若以原先的 R4 來判斷中 間價,將有可能獲得 430.5 的結果,所以可能預測下盤成交價上漲,但若以此公 開揭露資訊為例,下盤成交價將是 430,因此證實 R5 為有效。 表九、 最佳五檔買賣價所決定的中間價 價位(元) 最佳賣五 433 最佳賣四 432.5 最佳賣三 432 最佳賣二 431.5 最佳賣一 431 成交價 430.5 下一盤成交價 430 𝑀𝑀𝑎𝑎𝑎𝑎𝑎𝑎 430.45 最佳買一 430.5 最佳買二 430 最佳買三 429 最佳買四 428 最佳買五 427

(28)

17

3.2.6 自動演化之模型

為了驗證我們提出的模型的預測準確度,我們將上述幾個法則編入 GA 的染 色體之中去進行演化,並由 GA 進行挑選最佳的模型組合,以演化出最適合的模 型,此方法於本研究中定義為 Rule 6 (R6),並針對此重新設計了一組染色體,其 編碼方式將在 3.4.1 的部分加以詳述。

3.2.7 觀測方式

此小節我們將重新定義 Huang and Li [3]與 Huang et al. [4]於研究中所使用到 的觀測方式,詳細說明如下:

1. Observation 1 (O1):

此觀測方式為 Huang et al. [4]於其研究中所提出,同時也是 Huang and Li [3] 在其研究中所使用到的觀測方式,本研究也將會以此觀測方式為模型評估基 準來驗證該自動演化模型的預測能力,該觀測方式為預測每刻成交價的結果, 意思為若下刻為平盤也會將其計算在預測結果內,舉例來說:若當盤時刻為 𝑡𝑡,下一刻為𝑡𝑡 + 1,則以第𝑡𝑡盤的公開揭露資訊而預測第𝑡𝑡 + 1盤的股價變化即 為本觀測方式,詳細說明如表十、十一所示: 表十、 O1 之判斷方式(下一刻成交價有產生變化) Time Price T 100 T+1 101

(29)

18 表十一、 O1 之判斷方式(下一刻成交價並未變化) Time Price T 100 T+1 100 2. Observation 2 (O2): 該觀測方式為前個觀測方式之變形,其方法為僅預測成交價產生變化的那一 刻,即成交價若為平盤將不列入考慮,舉例來說:若當盤時刻為𝑡𝑡,下一個成 交價變化的時刻為𝑡𝑡 + 𝑛𝑛,則以第𝑡𝑡盤的公開揭露資訊而預測第𝑡𝑡 + 𝑛𝑛盤的股價 變化即為本觀測方式,該方法大幅減少了因預測到平盤所造成的預測失敗(FP 及 FN,將於 3.3 節詳述),因此提高了預測能力,結果的部分將會詳述此觀測 方式套入 Huang and Li [3]及 Huang et al. [4]之研究模型並與本研究模型進行 比較,該觀測方式詳細說明如表十二所示: 表十二、 O2 之判斷方式(成交價於 T+3 盤產生了變化) Time Price T 100 T+1 100 T+2 100 T+3 101

(30)

19

3.3 效能評估指標

為了評估模型的預測能力,本研究沿用 Huang and Li [3] 之研究,以精確度 (Precision)來表示模型的預測能力,亦被作為本研究中 GA 所使用的的適應性函 數指標,而適應性函數指標是用來作為當 GA 進行演化時驅動演算法尋找最佳解 的一種指標,其適應性函數指標在本研究中定義如下: 𝑀𝑀𝑃𝑃𝑃𝑃𝑃𝑃𝑀𝑀𝑠𝑠𝑀𝑀𝑏𝑏𝑛𝑛 =𝑇𝑇𝑃𝑃+𝐹𝐹𝑃𝑃𝑇𝑇𝑃𝑃 . (10) 計算時僅將 TP、FP 列入計算,也就是說以預測價格上漲為分母、預測價格 上漲且實際價格上漲為分子,能單純計算出預測正確的比率,其常用於機器學習、 資料探勘、病毒檢測、藥物檢測等領域,為一常用評估預測模型效能的指標。 底下我 們將 討論與 本 研究採 用的方法相 關之定義: TP (true positive)、TN (truenegative)、FP (false positive)、FN (false negative),詳細描述如下及表*所示:

TP: 預測價格上漲且實際價格上漲; FP: 預測價格上漲但實際價格未上漲; TN: 預測價格下跌且實際價格下跌; FN: 預測價格下跌但實際價格未下跌。 表十三、 模型預測結果分類 Actual outcome Predicted outcome True False

True TP(true positive) FP(false positive)

(31)

20 在 Huang and Li [3]的研究中指出,在台灣股市的高速交易環境中,平盤的狀 況非常多,亦即價平的部分也考慮進了預測失敗的結果之中,即 FP 之預測失敗 結果將採計下跌以及價平,FN 之預測失敗結果將採計上漲以及價平,這部分的 預測能力藉由觀測方式的改變而有所改善,其結果將在後續提到。

3.4 遺傳演算法

為了探究模型組合的最佳化,本研究採用了由 Holland [31]所提出的遺傳演 算法,並同時應用在 Huang and Li [3]中所提出的方法,以選出最適當的權重及各 項閾值並對這些參數進行最佳化。遺傳演算法為一種模擬物種生存模式的演算法, 其主要核心概念為達爾文所提出的「物競天擇,適者生存」的演化與淘汰的觀念。 此演算法模擬生物繁殖後代的過程中,具有較強適應性的個體將比較有機會產生 後代並進行交配及突變來修改基因的組成,促使親代及子代之間產生差異性,而 透過這些差異的特性所產生的生存者在新的環境中較具競爭性以利繼續繁殖,並 將優良的基因延續給下一代。 其中演算法是否滿足終止條件一般可透過以下三種方法來判斷: [1] 判斷是否收斂:設定收斂值門檻,一旦到達門檻即可停止執行演算法。 [2] 制定終止世代:設定系統執行到特定世代便停止進行演算法。 [3] 時間決定:預先設定演算法可執行時間,時間到達便停止運算。 如不符合中止條件,則將繼續執行演化步驟,直到中止條件滿足為止。 遺傳演算法的主要組成元素有親代、子代及交配與突變方法,及適應性函數 以驅動物種演化的方向,該演算法演化流程如下圖所示:

(32)

21 圖二、 基因演算法演化流程圖

3.4.1 基因編碼

本實驗的遺傳演算法編碼採用二進制的位元字串 Huang and Li [3] 來表示, 我們同時也將 Huang and Li [3]所使用的權重編碼也設計進本研究之染色體,該 染色體長度總共為 89 組基因,其中我們將各法則的啟動開關也同時編入了染色 體之中,而每個法則各需 1 組基因來做使用與否的判別,在最後為了讓 GA 理解 量價的大小比較,我們另外編入了一組判斷大小的基因,其詳細說明如下及圖 3 所示:

隨機產生

初始族群

適應性函數計算

檢查是否滿

足終止條件

近似最佳解

選擇與淘汰

交配與突變

(33)

22 R1: 於基因編碼中使用 1bit 作為此法則的啟動開關。 R2: 於基因編碼中用了 1bit 作為法則開關,及 1bit 作為大於或小於的判別, 並使用 80 個 bits 作為買賣最佳五檔做多及做空之權重編碼。 R3、R4 及 R5 皆使用了相同的編碼: 於基因編碼中用了 1bit 作為法則開關,及 1bit 作為大於或小於的判別。 圖三、 自動演化模型之基因編碼示意圖

3.4.2 解碼

在進行解碼的步驟時,染色體須先從 genotype(基因型)轉換至 phenotype(表 現型),其步驟為將染色體依其長度進行二進位轉換為十進位的比例換算步驟, 經比例換算後即可完成解碼該參數的作業,其中𝑝𝑝値為單個基因對應的 phenotype 參數, 𝑚𝑚𝑎𝑎𝑚𝑚𝑝𝑝 與 𝑚𝑚𝑀𝑀𝑛𝑛𝑝𝑝 表示參數的最大與最小數値,𝑀𝑀表示所對應的十進位數 値,𝑏𝑏表示對單一變數編碼時所用的長度(即位元的數量),其公式如下所示。 𝑝𝑝 = 𝑚𝑚𝑀𝑀𝑛𝑛𝑝𝑝+�2𝑙𝑙𝑚𝑚−1�× �𝑚𝑚𝑎𝑎𝑚𝑚𝑝𝑝− 𝑚𝑚𝑀𝑀𝑛𝑛𝑝𝑝�. (11)

(34)

23

3.4.3 選擇及淘汰方法

本 實 驗 採 用 由 Goldberg and Deb [38] 提 出 的 競 賽 選 擇 法 (Tournament Selection) ,使用此方法的原因為此方法產生下一代個體的計算成本較低,由於 高頻交易資料量大,以 GA 尋找最佳解的計算量將大幅提高,因此採用競賽選擇 法對本實驗的效益非常的大。 競賽選擇法的做法是從族群中隨機挑選出 2 條染色體,互相比較之後將此 2 條染色體中適應函數數値較高者保存到下一代族群中,持續這個步驟直到新 的子代之染色體個數達到預定數量,即完成這一代的選擇及淘汰步驟。

3.4.4 交配與突變

本實驗選用的交配法為 De Jong and Spears [39]所提出的單點交配法,交配 發生的機率由交配機率所控制,其作法是經由上個步驟選擇出來的染色體,每 2 條一組進行交配,在交配前先依染色體長度亂數產生一個整數 c,該整數值介於 染色體的長度 n 到 1 之間,之後開始交換位元資訊步驟,進而生成另外兩個新的 染色體而成為子代。 假定 2 條染色體設為父代個體以 𝐺𝐺𝑃𝑃𝑛𝑛𝑥𝑥 與 𝐺𝐺𝑃𝑃𝑛𝑛𝑦𝑦 表示,隨機產生交配點𝑃𝑃, 將兩個父代 𝐺𝐺𝑃𝑃𝑛𝑛𝑥𝑥 與 𝐺𝐺𝑃𝑃𝑛𝑛𝑦𝑦 做交換位元資訊步驟以產生全新染色體 𝐺𝐺𝑃𝑃𝑛𝑛𝑥𝑥′ 與 𝐺𝐺𝑃𝑃𝑛𝑛𝑦𝑦′,這 2 條染色體就是交配後產生的子代,定義公式如下,交配方式如圖四所 示: 𝐺𝐺𝑃𝑃𝑛𝑛𝑥𝑥 = {𝑔𝑔1𝑥𝑥, 𝑔𝑔2𝑥𝑥, ⋯ 𝑔𝑔𝑛𝑛−1𝑥𝑥 , 𝑔𝑔𝑛𝑛𝑥𝑥}, 𝑔𝑔𝑛𝑛𝑥𝑥∈ {0,1}, 𝑛𝑛 ∈ 𝑁𝑁; 𝐺𝐺𝑃𝑃𝑛𝑛𝑦𝑦 = �𝑔𝑔1𝑦𝑦, 𝑔𝑔2𝑦𝑦, ⋯ 𝑔𝑔𝑛𝑛−1𝑦𝑦 , 𝑔𝑔𝑛𝑛𝑦𝑦�, 𝑔𝑔𝑛𝑛𝑦𝑦 ∈ {0,1}, 𝑛𝑛 ∈ 𝑁𝑁; 𝐺𝐺𝑃𝑃𝑛𝑛𝑥𝑥′ = �𝑔𝑔1𝑥𝑥, 𝑔𝑔2𝑥𝑥, ⋯ , 𝑔𝑔𝑧𝑧𝑥𝑥, 𝑔𝑔𝑧𝑧+1𝑦𝑦 , … 𝑔𝑔𝑛𝑛−1𝑦𝑦 , 𝑔𝑔𝑛𝑛𝑦𝑦�; 𝐺𝐺𝑃𝑃𝑛𝑛𝑦𝑦′ = �𝑔𝑔1𝑦𝑦, 𝑔𝑔2𝑦𝑦, ⋯ , 𝑔𝑔𝑧𝑧𝑦𝑦, 𝑔𝑔𝑧𝑧+1𝑥𝑥 , … 𝑔𝑔𝑛𝑛−1𝑥𝑥 , 𝑔𝑔𝑛𝑛𝑥𝑥�.

(35)

24 𝐺𝐺𝑃𝑃𝑛𝑛𝑥𝑥 1 1 0 1 1 0 0 1 𝐺𝐺𝑃𝑃𝑛𝑛𝑦𝑦 1 0 1 0 0 1 1 0 𝐺𝐺𝑃𝑃𝑛𝑛𝑥𝑥′ 1 1 0 0 0 1 1 0 𝐺𝐺𝑃𝑃𝑛𝑛𝑦𝑦′ 1 0 1 1 1 0 0 1 𝑃𝑃交配點 圖四、 遺傳演算法交配示意圖 突變過程為隨機選取一條染色體字串,並亂數選取突變點,然後進行改變染 色體字串的位元資訊。突變過程發生的機率由(mutation rate)來決定是否發生,針 對二進制的位元字串而言就是將字串中的 0 變成 1 或者 1 變成 0,突變主要 的目的是為了防止染色體於演化過程中落入局部最佳解的現象,相對於交配的機 率,突變機率通常設定為相對較低的值以避免產生隨機搜尋的現象,如圖五所示: 突變點 𝐺𝐺𝑃𝑃𝑛𝑛′𝑥𝑥 1 1 0 0 0 1 1 0 突變後 𝐺𝐺𝑃𝑃𝑛𝑛′𝑥𝑥 1 1 1 0 0 1 1 0 突變點 圖五、 遺傳演算法突變示意圖

(36)

25

3.4.5 遺傳演算法範例

為了將遺傳演算法實際的運作方式解釋更為詳細,以下將設計一個範例,若 有一需要最佳化之問題定義為𝑓𝑓(𝑚𝑚) = 17𝑚𝑚 − 𝑚𝑚2,其中染色體 x 的編碼長度為 4 個位元,其產生的染色體如表十四所示: 表十四、 染色體 x 之四位元編碼 Integer Binary code Integer Binary code Integer Binary code Integer Binary code 0 0000 4 0100 8 1000 12 1100 1 0001 5 0101 9 1001 13 1101 2 0010 6 0110 10 1010 14 1110 3 0011 7 0111 11 1011 15 1111 我們假設某一個世代的族群含六支染色體𝑃𝑃1~c6,將其還原成整數並計算他 們的適應性數值(chromosome fitness)後如表十五: 表十五、 隨機染色體族群之適應值 Chromosome label Chromosome string Decoded integer Chromosome fitness c1 0101 5 60 c2 0011 3 42 c3 0100 4 52 c4 1011 11 66 c5 1110 14 42 c6 1000 8 72

(37)

26 因此,本小節的遺傳演算法範例流程可以用圖六表示: 圖六、 遺傳演算法範例流程圖 在第 i 個世代中,我們利用競賽法從表十五的染色體族群中選出 3 對親代染 色體進行單點交配。其中第一對親代染色體𝑃𝑃1𝑖𝑖𝑃𝑃4𝑖𝑖,我們假設他們並未通過預 設之交配機率,因此不做交配,僅複製雙方的染色體至突變階段。突變階段中, 我們假設僅𝑃𝑃4′𝑖𝑖𝑃𝑃1′𝑖𝑖的第三個位元有通過突變機率的檢驗,因此將這兩個位元 翻轉後形成新的染色體𝑃𝑃4′′𝑖𝑖與𝑃𝑃1′′𝑖𝑖,最後由這些染色體形成第 i+1 個世代的新族 群,繼續進行往後之適應性演化。

(38)

27

4. 研究結果

本章節分為 6 個小節,前半部分將說明本實驗所使用的資料來源及資料的時 間範圍區間,並介紹本實驗所使用到的時間驗證法(Temporal Validation)以及本實 驗的比較基準和其預測模型,最後將討論本實驗與過去的實驗比較結果。

4.1 資料來源

本研究以臺灣上司公司的股票類股為研究對象,為了比較本研究與過去的實 驗結果之間的差異性,本研究沿用了 Huang et al. [4]實驗中所使用到的五家公司, 其為台灣證券交易所民國 104 年 9 月 15 日之成交量前 20 名證券中的 5 支證券, 為了驗證本實驗模型的有效性,額外增加了同為半導體類股與金融類股的 5 支證 券如表十六所示: 表十六、 臺灣上市公司的個股研究對象

STOCK

證卷名稱

1

日月光半導體

2

台灣積體電路

3

兆豐金

4

富邦金

5

鴻海精密

6

中信金

7

友達

8

玉山金

9

旺宏

10

聯電

4.2 研究區間

本實驗為了與 Huang et al. [4]比較模型的效能差異,故挑選了同樣時間區

(39)

28 間為 2015 年 9 月 15 日~2015 年 10 月 28 日共計 26 個交易日來進行實驗,同 時還原原先的實驗方法以跟 R6 來進行比較。交易時段的部分則是從上午九點 到下午一點半,其中不包含開盤前與收盤後的集合競價,平均一個週期有 70,000 筆 資 料 。 資 料 來 源 為 台 灣 證 券 交 易 所 的 基 本 市 況 報 導 網 站 (http://mis.twse.com.tw/stock/index.jsp),資料更新的頻率以 5 秒為一個週期。

4.3 時間驗證(Temporal Validation)

由於財務領域的實驗數據是具有時間性的,因此和一般的交叉驗證(cross validation)不同的地方在於演算法不能事先知道未來的測試數據,在我們將資料 分為訓練期與測試期時,必須要遵守訓練期資料的時間須早於測試期的資料。因 此,我們採用了如圖七所示的時間驗證法(Temporal Validation, TV) [3,20]做為我 們檢驗模型效能的方法。 在 Huang and Li [3]中有提到測試期的資料不足所導致模型的評估難度增加, 該研究中是在每個 TV 中以 GA 演化至目前為止最好的結果(Best-So-Far solution, BSF)來進行測試,但此最佳模型可能不適用於不同的測試環境以致不具足夠的 強建性,因此我們在此實驗中紀錄了 GA 演化的所有的過程,並將每個 run 之中 最好的結果代入測試資料並將其預測結果平均化,亦即我們採用的是數個 run 的 BSF 而平均後的預測結果。這些結果平均(Mean Testing)出來的數據顯示,GA 所 訓練出來的結果在完全演化結束之前,其實就已存在著許多具參考價值的模型組 合,若照 Huang and Li [3]原先的實驗僅以最終演化的最佳結果來進行測試,可以 發現在有些 TV 中訓練期的唯一最佳解的條件在測試期中完全沒有出現以致於 無法做任何預測而造成準確度為 0 的可能性發生,但藉由 Mean Testing 處理後, 能夠發現其模型並不全然如此,在這其中還是存在著能夠於測試期中可讓預測模 型的啟動條件被滿足而使模型被啟動以執行預測的任務。

(40)

29

本研究所使用到的 Temporal Validation 將會是 Huang and Li [3]所提出的原始 運作方式,但其中的結果則是運用到了 MeanTesting 來進行處理,故 25 個 TV 中,我們將使用 26 天的歷史資料,並以「日」為單位分成 25 個區間,並將此 25 個區間分為訓練期與測試期。例如,第 1 個 TV 的訓練期為第 1 天的資料,第 2 到 26 天的資料為測試期;第 n 個 TV 的訓練期為第 1 到第 n 天的資料,測試期 為第 n+1 到第 26 天的資料,如圖七所示。更詳盡來說,TV=1 時,我們用 2015 年 9 月 15 日的歷史資料作為訓練期,並以 GA 演化出較優良的模型組合,並將 此組合套用至測試期 2015 年 9 月 16 日至 2015 年 10 月 28 日的期間;TV=2 時, 訓練期間為 2015 年 9 月 15 日至 16 日,測試期間為 2015 年 9 月 17 日至 10 月 28 日,依此類推。 TV\Day 2015/9/15 2015/9/16 … 2015/10/27 2015/10/28 1 2 Training Testing … … 24 25 圖七、 Temporal Validation 之圖示

4.4 演算法演化設定

在遺傳演算法的迭代計算中,於每一個 TV 中 GA 皆會進行 50 個回合的計 算,藉此找出 50 個較優秀的交易模型。同時每一個回合讓 GA 演化 50 代,而每 一代有 50 支個體(染色體)進行演化,因此每回合的目標值計算(function evaluation) 次數為 2500 次。 本實驗因使用了前幾個實驗提出的三種法則,故在 R2 中同樣使用到了 GA

(41)

30 對最佳五檔委託量權重所進行的參數演化,其中做多的最佳五檔委託量的權重 m𝑚𝑚、𝑚𝑚𝑚𝑚′及做空的最佳五檔委託量的權重 a𝑚𝑚、a𝑚𝑚′,在 GA 的演化參數設定上 則為個體演化中單點交配的機率為 0.7,突變機率為每個位元 0.005,每一個變 數於染色體上以 8 個位元長度被編碼,各參數演化的值域範圍如下表十七所示: 演化參數名稱 最小值 最大值 參數資料型態 控制大於或小於 0 1 布林數 法則開關 0 1 布林數 𝑚𝑚𝑚𝑚1, 𝑚𝑚𝑚𝑚2, … , 𝑚𝑚𝑚𝑚𝑛𝑛 0.0 1.0 浮點數 𝑚𝑚𝑚𝑚′1, 𝑚𝑚𝑚𝑚′2, … , 𝑚𝑚𝑚𝑚′𝑛𝑛 0.0 1.0 浮點數 𝑎𝑎𝑚𝑚1, 𝑎𝑎𝑚𝑚2, … , 𝑎𝑎𝑚𝑚𝑛𝑛 0.0 1.0 浮點數 𝑎𝑎𝑚𝑚′1, 𝑎𝑎𝑚𝑚′2, … , 𝑎𝑎𝑚𝑚′𝑛𝑛 0.0 1.0 浮點數 表十七、 最佳化演算法參數演化值域範圍

4.5 比較基準

在本研究中我們將比較本實驗所提出的模型與 Huang et al. [4]所提出的模型 之間的效能差異,該提出之模型即為 R1R2GAO1,R1 之所代表的法則為成交價 與最佳買價及最佳賣價之法則;R2GA 為最佳五檔委託量權重法則,其中 GA 的 意思係以遺傳演算法於 R2 演化出最佳五檔委託量之權重,故之後將簡稱為 R2; R3 則為最佳一檔委買量、委賣量壓力法則。在 3.2.7 裡所提到的兩種觀測方式, O1 即為此兩種觀測方式的其中一種,此觀測方式為以第 t 盤的公開揭露資訊而 預測第 t+1 盤的股價變化,O2 則為以第 t 盤的公開揭露資訊而預測第 t+n 盤(成 交價變化的盤數即為第 n 盤)的股價變化。在本實驗中,我們亦將 Huang et al. [4] 於其研究中所提出的模型進行了第二種觀測方式的實驗,故以下將詳細說明以上

(42)

31

幾種模型以及本實驗所提出的預測模型,第一組模型為我們為了驗證 R2 在獨立 運作的情況下能否利用 GA 演化出類似於 R1R2 所進行的測試,第二組模型是由 Huang et al. [4] 以 Huang and Li [3]文獻中所提出的模型改良而得,第三組模型即 為本實驗所提出的自動演化之模型:

Model1_O1 (M1O1): R2 在 O1 的觀測方式下以 Precision 為適應性函數而 進行演化

Model1_O2 (M1O2): R2 在 O2 的觀測方式下以 Precision 為適應性函數而 進行演化

Model2_O1 (M2O1): R1R2 在 O1 的觀測方式下以 Precision 為適應性函數 而進行演化

Model2_O2 (M2O2): R1R2 在 O2 的觀測方式下以 Precision 為適應性函數 而進行演化

Model3_O1 (M3O1): R6 在 O1 的觀測方式下以 Precision 為適應性函數而 進行演化

Model3_O2 (M3O2): R6 在 O1 的觀測方式下以 Precision 為適應性函數而 進行演化

在本實驗中提出的模型自動演化來檢驗是否可經由 GA 來挑出最佳的選股 法則以獲得最佳的預測模型組合而取得更好的股價預測結果。

(43)

32

4.6 實驗結果

實驗結果為 M3 透過遺傳演算法挑出最佳的模型組合後與其他模型所進行 的比較。首先將介紹十家公司使用遺傳演算法於訓練期及測試期分別的結果,圖 例將同時呈現觀測方式一(O1)及觀測方式二(O2),接著是三種模型各自在 25 個 TV 中的勝率,藉此來凸顯 M3 的預測能力,並解釋 M3 於 25 個 TV 中各挑選出 了多少 Rules,最後將比較三種模型在兩種觀測方式中各自的平均值及標準差。

4.6.1 三種模型於各家公司分別在 O1 及 O2 的表現

圖八上半部的圖是日月光半導體製造的股票運用遺傳演算法配合三種 Model (M1、M2、M3)於訓練期的預測結果,左上的圖為 O1 的訓練期間結果, 右上的圖則為 O2 的訓練期結果;下半部分的圖為三種模型於測試期的預測結果, 左下的圖為 O1 的測試期間結果,右下的圖則為 O2 的測試期結果。左上圖的結 果顯示,M2 略優於 M3 的結果,M1 則輸給了其餘兩種方法;右上圖的結果顯 示,M3 的表現皆優於 M1 及 M2 兩種方法;左下圖的結果顯示,M3 在 22 個 TV 之結果中表現最佳,M2 為在 2 個 TV,M1 則為在 1 個 TV 中表現最佳;右下圖 的結果顯示,M3 有 23 個 TV 之結果優於其他兩種,M2 則為在 2 個 TV 中為最 優的方法,M1 於所有 TV 中皆輸給了其他兩種方法。三種方法在 O1 及 O2 兩種 測試期的結果皆呈現出了過度訓練的情形,但相對而言 M3 的效果仍然為最佳, 亦即 R6 可產生較佳的預測模型。

(44)

33

圖八、 日月光在 O1 及 O2 於 2015/09/15~2015/10/28 期間預測結果

圖九是台灣積體電路製造公司的股票運用遺傳演算法配合三種 Model 的預 測結果,其圖片排列方式如同圖五所示,故以下圖片的解說方式將以左上圖 (Training O1)、右上圖 (Training O2)、左下圖 (Testing O1)、右下圖 (Testing O2) 來作呈現。左上圖的結果顯示,M3 及 M2 的結果相近;右上圖的結果顯示,M3 及 M2 同樣不分上下,M1 的結果也趨近於 M2 及 M3;左下圖的結果顯示,M3 有 17 個 TV 優於其他兩種方法,M2 為 7 個 TV 為最優的方法,M1 則有 1 個 TV 為最優方法;右下圖的結果顯示,M3 有 24 個 TV 優於其他兩種方法,M2 為 1 個 TV,M1 則為 0 個。 5 10 15 20 25 0 0.5 1 Precision Training (O1) M1O1 M2O1 M3O1 5 10 15 20 25 0 0.5 1 Training (O2) M1O2 M2O2 M3O2 5 10 15 20 25 Temporal Validation (TV) 0 0.5 1 Precision Testing (O1) M1O1 M2O1 M3O1 日月光半導體製造股份有限公司 5 10 15 20 25 Temporal Validation (TV) 0 0.5 1 Testing (O2) M1O2 M2O2 M3O2

(45)

34 圖九、 台積電在 O1 及 O2 於 2015/09/15~2015/10/28 期間預測結果 圖十是兆豐金融控股的股票運用遺傳演算法配合三種 Model 的預測結果。 左上圖的結果顯示,M3 及 M2 的結果相近;右上圖的結果顯示,M3 優於 M2 之 結果,M1 則輸給了 M2 及 M3;左下圖的結果相較於前兩家公司之結果較為特 殊,M3 於該次測試僅有 6 個 TV 贏過其他兩種方法,M2 於本次結果有 19 個 TV 優於其他兩種方法,M1 則為 0 個;右下圖的結果顯示,M3 有 24 個 TV 優於其 他兩種方法,M2 該次測試則為 0 個 TV,M1 為 1 個 TV 優於其他兩種方法。 5 10 15 20 25 0 0.5 1 Precision Training (O1) M1O1 M2O1 M3O1 5 10 15 20 25 0 0.5 1 Training (O2) M1O2 M2O2 M3O2 5 10 15 20 25 Temporal Validation (TV) 0 0.5 1 Precision Testing (O1) M1O1 M2O1 M3O1

台灣積體電路製造股份有限公司

5 10 15 20 25 Temporal Validation (TV) 0 0.5 1 Testing (O2) M1O2 M2O2 M3O2

(46)

35 圖十、 兆豐金在 O1 及 O2 於 2015/09/15~2015/10/28 期間預測結果 圖十一是富邦金融控股的股票運用遺傳演算法配合三種 Model 的預測結果。 左上圖的結果顯示,M3 及 M2 的結果相近,M1 輸給其他兩種方法;右上圖的結 果顯示,M3 及 M2 不分上下,M1 的結果也趨近於 M2 及 M3;左下圖的結果顯 示,M3 有 21 個 TV 優於其他兩種方法,M2 為 4 個 TV,M1 則為 0 個,M2 及 M3 於 TV23 之後結果明顯較差,此可能是因為測試資料不足而造成的結果,未 來我們將可再探討此現象;右下圖的結果顯示,M3 有 17 個 TV 優於其他兩種方 法,M2 為 8 個 TV,M1 則為 0 個,於 O1 類似的結果於 O2 也可看到,在 TV22 之後的結果較差,此亦可能是因為測試資料不足所造成的結果。 5 10 15 20 25 0 0.5 1 Precision Training (O1) M1O1 M2O1 M3O1 5 10 15 20 25 0 0.5 1 Training (O2) M1O2 M2O2 M3O2 5 10 15 20 25 Temporal Validation (TV) 0 0.5 1 Precision Testing (O1) M1O1 M2O1 M3O1

兆豐金融控股股份有限公司

5 10 15 20 25 Temporal Validation (TV) 0 0.5 1 Testing (O2) M1O2 M2O2 M3O2

(47)

36 圖十一、富邦金在 O1 及 O2 於 2015/09/15~2015/10/28 期間預測結果 圖十二是鴻海精密工業的股票運用遺傳演算法配合三種 Model 的預測結果。 左上圖的結果顯示,M3 及 M2 的結果相近;右上圖的結果顯示,M3 優於其他兩 種方法,M1 的結果則與 M2 不分上下;左下圖的結果顯示,M3 有 16 個 TV 優 於其他兩種方法,M2 為 9 個 TV,M1 則為 0 個;右下圖類似於台積電之結果, M3 有 24 個 TV 優於其他兩種方法,M2 為 1 個 TV,M1 則為 0 個。 5 10 15 20 25 0 0.5 1 Precision Training (O1) M1O1 M2O1 M3O1 5 10 15 20 25 0 0.5 1 Training (O2) M1O2 M2O2 M3O2 5 10 15 20 25 Temporal Validation (TV) 0 0.5 1 Precision Testing (O1) M1O1 M2O1 M3O1

富邦金融控股股份有限公司

5 10 15 20 25 Temporal Validation (TV) 0 0.5 1 Testing (O2) M1O2 M2O2 M3O2

(48)

37 圖十二、鴻海在 O1 及 O2 於 2015/09/15~2015/10/28 期間預測結果 圖十三是中國信託金融控股的股票運用遺傳演算法配合三種 Model 的預測 結果,該次訓練及測試相較於其他公司之結果也是較為特別的一家,其結果呈現 與其他家公司相比起來也較為極端。左上圖的結果顯示,M3 及 M2 的結果相近, M1 輸給其他兩種方法;右上圖的結果顯示,M2 贏過了其他兩種方法,M1 及 M3 的結果不分上下;左下圖的結果顯示,M3 僅有 6 個 TV 優於其他兩種方法,M2 則為 19 個 TV,M1 為 0 個;右下圖的結果顯示更為明顯,M3 僅 1 個 TV 優於 其他兩種方法,M2 則為 24 個 TV,M1 為 0 個。 5 10 15 20 25 0 0.5 1 Precision Training (O1) M1O1 M2O1 M3O1 5 10 15 20 25 0 0.5 1 Training (O2) M1O2 M2O2 M3O2 5 10 15 20 25 Temporal Validation (TV) 0 0.5 1 Precision Testing (O1) M1O1 M2O1 M3O1 鴻海精密工業股份有限公司 5 10 15 20 25 Temporal Validation (TV) 0 0.5 1 Testing (O2) M1O2 M2O2 M3O2

(49)

38 圖十三、中信金在 O1 及 O2 於 2015/09/15~2015/10/28 期間預測結果 圖十四是友達光電的股票運用遺傳演算法配合三種 Model 的預測結果。左 上圖的結果顯示,M3 及 M2 的結果相近,M1 輸給其他兩種方法;右上圖的結果 顯示,M3 及 M2 同樣不分上下,M1 的結果也趨近於 M2 及 M3;左下圖的結果 顯示,M3 有 17 個 TV 優於其他兩種方法,M2 為 8 個 TV,M1 則為 0 個;右下 圖的結果顯示,M3 有 24 個 TV 優於其他兩種方法,M2 為 1 個 TV,M1 則為 0 個,其結果類似於台積電與鴻海。 5 10 15 20 25 0 0.5 1 Precision Training (O1) M1O1 M2O1 M3O1 5 10 15 20 25 0 0.5 1 Training (O2) M1O2 M2O2 M3O2 5 10 15 20 25 Temporal Validation (TV) 0 0.5 1 Precision Testing (O1) M1O1 M2O1 M3O1 中國信託金融控股股份有限公司 5 10 15 20 25 Temporal Validation (TV) 0 0.5 1 Testing (O2) M1O2 M2O2 M3O2

(50)

39 圖十四、友達在 O1 及 O2 於 2015/09/15~2015/10/28 期間預測結果 圖十五是玉山金融控股的股票運用遺傳演算法配合三種 Model 的預測結果。 左上圖的結果顯示,M3 及 M2 的結果相近,M1 輸給其他兩種方法;右上圖的結 果顯示,M3 及 M2 同樣不分上下,M1 的結果也趨近於 M2 及 M3;左下圖的結 果顯示,M3 有 17 個 TV 優於其他兩種方法,M1 及 M2 皆為 4 個 TV;右下圖的 結果顯示,M2 及 M3 結果較為相近,但兩種方法分別於 TV19 及 TV24 呈現出 較大的震盪,M3 有 13 個 TV 優於其他兩種方法,M2 為 11 個 TV,M1 則為 1 個。 5 10 15 20 25 0 0.5 1 Precision Training (O1) M1O1 M2O1 M3O1 5 10 15 20 25 0 0.5 1 Training (O2) M1O2 M2O2 M3O2 5 10 15 20 25 Temporal Validation (TV) 0 0.5 1 Precision Testing (O1) M1O1 M2O1 M3O1

友達光電股份有限公司

5 10 15 20 25 Temporal Validation (TV) 0 0.5 1 Testing (O2) M1O2 M2O2 M3O2

(51)

40 圖十五、玉山金在 O1 及 O2 於 2015/09/15~2015/10/28 期間預測結果 圖十六是旺宏電子的股票運用遺傳演算法配合三種 Model 的預測結果。左 上圖的結果顯示,M3 略優於 M2 之結果;右上圖的結果顯示,M3 及 M2 同樣不 分上下,M1 的結果也趨近於 M2 及 M3;左下圖的結果顯示,三種方法於 TV1 至 TV7 之結果較為相似,於 TV8 之後,皆為 M3 之結果優於其他兩種,在這 25 個 TV 中,M3 皆優於其他兩種方法;右下圖的結果同樣顯示,M3 在 25 個 TV 之中優於其他兩種方法,較為特別的地方為 M2 在第 13 個 TV 之後輸給了 M1。 5 10 15 20 25 0 0.5 1 Precision Training (O1) M1O1 M2O1 M3O1 5 10 15 20 25 0 0.5 1 Training (O2) M1O2 M2O2 M3O2 5 10 15 20 25 Temporal Validation (TV) 0 0.5 1 Precision Testing (O1) M1O1 M2O1 M3O1

玉山金融控股股份有限公司

5 10 15 20 25 Temporal Validation (TV) 0 0.5 1 Testing (O2) M1O2 M2O2 M3O2

(52)

41 圖十六、旺宏在 O1 及 O2 於 2015/09/15~2015/10/28 期間預測結果 圖十七是聯華電子的股票運用遺傳演算法配合三種 Model 的預測結果。左 上圖的結果顯示,M3 及 M2 的結果相近,M1 輸給其他兩種方法;右上圖的結果 顯示,M3 及 M2 同樣不分上下,M1 的結果也趨近於 M2 及 M3;左下圖的結果 顯示,M3 有 15 個 TV 優於其他兩種方法,M2 為 10 個 TV,M1 則為 0 個;右 下圖的結果顯示,M3 有 23 個 TV 優於其他兩種方法,M2 為 2 個 TV,M1 則為 0 個。 5 10 15 20 25 0 0.5 1 Precision Training (O1) M1O1 M2O1 M3O1 5 10 15 20 25 0 0.5 1 Training (O2) M1O2 M2O2 M3O2 5 10 15 20 25 Temporal Validation (TV) 0 0.5 1 Precision Testing (O1) M1O1 M2O1 M3O1

旺宏電子股份有限公司

5 10 15 20 25 Temporal Validation (TV) 0 0.5 1 Testing (O2) M1O2 M2O2 M3O2

(53)

42 圖十七、聯電在 O1 及 O2 於 2015/09/15~2015/10/28 期間預測結果 5 10 15 20 25 0 0.5 1 Precision Training (O1) M1O1 M2O1 M3O1 5 10 15 20 25 0 0.5 1 Training (O2) M1O2 M2O2 M3O2 5 10 15 20 25 Temporal Validation (TV) 0 0.5 1 Precision Testing (O1) M1O1 M2O1 M3O1 聯華電子股份有限公司 5 10 15 20 25 Temporal Validation (TV) 0 0.5 1 Testing (O2) M1O2 M2O2 M3O2

(54)

43

4.6.2 三種模型各自在 25TV 中的獲勝比率

在此小節中我們將前面的三種模型於 25 個 TV 中獲勝比率的實驗結果整理 說明如下。在表十八中可以看到,M3 在大部分的情況下,皆能贏過 M2 及 M1, 少數幾個結果較為例外,如表十八中的 O1 部分,可以看到兆豐金的 M2 為勝率 最高的方法,同樣類似的結果在中信金也能看到。然而於其餘的結果都能看到 M3 皆勝過了其他兩種方法;O2 的部分則為中信金以 M2 作為測試的情形下贏過了 其他兩種方法,玉山金的部分則可以看到 M2 勝率佔比極為接近 M3,其餘的結 果則是 M3 皆勝過了其他兩種方法,尤以旺宏的測試結果可以看到,不論是在 O1 或 O2 的情形下,M3 皆完全勝過其他兩種方法,由此可以知道 M3 在自動演化 的規則下於大部分的情況皆是最優的方法。 表十八、 三種模型在 25 個 TV 中分別於十家公司中各自的勝率佔比 O1 O2 M1 M2 M3 M1 M2 M3 日月光半導體 4% 8% 88% 0% 8% 92% 台灣積體電路 4% 28% 68% 0% 4% 96% 兆豐金 0% 76% 24% 4% 0% 96% 富邦金 0% 16% 84% 0% 32% 68% 鴻海精密 0% 36% 64% 0% 4% 96% 中信金 0% 76% 24% 0% 96% 4% 友達 0% 32% 68% 0% 4% 96% 玉山金 16% 16% 68% 4% 44% 52% 旺宏 0% 0% 100% 0% 0% 100% 聯電 0% 40% 60% 0% 8% 92%

(55)

44

4.6.3 M3 在 25 個 TV 中所挑選到的各 Rule 的總次數統計結果

由於 M3 為一種運用遺傳演算法自動挑選規則的方法,以下我們說明 M3 分 別在兩種觀測方式下於 10 家公司各自挑選到的規則,藉此觀察出遺傳演算法在 每次演化後所挑選之規則重心偏向於哪些法則。 圖十八為日月光半導體的股票以 M3 作為模型在訓練期間所挑選到的各法 則總數,O1 (左圖)的結果顯示,R3 及 R5 的挑選較為突出;O2 (右圖)的結果顯 示,R2 及 R3 的挑選較為突出,R5 則為最低。 圖十八、日月光半導體以 M3 在訓練期間所挑選到的各 Rule 總數 圖十九為台灣積體電路的股票以 M3 作為模型在訓練期間所挑選到的各法 則總數,於 O1 的結果顯示 R2 及 R3 的挑選較為突出;O2 的結果則顯示 R3 的挑選最為突出,其次則為 R2。 O1 R1 R2 R3 R4 R5 Rule 0 200 400 600 800 1000 1200 1400 Times 日月光半導體製造股份有限公司 O2 R1 R2 R3 R4 R5 Rule 0 200 400 600 800 1000 1200 1400

(56)

45 圖十九、台積電以 M3 在訓練期間所挑選到的各 Rule 總數 圖二十為兆豐金融控股的股票以 M3 作為模型在訓練期間所挑選到的各法 則總數,O1 的結果顯示出 R2 的挑選最為突出,其次則為 R3;O2 的結果則顯 示,R2 及 R3 的挑選較為突出。 圖二十、兆豐金以 M3 在訓練期間所挑選到的各 Rule 總數 O1 R1 R2 R3 R4 R5 Rule 0 200 400 600 800 1000 1200 1400 Times 台灣積體電路製造股份有限公司 O2 R1 R2 R3 R4 R5 Rule 0 200 400 600 800 1000 1200 1400 O1 R1 R2 R3 R4 R5 Rule 0 200 400 600 800 1000 1200 1400 Times 兆豐金融控股股份有限公司 O2 R1 R2 R3 R4 R5 Rule 0 200 400 600 800 1000 1200 1400

參考文獻

相關文件

A factorization method for reconstructing an impenetrable obstacle in a homogeneous medium (Helmholtz equation) using the spectral data of the far-field operator was developed

A factorization method for reconstructing an impenetrable obstacle in a homogeneous medium (Helmholtz equation) using the spectral data of the far-eld operator was developed

We were particularly impressed by the large garden which is looked after by the students and used to grow fruit, herbs and vegetables for the midday meal which the school serves free

2.1 The Derivative and the Tangent Line Problem 2.2 Basic Differentiation Rules and Rates of Change 2.3 Product and Quotient Rules and Higher-Order Derivatives.. 2.4 The

Next, according to the bursts selected by a biologist through experience, we will generalize the characteristics and establish three screening conditions.. These three

• 在一台每秒可進行

The pipelined CORDIC arithmetic unit is used to compute the complex multiplications involved in FFT, and moreover the required twiddle factors are obtained by using the

We try to explore category and association rules of customer questions by applying customer analysis and the combination of data mining and rough set theory.. We use customer