• 沒有找到結果。

一個使用機器學習模型的資金管理系統的比較性研究

N/A
N/A
Protected

Academic year: 2021

Share "一個使用機器學習模型的資金管理系統的比較性研究"

Copied!
77
0
0

加載中.... (立即查看全文)

全文

(1)國立高雄大學資訊工程研究所 碩士論文. 一個使用機器學習模型的資金管理系統的比較性研究 A Comparative Study of Money Management Systems Using Machine Learning Models. 研究生:洪嘉澤 撰 指導教授:黃健峯 博士 指導教授:張志向 博士. 中華民國 102 年 7 月.

(2) 一個使用機器學習模型的資金管理系統的比較性研究 指導教授:黃健峯 博士 國立高雄大學資訊工程所. 指導教授:張志向 博士 國立高雄大學金融管理學系. 學生:洪嘉澤 國立高雄大學資訊工程所. 摘要 在這篇論文中,我們提出一個應用遺傳演算法與機率整合體來建立一個兼具 降低風險與提升績效的交易組合模型的比較性研究。為了驗證資金管理模型的效 用,我們使用技術指標來決定交易系統中的進出市場時機。我們同時採用多種不 同的目標函數以及績效指標來驗證模型的優劣,包含複利報酬率、Sharpe ratio、 Calmar ratio 以及 Sortino ratio。首先實驗結果顯示,以複利報酬率比較,遺傳演 算法與機率整合體所演化出的模型明顯優於買進持有策略。另外我們實驗結果也 表明,使用機率整合體所演化出的模型會比遺傳演算法更為強健。最後實驗結果 顯示,百分率模型是本文中最有效的資金管理系統。我們期望本文所提出的方法 可以推進機器學習方法於計算財務學的應用研究。. 關鍵字: 遺傳演算法,機率整合體、資金管理、技術指標、績效指標. I.

(3) A Comparative Study of Money Management Systems Using Machine Learning Models Advisor: Dr. Huang Institute of Computer Science and Information Engineer National University of Kaohsiung Co-advisor: Dr. Chih-Hsiang Chang Department of Finance National University of Kaohsiung Student: Chia-Tse Hung Institute of Computer Science and Information Engineer National University of Kaohsiung ABSTRACT In this thesis we present a comparative study of money management systems using two machine-learning approaches—Genetic Algorithms (GA) and Probability Collectives (PC). To investigate the effect of money management models, we purpose using technical indicators to determine the market timing for our trading systems. We also use a combination of various objective functions and performance indicators to evaluate our models, including annualized returns, Sharpe ratio, Calmar ratio as well as Sortino ratio. Our results showed that (1) both the GA and the PC outperformed the benchmark in terms of return and risk; (2) the models optimized by the PC are typically more robust than those by the GA; (3) the percent risk model tends to be the most effective in all the money management models we tested. We thus expect this proposed methodology to advance the current state of machine learning for computational finance. Keywords: Genetic Algorithms, Probability Collectives multi-agent systems, technical Indicators, money management, performance indicators II.

(4) 致謝 感謝黃健峯老師與張志向老師,指導我論文的方向以及建議。黃老師提供了 相當多的建議以及論文的架構,張老師則是提供了很棒的財務知識來幫助我了解 財務上的論文要怎麼修改。在此,感謝高雄大學資工系陳建源老師以及中興大學 電機系莊家峰老師來擔任我的口試委員,提出了很多良好的建議。 接著,我要感謝我的家人,資助我完成學、碩士的課業,以及幫助我生活中 的大小事,讓我可以順利完成碩士學位;謝謝我的爺爺與奶奶,希望你們在天堂 也能過得快樂。再來謝謝實驗室的所有人,幫忙我在口試前的很多準備工作,讓 我可以專心於口試。謝謝高雄大學籃球隊的所有老師,讓我可以在讀碩士期間還 能夠從事籃球活動,身心都相當的快樂。感謝我高雄大學資工系、電機系、法律 系的同學們,互相傳遞了很多畢業的訊息,讓我在行程上不會延誤,以及帶來很 多歡樂與籃球活動。 最後感謝暨南大學的老師以及同學,在我還不擅長寫程式時指導我很多,謝 謝你們。. 嘉澤 謹誌 國立高雄大學 資訊工程所 中華民國一百零二年七月. III.

(5) 目錄 中文摘要 ............................................................................................................... I 英文摘要 ...............................................................................................................II 致謝 .....................................................................................................................III 目錄 .................................................................................................................... IV 表目錄............................................................................................................... VIII 圖目錄................................................................................................................. IX 導論 ......................................................................................................1. 1 1.1. 研究背景 ............................................................................................... 1. 1.2. 研究目的 ............................................................................................... 2. 1.3. 論文架構 ............................................................................................... 2 文獻探討 ..............................................................................................3. 2 2.1. 技術指標 ............................................................................................... 3. 2.2. 資金管理 ............................................................................................... 3. 2.3. 績效指標 ............................................................................................... 4. 2.4. 人工智慧相關文獻 ............................................................................... 5. 2.2.1. 遺傳演算法 ........................................................................................ 6. 2.2.2. 機率整合體 ........................................................................................ 6 研究方法 ..............................................................................................7. 3 3.1 3.1.1. 技術指標 ............................................................................................... 7 簡單移動平均線 ................................................................................ 7. IV.

(6) 3.1.2. 乖離率 ................................................................................................ 8. 3.1.3. 指數平滑異同移動平均線 ................................................................ 9. 3.1.4. 隨機指標 .......................................................................................... 10. 3.2. 資金管理模型 ..................................................................................... 11. 3.2.1. 買進持有策略 .................................................................................. 11. 3.2.2. 固定比例投資組合保險 .................................................................. 11. 3.2.3. 不隨時間而變之投資組合保護 ...................................................... 12. 3.2.4. 百分率模型 ...................................................................................... 13. 3.2.5. 價格波動百分率模型 ...................................................................... 14. 3.3. 績效指標 ............................................................................................. 15. 3.3.1. 年化報酬率 ...................................................................................... 15. 3.3.2. maximum loss ................................................................................... 15. 3.3.3. maximum drawdown ....................................................................... 16. 3.3.4. Sharpe ratio ...................................................................................... 16. 3.3.5. Sortino ratio...................................................................................... 17. 3.3.6. Calmar ratio ...................................................................................... 17. 3.4. 遺傳演算法 ......................................................................................... 18. 3.4.1. 編碼方式 .......................................................................................... 19. 3.4.2. 選擇親代方式 .................................................................................. 20. 3.4.3. 交配與突變 ...................................................................................... 20. 3.4.4. 流程圖 .............................................................................................. 22. 3.5. 機率整合體 ......................................................................................... 24 V.

(7) 3.5.1. 機率整合體理論 .............................................................................. 24. 3.5.2. 機率整合體演算法 .......................................................................... 27. 3.5.3. 流程圖 .............................................................................................. 28 研究結果 ............................................................................................ 30. 4 4.1. 資料來源與研究期間 ......................................................................... 30. 4.2. 研究的驗證方式 ................................................................................. 30. 4.3. 研究結果比較 ..................................................................................... 31. 4.3.1. 同時演化技術指標與資金管理模型且目標函數為複利報酬率以比較 GA 與 PC ....... 32. 4.3.2. 同時演化技術指標與資金管理模型且目標函數為 Calmar ratio 以比較 GA 與 PC ..... 38. 4.3.3. 同時演化技術指標與資金管理模型以不同的績效指標作為目標函數之比較 .......... 40. 4.3.4. 固定技術指標與演化資金管理模型且目標函數為複利報酬率以比較 GA 與 PC ....... 47. 4.3.5. 固定技術指標與演化資金管理模型且目標函數為 Calmar ratio 以比較 GA 與 PC ..... 49. 4.3.6. 固定技術指標與演化資金管理模型型以不同的績效指標作為目標函數之比較 ....... 51. 4.4. 實驗數據總整理 ................................................................................. 56. 5. 結論 .................................................................................................... 62. 6. 參考文獻 ............................................................................................ 63. VI.

(8) 表目錄 表 1.. 適應性函數(或目標函數)為複利報酬率實驗結果(訓練期部分) ........................................ 32. 表 2.. 適應性函數(或目標函數)為複利報酬率實驗結果(測試期部分) ........................................ 33. 表 3.. PCFM1 與 GAFM1 的在 26 個 CV 中的複利報酬率與 MDD 比較(訓練期部分) ................. 34. 表 4.. PCFM2 與 GAFM2 的在 26 個 CV 中的複利報酬率與 MDD 比較(測試期部分) ................. 35. 表 5.. 適應性函數(或目標函數)為複利報酬率的績效指標數據(訓練期部分) ............................ 36. 表 6.. 適應性函數(或目標函數)為複利報酬率的績效指標數據(測試期部分) ............................ 37. 表 7.. PCFM1 與 GAFM1 的在 26 個 CV 中的績效指標比較(訓練期部分) ................................... 38. 表 8.. PCFM1 與 GAFM1 的在 26 個 CV 中的績效指標比較(測試期部分) ................................... 38. 表 9.. PCFM2 與 GAFM2 的在 26 個 CV 中的複利報酬率與 MDD 比較(訓練期部分) ................. 38. 表 10.. PCFM2 與 GAFM2 的在 26 個 CV 中的複利報酬率與 MDD 比較(測試期部分) ................. 39. 表 11.. PCFM2 與 GAFM2 的在 26 個 CV 中的績效指標比較(訓練期部分) ................................... 40. 表 12.. PCFM2 與 GAFM2 的在 26 個 CV 中的績效指標比較(測試期部分) ................................... 40. 表 13.. GAFM1 與 GAFM2 的在 26 個 CV 中的複利報酬率與 MDD 比較(測試期部分) ................ 41. 表 14.. PCFM1 與 PCFM2 的在 26 個 CV 中的複利報酬率與 MDD 比較(測試期部分).................. 44. 表 15.. PCFM3 與 GAFM3 的在 26 個 CV 中的複利報酬率與 MDD 比較(訓練期部分) ................. 48. 表 16.. PCFM3 與 GAFM3 的在 26 個 CV 中的複利報酬率與 MDD 比較(測試期部分) ................. 48. 表 17.. PCFM3 與 GAFM3 的在 26 個 CV 中的績效指標比較(訓練期部分) ................................... 49. 表 18.. PCFM3 與 GAFM3 的在 26 個 CV 中的績效指標比較(測試期部分) ................................... 49. 表 19.. PCFM4 與 GAFM4 的在 26 個 CV 中的複利報酬率與 MDD 比較(訓練期部分) ................. 49. 表 20.. PCFM4 與 PCFM4 的在 26 個 CV 中的複利報酬率與 MDD 比較(測試期部分).................. 50. VII.

(9) 表 21.. PCFM4 與 GAFM4 的在 26CV 中的績效指標比較(訓練期部分) ......................................... 51. 表 22.. PCFM4 與 GAFM4 的在 26CV 中的績效指標比較(測試期部分) ......................................... 51. 表 23.. GAFM3 與 GAFM4 的在 26 個 CV 中的複利報酬率與 MDD 比較(測試期部分) ................ 52. 表 24.. PCFM3 與 PCFM4 的在 26 個 CV 中的複利報酬率與 MDD 比較(測試期部分).................. 53. 表 25.. 實驗方法的複利報酬率比較 ................................................................................................ 58. 表 26.. 實驗方法的 MDD 比較 .......................................................................................................... 59. 表 27.. 實驗方法的 Calmar ratio 比較 .............................................................................................. 59. 表 28.. 實驗方法的 STD 比較 ............................................................................................................ 60. VIII.

(10) 圖目錄 圖 1.. 遺傳演算法編碼圖 .............................................................................................................. 20. 圖 2.. 遺傳演算法交配方式簡圖 .................................................................................................. 21. 圖 3.. 遺傳演算法突變方式簡圖 .................................................................................................. 22. 圖 4.. 遺傳演算法流程圖 .............................................................................................................. 23. 圖 5.. 機率整合體流程圖 .............................................................................................................. 29. 圖 6.. 交叉驗證方式 ...................................................................................................................... 31. 圖 7.. GAFM1 與 PCFM1 的複利報酬率以 box plots 比較之結果(測試期部分) ......................... 35. 圖 8.. GAFM2 與 PCFM2 的複利報酬率以 box plots 比較之結果(測試期部分) ......................... 39. 圖 9.. GAFM1 與 GAFM2 的複利報酬率比較之結果 ................................................................... 41. 圖 10.. GAFM1 與 GAFM2 的 MDD 比較之結果 ............................................................................. 42. 圖 11.. GAFM1 所採用的技術指標與資金管理模型 ..................................................................... 43. 圖 12.. GAFM2 所採用的技術指標與資金管理模型 ..................................................................... 43. 圖 13.. PCFM1 與 PCFM2 的複利報酬率比較之結果 .................................................................... 44. 圖 14.. PCFM1 與 PCFM2 的 MDD 比較之結果 .............................................................................. 45. 圖 15.. PCFM1 所採用的技術指標與資金管理模型 ...................................................................... 46. 圖 16.. PCFM2 所採用的技術指標與資金管理模型 ...................................................................... 46. 圖 17.. GAFM3 與 PCFM3 的複利報酬率以 box plots 比較之結果(測試期部分) ......................... 48. 圖 18.. GAFM4 與 PCFM4 的複利報酬率以 box plots 比較之結果(測試期部分) ......................... 50. 圖 19.. GAFM3 與 GAFM4 的複利報酬率比較之結果 ................................................................... 52. 圖 20.. GAFM3 與 GAFM4 的 MDD 比較之結果 ............................................................................. 53. IX.

(11) 圖 21.. PCFM3 與 PCFM4 的複利報酬率比較之結果 .................................................................... 54. 圖 22.. PCFM3 與 PCFM4 的 MDD 比較之結果 .............................................................................. 54. X.

(12) 1. 導論 1.1. 研究背景 由於近幾年的股市動盪,使得台灣的股價變化甚大。對於如何在股市大幅變. 化時保護自己的資本?以及避免價格劇烈動盪所造成的風險且尋找能夠提升交 易組合績效的方法,已成為產官學的關注重點。本研究以前述議題為研究重心來 試圖建立一個兼具降低風險與提升績效的交易組合模型。我們的交易組合模型包 含 3 個部分: 技術指標(technical indicators)、資金管理(money management)以及 績效指標(performance indicators)。技術指標指的是以股價、成交量等數據,運用 公式來反映指數或股價的變化,可用來判斷適合的進出場時機。資金管理或稱為 部位規模(position sizing, PS)在交易中扮演保護資本的角色,所謂保本的重點在於 如何有效管理自己的部位,部位也就是投資人持有的股數或口數,部位的大小可 以影響投資績效,傳統的資金管理專注於投入資金的多寡(Basak, 2002; Balder et al. 2009) 而沒有去強調部位風險,當持有的部位越多則獲利越高但風險相對越高, 因此本文使用了文獻中提出的方法來考慮風險與報酬對部位大小的關係以幫助 我們決定合適的部位規模。而在完成交易組合配置後,需要有一組回測機制來衡 量交易組合的績效,也就是本文中所提到的績效指標。績效指標可以幫助我們找 出報酬與風險皆穩定的交易組合模型。要同時比較多種技術指標與多種資金管理 互相組合所帶來的效益,我們使用人工智慧演算法來協助我們找出最佳的技術指 標以及資金管理模型。 在本文中我們採用兩種不同型態的演算法來幫助我們對交易組合最佳化,一 種是直接對參數做最佳化的遺傳演算法(Genetic Algorithm, GA),而第 2 種則是計 算參數值的最佳機率分布的機率整合體(Probability Collectives, PC),兩種方法的目 標皆是計算出在未來具有較高報酬率以及低風險的交易組合模型。相對於早期文 獻而言,本研究具有下列幾個特色。首先,傳統的投資人在使用技術指標以及資 金管理時要自行決定其相關參數,而本文中可以用人工智慧的演算法來計算出優 1.

(13) 秀的參數設定;其次,交易組合的績效評比有相當多種方式,運用人工智慧的方 法可以快速的找出在使用該種評比時的最佳交易組合策略,最後我們對機率整合 體與遺傳演算法所演化出來的交易組合模型做比較。. 1.2. 研究目的 一般投資人在做投資時,為了追求報酬的最大化目標,經常會將自己的全部. 資金投入市場,這種投資方法在遭遇連續虧損時,很容易使得投資人破產而出場, 並在市場轉為正向前就沒有資金繼續投資。因此本文的目的是藉由人工智慧演算 法來找出適合的交易組合策略,以兩種不同型態的演算法來幫助我們找尋交易組 合策略以及同時比較用不同績效指標來衡量策略所得出的報酬與風險,進而提供 投資人一個穩定獲利且風險可被控管的交易策略。. 1.3. 研究架構 本文共有 5 個章節,第 1 部分為導論,敘述本文的研究背景、研究目的及論. 文架構。第 2 部分為文獻探討,分為技術指標、資金管理、績效指標三個部分, 由技術指標定義進出場的時間而資金管理決定配置的部位,最後以績效指標評斷 交易組合優劣。第 3 部分為研究方法,詳細介紹文獻探討中所使用到的方法及其 定義。第 4 部分為實驗結果,介紹研究的資料來源、研究期間以及分析實驗結果。 第 5 部分為結論及未來展望。. 2.

(14) 2. 文獻探討 2.1. 技術指標 技術指標是以大量統計資料去分析市場歷史價格來預測未來價格的趨勢,技. 術指標會歸納重複發生的價格模式,市場對於歷史上出現的特定事件通常都會產 生特定的反應,而技術分析的最大貢獻便是提供一種方法,衡量這種反應的趨勢。 本文使用到幾個基本的技術指標來判斷進出場時機,包含 Granville (1960)、Brock et al. (1992)以及 Wong et al. (2003)根據簡單移動平均線(simple moving average, SMA)的相關應用來判斷進出場時機、Wong et al. (2003)所提出的乖離率(bias ratio, BIAS) 、 Appel (1985) 所 提 出 的 指 數 平 滑 異 同 移 動 平 均 線 ( moving average convergence/divergence,MACD) 、Lane (1984)提出的隨機指標(stochastic oscillator, KD)。. 2.2. 資金管理 資金管理也可被稱為是部位規模,資金管理模型考慮的是交易組合在交易過. 程中,該持有多少部位,部位越大則所要承擔的風險越多,而部位越小則獲利也 相對的減少,Perold and Sharpe (1988) 中提出以買進持有(buy and hold, BH)的方 式來做資金管理,買進持有是預期金融市場即使有一定的波動及衰退,但長期面 是正向的,此種策略屬於長期的投資策略。Black et al. (1987) 以及 Black and Perold (1992) 中 提 出 固 定 比 例 投 資 組 合 保 險 (constant proportion portfolio insurance‚ CPPI) 以最低要保額度以及乘數 m 來保護資本。CPPI 將總資產區分為 風險性資產(risky asset)與非風險性資產(risk-free asset),風險性資產作為投入的資 本而非風險性資產則作為保本的部分。Estep and Kritzman (1988)提出不隨時間而 變之投資組合保護(time invariant portfolio protection, TIPP),TIPP 是 CPPI 的變形, 差異在於 CIPP 的最低要保額度在一開始設定後就不會改變,在總資本增加的情 3.

(15) 況下,保護的資本依舊只有一開始的最低要保額度,Estep and Kritzman 認為應該 保護賺來的資本,所以一旦資本有增加,則最低要保額度根據最低要保比率重新 計算而得,一旦新的最低要保額度大於之前所定義的最低要保額度則取新的最低 要保額度。關於 BH、CPPI 與 TIPP 的比較在之前的文獻中有很多比較,Choie and Seff (1989)提出 TIPP 存在明顯的缺點,因最低要保額度會隨著資本的增加而增加, 但不會隨著資本的減少而減少,造成在後期一旦風險性資產小於最低要保比率, 則模型將停止交易,即使市場後期有大幅上升也不會交易,因此以 TIPP 作為模 型交易平均年報酬率會低於以 CPPI 交易的模型。Dichtl and Drobetz (2011)使用多 種數據來比較 TIPP 與 CPPI,文章中驗證了 TIPP 確實在平均年報酬率上是不如 CPPI,但模型的標準差則是 TIPP 較佳且若比較夏普指數,TIPP 也是勝過 CPPI,因 此 CPPI 與 TIPP 互有各自的好處。Anderson and Faff (2004) 提出百分率模型 (percent risk model, PRM),限制每一筆交易所冒的風險佔整體資本的比例,以單 口契約最大風險以及部位最大風險計算出可以持有的部位,部位最大風險以及單 口契約最大風險是根據歷史數據的最大損失以及乘數 f 而求得。Hua and Hua (2010) 提出以股價計算價格波動(volatility),價格波動表示某標的物在特定時段 內的價格走勢程度,可用來結合百分率模型(percent volatility model, PVM),以此 來代表單口契約最大風險。. 2.3. 績效指標 績效指標可以有效的評斷出交易組合的優劣,本文採用多個不同的績效指標. 作為交易組合優劣的標準。Acar and James (1997)提出maximum loss (ML)來表示 交易組合歷史上最大單次損失來表示交易組合中,在歷史上單次交易最多會損失 多少。Acar and James (1997)、Magdon-Ismail et al. (2003)以及Chekhlov et al. (2005) 提出maximum drawdown (MDD)來代表交易組合最大損失的程度,與ML的差異在 於MDD是由歷史數據中出現的最大連續虧損而ML則是歷史上出現最大單次虧損, 4.

(16) 因此可用來代表交易組合在歷史資料中發生的最大連續虧損比例,若交易組合最 大連續虧損比例達到百分之百則表示交易組合達到破產。Sharpe ratio為一項衡量 報酬風險比例的工具,由Sharpe (1994)提出,若投資目標的預期報酬越高則投資 人可接受的風險越高,而預期報酬越低則可接受風險越低,因此交易組合的目標 是在固定的風險下去最大化投資報酬,或是在固定的報酬下去最小化投資風險, 可計算交易組合在每單位風險下的超額報酬。Sortino and Meer (1991)提出Sortino ratio,其與 Sharpe ratio一樣是計算交易組合在每單位風險下的超額報酬,只是 風險的定義不一樣,Sharpe ratio的風險是定義為年化報酬率的標準差,會同時考 慮正向與負向的標準差,而Sortino ratio只考慮負向的標準差,代表交易組合的正 向報酬率符合投資人的需求,不計入風險調整。Young (1991)提出Calmar ratio將 年化報酬率除以最大虧損(MDD)而求得的指標,可以計算出在最大風險下可獲得 的報酬,是同時考慮最大風險以及獲利的指數,因此獲利高而風險低的交易組合 在這個績效指標中會表現較佳。. 2.4. 人工智慧相關文獻 多年來,如何建立優良的交易組合以期望增加個人的投資績效,一直是人. 們感興趣的問題。近年來有多數國內外的研究學者利用人工智慧的方法來解決 交易組合的問題。而在人工智慧的領域中,遺傳演算法與機率整合體皆可被用 來解決最佳化的問題。回顧早期的相關文獻得知,雖然有部分研究應用遺傳演 算法來尋找交易組合中的技術指標,但鮮少文獻同時探討技術指標與資金管理 模型。回顧早期文獻得知Huang et al. (2011)將遺傳演算法應用於建立選股模 型,其所選出的股票明顯優於大盤,而Huang et al. (2012)以機率整合體來建立 選股模型,並呈現機率整合體所選出的股票明顯優於遺傳演算法所選股票及大 盤,由於機率整合體已被證明為有效的系統,因此本研究將比較以遺傳演算法 與機率整合體所建立之交易組合模型,茲將其相關文獻如下所述: 5.

(17) 2.4.1 遺傳演算法 Holland (1975)提出遺傳演算法,遺傳演算法可用簡單的染色體來幫助我們求 複雜問題的解,這個演算法是根據「 物競天擇與適者生存」的演化概念來解決 最佳化問題。Allen and Karjalainen (1999)應用 GA 來尋找交易組合中最適合的技 術指標。Subramanian et al. (2006)利用各種人工智慧的方法,例如:遺傳演算法、 基因規劃法(Genetic Programming, GP)等來預測股價,並比較不同目標函數所演化 出的模型的各種績效指標。Cheng et al. (2010)將 GA 應用在台灣加權指數(taiwan capitalization weighted stock index, TAIEX)以建立交易組合中最適合的技術指標。 GA 被大量採用於建立交易組合的技術指標。根據 Huang et al. (2012)提出遺傳演 算法可以比傳統的迴歸分析法有更好的交易組合績效的預測能力。. 2.4.2 機率整合體 以遺傳演算法來進行交易組合選取的相關文獻有相當多,本文中除了以遺傳 演算法來演算外,也使用分散式最佳化與控制的機率整合體來進行最佳化,PC 由 Wolpert (2003) 提出,與 GA 不同的是 PC 的方法會更新目標解空間的機率分布 p,機率分布 p 值是隨著函數被最佳化時產生,最後會選出可以讓函數達到高峰 的 p 值。機率整合體是根據賽局理論及統計物理學而衍生出的演算法。Huang et al. (2005) 對 PC 與傳統 GA 做比較,在以 response rate、total speed 以及 expense 作為兩者的比較數據中 PC 在各項數據上都勝過 GA。Huang et al. (2012)將 PC 應 用到選股模型上,以 PC 來對基本面的權重做最佳化,而以此權重可選到未來具 有投資報酬的股票。. 6.

(18) 3. 研究方法 本研究分為3個部分來建置,決定進出場時間的技術指標、決定配置部位的資金 管理、回測交易組合優劣的判斷基準績效指標,我們分別描述如下。. 3.1. 技術指標 在進行資金管理前,我們要先有交易組合進出場的時間點,因此在此先介紹. 技術指標來幫助我們找到進出場的時機:. 3.1.1 簡單移動平均線 Granville (1960)提出如何應用簡單移動平均線在股票市場,SMA 是以一定時 間週期內之平均價格來預測未來價格走向,投資人可根據簡單移動平均線之間或 與價格間的相互關係來判斷進出場時間,簡單移動平均線的定義如下:. 1. 𝑆𝑀𝐴𝑡,𝑛 = 𝑛 ∑𝑛−1 𝑖=0 𝑝𝑡−𝑖 .. (1). 在時間點 t 的 n 日 SMA 線是將今日的價格𝑝𝑡 加上前 n-1 天的價格最後再除 以 n 做成算術平均數。舉例來說,今日的 5 日 SMA 是今日價格加上前 4 天的價 格最後除以 5。移動平均線可以去除短期的雜訊,反映出長期的趨勢或週期,SMA 的進出場分析常被使用者為價格突破(breakout)與斜率轉折(slope)兩種。 價格突破由 Wong et al. (2003)應用,定義如下:. 𝑝𝑒𝑛𝑡𝑟𝑦 = 𝑝𝑡1 , 𝑖𝑓 𝑝𝑡1 > 𝑆𝑀𝐴𝑡1 ,𝑛 , 𝑝𝑒𝑥𝑖𝑡 = 𝑝𝑡2 , 𝑖𝑓 𝑝𝑡2 < 𝑆𝑀𝐴𝑡2 ,𝑛 , 𝑡2 > 𝑡1 , 7. (2).

(19) 其中𝑡2 與𝑡1 代表兩個不同時間點,𝑡2 的時間點在𝑡1 之後,𝑝𝑒𝑛𝑡𝑟𝑦 代表進場價格,𝑝𝑒𝑥𝑖𝑡 代表出場價格,當股價由下而上穿過 SMA 時表示價格的多頭狀態可能出現因此 定為進場訊號,反之股價由上而下穿過 SMA 時定為出場訊號。. 除了 SMA 與股價的關係外,SMA 的斜率也代表著重要的訊息,Granville (1960) 提出斜率轉折,當斜率為正值時,代表市場在多頭狀態,投資人較樂觀,而斜率 為負值時,代表市場在空頭狀態,投資人較悲觀,因此斜率轉折是當 SMA 的斜 率由負轉正時進場,而斜率正轉負時出場,也就是在市場空頭轉多頭時進場,多 頭轉空頭時出場,定義如下:. 𝑝𝑒𝑛𝑡𝑟𝑦 = 𝑝𝑡1 , 𝑖𝑓 𝑆𝑀𝐴𝑡1 −1,𝑛 < 0 && 𝑆𝑀𝐴𝑡1 ,𝑛 > 0,. (3). 𝑝𝑒𝑥𝑖𝑡 = 𝑝𝑡2 , 𝑖𝑓 𝑆𝑀𝐴𝑡2 −1,𝑛 > 0 && 𝑆𝑀𝐴𝑡2 ,𝑛 < 0, 𝑡2 > 𝑡1 .. 3.1.2 乖離率(BIAS) Wong et al. (2003)提出乖離率,乖離率代表當日收盤價與移動平均線的差距, 當股價大於移動平均線時乖離率為正值,反之為負值,而當乖離率的正負值過大 時股價有可能會向著移動平均線調整。乖離率公式如下:. 𝐵𝐼𝐴𝑆𝑡,𝑛 =. 𝐶𝑡 −𝑆𝑀𝐴𝑡,𝑛 𝑆𝑀𝐴𝑡,𝑛. ,. (4). 其中𝐶𝑡 代表時間點 t 的收盤價,𝑆𝑀𝐴𝑡,𝑛 則是在時間點 t 時的 n 日 SMA 線,以此來 計算目前股價偏離移動平均線多遠,投資人可自行決定偏離多少比率要做交易; 舉例來說可設 BIAS 大於 10%時出場,而 BIAS 小於-10%時進場。. 8.

(20) 3.1.3 指數平滑異同移動平均線(MACD) Appel (1985) 提出 MACD 指標,是由兩條曲線與柱形圖組成,兩條曲線是由 差離值(DIF 值)以及訊號線(DEM 值,又稱 MACD 值)組成。DIF 值是由時間區間較 短的𝐸𝑀𝐴𝑙𝑒𝑎𝑑 與時間區間較長的𝐸𝑀𝐴𝑙𝑎𝑔 計算而得,EMA 代表指數移動平均 (exponential moving average, EMA),由 Hunter (1986)提出,將原本的 SMA 改良為 指數型遞減的移動平均線,越近期的數據權重越高,但較舊的數據依然給予一定 的權重,各數據權重的權重會根據常數α調整,使得越舊的數據權重越低,α介 在 0 到 1 之間,公式如下:. 2. (5). 𝛼 = 𝑛+1 , 𝐸𝑀𝐴𝑡,𝑛 = 𝛼 × (𝑝𝑡 + (1 − 𝛼) × 𝑝𝑡−1 + (1 − 𝛼)2 𝑝𝑡−2 + (1 − 𝛼)𝑛−1 𝑝𝑡−(𝑛−1) ,. 其中𝐸𝑀𝐴𝑡,𝑛 代表在時間 t 時的 n 日 EMA 線,越近期的數據權重越高,而越舊數 據的權重則以指數遞減,常數α可用日期的倒數計算。. DEM 則是將 DIF 計算其指數移動平均,DIF 與 DEM 的公式如下:. 𝐷𝐼𝐹 = 𝐸𝑀𝐴𝑙𝑒𝑎𝑑 − 𝐸𝑀𝐴𝑙𝑎𝑔 𝐷𝐸𝑀 = 𝐸𝑀𝐴𝐷𝐼𝐹. ,. (6). ,. 其中𝐸𝑀𝐴𝑙𝑒𝑎𝑑 及𝐸𝑀𝐴𝑙𝑒𝑎𝑑 分別表示時間區間較短的快線與時間區間較長的慢線. 柱形圖(OSC)是由 DIF 與 DEM 計算求得,公式如下:. OSC=DIF-DEM . 9. (7).

(21) 柱狀圖的好處可以使我們方便觀看目前系統的價格走勢,當柱狀圖的值為正 時,代表價格走勢較強,市場屬於多頭,而當值為負時,代表價格走勢較弱,市 場屬於空頭。當 DIF 由下往上穿過 DEM 時,為進場訊號,而當 DIF 由上往下穿過 DEM 時,為出場訊號。. 3.1.4 隨機指標(KD) Lane (1984)提出以快速隨機指標(%K)與慢速隨機指標(%D)的交叉與變化來判 斷進出場時機。要計算快速隨機指標須先計算未成熟隨機值(raw stochastic value, RSV),RSV 公式如下:. 𝐶 −𝐿. 𝑅𝑆𝑉𝑡,𝑛 = 𝐻𝑡 −𝐿𝑛 , 𝑛. (8). 𝑛. 其中 n 為交易期間,通常設為 9 日,𝐶𝑡 代表時間點 t 的收盤價,𝐻𝑛、𝐿𝑛 代表交易 期間 n 日內的最高價和最低價。在計算出 RSV 後,將 RSV 做指數移動平均後可 得到%K,而將%K 再做一次指數移動平均後可得到%D,公式如下:. %𝐾 = 𝑛𝐸𝑀𝐴𝑅𝑆𝑉 ,. (9). %𝐷 = 𝑛𝐸𝑀𝐴%𝐾 .. 通常 n 取 3 日,代表取𝑅𝑆𝑉𝑡,9 後計算其𝐸𝑀𝐴𝑡,3 得到%K 後,再計算%K 的𝐸𝑀𝐴𝑡,3 得到%D,而%K 值和%D 值會介於 0%~100%間。當%K 線向上穿過%D 線時為進場 訊號,當%K 線向下穿過%D 線時為出場訊號。但是%K 和%D 經常發生交叉,因此 需要為其設定在一些特殊情況下才交易。例如大於 80%稱為超買區,代表市場處 於多頭強勢;小於 20%稱為超賣區,代表市場處於空頭強勢。當%K 線在超賣區 向上穿過%D 線視為進場訊號,而當%K 線在超買區向下穿過%D 線視為出場訊號。 10.

(22) 3.2 資金管理模型 資金管理也可被稱為是部位規模(position sizing, PS),資金管理模型考慮的是 交易組合在交易過程中,該持有多少部位,部位越大則所要承擔的風險越多,而 部位越小則獲利也相對的減少;因此本節所要探討的重點在於如何在部位大小上 做選擇使得可以得到一個具有一定獲利且同時風險在可接受範圍的模型?我們 運用多種文獻中有提出過的方法來幫助我們計算部位規模,茲將以說明如下:. 3.2.1 買進持有策略(BH) 由Perold and Sharpe (1988)提出,是最簡單的投資模型,在第一次將全部的 資金都進場後即不出場直到投資期間結束,買進持有策略是建構在市場的走勢皆 為正面,也就是不管市場怎麼波動,長期來看還是往上增值,除此之外,長期持 有也可避免繁複交易所帶來的成本,可做為benchmark與其他模型進行比較。. 3.2.2 固定比例投資組合保險(CPPI) Black et al. (1987)提出一種簡單且公式不複雜的模型,投資人者根據自己的 風險承受程度來設定參數。CPPI的理念是,當股市上漲時,交易組合總資產增加, 可投入更多資金,而當股市下跌時,交易組合的總資產下跌,交易組合總資產減 少,會減少投入的資金。CPPI將交易組合總資產分為風險性資產(risky asset)與非 風險資產(risk-free asset),風險性資產以e (exposure)表示,公式如下:. 𝑒 = 𝑚 × 𝑐, (𝑓𝑜𝑟 0 < 𝑚 ≤ 10),. (10). 其中𝑒 代表風險性資產,m (multiple)是乘數,乘數可控制投入資金的比例,乘數 越大風險性資產越多,c (cushion)是緩衝額度,緩衝額度由交易組合總資產A(asset) 減去最低要保額度f (floor),因此我們可將方程式(10)改寫為方程式(11): 11.

(23) 𝑒𝑡 = 𝑚 × (𝐴𝑡 − 𝑓), 𝑡 ∈ 𝑁.. (11). 使用固定比例模型時,投資人依據自己的投資風險承擔能力來決定最低要保 額度floor,在CPPI中,最低要保額度需要投資人設定調整法則來動態調整,在得 到最低要保額度以及乘數m後可求得e (exposure),e即為風險性資產,用來投資 風險高但獲利也相對高的投資標的,而剩下的資產設為非風險性資產來投資風險 低但獲利也低的穩定投資標的,當總資產與風險性資產因獲利或虧損發生變動時 則須根據公式(11)重新計算新的風險性資產配置。. 3.2.3 不隨時間而變之投資組合保護(TIPP) TIPP與CPPI的差異在於,CPPI的最低要保額度在一開始決定後便不會改變, 在後期交易組合資本增加的情況下,會使得最低要保額度太少而造成模型的風險 增加,因此Estep and Kritzman (1988)提出最低要保比率f%,根據最低要保比率來 調整最低要保額度使得在投資後期的獲利也可以包含在最低要保額度中來保障 資本,另外在TIPP中,每次交易結束後會重新計算最低要保額度f (floor),且會將 新計算出的最低要保額度與原來的最低要保額度相比較,取較大的作為資產變動 後的最低要保額度,新的最低要保額度計算方式如下:. 𝑓𝑡 = 𝑚𝑎𝑥(𝐴𝑡 × (𝑓%), 𝑓𝑡−1 ),. 𝑡 ∈ 𝑁.. (12). 根據新的資本𝐴𝑡 與定義好的 f% 計算新的最低要保額度𝑓𝑡,在與之前的最低 要保額度𝑓𝑡−1 相比,取較大者。在得到新的最低要保額度f的計算方式後我們可將 方程式(12)改寫為方程式(13):. 12.

(24) 𝑒𝑡 = 𝑚 × (𝐴𝑡 − 𝑓𝑡 ), 𝑡 ∈ 𝑁.. (13). 最低要保額度不再是固定的一個值,而會隨著資產的增加而增加,但當資產 下降時,根據方程式(12)可得知並不會跟著將最低要保額度調降,會以原來的最 低要保額度為主,在後期中保護的資本會越來越多,達到資金管理的部分。. 3.2.4 百分率模型 (PRM) CPPI與TIPP只考慮投入資金的大小,之後將全部的資金投入市場而沒有考慮 每次交易要持有多少部位,因此Anderson and Faff (2004)提出限制每一筆交易所 占整體資金的比例,建立單筆交易的停損點(capitalization per contract, CPC),在 得出CPC以及要投入的資金後可算出應持有多少部位,百分率模型的優點在於每 部位所承擔的風險是一致的,且部位的最大虧損等於CPC,交易組合較容易穩定 成長。部位大小的公式如下:. 𝑃𝑆 =. 𝑒 𝐶𝑃𝐶. ,. (14). 其中PS (position sizing)代表投資部位大小,要持有多少部位,e (exposure)表示要 投入的風險性資產,CPC則是單筆交易的停損點. 𝐶𝑃𝐶 =. 𝑀𝐿 𝑘. , (𝑓𝑜𝑟 0 < 𝑘 ≤ 1),. (15). 其中CPC代表每部位可負擔的損失,k表示乘數大小會影響單口契約最大風險, Chekhlov et al. (2005) 提 出 了 maximum loss 與 maximum drawdown , ML 代 表 maximum loss 是 交 易 組 合 在 歷 史 上 最 大 單 次 損 失 , 而 MDD 代 表 maximum drawdown是交易組合歷史上最大連續損失,以ML當作停損點跟以MDD作為停損 13.

(25) 點的差異在於,ML可虧損的程度較小,因此部位會持有的較少,而MDD代表交 易組合可接受的虧損程度較大,因此持有的部位會較ML多,我們會在後面的實 驗會比較兩者差異,在實驗中我們將以歷史資料來計算MDD與ML,因此我們可 將公式(15)改寫為公式(16):. 𝐶𝑃𝐶 =. 𝑀𝐷𝐷 𝑘. , (𝑓𝑜𝑟 0 < 𝑘 ≤ 1).. (16). 3.2.5 價格波動百分率模型 (PVM) Hua et al. (2010)提出價格波動(volatility),指的是交易的對象在特定時段內的 價格走勢程度,價格走勢程度可根據公式(17)計算而得,本文中的價格波動為了 考慮跳空的情勢計算真實價格區間,真實價格區間考慮的是今日最高價(high)、 今日最低價(low)、昨日收盤價(close)之間的關係,本文應用此種關係設為,當停 損點設為價格波動時可使得每個部位在未來的價格波動程度都相同,. 𝑃𝑆 =. 𝑒 𝑉. ,. (17). 𝑉 = 𝑚𝑎𝑥{ℎ𝑖𝑔ℎ − 𝑙𝑜𝑤, |ℎ𝑖𝑔ℎ − 𝑐𝑙𝑜𝑠𝑒|, |𝑙𝑜𝑤 − 𝑐𝑙𝑜𝑠𝑒|} ,. 其中PS (position sizing)代表投資部位大小,要持有多少部位,e (exposure)表示要 投入的風險性資產,V (volatility) 代表真實價格區間。. 14.

(26) 3.3 績效指標 對於各種由技術指標決定進出場時間點及資金管理決定持有的部位所組合 設計的投資系統,在本研究中我們採用數個績效指標來比較各種投資系統的優劣。 在下文的數小節中我們將討論這些績效指標。. 3.3.1 年化報酬率 可分為兩種,算數平均(arithmetic)和幾何平均(geometric)。若考慮年度報酬 率,則算術平均又稱為平均年報酬率,並是將總報酬率除以資金投入的年數以計 算之。例如若總報酬率為20%,投資年限為2年,則平均年報酬率為10%。幾何平 均又稱為複利報酬率,是將每年獲利的再投資也計算進去,以上面的例子來計算 複利報酬率則為4.5%,兩種年化報酬率的公式如下: 1. (18). 𝑅𝑎 = 𝑁 ∑𝑁 𝑖=1 𝑅𝑖 , 1/𝑁. 𝑅𝑔 = (∏𝑁 𝑖=1(1 + 𝑅𝑖 )). −1,. (19). 其中N表示投資績效被計算的總時間區間數(譬如年數),𝑅𝑖 表示在時間區間 i 的 報酬率,𝑅𝑎 代表平均年報酬率,而 𝑅𝑔 代表複利報酬率。. 3.3.2 maximum loss Acar and James (1997)提出maximum loss (ML),ML代表交易組合歷史上最大 單次損失,可用來衡量交易組合的風險,定義如下:. 𝑀𝐿(𝑇) = 𝑚𝑎𝑥(𝑊(𝑡 − 1) − 𝑊(𝑡)), 0 ≤ 𝑡 ≤ 𝑇,. 其中,𝑊(𝑡)表示交易組合𝑊在時間 t 時的價值。 15. (20).

(27) 3.3.3 maximum drawdown Acar and James (1997)提出了ML外也同時提出maximum drawdown (MDD), MDD代表交易組合歷史上最大連續損失,與ML的差異在於MDD所算的是多次連 續虧損的組成,是交易組合出現的連續損失,而ML只考慮單次交易的損失。MDD 的定義如下:. 𝑀𝐷𝐷(𝑇) = 𝑚𝑎𝑥(𝑚𝑎𝑥 𝑊(𝜏) − 𝑊(𝑡)),. (21). 0 ≤ 𝑡 ≤ 𝑇 0 ≤ 𝜏 ≤ 𝑡,. 其中,𝑊(𝑡)表示交易組合𝑊在時間 t 時的價值。. 3.3.4 Sharpe ratio Sharpe (1994)提出以平均年報酬率除以平均年報酬率之標準差而求得Sharpe ratio,可用以評估交易組合在每單位總風險下可得到的報酬,是一般文獻中最常 被拿來比較投資模型的一種績效指標,定義如下:. 𝑆ℎ𝑎𝑟𝑝 𝑟𝑎𝑡𝑖𝑜 =. 𝑅𝑎 −𝑅𝑏 𝜎. ,. (22). 2 𝜎 = √∑𝑁 𝑖=1(𝑅𝑖− 𝑅𝑎 ) ,. 其中N表示投資績效被計算的總時間區間數(譬如年數),𝑅𝑖 表示在時間區間 i 的 報酬率,𝑅𝑎 表示平均年報酬率如公式(18)定義,𝑅𝑏 代表無風險利率,𝜎是年化報 酬率之標準差。. 16.

(28) 3.3.5 Sortino ratio Sortino ratio由Sortino and Meer (1991)所提出,與Sharpe ratio差別在於Sharpe ratio採用年化標準差,而Sortino ratio是以負向標準差來代表交易組合風險,如公 式(23)的lower partial moments (LPM) 為計算負向的標準差之公式:. 1. 𝐿𝑃𝑀 = 𝑁 ∑𝑁 𝑖=1 𝑚𝑎𝑥 [𝑅𝑎 − 𝑅𝑖 , 0] .. (23). 在計算出LPM後,將原本Sharpe ratio的年化標準差𝜎改為LPM,可求得新方程 式:. 𝑆𝑜𝑟𝑡𝑖𝑛𝑜 𝑟𝑎𝑡𝑖𝑜 =. 𝑅𝑎 −𝑅𝑏 √𝐿𝑃𝑀. .. (24). 3.3.6 Calmar ratio Young (1991)提出Calmar ratio,又稱為drawdown ratio。Calmar ratio與Sharp ratio的差異在於本Sharpe ratio是計算平均年報酬率而Calmar ratio則是計算複利 報 酬 率 , 風險 部 分 Sharpe ratio 是用 年 化標準 差 而 Calmar ratio 是用 maximum drawdown (MDD)來表示,因此Calmar ratio可表為下式:. 𝑅𝑔. 𝐶𝑎𝑙𝑚𝑎𝑟 𝑟𝑎𝑡𝑖𝑜 = 𝑀𝐷𝐷, 其中𝑅𝑔 代表複利報酬率如公式(19)定義,而MDD的定義可參考方程式(21)。. 17. (25).

(29) 3.4 遺傳演算法 遺傳演算法由 Holland (1975)提出,是一個藉由物競天擇、適者生存理論所 建立而可用於解決最佳化問題的方法。遺傳演算法乃是模仿生物學的演化過程, 通常可經由選擇親代、交配及突變而產生子代等機制,不斷改進群體適應性的演 算法。其中個體的適應性是利用一個可以反應當時生存環境定義的適應值(fitness function)來判定,適應值較大的個體將有較大的機會被選擇成為親代以產生子代, 其演算法簡易流程如下:. Step1. 隨機產生一組有 x 個個體的初始族群,每個個體各自存在 n-bits 的遺傳型基因(染色體),定義如下:. 𝐶 = {𝐺1 , 𝐺2 , ⋯ , 𝐺𝑥 }, 𝑥 ∈ 𝑁; 𝐺𝑥 = {𝑏1 , 𝑏2 , ⋯ , 𝑏𝑛 }, 𝑏𝑛 ∈ {0,1}.. (26). C 表示由 x 個個體所組成的群組,𝐺𝑥 代表第 x 個體,𝑏𝑛 則代表在某個體 中的一個編碼數,在二進位的表示法中其值為 0 或 1。. Step2. 評估每個個體的適應性強度,在本文中我們會根據 3.1 節與 3.2 節所定義 的指標作為染色體的適應值。 Step3. 重複如下運算直到有 x 個後代子孫被產生 I.. 選擇親代. II.. 交配. III. 變異 Step4. 以此 x 個新產生的子孫取代原有 x 個個體的族群,成為一個新 族群。. 18.

(30) Step5. 回到 Step2,直到終止條件發生為止。 判斷演算法停止計算的條件一般可透過以下三種方法。 (1)設定終止世代: 預設系統執行到特定世代便停止進行演算法。 (2)判斷是否收斂: 透過收斂值的門檻來決定是否停止執行演算法。 (3)時間決定: 預設演算法的執行時間便停止。 以下我們介紹在本研究中採用的遺傳演算法的編碼方式、如何運行以及流程 圖。. 3.4.1 編碼方式 本文中,遺傳演算法採用 2 進制(0 或 1)表示,我們設計的編碼可分為 3 個 部分如圖 1 所示:資金管理模型、技術指標以及變數部分。資金管理模型與技術 指標部分是將 2 進制編碼轉回 10 進制來決定出所使用的資金管理模型與技術指 標,變數部分是資金管理模型或技術指標中會使用到的變數值,像是移動平均線 要使用的天數以及不隨時間而變之交易組合保護會使用到的變數值 f%皆可由變 數編碼部分來取得,變數值 W 是採用將 2 進制轉為 10 進制進而決定變數值,轉 換公式如下:. 𝐷. 𝑊 = 𝑚𝑖𝑛𝑤 + 2𝑚 −1 × (𝑚𝑎𝑥𝑤 − 𝑚𝑖𝑛𝑤 ),. (27). 其中,W 代表轉換後的變數值;m 表示編碼長度,即為 m 位元的 2 進制編碼轉 成 10 進制之值;𝑚𝑎𝑥𝑤 代表我們所要轉換出來之變數最大值;𝑚𝑖𝑛𝑤 代表我們所 要轉換出來之變數最小值(例如: 本研究所用之不隨時間而變之交易組合保護所 用到的變數值 f%,其範圍設定在 0%到 100%之間,所以𝑚𝑎𝑥𝑤 =100%;𝑚𝑖𝑛𝑤 =0%)。. 19.

(31) 圖 1. 遺傳演算法編碼圖. 3.4.2 選擇親代方式 本 文 中 ,採 用 Goldberg and Deb (1991) 提出 的 競 賽選 取法 (tournament selection),以 2 進制編碼產生 50 條染色體,從中隨機選擇 2 條染色體來競爭選 出優秀的親代,進行多次的競賽直到選出足夠的親代,再進行交配與突變。. 3.4.3 交配與突變 交配是遺傳演算法中一種使個體產生變異的運算方式,其為將 2 個染色體設 為親代,再經過不同交配方式產生出含有親代特性的子代,子代可能會遺傳親代 的優點與缺點。在本研究中我們使用 De Jong and Spears (1993)提出的單點交配的 方式,演算法如下面流程:. Step 1. 有 2 條染色體設為親代個體以𝑃𝑥 與𝑃𝑦 表示,定義如下:. 𝑥 𝑃𝑥 = {𝑏1𝑥 , 𝑏2𝑥 , ⋯ 𝑏𝑛−1 , 𝑏𝑛𝑥 }; 𝑏𝑛𝑥 ∈ {0,1}; 𝑛 ∈ 𝑁, 𝑦. 𝑦. 𝑦. 𝑦. 𝑦. 𝑃𝑦 = {𝑏1 , 𝑏2 , ⋯ 𝑏𝑛−1 , 𝑏𝑛 }; 𝑏𝑛 ∈ {0,1}; 𝑛 ∈ 𝑁.. Step 2. 隨機產生交配點 i,將兩親代𝑃𝑥 與𝑃𝑦 基因交換產生子代𝐶𝑥 與𝐶𝑦 , 定義如公式(29),而交配方式如圖 2:. 20. (28).

(32) 𝑦. 𝑦. 𝑦. 𝐶𝑥 = {𝑏1𝑥 , 𝑏2𝑥 , ⋯ , 𝑏𝑖𝑥 , 𝑏𝑖+1 , ⋯ , 𝑏𝑛−1 , 𝑏𝑛 }, 𝑦. 𝑦. (29). 𝑦. 𝑥 𝑥 𝐶𝑦 = {𝑏1 , 𝑏2 , ⋯ , 𝑏𝑖 , 𝑏𝑖+1 , ⋯ , 𝑏𝑛−1 , 𝑏𝑛𝑥 }.. 圖 2. 遺傳演算法交配方式簡圖. Step 3. 根據突變機率(mutation rate)來判斷是否進行突變。突變會對染色體作隨 意的變化使得演算法可以執行從未尋找過的基因架構以避免區域最佳解,但若是 突變太常發生將會使得遺傳演算法變成隨機演算法,因此突變機率不能設定的太 高。若發生突變,則反轉子代某一編碼,若為 0 則轉為 1,若為 1 則變為 0,如 圖 3:. 21.

(33) 圖 3. 遺傳演算法突變方式簡圖. 3.4.4 流程圖 在本研究中我們會以真實股市資料來測試並於 GA 中產生 50 條染色體,每 條染色體包含資金管理模型、技術指標以及變數的編碼(0 或 1),將各部分的 2 進 制編碼值轉為 10 進制後代入系統中,再根據第 3.2 章所定義的適應性函數來評 估模型的績效,可用不同的指標來做為適應性函數,績效較好者會有較高機率被 選為親代,再經過交配與突變來產生子代,最後在我們所設定的終止條件停止, 我們藉由這樣來找出有效的交易模型。. 22.

(34) 圖 4. 遺傳演算法流程圖. 23.

(35) 3.5 機率整合體 本文中除了應用了遺傳演算法外,為了在模型的選取中有更好的結果,採用 機率整合體作為本文的第二種演算法,Huang et al. (2005)中已證實機率整合體比 遺傳演算法更強健,機率整合體是由賽局理論、統計物理、最佳化所組合而成, 本文會介紹機率整合體如何應用在多代理人系統(multi-agent system, MAS),接下 來的小節將從機率整合體的理論部分開始,最後會介紹我們所使用的演算法。. 3.5.1 機率整合體理論 機率整合體由 Wolpert (2003)提出,主要的精神在於尋找目標解的最佳機率 分布以求得最佳效用(world utility)。舉例來說,玩家 i 所採行的策略𝑥𝑖 是根據策略 的機率分佈𝑞𝑖 (𝑥𝑖 )來決定,在𝑞𝑖 (𝑥𝑖 )中機率較高的策略會優先被採用且代表該策略 的期望效用高於其他策略。在 PC 的架構中,為了解釋現實世界中玩家使用混合 策略(mixed strategy)的現象,玩家會被制定為依據機率來決定他們的策略。因此 在一個包含 N 個使用混合策略的玩家的系統中,我們必須將所有玩家採取的策 略集合表示成一個 joint distribution P(x),並以方程式(30)來表示:. 𝑃(𝑥) = 𝑃(𝑥1 , 𝑥2 ⋯ 𝑥𝑛 ).. (30). 為了簡化此 joint distribution 的計算 Wolpert (2004)提出 product distribution (PD) theory,將 P(x)轉為各獨立玩家策略機率分佈的乘積,以公式(31)表示:. 𝑃(𝑥) = 𝑃(𝑥1 , 𝑥2 ⋯ 𝑥𝑛 ) = 𝑞1(𝑥1 ) × 𝑞2(𝑥2 ) ⋯ × 𝑞𝑛(𝑥𝑛 ) = ∏𝑁 𝑖=1 𝑞𝑖 (𝑥𝑖 ).. 24. (31).

(36) 上式代表共有 N 個玩家,每個玩家 i 所採用的策略𝑥𝑖 是各自獨立的,N 個玩 家皆使用混合策略,而他們的策略機率分佈會組成一個整個系統的策略的 joint distribution,他們在統計上彼此相關,但是各自的策略卻又是獨立的。在 P(x)拆 解為各玩家策略機率分佈的乘積後,整個問題被簡化為我們對各玩家 i 他們策略 的機率分佈𝑞𝑖 (𝑥𝑖 )作最佳化即可得到整個系統的最佳效用。. 為了方便後面公式的運算,我們將最佳化的目標改為成本,在一般思考中, 最佳效用 G 是去最大化效用,效用越大代表玩家越滿意,改為成本後,玩家們會 想盡辦法去降低整體策略所帶來的成本,當成本越低,玩家的效用也就越高,所 以接下來的章節我們將去最小化成本 G 以尋找 world cost G。. 接 下 來 我 們 要 介紹 如何 最 佳 化 各 玩 家 i 的機 率 分 佈 𝑞𝑖 (𝑥𝑖 ) 。 首 先 根 據 Fudenberg and Tirole (1991)提出,假設有 N 個玩家參與一個非合作的賽局,任一 玩家 i 會使用混合策略,其中包含自己所會用策略的機率分布𝑞𝑖 (𝑥𝑖 )以及 private utility function 𝑔𝑖 (𝑥),而𝑔𝑖 (𝑥)是由 N 個玩家所做出的策略的集合 x 計算得來,因 此玩家 i 的期望成本𝐸(𝑔𝑖 )可用方程式(32)表示:. 𝐸(𝑔𝑖 ) = ∫ 𝑑𝑥 ∏𝑗 𝑞𝑗 (𝑥𝑗 )𝑔𝑖 (𝑥).. (32). Nash (1951)提出納許均衡(Nash equilibrium)也可稱呼為非合作賽局平衡。在 納許均衡中,假設每名玩家都是完全理性,亦即這類玩家知道其他人所採取的策 略,則每位玩家便可計算最佳的策略機率分佈以最大化自己的期望效用,當所有 玩家都滿意他們的效用且不會再改變他們的策略時,此種情況被稱為納許均衡, 在本文中,因目標改為成本,所以每位玩家都想最小化自己的成本。. 25.

(37) 但在現實世界中,並沒有完全理性的玩家,每個玩家皆是有限理性,亦即這 類玩家無法完全知道其他人所採取的策略。為了在公式中加入這一部份,Wolpert (2004)使用 Shannon entropy 來代表有限理性的部分:. 𝑆(𝑃) = − ∫ 𝑑𝑦 𝑃(𝑥) 𝑙𝑛(𝑃(𝑥)).. (33). 根據 maximum entropy (maxent) principle, 對於玩家 i 的策略機率分佈之最佳估 計為將下面公式中的 lagrangian 最小化之機率:. 𝐿𝑞 ≡ 𝛽𝑖 [𝜀𝑖 − 𝐸(𝑔𝑖 )] − 𝑆𝑖 (𝑞𝑖 ),. (34). =𝛽𝑖 [𝜀𝑖 − ∫ 𝑑𝑥 ∏𝑗 𝑞𝑗 (𝑥𝑗 )𝑔𝑖 (𝑥)] − 𝑆𝑖 (𝑞𝑖 ).. 𝜀𝑖 表示玩家 i 事先知道的資訊所對應的期望效用,Wolpert (2003)提出若沒有任何 事先知道的資訊,則𝜀𝑖 = 0。 上述的架構可被用於處理最佳化的問題如下 (Wolpert, 2003):在團隊合作的 賽局中,個別玩家的 private utility 可用一個 world cost G 來取代,𝛽𝑖 是溫度的倒 數也可用 1/𝑇𝑖 表示,而方程式(34)可改為方程式(35):. 𝐿𝑖 (𝑞𝑖 ) = 𝐸[𝐺(𝑥𝑖 , 𝑥(𝑖) )] − 𝑇𝑖 𝑆(𝑞𝑖 ),. (35). = ∑𝑥𝑖 𝑞𝑖 (𝑥𝑖 ) 𝐸[𝐺(𝑥𝑖 , 𝑥(𝑖) )|𝑥𝑖 ] + 𝑇𝑖 ∑𝑥𝑖 𝑞𝑖 (𝑥𝑖 ) ln(𝑞𝑖 (𝑥𝑖 )),. 其中𝐺(𝑥𝑖 , 𝑥(𝑖) )表示 world cost,是由玩家 i 的策略𝑥𝑖 以及其他玩家的策略𝑥(𝑖) 所組 合而成;𝑇𝑖 代表溫度,越高會搜尋得越廣,越低則會越集中於已知解附近; 𝑆(𝑞𝑖 )代 表 Shannon entropy。各玩家的期望成本𝐸[𝐺(𝑥𝑖 , 𝑥(𝑖) )|𝑥𝑖 ]可透過下式不包含 i 的其 他玩家策略分佈來得到:. 26.

(38) p(𝑥(𝑖) ) = ∏𝑗≠𝑖 𝑞𝑗 (𝑥𝑗 ).. (36). 在 PC 的架構下,最佳化的任務即變成各個玩家處理局部最小化的問題,亦 即各玩家欲求得其策略之最佳機率分布以最小化個別的 lagrangian,如下列方程 式:. (37). min 𝐿𝑖 (𝑞𝑖 ), 𝑞𝑖. s.t. ∑𝑥𝑖 𝑞𝑖 (𝑥𝑖 ) = 1, 𝑞𝑖 (𝑥𝑖 ) ≥ 0, ∀𝑥𝑖 .. 我們可以使用多個最佳化搜尋法來幫助我們求 lagrangian 的最小值,包含梯 度坡降法(gradient descent method)、最陡坡降法(steepest descent method)、 牛頓法(Newton method),本文中使用牛頓法來更新所有玩家的最佳策略分布, 如下列方程式 (Wolpert & Bieniawski, 2004):. 𝑞𝑖 (𝑥𝑖 ) → 𝑞𝑖 (𝑥𝑖 ) − 𝛼𝑞𝑖 (𝑥𝑖 ) × {. (𝐸[𝐺|𝑥𝑖 ]−𝐸[𝐺]) 𝑇𝑖. + 𝑆(𝑞𝑖 ) + ln 𝑞𝑖 (𝑥𝑖 )}.. (38). 在牛頓法更新所有玩家的最佳策略時,我們要確保不會出現負的機率值,因此我 們將負的機率改為極小值1 × 10−6 。. 3.5.2 機率整合體演算法 若要使用牛頓法,我們需要去計算每個玩家 i 的所有可能策略𝑥𝑖 的期望成本 𝐸[𝐺|𝑥𝑖 ],因此我們使用蒙地卡羅法(Monte Carlo method)幫助我們計算,每個 玩家 i 會從他目前的機率分佈𝑞𝑖 (𝑥𝑖 )中根據蒙地卡羅選出他的策略𝑥𝑖 ,在得到每 個玩家的策略後,我們就可以經由 objective function 計算出期望成本,最後根據 方程式(32)更新策略分佈𝑞𝑖 (𝑥𝑖 )。 27.

(39) 整個演算法根據 Bieniawski (2005)所提出,簡易流程如下: Step1. 初始值設定,設定溫度 T,並對 T 設定冷卻進度表,設定蒙地卡羅法的取 樣次數,將要代入參數的機率分佈初始為相同,決定收斂條件。 Step2. 產生 N 個蒙地卡羅取樣。 Step3. 將 N 個取樣經由 objective function 計算出 private utility。 Step4. 經由 regression,計算出當玩家執行任一種策略時的期望成本。 Step5. 根據方程式(32)更新策略的機率分布𝑞𝑖 (𝑥𝑖 ) 。 Step6. 根據冷卻進度表更新參數。 Step7. 判斷是否滿足收斂條件,若不滿足則返回 Step2,滿足則進入 Step8。 Step8. 得到玩家機率最高,最有可能採取的策略𝑥𝑖 。 Step9. 將所有玩家中機率最高的策略代入 objective function。. 3.5.3 流程圖 首先我們將在初始化的時候匯入股市資料,並且將我們要取的模型以及其相 關參數設為多個玩家,之後經由機率整合體多次演化,最終我們可以得出要選模 型最佳的機率分佈以及用此機率蒙地卡羅取樣出來的結果,因此我們可得到最佳 的模型以及其最佳的參數。. 28.

(40) 圖 5. 機率整合體流程圖. 29.

(41) 4. 研究結果 4.1. 資料來源與研究期間 本研究以台灣加權指數(TAIEX)為研究數據,其為由臺灣證券交易所所編製的. 股價指數,研究期間為1970年1月到2009年12月共40年時間,研究資料頻率為日 線資料,在此我們採用加權指數的收盤價作為研究的樣本數據。. 4.2. 研究的驗證方式 本研究使用交叉驗證(cross validation)來驗證模型的正確性。我們將資料分為. 歷史資料(historical data)、訓練資料(training data)和測試資料(testing data)三個部 分,首先根據3.2.4節,要使用百分率模型須先根據歷史資料計算其MDD與ML, 之後將MDD與ML代入訓練期中,根據績效指標選出良好的技術指標與資金管理 模型,之後將訓練期選出的模型代入測試期中以測試模型的效能。我們採用如圖 6所示的滑動視窗法(sliding window)來分割資料,每個部份各5年的期間,之後向 後推移。例如CV=1時我們使用1970-1974的歷史資料以計算MDD與ML,再以19751979的訓練資料根據人工智慧演算法選出合適的交易系統模型,之後將選出的模 型代入1980-1984的測試資料來驗證其績效;而在CV=2時歷史資料為1971-1975的 數據,1976-1980為訓練資料,而1981-1985則為測試資料,依此類推。此外,我 們設定在每一個CV中執行50回合的GA或PC。在GA中每一回合會演化50代,而每 一代的個體數有50,因此每個回合共會有2500次的目標值被計算 (function evaluations)。而在PC中每個回合我們也進行50次迭代,每一次迭代使用50個蒙地 卡羅取樣,因此總共亦產生2500次的目標值被計算,如此GA和PC的function evaluations設定為一致,才能公平比較。對此兩種演算法,在每個CV中我們均將 從每一回合選出最佳解,代表兩種演算法均會選出50個可能的最佳交易組合模型。. 30.

(42) 圖6. 交叉驗證方式. 研究結果比較. 4.3. 在本文中我們會以兩種不同方法來比較GA與PC的實驗結果。第一種是同時 演化技術指標及資金管理模型,並分別以複利報酬率及Calmar ratio為目標函數以 找出合適的交易組合模型。稍後的實驗結果將顯示在第一種方法後,我們發現原 本所使用之數個技術指標中某技術指標常被演算法挑選出來,顯示此技術指標可 能對交易系統效能有重要的影響,因此我們將進一步研究在固定技術指標的情況 下,如何尋找最佳的資金管理模型。對於實驗設計我們首先分為2個部分: I.. II.. 同時演化技術指標與資金管理模型且目標函數為複利報酬率 1.. 遺傳演算法:GAFM1. 2.. 機率整合體:PCFM1. 同時演化技術指標與資金管理模型且目標函數為 Calmar ratio 1.. 遺傳演算法:GAFM2. 2.. 機率整合體:PCFM2. 實 驗 數 據 討 論 部 分 我 們 區 分 為 以 PC 演 化 、 以 GA 演 化 以 及 作 為 大 盤 (benchmark)的買進持有法(BH)的比較。. 31.

(43) 4.3.1 同時演化技術指標與資金管理模型且目標函數為複利報酬率以比較GA與 PC 本小節將同時演化技術指標與資金管理模型,技術指標中所會用到的模型參 數也交由GA或PC演算法來自動化選擇,並以績效指標中的複利報酬率為目標函 數來演化模型。 實驗數據如表1、表2所示,表1為訓練期部分結果,表2為測試期部分結 果,包含benchmark的複利報酬率𝑅𝑔 及MDD,兩者皆以百分率表示。PC與GA的 數據資料則包含其所選出的50個可能的最佳交易組合模型的平均複利報酬率的 及對應的 standard deviation (STD);同時此50個交易組合模型對應的平均MDD 也列在表中。 在表中的結果複利報酬率𝑅𝑔 值越高表示系統投資報酬率越高。STD越低則表 示演算法所製造的多種模型彼此效能的變異性越低,因此模型的可複製性便越 高。此外,MDD值越低則表示模型的投資風險越低。. 表1. 適應性函數(或目標函數)為複利報酬率實驗結果(訓練期部分) Training. CV. Training. benchmark. Mean of GA. Mean of PC. STD of. STD of. benchmark. Mean of. Mean of. period. 𝑅𝑔 (%). model 𝑅𝑔. model 𝑅𝑔. GA. PC. MDD (%). GA. PC. (%). (%). model. model. model. model. 𝑅𝑔 (%). 𝑅𝑔 (%). MDD(%). MDD(%). 1. 1975-1979. 23.65%. 44.86%. 47.33%. 3.15%. 0.01%. 39.97%. 16.28%. 17.06%. 2. 1976-1980. 10.28%. 25.69%. 26.82%. 1.45%. 0.49%. 38.24%. 15.80%. 16.91%. 3. 1977-1981. 7.15%. 21.06%. 22.31%. 1.59%. 0.73%. 30.23%. 17.33%. 16.64%. 4. 1978-1982. -0.39%. 14.33%. 15.11%. 1.56%. 0.87%. 38.79%. 13.59%. 13.44%. 5. 1979-1983. 6.80%. 18.56%. 18.47%. 1.22%. 0.84%. 36.07%. 9.08%. 10.64%. 6. 1980-1984. 7.94%. 18.69%. 18.65%. 1.62%. 1.45%. 29.85%. 9.79%. 9.85%. 7. 1981-1985. 8.88%. 20.90%. 21.53%. 1.10%. 0.01%. 34.38%. 12.29%. 12.19%. 8. 1982-1986. 14.42%. 22.71%. 23.80%. 1.20%. 0.01%. 34.38%. 13.48%. 12.19%. 9. 1983-1987. 39.57%. 64.14%. 65.63%. 2.06%. 0.01%. 50.83%. 11.79%. 12.19%. 10. 1984-1988. 44.59%. 84.49%. 86.03%. 2.52%. 0.02%. 50.83%. 15.55%. 18.84%. 11. 1985-1989. 63.96%. 96.18%. 95.80%. 1.48%. 3.92%. 50.83%. 18.31%. 17.19%. 32.

(44) 12. 1986-1990. 39.32%. 100.65%. 101.20%. 3.21%. 0.50%. 79.51%. 23.56%. 25.26%. 13. 1987-1991. 34.25%. 88.37%. 85.89%. 10.33%. 5.26%. 79.51%. 25.14%. 24.45%. 14. 1988-1992. 6.81%. 72.09%. 53.63%. 21.64%. 18.36%. 79.51%. 29.68%. 27.06%. 15. 1989-1993. 5.12%. 33.94%. 28.24%. 14.52%. 9.13%. 79.51%. 27.68%. 25.59%. 16. 1990-1994. -6.61%. 24.61%. 21.81%. 6.11%. 1.93%. 79.51%. 22.06%. 17.34%. 17. 1991-1995. 2.75%. 23.10%. 21.23%. 4.84%. 1.80%. 50.27%. 20.92%. 24.16%. 18. 1992-1996. 7.72%. 17.17%. 17.39%. 1.53%. 0.55%. 41.84%. 15.70%. 12.74%. 19. 1993-1997. 20.29%. 29.37%. 29.93%. 4.59%. 2.22%. 37.31%. 22.82%. 22.78%. 20. 1994-1998. -0.95%. 14.13%. 14.49%. 1.74%. 1.07%. 39.19%. 18.39%. 16.81%. 21. 1995-1999. 5.04%. 16.42%. 15.53%. 2.89%. 2.10%. 45.88%. 17.49%. 15.47%. 22. 1996-2000. 1.78%. 16.38%. 17.00%. 0.90%. 0.00%. 54.77%. 21.04%. 22.16%. 23. 1997-2001. -3.23%. 13.25%. 15.76%. 4.41%. 4.23%. 66.22%. 29.13%. 30.86%. 24. 1998-2002. -10.05%. 10.51%. 9.67%. 2.42%. 1.01%. 66.22%. 27.56%. 28.80%. 25. 1999-2003. -0.24%. 14.29%. 13.91%. 1.70%. 1.60%. 66.22%. 24.02%. 21.60%. 26. 2000-2004. -7.66%. 9.70%. 8.80%. 3.14%. 1.57%. 66.22%. 14.42%. 13.35%. 表2. 適應性函數(或目標函數)為複利報酬率實驗結果(測試期部分) Testing. CV. Testing. benchmark. Mean of GA. Mean of PC. STD of. STD of. benchmark. Mean of. Mean of. period. 𝑅𝑔 (%). model 𝑅𝑔. model 𝑅𝑔. GA. PC. MDD (%). GA. PC. (%). (%). model. model. model. model. 𝑅𝑔 (%). 𝑅𝑔 (%). MDD(%). MDD(%). 1. 1980-1984. 7.94%. 17.59%. 18.96%. 1.78%. 0.00%. 29.85%. 13.80%. 14.14%. 2. 1981-1985. 8.88%. 20.29%. 21.54%. 1.70%. 0.45%. 34.38%. 15.25%. 14.21%. 3. 1982-1986. 14.42%. 21.89%. 22.42%. 1.21%. 0.56%. 34.38%. 14.50%. 13.32%. 4. 1983-1987. 39.57%. 32.45%. 35.51%. 16.80%. 16.38%. 50.83%. 13.49%. 11.61%. 5. 1984-1988. 44.59%. 54.69%. 63.67%. 22.65%. 27.24%. 50.83%. 12.57%. 15.50%. 6. 1985-1989. 63.96%. 75.96%. 76.16%. 17.70%. 17.13%. 50.83%. 16.77%. 17.80%. 7. 1986-1990. 39.32%. 83.46%. 83.38%. 2.42%. 0.02%. 79.51%. 53.42%. 53.22%. 8. 1987-1991. 34.25%. 70.91%. 67.44%. 6.00%. 1.21%. 79.51%. 43.06%. 53.22%. 9. 1988-1992. 6.81%. 23.44%. 23.53%. 4.41%. 3.38%. 79.51%. 53.51%. 53.23%. 10. 1989-1993. 5.12%. 3.50%. 3.56%. 2.18%. 0.22%. 79.51%. 54.45%. 58.94%. 11. 1990-1994. -6.61%. -2.63%. -3.11%. 4.45%. 6.65%. 79.51%. 55.12%. 53.68%. 12. 1991-1995. 2.75%. 16.28%. 16.80%. 1.62%. 0.77%. 50.27%. 25.22%. 24.94%. 13. 1992-1996. 7.72%. 12.98%. 13.57%. 1.79%. 1.47%. 41.84%. 21.47%. 22.14%. 14. 1993-1997. 20.29%. 21.28%. 20.44%. 2.33%. 5.60%. 37.31%. 18.90%. 17.98%. 15. 1994-1998. -0.95%. 9.64%. 7.39%. 2.74%. 2.04%. 39.19%. 19.29%. 17.73%. 33.

(45) 16. 1995-1999. 5.04%. 10.03%. 9.47%. 2.88%. 0.96%. 45.88%. 16.94%. 14.93%. 17. 1996-2000. 1.78%. 2.98%. 8.32%. 9.76%. 6.15%. 54.77%. 36.53%. 31.62%. 18. 1997-2001. -3.23%. 1.28%. 0.38%. 4.06%. 0.74%. 66.22%. 31.87%. 27.95%. 19. 1998-2002. -10.05%. 4.89%. 4.46%. 4.80%. 3.10%. 66.22%. 37.36%. 36.12%. 20. 1999-2003. -0.24%. 0.07%. -1.06%. 6.41%. 5.18%. 66.22%. 31.39%. 27.68%. 21. 2000-2004. -7.66%. -5.19%. -3.45%. 5.48%. 6.94%. 66.22%. 47.94%. 43.56%. 22. 2001-2005. 5.28%. 9.95%. 10.81%. 1.95%. 0.09%. 43.54%. 18.41%. 16.96%. 23. 2002-2006. 6.16%. 4.06%. 4.01%. 2.10%. 1.53%. 40.42%. 19.39%. 19.59%. 24. 2003-2007. 10.89%. 7.63%. 7.07%. 4.56%. 4.10%. 24.41%. 17.02%. 16.41%. 25. 2004-2008. -5.22%. 0.17%. -0.44%. 1.76%. 2.67%. 58.31%. 22.36%. 15.01%. 26. 2005-2009. 6.54%. 7.99%. 5.40%. 5.22%. 2.65%. 58.31%. 9.76%. 7.41%. 在此我們將表1與表2的結果簡化為表3與表4的GA、PC、benchmark之比較。 由表4的測試期結果可以發現,在26個CV中,GA與PC的複利報酬率優於大盤的比 率為75%以上,而其MDD優於大盤的比率皆為100%(由於大盤只是單一個模型, 因此我們沒有比較GA與PC對大盤的STD比率)。底下我們比較GA與PC的關係,PC 在複利報酬率上優於GA 13次,約為50%;PC在MDD部分優於GA 18次,約為73%; 而PC在STD優於GA 21次,約為81%。因此在同時演化技術分析與資金管理模型的 情況下,PC所找出的模型在複利報酬率上與GA相差不大但其選出模型的MDD與 STD皆顯著優於GAFM1所演化出的模型。. 表3. PCFM1與GAFM1的在26個CV中的複利報酬率與MDD比較(訓練期部分) 𝑅𝑔. MDD. STD. PCFM1>GAFM1. 14. 11. 1. GAFM1>benchmark. 26. 0. PCFM1>benchmark. 26. 0. 34.

(46) 表4. PCFM1與GAFM1的在26個CV中的複利報酬率與MDD比較(測試期部分) 𝑅𝑔. MDD. STD. PCFM1>GAFM1. 13. 7. 5. GAFM1>benchmark. 22. 0. PCFM1>benchmark. 20. 0. 底下我們將表4中的複利報酬率與其模型STD的關係整理為圖7的box plots。 圖7呈現出在CV 5與14中PC所選出50個模型的複利報酬率比GA具有稍大的變異範 圍,但總體而言,PC所演化出的模型在複利報酬率確實較GA的穩定。. 圖7. GAFM1與PCFM1的複利報酬率以box plots比較之結果(測試期部分). 實驗數據如表5、表6所示,表5為訓練期結果,表6為測試期結果,包含GA與 PC的50個可能的最佳交易組合模型的平均Sharpe ratio、平均Calmar ratio及平均 Sortino ratio。在表中的ratio值越高則模型越佳。. 35.

(47) 表5. 適應性函數(或目標函數)為複利報酬率的績效指標數據(訓練期部分) Training CV. Training. Mean of GA. Mean of PC. Mean of GA. Mean of PC. Mean of GA. Mean of PC. period. Sharpe ratio. Sharpe ratio. Calmar ratio. Calmar ratio. Sortino ratio. Sortino ratio. 1. 1975-1979. 0.923. 0.915. 2.759. 2.774. 41.164. 44.227. 2. 1976-1980. 1.153. 1.185. 1.632. 1.587. 3.090. 2.097. 3. 1977-1981. 0.802. 0.918. 1.265. 1.343. 2.003. 1.619. 4. 1978-1982. 0.275. 0.341. 1.098. 1.170. 0.747. 0.933. 5. 1979-1983. 0.538. 0.494. 2.194. 1.987. 4.928. 3.372. 6. 1980-1984. 0.514. 0.517. 1.958. 1.953. 12.551. 12.843. 7. 1981-1985. 0.459. 0.465. 1.703. 1.766. 11.703. 12.010. 8. 1982-1986. 0.578. 0.613. 1.720. 1.953. 12.180. 15.661. 9. 1983-1987. 0.775. 0.783. 5.507. 5.384. 303.720. 434.899. 10. 1984-1988. 0.930. 0.915. 5.692. 4.567. 103.361. 106.489. 11. 1985-1989. 1.091. 1.139. 5.314. 5.928. 110.411. 108.722. 12. 1986-1990. 1.628. 1.626. 4.428. 4.007. 103.169. 105.692. 13. 1987-1991. 1.160. 1.061. 3.700. 3.552. 81.241. 78.736. 14. 1988-1992. 0.914. 0.806. 2.381. 1.982. 10.823. 7.824. 15. 1989-1993. 0.697. 0.598. 1.183. 1.089. 2.577. 1.769. 16. 1990-1994. 0.564. 0.525. 6.382. 1.366. 2.250. 2.144. 17. 1991-1995. 0.633. 0.504. 1.387. 1.008. 7.260. 5.024. 18. 1992-1996. 0.406. 0.395. 1.583. 1.366. 2.763. 2.298. 19. 1993-1997. 0.667. 0.665. 1.313. 1.345. 2.402. 2.490. 20. 1994-1998. 0.369. 0.356. 0.795. 0.869. 1.717. 1.950. 21. 1995-1999. 0.632. 0.600. 0.974. 1.024. 1.471. 1.532. 22. 1996-2000. 0.490. 0.503. 0.883. 0.767. 1.630. 1.360. 23. 1997-2001. 0.448. 0.513. 0.487. 0.514. 2.386. 2.659. 24. 1998-2002. 0.417. 0.353. 0.496. 0.429. 1.570. 1.493. 25. 1999-2003. 0.826. 1.099. 0.811. 0.795. 4.326. 7.712. 26. 2000-2004. 0.503. 0.441. 0.846. 0.699. 4.447. 3.661. 36.

(48) 表6. 適應性函數(或目標函數)為複利報酬率的績效指標數據(測試期部分) Testing CV. Testing. Mean of GA. Mean of PC. Mean of GA. Mean of PC. Mean of GA. Mean of PC. period. Sharpe ratio. Sharpe ratio. Calmar ratio. Calmar ratio. Sortino ratio. Sortino ratio. 1. 1980-1984. 0.2586. 0.2864. 1.2833. 1.3404. 2.7033. 2.3540. 2. 1981-1985. 0.4751. 0.5140. 1.3442. 1.5180. 2.0082. 2.3683. 3. 1982-1986. 0.6121. 0.6371. 1.5321. 1.6919. 3.9307. 3.2880. 4. 1983-1987. 1.0538. 1.0944. 2.5173. 2.8893. 30.6016. 35.0979. 5. 1984-1988. 0.8549. 0.8530. 4.2491. 4.0699. 61.5974. 76.9722. 6. 1985-1989. 1.1674. 1.2081. 4.7702. 4.5984. 83.0586. 79.0693. 7. 1986-1990. 0.9624. 0.9607. 1.5627. 1.5667. 3.2029. 3.1250. 8. 1987-1991. 0.8595. 0.7906. 1.9136. 1.2672. 12.5634. 2.2579. 9. 1988-1992. 0.4413. 0.4456. 0.4386. 0.4420. 1.5541. 1.5204. 10. 1989-1993. 0.1153. 0.1404. 0.0687. 0.0603. 0.2810. 0.3529. 11. 1990-1994. -0.1271. -0.1392. -0.0435. 0.0503. -0.2488. -0.1662. 12. 1991-1995. 0.3511. 0.3593. 0.6512. 0.6745. 1.4938. 1.5397. 13. 1992-1996. 0.3073. 0.3012. 0.6193. 0.6190. 1.1911. 1.1596. 14. 1993-1997. 0.6658. 0.5925. 1.1251. 1.1243. 3.0610. 4.0367. 15. 1994-1998. 0.3504. 0.1903. 0.5048. 0.4167. 0.9192. 0.5397. 16. 1995-1999. 0.3546. 0.2857. 0.6111. 0.6607. 1.2635. 1.4633. 17. 1996-2000. -0.9249. 0.0548. 0.0742. 0.2643. -1.2991. 0.1241. 18. 1997-2001. -0.1682. -0.1992. 0.0294. 0.0113. -0.3688. -0.4985. 19. 1998-2002. 0.1126. 0.1137. 0.1086. 0.1060. 0.4170. 0.4348. 20. 1999-2003. -0.0939. -0.1444. -0.0032. -0.0572. -0.1216. -0.4869. 21. 2000-2004. -0.2438. -0.1861. -0.0897. -0.0356. -0.3118. -0.1691. 22. 2001-2005. 0.6282. 0.5416. 0.5763. 0.6378. 3.7961. 0.8966. 23. 2002-2006. 0.2620. 0.2607. 0.2496. 0.2140. 0.9694. 0.8010. 24. 2003-2007. 0.3982. 0.4253. 0.4910. 0.4202. 1.0149. 0.7196. 25. 2004-2008. -0.2362. -0.5394. -0.0067. -0.0618. -0.4135. -0.9328. 26. 2005-2009. 0.5346. 0.5872. 0.9025. 0.8047. 6.1214. 2.8475. 我們同樣將表5、表6簡化為表7與表8的比較數據。由表8的測試期結果可以 發現,在26個CV中,以PC所演化出的模型與GA相比其績效指標並未完全優於GA, 譬如以Sharpe ratio比較,PC優於GA 13次,約為50%;以Calmar ratio比較,PC優於. 37.

(49) GA 12次,約為46%;以Sortino ratio比較,PC優於GA 11次,約為48%。而在後面 章節我們將呈現何種情況下以PC所演化出的模型與GA相比將獲得顯著的優越性。. 表7. PCFM1與GAFM1的在26個CV中的績效指標比較(訓練期部分) PCFM1>GAFM1. Sharpe ratio. Calmar ratio. Sortino ratio. 11. 10. 13. 表8. PCFM1與GAFM1的在26個CV中的績效指標比較(測試期部分) PCFM1>GAFM1. Sharpe ratio. Calmar ratio. Sortino ratio. 13. 12. 11. 4.3.2 同時演化技術指標與資金管理模型且目標函數為Calmar ratio以比較GA與 PC 本小節將同時演化技術指標與資金管理模型,技術指標中所會用到的模型參 數也交由GA或PC演算法來自動化選擇,但此處我們以績效指標中的Calmar ratio 來演化模型。表9、表10為PC、GA與benchmark之比較,由表10的測試期結果可以 發現,以複利報酬率比較,GA與PC有73%以上優於大盤;以MDD來比較,GA和PC 有100%優於大盤。底下我們比較GA與PC的關係,以複利報酬率比較,PC有69%優 於GA;但以MDD比較,PC優於GA的比率也同時下降到31%,代表以Calmar ratio作 為目標函數則PC會找到比GA獲利更高但MDD也相對提高的模型。. 表9. PCFM2與GAFM2的在26個CV中的複利報酬率與MDD比較(訓練期部分) 𝑅𝑔. MDD. STD. PCFM2>GAFM2. 23. 12. 1. GAFM2>benchmark. 25. 0. PCFM2>benchmark. 25. 0. 38.

(50) 表10. PCFM2與GAFM2的在26個CV中的複利報酬率與MDD比較(測試期部分) 𝑅𝑔. MDD. STD. PCFM2>GAFM2. 18. 18. 1. GAFM2>benchmark. 21. 0. PCFM2>benchmark. 19. 0. 底下我們將表10中複利報酬率與其模型的STD整理為圖8的box plots。圖8呈 現出PC在每個CV中所選出的50個模型在複利報酬率較GA所選出的模型的差異性 顯著較小。. 圖8. GAFM2與PCFM2的複利報酬率以box plots比較之結果(測試期部分). 最後我們再進一步比較在測試期部分PC與GA這兩種方法在其他績效指標的 情況,如表11、表12所示。表12呈現以PC所演化出的模型,其績效指標優於以GA 所演化出的模型。以Sharpe ratio比較,PC有65%優於GA;以Calmar ratio比較,PC 有50%優於GA;以Sortino ratio比較,PC有50%優於GA。與表8相比,PC在績效指 39.

參考文獻

相關文件

Department of Computer Science and Information

Department of Computer Science and Information

Department of Computer Science and Information

Professor of Computer Science and Information Engineering National Chung Cheng University. Chair

隨著科技的進步,展覽場的導覽系統已從過去導遊、磁帶機或 CD 播放 器講解的時代轉換成行動導覽的時代。目前行動導覽方式大都以 RFID 或 QR

2 Department of Materials Science and Engineering, National Chung Hsing University, Taichung, Taiwan.. 3 Department of Materials Science and Engineering, National Tsing Hua

Towards a model apprenticeship framework: A comparative analysis of national apprenticeship systems. Globalization and new industrial organization: Implication for

Department of Computer Science and Information Engineering, Chaoyang University of