• 沒有找到結果。

台股指數交易之研究 – EEMD與ANN方法 - 政大學術集成

N/A
N/A
Protected

Academic year: 2021

Share "台股指數交易之研究 – EEMD與ANN方法 - 政大學術集成"

Copied!
60
0
0

加載中.... (立即查看全文)

全文

(1)國立政治大學金融學系碩士班碩士論文. 台股指數交易之研究--EEMD 與 ANN 方法. 立. 政 治 大. ‧. ‧ 國. 學. 指導教授: 廖四郎 博士. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 研究生: 蔡橙檥 撰 中華民國一○○年 6 月.

(2) 謝. 辭. 研究所短短的兩年裡,讓我對於財務金融的專業知識有更深一層的了 解,在碩一上的財務數學、財務工程與金融創新等專業課程,更是增加我 在財務工程領域的相關知識與技能,非常感謝廖四郎老師經常利用課餘時 間來加強我在財務工程的專業知識及程式撰寫的能力,而在論文研究的過 程中,老師也花費了許多的心思從旁指導,並給予我許多寶貴的意見,讓 我的論文能夠順利完成。 感謝我的同學釗旻、韋大、逸華、涵如、云瑄、繼文、致穎、玉樹、. 治 政 雅雯、Bobby、聖元、崇文、小風、志揚、培均,我會懷念在寢室及研究 大 立 室打牌、聊天的歡樂、在貓空泡茶的喜悅、從政大走山路到碧潭的衝勁及 ‧ 國. 學. 在河濱公園喝酒談心的場景,還有感謝博班的怡婷學姐、嘉晃學長、志偉. sit. y. Nat. 勵,再次感謝各位夥伴的關心。. ‧. 學長、俊洪學長、宗穎學長,能夠不時關心學弟我的論文狀況,並給予鼓. io. er. 最後感謝我的家人,沒有你們的支持,我也無法順利念完研究所的課 程,雖然我遠在台北唸書,你們經常關心我的學業及身體健康狀況,讓我. al. n. iv n C 深深感受到家人的溫暖,真的非常感謝你們,我終於畢業了!! hengchi U.

(3) 摘. 要. 在台灣證券市場中,有許多的技術分析方法或指標,市場參與者或財 務學者會利用歷史資料來做回溯測試,找出可運用的方法或指標,以此來 推測出台股加權指數未來的趨勢,也有學者利用類神經網路(Artificial Neural Network, ANN)考慮經濟景氣、技術分析指標等作為輸入變數來預測 台股加權指數,而本文則利用 EEMD(Ensemble Empirical Mode Decomposition)拆解出來的結果作為 ANN 的輸入變數,並將 ANN 預測出 的值轉換成 FK (Forward-calculated %K) 值,再搭配不同的交易方式,來. 政 治 大. 補捉台股加權指數的走勢,並比較各種交易方式的績效,找出一個能夠穩. 立. 定獲利的交易模型。. ‧ 國. 學. 【關鍵字】類神經網路、Ensemble Empirical Mode Decomposition、Artificial. ‧. Neural Network. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v.

(4) 目. 錄. 1. 序論 ......................................................................................... 6 1.1 研究動機與目的 ............................................................................ 6 1.2 研究架構 ........................................................................................ 7. 2. 文獻探討................................................................................. 8 3. 研究方法............................................................................... 11 3.1. 政 治 大 Empirical Mode Decomposition (EMD) .................................... 11 立. ‧ 國. 學. 3.2 Ensemble Empirical Mode Decomposition (EEMD) ................... 14 3.3 Artificial Neural Network (ANN) ................................................ 16. ‧. sit. y. Nat. 3.4 FK Indicator .................................................................................. 23. n. al. er. io. 4. 實證研究............................................................................... 25. iv. Ch 4.1 資料選取 ...................................................................................... 25 Un engchi. 4.2 實證過程 ...................................................................................... 25 4.2.1 資料分類................................................................................ 26 4.2.2 EEMD 拆解結果 ................................................................... 27 4.2.3 ANN 預測與 FK 指標 ........................................................... 31 4.2.4 交易邏輯與績效.................................................................... 38. 1.

(5) 5. 結論 ....................................................................................... 43 參考文獻.................................................................................... 44 Appendix ................................................................................... 46. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 2. i Un. v.

(6) 表. 次. 【表 3-1】原始資料 X(t)拆解成多條 IMF 的過程 ....................................... 12 【表 3-2】各神經層的功能 ............................................................................ 18 【表 4-1】各 IMF 的平均週期(Signal-Noise Ratio 為 0.1) ........................... 30 【表 4-2】各 IMF 的平均週期(Signal-Noise Ratio 為 0.2) ......................... 31 【表 4-3】買進與賣出 FK 門檻值 ................................................................. 39 【表 4-4】交易訊號判別式 ............................................................................ 39 【表 4-5】各模型交易績效表(留倉單位限制為 5) .................................... 40. 政 治 大. 【表 4-6】各模型交易績效表(留倉單位限制為 10) .................................. 41. 立. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 3. i Un. v.

(7) 圖. 次. 【圖 3-1】上下緣(極值)包絡線...................................................................... 11 【圖 3-2】均值包絡線 .................................................................................... 11 【圖 3-3】原始資料與均值包絡線之差值曲線 ............................................ 12 【圖 3-4】EMD 拆解 Input 的結果 ................................................................ 14 【圖 3-5】EEMD 拆解 Input 的結果 ............................................................. 16 【圖 3-6】類神經網路架構圖 ........................................................................ 17 【圖 3-7】單一神經層多個神經元的運作流程圖 ........................................ 18. 政 治 大 【圖 3-9】倒傳遞類神經網路流程圖 ............................................................ 22 立 【圖 3-8】三層神經層多個神經元的運作流程圖 ........................................ 20. ‧ 國. 學. 【圖 4-1】實證流程圖 .................................................................................... 25 【圖 4-2】台股加權指數日內每分鐘資料 .................................................. 26. ‧. 【圖 4-3】EEMD 拆解的各 IMF 與 R(Signal-Noise Ratio 為 0.1) ......... 27~28. sit. y. Nat. 【圖 4-4】EEMD 拆解的各 IMF 與 R(Signal-Noise Ratio 為 0.2) ....... 28~30. er. io. 【圖 4-5】1~T 日的歷史資料預測 T+1 日 .................................................... 32. n. al 【圖 4-6】1~T+1 日的歷史資料預測 T+2 日................................................ 32 iv Un. C. h e n g ........................................................ 【圖 4-7】本文的類神經網路模型架構 33 chi 【圖 4-8】EEMD-ANN-FK 的架構圖 ......................................................... 34 【圖 4-9】2010/09/01 至 2010/09/30 的每分鐘台股加權指數走勢圖 ......... 34 【圖 4-10】2010/09/01 至 2010/09/30 的每分鐘 FK01-8 值 ........................ 35 【圖 4-11】2010/09/01 至 2010/09/30 的每分鐘 FK01-12 值 ...................... 35 【圖 4-12】2010/09/01 至 2010/09/30 的每分鐘 FK01-16 值 ...................... 36 【圖 4-13】2010/09/01 至 2010/09/30 的每分鐘 FK02-8 值 ........................ 36 【圖 4-14】2010/09/01 至 2010/09/30 的每分鐘 FK02-12 值 .................... 37 【圖 4-15】2010/09/01 至 2010/09/30 的每分鐘 FK02-16 值 ...................... 37. 4.

(8) 【圖 4-16】各模型交易績效走勢圖(留倉單位限制為 5) ............................ 40 【圖 4-17】各模型交易績效走勢圖(留倉單位限制為 10) .......................... 41 【圖 A-1】FK01-8(留倉單位限制為 5)的各門檻值累計績效 ..................... 46 【圖 A-2】FK01-8(留倉單位限制為 5)的績效與次數 ................................. 46 【圖 A-3】FK01-12(留倉單位限制為 5)的各門檻值累計績效 ................... 47 【圖 A-4】FK01-12(留倉單位限制為 5)的績效與次數 ............................... 47 【圖 A-5】FK01-16(留倉單位限制為 5)的各門檻值累計績效 ................... 48 【圖 A-6】FK01-16(留倉單位限制為 5)的績效與次數 ............................... 48 【圖 A-7】FK02-8(留倉單位限制為 5)的各門檻值累計績效 ..................... 49. 治 政 【圖 A-8】FK02-8(留倉單位限制為 5)的績效與次數 大 ................................. 49 立 【圖 A-9】FK02-12(留倉單位限制為 5)的各門檻值累計績效 ................... 50 ‧ 國. 學. 【圖 A-10】FK02-12(留倉單位限制為 5)的績效與次數 ............................. 50. ‧. 【圖 A-11】FK02-16(留倉單位限制為 5)的各門檻值累計績效 ................. 51. sit. y. Nat. 【圖 A-12】FK02-16(留倉單位限制為 5)的績效與次數 ............................. 51. io. er. 【圖 A-13】FK01-8(留倉單位限制為 10)的各門檻值累計績效 ................. 52 【圖 A-14】FK01-8(留倉單位限制為 10)的績效與次數 ............................. 52. al. n. iv n C 【圖 A-15】FK01-12(留倉單位限制為 ............... 53 h e n g10)的各門檻值累計績效 chi U 【圖 A-16】FK01-12(留倉單位限制為 10)的績效與次數 ........................... 53 【圖 A-17】FK01-16(留倉單位限制為 10)的各門檻值累計績效 ............... 54 【圖 A-18】FK01-16(留倉單位限制為 10)的績效與次數 ........................... 54 【圖 A-19】FK02-8(留倉單位限制為 10)的各門檻值累計績效 ................. 55 【圖 A-20】FK02-8(留倉單位限制為 10)的績效與次數 ............................. 55 【圖 A-21】FK02-12(留倉單位限制為 10)的各門檻值累計績效 ............... 56 【圖 A-22】FK02-12(留倉單位限制為 10)的績效與次數 ........................... 56 【圖 A-23】FK02-16(留倉單位限制為 10)的各門檻值累計績效 ............... 57 【圖 A-24】FK02-16(留倉單位限制為 10)的績效與次數 ........................... 57 5.

(9) 1. 序論 1.1 研究動機與目的 在台灣的金融市場中,存在著許多金融商品,有股票、債券、期貨、 選擇權,而債券市場的投資門檻較高,所以眾多投資者都偏好投資股票、 期貨、選擇權,想要把錢投入金融市場,為了獲得他們渴望的報酬,但要 如何在這劇烈變化的金融市場中存活下來,並且得到期望的報酬,就需要 精確地掌握市場快速變化的趨勢,因此,金融市場的眾多參與者都想要找. 政 治 大 的正報酬是所有市場參與者的共同目標。 立. 到方法能夠準確地預測市場趨勢,無疑地,透過持續性的投資,賺取穩定. ‧ 國. 學. 期貨和選擇權是股票所衍生出來的金融商品,所以股票市場的價格波 動是最主要的,而股票市場的價格受到許多因素的影響,有政治因素、經. ‧. 濟景氣、人為因素等等,也會受到其它國家金融市場變化的影響,因此,. y. Nat. sit. 市場上也有一些分析方法,如:基本面分析、技術面分析、籌碼面分析等. er. io. 等,這些分析方法的目的是為了要從市場參與者所造成的股價變動中,找. n. a. v. l C 出一些規則,在技術分析中,有許多的技術指標是市場參與者常用來做決 ni. hengchi U. 策的參考,但若同時有幾個不同的技術指標出現不同的買賣訊號,會讓參 與者有所遲疑,錯失了絕佳的時機點,也透露出這些技術指標或許不是一 個良好的參考指標。 隨著電腦科技的不斷進步,許多財務學者以市場上的歷史交易資料作 為研究對象,利用電腦建立類神經網路模型、計量模型等,詴圖找出一個 預測模型能夠較敏感地捕捉市場價格變動走勢,這是市場參與者和財務學 者都渴望找到的。. 6.

(10) 1.2 研究架構 本文的研究架構:第二章針對金融市場價格變動預測的主題,蒐集並 整理國內、外相關文獻;第三章對於本文所建立的預測模型,其所運用的 EEMD 與 ANN 方法作詳細的說明;第四章以台股加權指數的日內每分鐘 交易資料作為實證對象,並將本文的預測模型績效表現結果與 Buy and Hold 策略績效作比較;第五章本文結論。 研究架構流程如下:. 學. ‧ 國. 立. 治 政文獻探討 大 EEMD 方法. y. ‧. Nat. n. er. io. al. sit. ANN 方法. i Un. Ch. engchi 實證研究及結果. 結論. 7. v.

(11) 2. 文獻回顧 Yu , Wang , Lai(2008)將 West Texas Intermediate(WTI)與 Brent 輕原油現 貨價格的時間序列資料分割成有限條 Intrinsic Mode Functions(IMFs),利用 three-layer 前饋式類神經網路(Feed-forward Neural Network, FNN)模型化 每一條 IMF,並精確地預測出這些 IMF 的長期趨勢,最後將這些 IMF 利 用 Adaptive Linear Neural Network(ALNN)線性組合輸出輕原油價格序列, 再與 GARCH 模型的 RMSE 作比較,驗證出 EMD-FNN-ALNN 模型的 RMSE 最小。. 治 政 Zhang , Lai , Wang (2008)提到針對非線性與非定態的時間序列資料, 大 立 Empirical Mode Decomposition(EMD)是一個新穎的數值分析方法,從一個 ‧ 國. 學. 較新的觀點去解釋時間序列資料的產生,Ensemble EMD(EEMD)則是改善. ‧. 了 EMD 的 mode mix 問題,將 white noise 加入原始時間序列資料,進而更. sit. y. Nat. 有效地拆解資料所隱含的資訊,此篇文章利用 EEMD 對輕原油價格作分. io. er. 析,認為拆解出來的 IMFs 從高頻到低頻,以經濟層面的角度來看,可分 為三個部分,第一部分為由供需不均衡或一些市場活動所造成的短期波動. al. n. iv n C (高頻),其次為不可預期與顯著事件衝擊影響(低頻),最後為長期趨勢 hengchi U (Trend)。. Wu , Huang(2009)在探討 EEMD 這個新的數值分析方法,以聲波與氣 候數據做為 EEMD 拆解的輸入資料,除了增加 white noise 外,還加入重覆 拆解成 IMF 的次數,並將其平均,這個次數(ensemble number)並沒有任何 準則可依循,認為可把所有可能的 IMF 結果考慮進去,因此所得出的 IMF 更具有實質的意義,改善了原始 EMD 的缺點,是一個真實地 NADA(Noise-Assisted Data Analysis)方法。. 8.

(12) Hamid , Iqbal(2004)利用 ANN 預測 S&P500 指數期貨的波動度,並與 美式選擇權評價模型的隱含波動度作比較,探討 ANN 最適的神經層層數 為 3~4 層,超過 4 層績效未必好且增加 ANN 的訓練時間;第 2 層神經元 個數為輸入變數的 0.5 倍至 2 倍較好,結果證實 ANN 預測的波動度相較於 隱含波動度,較接近真實的波動度。 Lin , Yu(2009)運用 ANN 來預測台股加權指數(Taiwan Weighted Index) 與 S&P500 指數,以 Forward-calculated %K(FK) Indicator 作為買賣交易訊 號的依據,並與傳統的移動平均法(Moving Average)、買進持有策略. 政 治 大 Indicator 作為買賣交易的策略,其績效明顯優於其他兩者。 立. (Buy-and-Hold)的交易績效比較,發現利用 ANN 預測出走勢,再轉換成 FK. ‧ 國. 學. Irina, Lelis(2008)以預測通訊網路連結(如:IP、電話等)強度為對象, 探討 Neural Network 的資料輸入前處理程序,可以考慮 Neural Network 的. ‧. 神經元間網路連結特性,來增加預測的精確度與可信性,減少 Neural. y. Nat. sit. Network 的模擬訓練時間,尤其是輸入資料量很大時,減少訓練學習時間. er. io. 將是非常重要的,而網路中各層神經元個數如何配置是影響 Neural. n. a. l C Network 的執行效率與預測精確度的重要因素。 ni. hengchi U. v. Chan , Wong , Lam(2000)多層 Neural Network 已逐漸被應用在時間序 列預測,又以倒傳遞類神經網路(Back-Propagation Network, BPN)學習演算 法較受歡迎,此篇論文還提出了另一個 Gradient 學習演算法,且普遍使用 的隨機配適權重值不能保證能夠產生接近最適的權重值,也會導致緩慢收 斂,本文也提出了多元線性迴歸(Multiple Linear Regression, MLR),與前者 相互比較,以上海股票交易所(Shanghai Stock Exchange)上市公司的日交易 資料為標的,結果發現 Neural Network 模組化時間序列資料跑出的預測效 果較佳。. 9.

(13) Chena , Leungb , Daouk(2003)利用 Probabilistic Neural Network(PNN) 預測台股加權指數報酬率的方向,將 PNN 預測效果與 Kalman 的 Generalized methods of Moments(GMM)作比較,更進一步,以 PNN 預測出 的結果搭配數種交易策略並與買進持有策略(Buy and Hold)及 GMM 搭配 同樣的交易策略作比較,實證結果發現以 PNN 為主的交易策略績效表現 優於其它兩者。 Quaha , Srinivasan(1999)ANN 在證券市場應用越來越普遍,本篇文章 利用 Artificial Neural Network(ANN)的結果作為選擇股票的標準,以 Credit. 政 治 大 股票績效表現的歷史資料作推測,股票的績效反應該公司的獲利能力與管 立. Lyonnais Securities(Singapore)所提供的證券市場資訊為對象,ANN 能夠從. ‧ 國. 學. 理者的素質,這類資訊會反應在財務變數與技術分析變數,以這兩類變數 作為 ANN 的輸入資料,輸出則為該公司股票未來的績效表現,實證結果. ‧. 指出 ANN 確實有能力推測出公司股票的未來表現,更進一步的話,可以. n. al. er. io. sit. y. Nat. 在 ANN 的內部結構作多次調整與實證,找出最適的 ANN 結講。. Ch. engchi. 10. i Un. v.

(14) 3.. 研究方法. 3.1 Empirical Mode Decomposition (EMD) EMD 是一個對非線性、非定態資料的分析方法,由黃鍔(Hilbert Huang) 博士於 1998 年所發表的,他認為在複雜的時間序列資料中,存在許多不 同的振動模式,而 EMD 利用資料本身的極值特性,可以取出這些內含在 原始時間序列資料中的振動模式(Intrinsic Mode Function ,IMF),EMD 的演 算法如下: (1) 找出時間序列資料 X(t)的極大值與極小值. 政 治 大. (2) 利用 cubic-spline 內差法,產生上緣(極大值)包絡線 emax(t)與下緣(極小 值)包絡線 emin(t). 立. ‧. ‧ 國 io. y. sit. Nat. emin(t). er. X(t). 學. emax(t). 【圖 3-1】上下緣(極值)包絡線1. al. n. iv n C (3) 計算上下緣包絡線的平均值,產生均值包絡線 h e n g c h i U m11(t) (e (t )  e (t )) m11 (t ) . min. max. 2. m11(t). 【圖 3-2】均值包絡線2 1 2. 圖 3-1 的參考資料來源:謝志敏-希爾伯特黃轉換簡介(Hilbert Huang Transform),2007 圖 3-2 的參考資料來源:謝志敏-希爾伯特黃轉換簡介(Hilbert Huang Transform),2007 11.

(15) (4) 求出 h11(t)=X(t)-m11(t),即均值包絡線與原始資料之差值. h11(t). 【圖 3-3】原始資料與均值包絡線之差值曲線3 (5) 檢查 h11(t)是否為 IMF: a. 若 h11(t)為 IMF,則將 h11(t)視為 C1(t),C1(t)為 EMD 拆解的第 1 條. 政 治 大 以此類推至第 n 條 IMF 立. IMF,而第 2 條 IMF 的初始序列資料改為 r1(t),r1(t)=X(t)-C1(t),. ‧ 國. 學. b. 若 h11(t)不為 IMF,則將 X(t)換成 h11(t),即 h11-m12=h12,重覆(1)~(5). 的步驟,直到滿足 stopping criterion,即為 IMF(h1k=C1,重覆 k 次). ‧. 上述為 EMD 演算法的流程,而利用 EMD 拆解成多條 IMF 的過程,如【表 3-1】所示:. y. Nat. IMFn. iv l C n U31 r1-m21=hh 21 e h i31=h n g cr2-m. …. rn-1-Cn=rn. …. rn-mn1=hn1. X(t)-C a 1=r1. r1-C2=r2. io. IMF3. n. X(t). sit. …. IMF2. er. IMF1. 1. X(t)-m11=h11. 2. h11-m12=h12. h21-m22=h22. h31-m32=h32. …. hn1-mn2=hn2. 3. h12-m13=h13. h22-m23=h23. h32-m33=h33. …. hn2-mn3=hn3. 4. h13-m14=h14. h23-m24=h24. h33-m34=h34. …. hn3-mn4=hn4. :. :. :. :. …. :. k. h1(k-1)-m1k=h1k. h2(k-1)-m2k=h2k. h3(k-1)-m3k=h3k. …. hn(k-1)-mnk=hnk. IMF. h1k=C1. h2k=C2. h3k=C3. …. hnk=Cn. 【表 3-1】原始資料 X(t)拆解成多條 IMF 的過程 3. 圖 3-3 的參考資料來源:謝志敏-希爾伯特黃轉換簡介(Hilbert Huang Transform),2007 12.

(16) 在【表 3-1】中,hij(t)為拆解第 i 條 IMF 的過程中,重覆(1)~(5)步驟第 j 次的差值序列資料;mij(t)為拆解第 i 條 IMF 的過程中,重覆(1)~(5)步驟 第 j 次的均值序列資料。 Huang 提出了關於求得一條 IMF,其 stopping criterion 有如下幾點: a. 通過零點的次數與極值的個數相差不得大於 1 b. 設定 k 值為多少,即重覆(1)~(5)步驟的次數 c. 其標準差小於某值 EMD 拆解出來的 IMFs(包含殘差項)要有多少條,是利用 Log2N 的整 數部分來決定的,N 為序列資料的長度,時間序列資料為這些 IMFs 與殘 差項的加總,如下公式:. n-1. X (t )   Ci (t )  r (t ) i 1. 學. ‧ 國. 立. 政 治 大. (1). n 為 Log2N 的整數值,r(t)為最後的殘差項. ‧. 在拆解過程中,一開始求得的第一條 IMF(C1)會是高頻(平均週期短). Nat. sit. y. 且振幅較小的波形,原始資料 X(t)減去 C1(t)所得的殘差項 r1(t)會是週期較. er. io. 長的序列資料,因此,從第一條 IMF(C1)到最後一條 IMF(Cn)的頻率是從高. n. a 頻(平均週期短)到低頻(平均週期長),但其振幅不一定會是由小到大,要看 iv l C n 其資料特性而定,若是像 WTIh 輕原油價格或黃金價格走勢等標的,隨著事 engchi U 件發生的平均週期越來越長,對市場的正面或負面影響也就越來越大,而 在 Huang and Wu(2009)文中所分析的自然現象數據,就不是平均週期越 長、振幅越大的結果。 若是像輕原油價格走勢或金融市場指數等資料,經由 EMD 拆解完的 IMFs 及殘差項,可分為三個部分,也都具有其經濟意涵,第一部分為高頻, 因市場上供需不均衡或者一些市場行為所發生的短期變動過程,第二部分 為低頻,市場上一些重大事件的影響,所以低頻的振幅會比高頻大出許 多,最後就是殘差項,為一個長期趨勢(Trend)。 序列資料是由許多不同頻率的擺動波形所組成的,如【圖 3-4】所示, 13.

(17) 利用 EMD 數值分析方法將隱含在序列資料內不同頻率的擺動模式拆解出 來,但 EMD 方法存在了一個 mode mixing 的問題,mode mixing 是指在一 條 IMF 中同時存在低頻振動模式與高頻週期性波形(如【圖 3-4】中的 C1), 使高頻與低頻的 IMFs 間存在了相關性,亦即不具有獨立性。. 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. i. e. i Un. v. h 的結果4 n g cInput 【圖 3-4】EMD 拆解 在數值拆解方法中,獨立性是基本條件,因 EMD 拆解存在這個令人 困擾的問題,所以 Huang and Wu(2009)提出了一個新的數值分析方法 Ensemble-EMD(EEMD),改善了 EMD 的 mode mixing 問題。. 3.2 Ensemble Empirical Mode Decomposition (EEMD) Huang and Wu(2009)提到序列資料本身就同時存在真實訊號 (true signal)與 white noise 兩個部分,其公式表示如下: 4. 圖 3-4 的參考資料來源:Ensemble Empirical Mode Decomposition :A Noise-Assisted Data Analysis Method, Huang and Wu, 2009 14.

(18) X (t )  s(t )   (t ). (2). X(t)為原始序列資料 s(t)為真實訊號.  (t ) 為 white noise 許多的數值分析方法都希望能夠有效地排除 white noise 的部分,並掘 取出真實訊號,提高數值分析方法的精確度,而 Huang and Wu(2009)這篇 文章所提出的 EEMD 方法有效地將真實訊號拆解出來,且排除了 EMD 方 法所造成的 mode mixing 問題,EEMD 與 EMD 方法上的差異在於前者將 white noise 加入原始序列資料後,才做 EMD 的拆解,在拆解的過程中,. 政 治 大 Y (t )  X (t )  z. 還增加了一個參數 ensemble number,其公式表示如下:. 立. s. (3). s. ‧ 國. z s 為第 s 次 white noise 值. 學. X(t)為原始序列資料. ‧. Ys(t)為加入第 s 次 white noise 值的新序列資料. sit. y. Nat. 從公式(3)中可看出,ensemble number 即為 s 的值,定義為運行 EEMD 時,添加 white noise 的次數,並且會計算出 j 組的 IMF 結果再進行平均,. er. io. 其目的是為了將 white noise a 排除掉,因加入 white noise 的本意是要排除. n. iv l C n mode mixing 問題,但其本身對原始資料來說是雜訊,需要被排除;添加 hengchi U. 的 white noise 為 Signal-Noise Ratio 乘標準常態分配的隨機亂數值,以下為 EEMD 方法的步驟: (a) 將 white noise 值(zs)加至原始序列資料 X(t)。 (b) 把加入 white noise 的新序列資料 Ys(t)放入 EMD 拆解成 IMFs。 (c) 加入不同的 white noise 值(zs),並重覆(a)~(b)步驟。 (d) 不同 white noise 的新序列資料 Ys(t)會拆解出不同的 IMFs,將其平均即 為最後的 IMFs 結果,而所加入不同 white noise 序列的次數為 ensemble number。. 15.

(19) 政 治 大. 立. sit. y. ‧. ‧ 國. 學. Nat. 【圖 3-5】EEMD 拆解 Input 的結果5. er. io. 【圖 3-5】為同樣的 Input 經由 EEMD 拆解後的 IMFs 結果,可看出. n. al EEMD 比 EMD 更有效地拆解出隱含在 Input Data 內的高頻振動模式,解 iv n. C. h e Lai, 決了 mode mixing 問題,而 Zhang, EEMD 方 n gWang(2008)這篇文章利用 chi U 法分析輕原油價格走勢,有提到在實證中,ensemble number 的值都設為 100,signal-noise ratio 的值都設為 0.1 或 0.2,本文就引用此篇論文的參數 設定值來拆解台股加權指數的走勢。. 3.3 Artificial Neural Network (ANN) 類神經網路是一種計算系統,由許許多多的人工神經元聯結所組成 的,而人工神經元則是最基本的類神經網路單元,又可稱它為處理單元 5. 圖 3-5 的參考資料來源:Ensemble Empirical Mode Decomposition :A Noise-Assisted Data Analysis Method, Huang and Wu, 2009 16.

(20) (processing element)或節點 (node),用來處理資訊並對外部的輸入以網路 動態來回應。 類神經網路具有三層:輸入層、隱藏層、輸出層,如下圖所示,每一 個節點都是獨立地進行運作,可視為一個單獨的處理器,而且這些處理器 都是以並行方式運作的。 處理單元或節點. 輸入. 輸出. 立. 政 治 大. ‧. ‧ 國. 學 隱藏層. 輸出層. er. io. 權重連結 iv. n. al. sit. y. Nat. 輸入層. n. Ch. engchi U 6 【圖 3-6】類神經網路架構圖. 類神經網路可視為一個黑盒子,經由輸入層的所有節點來輸入訊號, 透過層與層之間各節點的相互聯接關係(權重連結)來作訊號的處理,而且 整個處理過程對我們而言是隱藏的,且將最終處理結果由輸出層傳出, 【表 3-2】列出各層的功能:. 6. 圖 3-6 的參考資料來源:類神經網路 – MATLAB 的應用,羅華強編著(2005) 17.

(21) 層 輸入層 隱藏層 輸出層. 功. 能. 從外面接受訊號並將此訊號輸入類神經網路中,以方便進行訊 號處理 接受輸入層的訊號,對訊號進行處理,然而整個訊號處理過程 對網路使用者來說是隱藏的,猶如一個黑盒子 接受網路處理後的訊號,並將結果輸出 【表 3-2】各神經層的功能. 在類神經網路中,訊號處理過程是以數值方式來進行的,網路可以儲 存訊號,而且所儲存的資訊是數值型態的,因此,類神經網路可以用來做 為多變數經驗建模的工具。. 政 治 大. 神經元為一個類神經網路最基本的元素,所以我們必需了解到神經元. 立. 輸入端. 神經層. ‧. n. P3. b1. A1. y. F. sit. io. al. N1. Σ. er. Nat. W1,1. P1 P2. 學. ‧ 國. 的運作流程,下圖為單一神經層有多個神經元的運作流程圖:. iv Fn Ch Σ engchi U N2. A2. b2. NS. Σ. PR. AS. F. WS,R bS. A=F(W·P+b) 【圖 3-7】單一神經層多個神經元的運作流程圖7. 7. 圖 3-7 的參考資料來源:類神經網路 – MATLAB 的應用,羅華強編著(2005) 18.

(22) P為輸入向量,P  P1. P2  PR  ,Px為第x個輸入參數,x  1,2, R T. W1,1 W1, 2  W1, R  W    W 2 , 1 2 , R  W為權重向量,W           WS ,1 WS , 2  WS , R  W y , x為第x個輸入參數連結第y個神經元的權重值,y  1,2, S,x  1,2, R b為偏壓值向量,b  [b1. b2  bS ]T,. b y為第y個神經元的偏壓值,y  1,2, S N為  值的向量,N  N1. N2.  NS . T. N y為第y個 值或F的輸入值,y  1,2, S A為輸出向量,A  [ A1. A2.  AS ]T,. 政 治 大. Ay為第y個神經元或F的輸出值,y  1,2, S. 立. ‧ 國. 學.  為輸入參數  權重值的線性組合 F為轉換函數. 【圖 3-7】有 S 個神經元與 R 個輸入參數,其運作流程說明如下:. ‧. (1) 輸入端與神經層的連結:神經層內的每一個神經元都會接收所有輸入. sit. y. Nat. 參數(P1,P2,…PR)的資訊,並給予每一個輸入參數權重(Wy,x )。. er. io. (2) 彙整輸入資訊:每一個輸入參數乘上個別權重後,利用線性組合的方. a 式加總,如下所示。 n. iv l C n h e n g R i U h c W1,x  Px  W  P  . W1,1 W1, 2 W  2,1      WS ,1 WS , 2.  1, R 1  xR1      W P   W2,R  P2      2, x x         x1       WS ,R   PR   R WS , x  Px   x1 . 第 1 個Σ 第 2 個Σ. 第 S 個Σ. (3) 轉換函數(活化函數):此函數是將類神經元中 Σ 的值轉換到一個被允 許範圍的輸出值,最常用的轉換範圍是界於[0,1]或[-1,1]之間。. 19.

(23) 圖中的 by 是偏壓值,主要功能是可以增減轉換函數的輸入值。以數學 公式來表示神經元的方程式如下: R. N y   W y , x  Px  b y. (4). x 1. R. Ay  F ( N y )  F ( W y , x  Px  b y ). (5). x 1. 其中,y=1,2,…,S,by 可視為神經元的外部參數,若假設 by 為 Wy,0,且 P0 為 1,則 Ny 的方程式可以改寫如下: R. N y  W y , x  Px. (6). 治 政 A  F ( N )  F (W 大 P) 立 x 0. R. y. y. y,x. x 0. (7). x. ‧ 國. 學. 以上所述為單一神經層的運作流程,而本文所使用的類神經網路模型的神 經層層數為三層(Shaikh A.Hamid, Zahid Iqbal,2004),其運作流程圖如下: 第1層. b11 P2. Σ. N. 1 2. F1. F2. Ch. A21. b12. e n g cNh i Σ. 1 S1 , R. W. Σ. 2 2. 3 A12 W1,1. i Un F2. F1. v. Σ. Σ 2 S 2 , S1. F2 2 S2. b. A2=F2(W2·A1+b2). 2 S2. A W. 3 S3 , S 2. N S33. Σ. F3. AS33. A3=F3(W3·A2+b3)=O. 圖 3-8 的參考資料來源:類神經網路 – MATLAB 的應用,羅華強編著(2005) 20. A23. bS33. 【圖 3-8】三層神經層多個神經元的運作流程圖8. 8. N 23. F3. N S22. AS11. b. A1=F1(W1·P+b1). F3 b13. A22. A13. O1. O2. b23. W 1 S1. N13. Σ. b22 N S11. PR. Σ. b21. P3. 第3層. y. al. N12. sit. F1. A11 W1,21. er. Σ. 第2層. n. P1. N11. io. W. Nat. 1 1,1. ‧. 輸入端. O3.

(24) 由【圖 3-8】可看出三層神經層與單層神經層的變數差別在多個上標, 將其視為 L,所以神經元的表示式改寫成如下公式: R. N   W yL, x  PxL L y. (8). x 0. R. AyL  FL ( N yL )  FL ( W yL, x  PxL ). (9). x 0. L 為神經層層數,L=1,2,3,每一層神經層有 SL 個神經元,第一層神經層的 輸入為 P,輸出為 A1,第二層的輸入為 A1,輸出為 A2,第三層的輸入為 A2,輸出為 O,每一層神經層的輸入都為前一層的輸出,如【圖 3-8】中 下方所列公式。. 政 治 大 數,本文所使用的轉換函數如下: 立. 每一層神經層都有各自的轉換函數,而轉換函數通常都使用雙彎曲函. ‧ 國. 學. 第 1 層:Logsig(對數雙彎曲轉換函數) a. ‧. 1. io. n. al. Ch. engchi. 第 2 層:Tansig(正切雙彎曲轉換函數) a 1. n 0. y er. n. 1 1  e n. sit. Nat. 0. a. e n  e n a n e  e n. -1. 21. i Un. v.

(25) 第 3 層:Purelin(線性轉換函數) a 1. n. an. 0. -1. 第 1 層與第 2 層的轉換函數是被廣泛運用的雙彎曲函數,而第 3 層的 轉換函數使用線性函數,是要利用線性組合的方式將所有輸入至類神經網 路模型模擬預測的結果加總。. 政 治 大 本文所使用的類神經網路模型為前饋式倒傳遞類神經網路,屬於監督 立. ‧ 國. 學. 式學習網路,給予的模擬訓練資料中包含輸入資料和目標資料,藉此訓練 網路,學習出規則,並進一步預測新的輸入資料的輸出結果,下圖為前饋. ‧. 式倒傳遞類神經網路運作流程圖:. Nat. n. sit er. io. al. y. 輸入向量. Ch. 類神經網路. engchi. i Un. v. 輸出向量. 目標向量. 計算誤差. 輸出結果. 【圖 3-9】倒傳遞類神經網路流程圖. 22. 調 整 權 重.

(26) 倒傳遞類神經網路可分成向前傳遞及向後傳遞兩部分,向前傳遞是由 輸入向量至輸出向量的過程,向後傳遞是當輸出向量與目標向量間產生的 誤差高於某一基準值時,會回到類神經網路再重新調整權重,直到誤差低 於某一基準值的過程,假設目標向量為 G,輸出向量為 O,e 為 G 與 O 之 間的誤差向量,其向量分別表示如下: G  G1. G2  G M . T. O  O1. O2  OM . T.  G1  O1   e1   G O  e  2  e  G O   2  2           GM  OM  eM . MSE . 學. ‧ 國. 治 政 大 M 為輸出參數個數,目標值與輸出值之間的誤差是利用 MSE 衡量,MSE 立 是輸出值與目標值兩者之間的差異平方和,其公式如下: 1 1 M 2 G  O   eu2 M M u 1. (9). ‧. Nat. n. al. er. io. 3.4 FK Indicator. sit. 產生一個類神經網路預測模型,來預測新的輸出值。. y. 倒傳遞類神經網路就是重覆調整權重,計算 MSE 直到低於某一基準值後,. i Un. Ch. v. e n g c h i George Lane(1984)所發明 Forward-calculated %K(FK)是由技術分析師 的 KD 隨機指標中的%K 值衍生而來,%K 值公式如下: Cn  MINinnk ( Li ) %K  MAX innk ( H i )  MINinnk ( Li ) k n. (10). MAX innk ( H i )為第n  k天至第n天的最高價中的最大值 MINinnk ( Li )為第n  k天至第n天的最低價中的最小值 Cn為第n天的收盤價. George Lane 認為第 n 天交易日的收盤價會與過去 k 天的價格變動範圍 有關,Zhang(1993) 將%K 值的概念往後衍生 k 天,認為若預測出未來 k 天的收盤價格,因為預測是利用歷史資料去推測出來的,所以未來 k 天的. 23.

(27) 價格變動應當與第 n 的收盤價有關,因此將%K 值公式改寫成公式(11),並 將其命名為 Forward-calculated %K(FK): Cn  MINinnk ( Li ) FK  MAX innk ( H i )  MINinnk ( Li ) k n. (11). MAX innk ( H i )為第n天至第n  k天的最高價中的最大值 MINinnk ( Li )為第n天至第n  k天的最低價中的最小值. Lin and Yu(2009)則結合了上述兩者的想法,認為當天的收盤價會與過 去 j 天及未來 k 天的價格變動有關,將公式(11)再改寫成公式(12): FK. j,k n. . Cn  MINinnk j ( Li ). (12). MAX innk j ( H i )  MINinnk j ( Li ). 政 治 大 ( L )為第 n  j天至第n  k天的最低價中的最小值 立. MAX innk j ( H i )為第n  j天至第n  k天的最高價中的最大值 MINinnk j. i. ‧ 國. 學. 本文的預測模型為過去不同週期事件對市場未來一天的影響集合,並 將此集合的值轉換成 FK 指標值,故將公式(12)改寫成公式(13): Sn  MINiclose  open ( Si ). (13). sit. y. Nat. close MAX iclose  open ( Si )  MINi  open ( Si ). ‧. , close FKopen  n. MAX iclose open ( S i )為開盤至收盤每分鐘週期事件集合值的最大值. io. n. al. er. MINiclose open ( S i )為開盤至收盤每分鐘週期事件集合值的最小值 S n為第n分鐘的週期事件集合值. Ch. engchi m. i Un. v. 週期事件集合值為 Si,Si   IMFi , j ,i=1,2,…,270,m 為 IMF 的條數, j 1. 因 EEMD-ANN 的預測模型是預測出未來一天從開盤至收盤這段時間區 間,每一分鐘的週期事件集合值,所以利用公式(13)將週期事件集合值轉 換成 FK 指標值,其值為[0,1],並給定買進與賣出的 FK 門檻值做為交易 訊號,所以若出現 FK 指標值低於買進門檻值時,則週期事件集合值必為 當日開盤至收盤期間的相對偏低值;若高於賣出門檻值,則為相對偏高值。. 24.

(28) 4.. 實證研究. 4.1 資料選取 本文資料為台股加權指數日內每分鐘收盤價資料(資料來源:台灣證券 交易所),資料期間為 2006/01/02 至 2010/9/30,共有 1180 個交易日,台股 加權指數開盤時間為 9:00,收盤時間為下午 13:30,共 270 分鐘,但證 交所的資料一天會有 271 筆,是因為包含 9:00 這筆資料,且當天 9:00 的收盤價資料和前一天 13:30 的收盤價資料是一樣的,所以當天 9:00 的資料會刪除,故每分鐘收盤價資料共有 318,600(1180*270)筆。. 4.2 實證過程. 立. 政 治 大. ‧ 國. 學. 本文的實證流程如【圖 4-1】所示:. ‧. 台股加權指數日內每分鐘資料分類. sit. y. Nat. n. al. er. io. 利用 EEMD 將指數資料拆解成 數條 IMF(包含 Trend). Ch. engchi. i Un. v. 將數條 IMF 視為 ANN 的輸入參 數,放入 ANN 作模擬預測,並 轉換成 FK 指標值. 給定買進與賣出的 FK 門檻值作 為買賣交易訊號,並計算其交易 績效 【圖 4-1】實證流程圖. 25.

(29) 4.2.1. 資料分類. 2006/01/02 至 2010/09/30 的台股加權指數日內每分鐘收盤價資料,如 【圖 4-2】所示:. 立. 政 治 大. ‧. ‧ 國. 學 y. Nat. 此序列資料依每分鐘分類成下方的矩陣形式:. n. al. 270 分鐘. er. io. sit. 【圖 4-2】台股加權指數日內每分鐘資料. i n C U T 天交易日 hengchi.  9 : 01 9 : 01  9 : 02 9 : 02   9 : 03 9 : 03     13 : 30 13 : 30.          . v. 第 T+1 天交易日. 9 : 01  9 : 02  預測 9 : 03     13 : 30.  9 : 01   9 : 02     9 : 03       13 : 30. 類神經網路預測期間較長時,預測出來的資料走勢除了前幾筆較精確 外,往後的資料會呈現下滑的現象,故類神經網路模型預測出來的值,最 具有參考價值的是第一筆資料,因此將序列資料分類成上述矩陣形式是為 了達到最佳的預測效果。 26.

(30) 4.2.2. EEMD 拆解. 上述矩陣中的每一列為固定一個時點,但不同交易日的序列資料,每 一列向量做為 EEMD 拆解的輸入資料,因資料長度為 1180 筆,經由 Log21180=10.2 的計算並取整數部分,會拆成 10 條 IMF(包含 Trend),有關 EEMD 拆解的參數設定如下: (1) Ensemble Number 的值設為 100(Zhang ,Lai ,Wang,2008) (2) Signal-Noise Ratio 的值設為 0.1 與 0.2(Zhang ,Lai ,Wang,2008) (3) k 值為 10(stopping criterion) 以 9:01(第一列)的列向量作為輸入資料,進行 EEMD 拆解(不同. 政 治 大. Signal-Noise Ratio)成 10 條 IMF,如【圖 4-3】與【圖 4-4】所示:. 立. (A) Signal-Noise Ratio 為 0.1. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 27. i Un. v.

(31) 政 治 大. 立. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 【圖 4-3】EEMD 拆解的各 IMF 與 R(Signal-Noise Ratio 為 0.1) (B) Signal-Noise Ratio 為 0.2. 28.

(32) 立. 政 治 大. ‧. ‧ 國. 學. n. er. io. sit. y. Nat. al. Ch. engchi. 29. i Un. v.

(33) 【4-4】EEMD 拆解的各 IMF 與 R(Signal-Noise Ratio 為 0.2) 依【圖 4-3】與【圖 4-4】的 EEMD 拆解結果發現,加入不同程度的 white noise 拆解出來的各條 IMF,其振幅與波形有些許不同,因台股加權 指數本身是一個鋸齒狀的波形,存在許許多多的尖點(極值),而加入不同 程度的 white noise 對尖點會有影響,導致最後拆解出來的振幅與波形會有 點不同。台股加權指數拆解出來的 IMF1 至 IMF9 是多個從高頻到低頻的. 政 治 大. 振動模式,最後的 R 則是長期趨勢線,高頻振動模式是指平均週期較短,. 立. 學. ‧ 國. 低頻振動模式是平均週期較長, 【表 4-1】與【表 4-2】為【圖 4-3】與【圖 4-4】各 IMF 的平均週期(天):. IMF1. 2.92. IMF2. 6.35. IMF3. …. …. 13:28. 13:29. 13:30. 2.87. 2.92. …. …. 2.95. 2.89. 2.90. 6.64. 6.53. …. …. 6.35. 6.64. 13.49. l C 13.49 13.97. …. …n. i v 13.65. 6.42 13.49. 13.97. IMF4. 35.32. 35.32. 35.32. …. …. 33.36. 35.32. 35.32. IMF5. 75.06. 70.65. 75.06. …. …. 75.06. 75.06. 75.06. IMF6. 150.13. 150.13. 171.57. …. …. 150.13. 171.57. 150.13. IMF7. 400.33. 400.33. 400.33. …. …. 400.33. 400.33. 400.33. IMF8. 1020. 1040. 1052. …. …. 1052. 1068. 1040. IMF9. 1392. 1408. 1400. …. …. 1418. 1588. 1410. n. hengchi U. er. io. a. sit. 09:03. Nat. 09:02. y. 09:01. ‧. 平均週期 (天). 【表 4-1】各 IMF 的平均週期(Signal-Noise Ratio 為 0.1). 30.

(34) 平均週期 (天). 09:01. 09:02. 09:03. …. …. 13:28. 13:29. 13:30. IMF1. 2.83. 2.83. 2.85. …. …. 2.86. 2.85. 2.84. IMF2. 6.53. 6.22. 6.42. …. …. 6.32. 6.42. 6.39. IMF3. 13.34. 13.49. 13.20. …. …. 13.20. 13.20. 13.05. IMF4. 28.60. 30.03. 31.61. …. …. 29.29. 29.29. 30.03. IMF5. 60.05. 66.72. 70.65. …. …. 70.65. 63.21. 70.65. IMF6. 150.13 150.13 150.13. …. …. 150.13 150.13 150.13. IMF7. 300.25 300.25 300.25. …. …. 300.25 300.25 300.25. 政 …治 …大. IMF8. 988. 958. 894. IMF9. 1392. 1394. 1386. 立. …. …. 968. 970. 926. 1388. 1388. 1396. ‧ 國. 學. 【表 4-2】各 IMF 的平均週期(Signal-Noise Ratio 為 0.2). ‧. 由【表 4-1】與【表 4-2】可看出 IMF1 至 IMF9 的平均週期越來越長,. sit. y. Nat. 表示兩次事件發生的期間越來越長,也隱含當事件發生時,對市場所造成. er. io. 的衝擊會越大,但不一定是負面衝擊,也有可能是正面的,因兩事件期間. n. 越長,代表事件對市場的衝擊力道,醞釀的時間越久,對市場的影響就越 a v. i l C n U hengchi 大,但 IMF8 與 IMF9 的振幅卻不符合這個現象,因此認為 IMF8 與 IMF9 不具參考價值,以 IMF1 至 IMF7 及 R(Trend)作為 ANN 的輸入變數。. 4.2.3. ANN 預測與 FK 指標. 本文所使用的是前饋式倒傳遞類神經網路模型,需要輸入資料與目標 資料兩個部分,輸入資料為 IMF1 至 IMF7 與 R(Trend)的序列資料,目標 資料為所有週期事件(IMF1~IMF7 及 R)的集合值序列資料且為落後一期, 若輸入資料的時間為 1~T-1 日,目標資料的時間為 2~T 日,經由倒傳遞類 神經網路訓練出預測模型後,將輸入改成 T 日的 IMF1~IMF7 及 R 的資料,. 31.

(35) 輸出為預測 T+1 日所有週期事件(IMF1~IMF7 及 R)的集合值;若輸入資料 的時間改為 1~T 日,目標資料的時間改為 2~T+1 日,訓練出預測模型後, 輸入改成 T+1 日各週期事件的實際資料,預測 T+2 日所有週期事件的集合 值,如【圖 4-5】與【圖 4-6】所示。以此類推,直到 T+n 日,T+1 日為 2010/09/01(第 1160 天交易日),T+n 日為 2010/09/30(第 1180 天交易日), 2010/09/01~2010/09/30 共有 21 天交易日,為本文的預測與交易期間。 1. 2. 3. T-2. T-1 T. 輸入 2. 3. 4. T-1. 預測. T+1. T. 政 治 大. 目標. 立 ANN Training. Predict Model. ‧ 國. 學. 【圖 4-5】1~T 日的歷史資料預測 T+1 日. 3. T-1. T. Nat 3. 4. io. 2. y. T+1 T. n. al. T-1. Ch. engchi. ANN Training. T+1. sit. 輸入. 目標. T-2. 預測. T+2. er. 2. ‧. 1. i Un. v. Predict Model. 【圖 4-6】1~T+1 日的歷史資料預測 T+2 日 確定目標資料與輸入資料的設定後,接下來就是倒傳遞類神經網路模 型的參數設定,重要參數有神經層層數、各神經層的轉換函數及神經元個 數、MSE 的門檻值,而 MSE 門檻值設定為 0.001(預設值皆為 0.01),至於 層數、轉換函數、神經元個數就利用【圖 4-7】來說明:. 32.

(36) 隱. 輸入端. IMF1 IMF2 IMF3 IMF4 IMF5 IMF6 IMF7 R. 藏. 層. 第1層. 第2層. 第3層. (Logsig). (Tansig). (Purelin). 8. 8. 1. 8. 12. 1. 16 政 治 大. 8. 立. 輸出端. IMF1 至 IMF7 與 R 的 集 合. 1. 【圖 4-7】本文的類神經網路模型架構. ‧ 國. 學. 倒傳遞類神經網路的輸入變數有 8 個,第 1 層的神經元個數需與輸入. ‧. 變數個數一致;第 2 層的神經元個數則為輸入變數個數的 1 倍、1.5 倍與 2. sit. y. Nat. 倍;第 3 層的神經元個數與輸出變數個數一致(Shaikh, Zahid ,2004),第 2. io. er. 層神經元個數過多,會造成類神經網路的執行效率較差,預測出來的效果 不一定較好,但神經元個數太少的話,會發生預測效果不佳的問題,因此. n. al. iv. C 認為第 2 層的神經個數至少要大於或等於輸入變數個數。 Un hengchi. 本文利用倒傳遞類神經網路預測出未來一天日內台股加權指數開盤 (9:00)至收盤(13:30)每一分鐘的週期事件集合值,並利用公式(13),將 週期事件集合值轉換成 FK 指標值,且 FK 指標值是界於[0,1]之間。 , close FKopen  n. Sn  MINiclose  open ( Si ) close MAX iclose  open ( Si )  MINi  open ( Si ). 33. (13).

(37) 本文經由不同 Signal-Noise Ratio 的 EEMD 拆解到 ANN 模擬預測出週 期事件集合值,再轉換成 FK 值,共有 6 個 model,如【圖 4-8】所示:. 台 股 加 權 指 數 日 內 資 料. Ratio=0.1. Ratio=0.2. 立. 8–8–1. FK01-8. 8 – 12 – 1. FK01-12. 8 – 16 – 1. FK01-16. 8–8–1. FK02-8. 8 – 12 – 1. FK02-12. – 16 – 1 政 8治 大. FK02-16. 【圖 4-8】EEMD-ANN-FK 的架構圖. ‧ 國. 學. 以下【圖 4-9】至【圖 4-15】分別為 6 個 model 在 2010/09/01 至 2010/09/30 的日內每分鐘 FK 值與台股加權指數走勢圖, 【圖 4-9】可看出台股加權指. ‧. 數在 9 月份期間呈現一個牛市行情走勢。. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 【圖 4-9】2010/09/01 至 2010/09/30 的每分鐘台股加權指數走勢圖 34.

(38) 立. 政 治 大. ‧ 國. 學. 【圖 4-10】2010/09/01 至 2010/09/30 的每分鐘 FK01-8 值. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 【圖 4-11】2010/09/01 至 2010/09/30 的每分鐘 FK01-12 值. 35.

(39) 立. 政 治 大. ‧ 國. 學. 【圖 4-12】2010/09/01 至 2010/09/30 的每分鐘 FK01-16 值. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 【圖 4-13】2010/09/01 至 2010/09/30 的每分鐘 FK02-8 值. 36.

(40) 立. 政 治 大. ‧ 國. 學. 【圖 4-14】2010/09/01 至 2010/09/30 的每分鐘 FK02-12 值. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 【圖 4-15】2010/09/01 至 2010/09/30 的每分鐘 FK02-16 值. 37.

(41) 這 6 個模型所產生的日內每分鐘 FK 值是一個高頻振動波形,因為本 文跑模型的方式是每一個時點跑出一個預測值(4.2.1 的矩陣形式),也就是 每一個時點有它自己的預測模型,所以才會產生【圖 4-10】至【圖 4-15】 的高頻震盪圖,這樣做的目的是為了預測隔天開盤至收盤的每 1 分鐘 FK 值作為買賣交易的訊號,當我接收到 1~T 日的日內每分鐘收盤價資料,經 由 EEMD-ANN-FK 模型產生 T+1 天的每分鐘 FK 值,藉由買進與賣出 FK 門檻值的判斷,可以讓我知道未來一天那個時點該買進或賣出(放空),當 然這 6 個模型並不是每一個的 FK 值都具有參考價值,從【圖 4-10】至【圖 4-15】中可發現,除了 FK02-16 之外,其它 5 個模型都有異常低或高的週. 政 治 大 訊號都呈現單一方向,也就是一直放空或一直買進,會使交易績效有較大 立 期事件集合值出現,導致 FK 值都偏高或偏低的情況,此種情況會讓交易. ‧ 國. 學. 幅度的變動。. Signal-Noise Ratio 為 0.1 的 FK01-8、FK01-12、FK01-16,相較於. ‧. Signal-Noise Ratio 為 0.2 的 FK02-8、FK02-12、FK02-16,出現異常週期事. sit. y. Nat. 件集合值的情形略微明顯,且第 2 層神經層的神經元個數為輸入變數 2 倍. er. io. 的 FK02-16 與 FK01-16,相較於同一 Signal-Noise Ratio 下第 2 層神經元個. n. 數為 12 與 8 的模型,較不會出現異常集合值,表示第 a v 2 層神經元個數為. i l C n U 16 的模型,其 FK 值較不會讓交易訊號都呈現單一方向,也就是其交易績 hengchi 效相較於其它兩者不會出現大幅變動的情形,接下來以台股加權指數作為 交易標的,計算這 6 個模型的交易績效與交易次數,找出一個較能準確地 捕捉到市場行情走勢的交易模型。. 4.2.4. 交易邏輯與績效. 本文的交易邏輯如下所述: (1) 依 FK 買賣門檻值作為交易訊號,單筆交易數量為 1 個單位(口數),其 買賣門檻值與交易訊號如【表 4-3】與【表 4-4】:. 38.

(42) 買進(Buy)門檻值. 賣出(Sell)門檻值. 1. 0.15. 0.85. 2. 0.16. 0.84. 3. 0.17. 0.83. 4. 0.18. 0.82. 5. 0.19. 0.81. 6. 0.20. 0.80. 7. 0.21. 0.79. 8. 0.22. 0.78. 9. 0.23. 0.77. 10. 0.24. 立. 學. ‧ 國. 11. 政 治 大0.76 0.25 0.75. 【表 4-3】買進與賣出 FK 門檻值. Sell. FK≥賣出門檻值. Hold. 買進門檻值<FK<賣出門檻值. y. sit. n. al. er. io Buy. ‧. FK 指標值. Nat. 交易訊號. FK≤買進門檻值v. ni U engchi 【表 4-4】交易訊號判別式. Ch. (2) 限制買進或賣出連續交易次數不超過 10 次或 5 次(留倉單位限制) (3) 考慮交易成本為 3 點 (4) 當日沖銷交易,即當日收盤時會將所有未平倉部位全數平倉 此交易邏輯下,存在二個假設: (1) 不考慮流動性問題,即每筆交易的所有單位數必定全數成交 (2) 每筆交易的所有單位數必定成交在同一價位 本文經由 EEMD-ANN-FK 產生了未來一天開盤至收盤每一分鐘的 FK 值,並給定不同買進與賣出 FK 門檻值,探討各個模型在不同的 FK 門檻 39.

(43) 值範圍的交易績效,並與 Buy and Hold 策略作比較,及不同門檻值範圍的 交易績效與交易次數,交易期間為 2010/09/01 至 2010/09/30 共有 21 天交 易日,以下為 6 個模型在不同留倉單位限制下的交易績效與 Buy and Hold 策略交易績效比較圖表: 交易績效(%). FK01-8(5) FK01-12(5) FK01-16(5) FK02-8(5) FK02-12(5) FK02-16(5). 0.25-0.75. 2.14%. -7.97%. 3.65%. 4.39%. -0.03%. -11.43%. 0.24-0.76. 5.22%. -6.29%. 1.01%. 6.05%. 2.43%. -10.36%. 0.23-0.77. 5.89%. 0.20%. 2.04%. 6.95%. 2.52%. -8.63%. 0.22-0.78. 5.32%. 0.20%. 4.82%. 6.98%. 2.62%. -6.02%. 0.21-0.79. 4.66%. 1.18%. 6.46%. 8.30%. 2.69%. -0.23%. 0.20-0.80. 6.39%. 4.93%. 0.25%. 0.19-0.81. 6.47%. 2.67%. 3.03%. 0.18-0.82. 9.64%. 5.56%. 4.08%. 0.17-0.83. 9.87%. 1.04%. 5.32%. 7.07%. 5.53%. 5.10%. 0.16-0.84. 10.08%. 0.29%. 6.96%. 7.43%. 7.01%. 7.36%. 0.15-0.85. 7.82%. 0.54%. 7.81%. 7.72%. 9.46%. 7.64%. ‧. ‧ 國. 學. 7.73%. y. Nat. io. sit. 【表 4-5】各模型交易績效表(留倉單位限制為 5). n. al. er. buy & hold. 6.86% 治 7.25% 政 1.08% 4.31% 8.22% 大 立2.18% 3.43% 10.24% 2.08%. Ch. engchi. i Un. v. 【圖 4-16】各模型交易績效走勢圖(留倉單位限制為 5). 40.

(44) 交易績效(%) FK01-8(10) FK01-12(10) FK01-16(10) FK02-8(10) FK02-12(10) FK02-16(10) 0.25-0.75. 1.53%. -10.84%. 7.10%. 9.73%. 1.83%. -14.97%. 0.24-0.76. 3.15%. -9.16%. 6.54%. 12.08%. 2.77%. -12.88%. 0.23-0.77. 3.52%. -1.54%. 9.07%. 13.70%. 3.21%. -9.50%. 0.22-0.78. 2.22%. 0.70%. 9.70%. 14.43%. 1.96%. -5.55%. 0.21-0.79. 3.89%. 1.77%. 11.25%. 12.84%. 2.55%. 1.68%. 0.20-0.80. 6.82%. 2.20%. 10.14%. 12.68%. 6.60%. 2.41%. 0.19-0.81. 6.25%. -0.41%. 6.41%. 14.95%. 5.38%. 7.37%. 0.18-0.82. 8.90%. 0.15%. 4.62%. 16.75%. 6.49%. 9.00%. 0.17-0.83. 7.56%. -1.70%. 3.76%. 13.73%. 5.80%. 10.12%. 0.16-0.84. 9.57%. -2.35%. 6.03%. 12.60%. 7.43%. 14.72%. 0.15-0.85. 6.98%. -2.97%. 7.00%. 11.72%. 9.88%. 13.85%. 7.73% 治 政 大 【表 4-6】各模型交易績效表(留倉單位限制為 10) 立. 學 ‧. ‧ 國. buy & hold. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 【圖 4-17】各模型交易績效走勢圖(留倉單位限制為 10) Appendix 的【圖 A-1】至【圖 A-24】分別為各交易模型在不同的留倉 單位限制與不同的 FK 買賣門檻值範圍下,2010/09/01~2010/09/30 的累計 交易績效走勢圖,及不同買賣門檻值範圍的交易績效與次數圖, 【表 4-5】. 41.

(45) 與【表 4-6】是將各模型在不同買賣門檻值範圍與不同留倉單位限制的累 計交易績效結果整理出來, 【圖 4-16】與【圖 4-17】則是將【表 4-5】與【表 4-6】的數值畫成圖來表示。 在累計績效圖中,這 6 個模型的累計績效走勢,以 FK02-16 的振盪程 度為最小,這樣的結果從【圖 4-9】至【圖 4-15】的各模型 FK 值圖形可觀 察出來,若交易模型出現異常高或低的週期事件集合值,對於部位的績效 表現有很大的影響,如果模型的預測方向是正確的,會產生高額的獲利, 但若預測方向是錯誤的,會造成巨額的虧損,這樣的交易模型無法精確地 捕捉台股加權指數的走勢。. 政 治 大 圍,詴圖找出一個交易模型的累計交易績效走勢是穩穩地向上攀升,並且 立 本文將各交易模型搭配不同的留倉單位限制及不同的買賣門檻值範. ‧ 國. 學. 可以優於 Buy and Hold 策略績效,從【圖 4-16】與【圖 4-17】可看出,留 倉單位限制 10 的交易績效較佳,而【圖 4-17】中 FK02-8 在任一 FK 買賣. ‧. 門檻值範圍下,其交易績效表現都較 Buy and Hold 策略好,但若從 FK02-8. y. Nat. 的累計交易績效圖【圖 A-19】來看的話,累計交易績效走勢並非穩定向上. io. sit. 攀升,因為 FK02-8 的 FK 圖【圖 4-13】中可看出有異常高或低的週期事. er. 件集合值,而 FK02-16 在留倉單位限制為 10【圖 4-17】的情況下,有幾個. n. a. iv. l C 買賣門檻值範圍的累計交易績效優於 Buy and Hold n 策略,分別為. hengchi U. 0.15-0.85、0.16-0.84、0.17-0.83,其中以 0.16-0.84 的累計交易績效為最好, 而且在 FK02-16 的累計交易績效圖【圖 A-23】中可看出這幾個買賣門檻值 範圍的走勢幾乎都在 Buy and Hold 策略累計交易績效之上,是一個穩穩地 向上攀升的交易績效。 在平均交易次數方面,直覺上,買賣門檻值範圍越小,其平均交易次 數應越多,實證結果正是如此,而本文也發現在同一買賣門檻值範圍下, FK02-16 的平均交易次數較其它模型多,當然平均交易次數多不代表能夠 獲利,但 FK02-16 不僅平均交易次數多,也能夠有優於 Buy and Hold 策略 績效。. 42.

(46) 5.. 結論 為了找出一個能夠補捉台股加權指數走勢並且能夠穩定獲利的交易. 模型,本文利用 EEMD-ANN 預測出未來一天的日內每分鐘週期事件集合 值,並轉換成 FK 值,考慮不同的 ANN 內部各層神經元個數配置及 Signal-Noise ratio,產生 6 個模型,再利用不同的留倉單位限制與 FK 買賣 門檻值範圍,驗證這些模型是否能夠有穩定地交易績效表現,最後發現 FK02-16 這個模型在買賣門檻值設定為 0.16-0.84 的情況下,能夠精確地捕 捉到台股加權指數走勢的買賣點,這也告訴我們台股加權指數較適合用. 政 治 大 的神經元個數應為輸入變數 2 倍較佳,之後的研究可考慮在 ANN 內部結 立 Signal-Noise Ratio 為 0.2 的 EEMD 拆解,而 ANN 的 3 層神經層中第 2 層. ‧. ‧ 國. 學. io. sit. y. Nat. n. al. er. 構作改變。. Ch. engchi. 43. i Un. v.

(47) 參考文獻 Chena A.S., M.T. Leungb, H. Daouk(2003), “Application of neural networks to an emerging financial market: forecasting and trading the Taiwan Stock Index”, Computers & Operations Research 30 (2003) 901–923 Chan M.C., C.C. Wong, C.C. Lan(2000), “Financial Time Series Forecasting by Neural Network Using Conjugate Gradient Learning Algorithm and Multiple Linear Regression Weight Initialization”, Citeseer (2000). 政 治 大 of S&P 500 Index futures立 prices”, Journal of Business Research 57(2004). Hamid S.A., Z. Iqbal(2004), “Using neural networks for forecasting volatility. ‧ 國. 學. 1116-1125. Irina K., J. Lelis(2008), “Pre-Processing of Input Data of Neural Networks:The. ‧. Case of Forecasting Telecommunication Network Traffic”, Telenor ASA(2008). y. Nat. er. io. sit. Lane G.C.(1984), “Trading Strategies”, Future Symposium International(1984). n. Lin T.W., C.C. Yu(2009), a“Forecasting stock market with i v neural networks”, l SSRN Working Paper (2009). Ch. n engchi U. Quaha T.S., B. Srinivasan(1999), “Improving returns on stock investment through neural network selection”, Expert Systems with Applications 17 (1999) 295–301 Wu Z.H., N.E. Huang(2009), “Ensemble Empirical Mode Decomposition:A Noise-Assisted Date Analysis Method”, Advances in Adaptive Data Analysis Vol. 1, No.1 (2009) 1-41.. 44.

(48) Yu L., S.Y. Wang , K.K. Lai(2008), “Forecasting crude oil price with an EMD-based neural network ensemble learning paradigm”, Energy Economics 30(2008) 2623-2635 Zhang, J.Z., “Design and implementation of intelligent stock trading decision support systems using adaptive-structure neural networks”, PhD thesis, Department Of Electrical Engineering, National Taiwan University, 1993 Zhang X., K.K. Lai, S.Y. Wang (2008), “A new approach for crude oil price analysis based on Empirical Mode Decomposition”, Energy Economics 30(2008) 905-918. 立. 政 治 大. 林萍珍(2008), 投資分析:含 Matlab 應用、類神經網路與遺傳演算法模型. ‧ 國. 學. 謝志敏(2007), 希爾伯特黃轉換簡介(Hilbert Huang Transform). ‧. 羅華強編著(2005), 類神經網路 – MATLAB 的應用. n. er. io. sit. y. Nat. al. Ch. engchi. 45. i Un. v.

(49) Appendix. 立. 政 治 大. ‧ 國. 學 ‧. 【圖 A-1】FK01-8(留倉單位限制為 5)的各門檻值累計績效. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 【圖 A-2】FK01-8(留倉單位限制為 5)的績效與次數. 46.

(50) 立. 政 治 大. ‧ 國. 學. 【圖 A-3】FK01-12(留倉單位限制為 5)的各門檻值累計績效. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 【圖 A-4】FK01-12(留倉單位限制為 5)的績效與次數. 47.

(51) 立. 政 治 大. ‧ 國. 學. 【圖 A-5】FK01-16(留倉單位限制為 5)的各門檻值累計績效. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 【圖 A-6】FK01-16(留倉單位限制為 5)的績效與次數. 48.

(52) 立. 政 治 大. ‧ 國. 學. 【圖 A-7】FK02-8(留倉單位限制為 5)的各門檻值累計績效. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 【圖 A-8】FK02-8(留倉單位限制為 5)的績效與次數. 49.

(53) 立. 政 治 大. ‧ 國. 學. 【圖 A-9】FK02-12(留倉單位限制為 5)的各門檻值累計績效. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 【圖 A-10】FK02-12(留倉單位限制為 5)的績效與次數. 50.

(54) 立. 政 治 大. ‧ 國. 學. 【圖 A-11】FK02-16(留倉單位限制為 5)的各門檻值累計績效. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 【圖 A-12】FK02-16(留倉單位限制為 5)的績效與次數. 51.

(55) 立. 政 治 大. ‧ 國. 學. 【圖 A-13】FK01-8(留倉單位限制為 10)的各門檻值累計績效. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 【圖 A-14】FK01-8(留倉單位限制為 10)的績效與次數. 52.

(56) 立. 政 治 大. ‧ 國. 學. 【圖 A-15】FK01-12(留倉單位限制為 10)的各門檻值累計績效. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 【圖 A-16】FK01-12(留倉單位限制為 10)的績效與次數. 53.

(57) 立. 政 治 大. ‧ 國. 學. 【圖 A-17】FK01-16(留倉單位限制為 10)的各門檻值累計績效. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 【圖 A-18】FK01-16(留倉單位限制為 10)的績效與次數. 54.

(58) 立. 政 治 大. ‧ 國. 學. 【圖 A-19】FK02-8(留倉單位限制為 10)的各門檻值累計績效. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 【圖 A-20】FK02-8(留倉單位限制為 10)的績效與次數. 55.

(59) 立. 政 治 大. ‧ 國. 學. 【圖 A-21】FK02-12(留倉單位限制為 10)的各門檻值累計績效. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 【圖 A-22】FK02-12(留倉單位限制為 10)的績效與次數. 56.

(60) 立. 政 治 大. ‧ 國. 學. 【圖 A-23】FK02-16(留倉單位限制為 10)的各門檻值累計績效. ‧. n. er. io. sit. y. Nat. al. Ch. engchi. i Un. v. 【圖 A-24】FK02-16(留倉單位限制為 10)的績效與次數. 57.

(61)

參考文獻

相關文件

的機率分配 常態分配 標準常態 分配..

由圖可以知道,在低電阻時 OP 的 voltage noise 比電阻的 thermal noise 大,而且很接近電阻的 current noise,所以在電阻小於 1K 歐姆時不適合量測,在當電阻在 10K

階段一 .小數為分數的另一記數方法 階段二 .認識小數部分各數字的數值 階段三 .比較小數的大小.

• 將已收集的 LPF 有效顯證,加入為校本的 學生表現 示例 ,以建立資源庫作為數學科同工日後的參照,成 為學校數學科組知識管理

Hsuan-Tien Lin (NTU CSIE) Machine Learning Foundations 5/25.. Noise and Error Noise and Probabilistic Target.

nonuniform sampling, trading off noise for

1900年, Bachelier以數學方法分析巴黎股票交易的價格變化,自

將一群統計資料由小而大排成一列,則中位數(Me)前段數值之中位數稱為第 一四分位數(Q1),中位數(Me)後段數值之中位數稱為第三四分位數(Q3),而中