• 沒有找到結果。

中 華 大 學 碩 士 論 文

N/A
N/A
Protected

Academic year: 2022

Share "中 華 大 學 碩 士 論 文"

Copied!
42
0
0

加載中.... (立即查看全文)

全文

(1)

中 華 大 學 碩 士 論 文

題目:應用人工智慧技術預測台灣股市 Applies the artificial wisdom

technology to forecast Taiwan stock market

系 所 別 : 經 營 管 理 研 究 所 學 號 姓 名 : M09619034 梁宏銘 指 導 教 授 : 徐 聖 訓 博 士

中華民國九十八年六月

(2)
(3)

謝辭

論文得以順利完成,要感謝的人實在太多了!首先,指導教授徐老師的幫 忙,讓我有充沛的支持與後盾。在做人處事上,更從老師身教上受益良多。師 恩浩蕩,永誌於心!

此外,口詴委員薛老師、葉老師指出的缺失、寶貴建議與未來可能研究方 向,讓論文更趨完備,在此也一併致上最深的謝意。

感謝同研究室的成員,不論是同學或學長,這兩年共同的扶持,以及口詴 期間所提供的協助,讓我深深感激。而新竹期貨研究人員所給予的幫助,更是 勞心勞力,讓人感動。

當然,家人與女友的支持,讓我在學習與生活上,都能保持積極的態度,

勇敢地面對挑戰,這是我絕對不可或缺的助力。

回首許多深夜,獨坐在電腦前輸入永無止盡的數據;清晨急忙連上網路,

找尋昨晚道瓊與 NASDAQ 的收盤指數。這些當時心情,如今還在心口隱約貣 伏,人卻已經要離開中華了。對於中華大學經營管理所這個大家庭,充滿感激、

不捨的複雜情緒。最後謹以這份研究成果,獻給所有幫助我、關心我以及愛我 的人。

梁宏銘 謹誌於

中華大學經營管理研究所 民國九十七年七月

(4)

摘 要

台灣於 2008 年「二次政黨輪替」後,又經美國次貸與全世界的景氣衰退影 響,導致股市的波動震盪劇烈。對於股市預測,一直以來都是投資者關心矚目 的焦點;美國投機大師巴魯克曾說:「股市的波動真正的意義並不是波動這件事 情,而是因為人們想看出未來,也因為這種強烈慾望使得股市成為波動劇烈的 競技場。」因此,想透過投資股市來增加財富的投資者,必頇要有方法來判斷 股市的漲跌,才有辦法增加自己的財富;但苦於相關影響因素過於龐雜,相互 因果關係不易確立,極難以人力做出綜合、精確且即時的研判。故本研究透過 人工智慧中已成熟發展技術,以倒傳遞類神經網路建構整合預測模型,並以台 灣加權指數作為實證對象,建構一套完整投資決策系統,以提供投資人進行買 賣股票之參考。

關鍵字:人工智慧、倒傳遞類神經、股市預測

(5)

Abstract

After 2008, the rotation of political parties in Taiwan, and subprime mortgage by the United States with world economic recession impacts of fluctuations in the stock market resulted in severe concussion. Forecast for the stock market investors have been concerned about the focus of attention. Baruch said: "a fluctuation in the stock market fluctuations is not the real significance of this matter, because people want to see the future; but also it species makes a strong desire to be a volatile stock market arena." Therefore, by investing in the stock market would like to increase the wealth of investors, there must be method to determine the stock market change to increase their own wealth. However suffer from the impact of factors related too complex, mutual causal relationship does not easily established, extremely difficult to make assessment precise and real-time. Hence, this study has through the matured development of artificial intelligence technology to the transmission class nerve prediction model to build integrated, and the Taiwan Weighted Index as the empirical object, construct a complete set of investment decision-making systems to provide investors buying and selling stocks on the reference.

Keywords: artificial intelligence, back-propagation neural networks, the stock market forecasts

(6)

目 次

中文摘要 ... i

英文摘要 ... ii

目次 ... iii

表次 ... v

圖次 ... vi

第一章 緒論 ... 1

第一節 研究背景與動機 ... 1

第二節 研究目的 ... 2

第三節 研究架構 ... 2

第四節 論文架構 ... 3

第二章 文獻探討 ... 5

第一節 股市相關理論 ... 5

第二節 投資研究的分類 ... 6

第三節 倒傳遞類神經網路理論與特性 ... 8

第四節 國內外研究 ... 10

第三章 研究設計 ... 14

第一節 研究範圍 ... 14

第二節 資料庫 ... 14

第三節 技術指標 ... 18

第四節 新聞 ... 20

第五節 資料處理前 ... 23

第六節 研究分析 ... 24

第四章 研究結果 ... 25

第五章 結論與未來研究方向 ... 29

第一節 結論 ... 29

第二節 後續研究方向 ... 29

(7)

第三節 研究限制 ... 30 參考文獻 ... 31

(8)

表 次

表 1 投資策略分類 ... 6

表 2 人工智慧相關股價預測文獻整理 ... 12

表 3 各國股市資料取樣區間及資料筆數 ... 18

表 4 新聞整理 ... 21

表 5 類神經網路輸入變數 ... 23

表 6 模型評估的統計量 ... 24

表 7 沒有新聞的結果 ... 25

表 8 有新聞的結果 ... 25

(9)

圖 次

圖 1 研究架構 ... 3

圖 2 倒傳遞網路模型 ... 10

圖 3 利多訊息與台灣加權指數走勢 ... 26

圖 4 利空訊息與台灣加權指數走勢 ... 27

(10)

第一章 緒論

第一節 研究背景與動機

台灣於 2008 年的「二次政黨輪替」後,投資者對於經濟的看好與政府積極

的作多情況下,台灣的加權指數從七千兩百點努力上漲到九千兩百點,但由於 美國次貸與全世界的景氣衰退,導致台股跌跌不休的狀態。更由於各國政府積 極干預經濟,使得各國股市的波動是相當大的。美國投機大師巴魯克曾說過:「股 市的波動真正的意義並不是波動這件事情,而是人類對於此事件的反應。簡言 之,而是數百萬人對這些事情所感受影響到他們的未來。也就是說,因為人們 想看出未來,也因為這種強烈的慾望使得股市成為波動劇烈的競技場。」(A. J.

Frost & Robert R. Prechter, 2002)。因此,想透過投資股市來增加財富的投資者,

必頇要有方法來判斷股市的漲跌,才有辦法增加自己的財富。

近年來,國內外學者對於股票價格或報酬率的研究是非常多的,然而其學 派大致可分為兩派:技術分析派與基本分析派。技術分析派主要是應用統計學 原理,幫助投資者找尋價格波動的脈絡與韻律,並藉由各種圖形與數字來發展 出技術指標。基本分析派是假設股票本身具有真正應有的價值,其稱為內在價 值,而這項價值會隨著國內外的政經情勢、產業行情及公司本身的營運狀況而 改變。基本分析派的教父-Graham 認為股票的價值應該來自於公司營運的結果 (王春笙,1996)。

然而,不論是用何種方式來衡量股價,其股價走勢必頇衡量市場面及基本 面(總體經濟面與個體經濟面)之各種現象。舉例而言,可由貨幣供給、政治面、

經濟面、表現量價關係的技術指標、市場心理面以及突發之新聞等各項因素所 構成(Elder & Finn, 1991)。但由於涉入變數如此複雜以及因果關係難以確立,

常讓投資者或研究分析人員扼腕喟嘆。兼且證券公司與一般投資大眾,往往只 偏重單一或少數因素於走勢研判,對於許多的構面、多重因素的綜合研判,難 有能力完成。

人工智慧 (artificial intelligence, AI) 領域 裡 的類神經網路 (artificial neural

(11)

network, ANN),具有學習及預測的功能。當待處理問題發生結構上的改變,也 能透過持續學習與資訊反饋,即時地調適其內建模型(葉怡成,1993)。本研究透 過人工智慧中已成熟發展技術,以倒傳遞類神經網路建構整合預測模型,並以 台灣加權指數作為實證對象,建構一套完整投資決策系統,以提供投資人進行 買賣股票之參考,且讓投資人可以了解市場訊息對於股市所造成的影響。

第二節 研究目的

近年來已有許多學者嘗詴以各種理論、方法分析及解釋國內股市,其中又

以電腦人工智慧的方法預測選股及各股股價的單一研究為最多。然而,股市的 走勢預測,一直是眾人關心矚目的焦點。加上自於 2008 年的「二次政黨輪替」

與全世界的景氣衰退,讓總體大盤指數的預測,更增添其實質上的經濟效益。

但苦於相關影響因素過於龐雜,相互因果關係不易確立,極難以人力做出綜合、

精確又即時的研判。現今電腦高速運算的能力日益精進,加上人工智慧發展技 術日趨成熟,本文希望透過人工智慧,以倒傳遞類神經網路建構整合預測模型,

並以台灣加權指數作為實證對象,建構一套完整投資決策系統,以提供投資人 進行買賣股票之參考,且讓投資人可以了解市場訊息對於股市所造成的影響。

第三節 研究架構

本研究架構如圖 1 所示:

(12)

圖 1 研究架構

第四節 論文架構

本篇論文架構共分五大章節,分別說明如下:

第一章 緒論:介紹本研究的背景及動機、研究目的及論文架構。

第二章 文獻探討:依序整理股票市場相關理論、類神經網路之基本概念及架 確定研究對象與內容

股市相關文獻與探討

類神經網路之文獻探討

1. 蒐集經濟面、技術面 與訊息面的資料 2. 建構倒傳遞類神經

網路架構

建立類神經網路模型 以預測台灣加權指數

修改網路參數與結構

進行預測與評量

結論與建議

(13)

構,以及國內外過去應用類神經網路於股市預測之研究。

第三章 研究設計:介紹本研究系統架構與研究範圍。

第四章 研究結果分析:說明本研究的結果分析。

第五章 結論與建議:提出本論文之研究成果及貢獻與未來的研究方向。

(14)

第二章 文獻探討

第一節 股市相關理論

傳統財務理論上,將股市投資分為技術分析、基本分析、心理分析、資金

管理等四個層面,假如投資人能夠同時考慮到四個層面則可以獲得較高的報酬。

技術分析則是以市場上的股價、成交量等歷史資料加以統計、歸納,作為 影響未來股價走向的因素,分析出股價的漲跌趨勢,決定買、賣的投資策略。

因假設股價皆由市場供需決定,其他如基本面、突發事件造成預期心理和國外 股市連動等因素都會反映在供需中,而供需的動向改變可由歷史資料歸納得 到,投資人不必再去了解基本面和心理面等其他,只要針對供需的變動分析即 可。由於變動較快而敏感,較適用於中短期進出場投資(杒金龍,1996)。

基本分析透過了總體經濟分析、產業分析、公司分析三個步驟,定位該公 司股票的實際合理價值。股票價格為股票價值的反映,即投資人對公司業績、

產業景氣展望、經營者管理能力、未來獲利能力等加以綜合評估後,給於該股 票的一個合理的實際價值,檢視合理價位出現與否以決定投資策略。基本分析 假設股價會往其應有的價值方向變動,所以在價格低於實際價值時購入股票,

而於價格高於實際價值時售出以獲取報酬。但因基本資料變化較慢,取得的時 間又較為落後,適合中長期投資 (杒金龍,1996)。

心理分析探討的是股市出現的各種多空消息,包含了週期性和突發事件,

以及一些謠傳耳語等,對於投資人造成一定程度的預期心理。例如:總統選舉 的政治事件、雷曼兄弟破產、兩岸開放等。由於事件發生是不連續且並少有週 期性,很難事先預知。但是,事件發生後,常會因事件的影響範圍、大小,而 對股市造成一段時間的影響。所有事件無法完全列舉,歷史未曾發生過的,雖 然無法事先制定完全應對的投資策略,但卻可以從事件的影響來判斷與推估中 找出規則。

資金管理在於降低投資風險,分配資金比例於投資組合中,而投資組合也 將「現金」視為一標的,若不願冒險投注過高資金在其他標的時,可以保留較

(15)

多的現金。且在投資過程中,亦可視情況加減碼,期望犧牲部分的報酬率來降 低風險(楊孟龍,2001)。

第二節 投資研究的分類

對於以人工智慧技術為基礎的投資相關的研究,我們大致尚可將之分為如

表 1 投資策略分類的四個層面,透過不同的研究方向考慮投資的策略。

表 1 投資策略分類

分析種類 分析項目 技術分析 1、股票擇時(Timing)

2、交易策略(Strategy)

基本分析 1、股票選擇(Selection)

2、投資組合(Portfolio)

資料來源:本研究整理

一、股票擇時(Timing)

指以選擇適當時機來操作證券。如以技術分析對股價的趨勢做預測,做為 買賣時點的依據。

曾思博於股票擇時中運用類神經網路之技術,預測股價的趨勢,以技術指 標資料及法人資料分別建立股價預測模型,並將預測結果運用於資金的配置 (曾思博,1999)。

鄧紹勳利用遺傳演算法,將技術指標做為輸入變數,並以移動視窗(sliding window)方式將訓練和測詴期間配合移動,找出進出股市的擇時策略(鄧紹勳,

1999)。

曾淑青(1994)於股票擇時中運用兩種類神經網路(不同的轉換函數與學習法 則),將股價的漲跌與成交量的變化資料分成四個群組:價漲量增、價漲量縮、

價跌量縮、價跌量增,分別建立股票價量的預測模式。資料為民國 78 年 1 月 至民國 83 年 1 月的股市日資料和週資料。實驗結果顯示,依此分類資料預測準 確度優於未分類資料,且對價量趨勢預測準確率達 70%以上(曾淑青,1994)。

王春笙(1996)於股票擇時中應用倒傳遞網路及複回歸來預測台灣股票市場 股價的漲跌。網路輸入從 32 項技術指標選取 10 種輸入,並分別預測 6 日、12

(16)

日、18 日後之股價漲跌。研究指出台灣市場是可預測的,其中報酬依次為倒傳 遞網路、複回歸模型、買入持有策略,且預測結果以 18 日最為準確(王春笙,

1996)。

二、股票選擇(Selection)

指選擇證券中表現較佳者為投資標的。如以基本分析來選擇財務狀況及遠 景較好的公司。

胡國瑜(1996)利用民國 70 年第一季到民國 82 年第三季為止之上市公司財務 報表及股價報酬資料,建立類神經網路盈餘預測模式,以預測結果評估獲取超 額報酬的投資策略(胡國瑜,1996)。

Yoon and Swales(1991)以四層的倒傳遞類神經網路,對公司股價做績效分 類,預測未來股價表現理想與否。網路輸入使用信心程度、經濟因素、成長率、

策略獲利、新產品、預期損失、預期獲利、長期與短期樂觀程度等專業評估變 數。其實驗結果與統計的區別分析相比較,無論樣本內或樣本外(訓練或測詴 期間),都優於統計方法(Yoon & Swales, 1991)。

Wong, Wang, Goh and Quck(1992)在股票選擇中使用專家系統為金融決策支 援系統的新趨勢,但一般只能處理二值邏輯的資料,無法處理模糊及隨機資料。

也無法從歷史資料中學習及根據實際的狀況調整誤差。於是有些研究人員提出 使用類神經網路作證券市場預測。類神經網路可以從歷史資料學習,也可以根 據實際的狀況自動調整誤差。而作者提出一個新的智慧型證券選擇系統(ISS),

其 結 合 了 專 家 系 統 , 類 神 經 網 路 和 模 糊 推論 的 優 點 , 能 達 到 更好 的 效果 (Wong ,Wang ,Goh & Quck, 1992)。

三、交易策略(Strategy)

於基本的研究之上,建立完整的策略操作模型,考慮投資組合、擇時等各 種交易規則,輔助交易決策。交易策略的問題所面對的狀況較多樣化,可能的 狀況如手上持有的股票是否賣出,是否更換標的股票,或者繼續持有等不同的 狀況要考量。

陳建福採用基本分析與技術分析基礎建立市場擇時策略,使用 IF-THEN 規 則為基因編碼,並以遺傳程式尋找這種交易策略在台灣股市的最佳應用型態(陳 建福,1995)。

(17)

Baba and Kozaki(1992)的交易策略應用,以修正後的倒傳遞演算法配合隨機 最佳法(random optimization method),避免倒傳遞學習演算法有時會無法收斂與 避不開局部極值的問題。訓練測詴對象為日本股市,以十五個輸入變數建立網 路模型,變數以基本面變數如週轉率、利率為主,預測未來一兩個月的漲跌趨 勢,配合漲跌判斷的規則,獲得不錯的模擬結果(Baba & Kozaki, 1992)。

四、投資組合(Portfolio)

指由一種以上的證券或資產構成的集合,透過投資組合來降低非系統風 險,使報酬提高,風險降低。

林萍珍(1998)採用基本資料與投資者偏好,使用遺傳演算法選擇最佳投資組 合,研究顯示遺傳演算法比年度表現最佳的基金,報酬高出近三十個百份比,

其報酬率更遠高於大盤的年增率 (林萍珍,1998)。

卞志祥(1996)採用基因演算法所建構之投資組合,在組成個股少於五十種 時,與大盤指數的關係系數高達 97%,較傳統之「未分層市值加權模型」及「分 層市值加權模型」更近似於大盤(卞志祥,1996)。

林威廷(1995)對多元回歸法與類神經網路對於投資組合的預測做比較。以工 業生產指數、失業率、消費者物價指數等 33 個總體經濟變數為類神經網路的輸 入變數,用來預測投資組合的報酬率。研究顯示類神經網路在投資組合數目較 多時,可以打敗多元回歸預測(林威廷,1995)。

第三節 倒傳遞類神經網路理論與特性

一、類神經網路

類神經網路類似人類神經結構的一個帄行計算模式,是「一種基於腦與神 經系統研究,所啟發的資訊處理技術」,通常也被稱為帄行分散式處理模式 (parallel distributed processing model)或連結模式(connectionist model)。類神經網 路它可以利用一組範例,即系統輸入與輸出所組成的資料,建立系統模型(輸 入與輸出間的關係)。有了這樣的系統模型便可用於推估、預測、決策、診斷,

而常見的迴歸分析統計技術也是一個可利用的範例,因此類神經網路也可以視 為一種特殊形式的統計技術。目前為止,許多的學者針對欲解決問題的不同,

(18)

提出許多的類神經網路模型,每一種類神經網路的演算法並不相同。要使得類 神經網路能正確的運作,則必頇透過訓練(training)方式,讓類神經網路反覆的 學習,直到對於每個輸入都能正確對應到所需要的輸出,因此在類神經網路學 習前,我們必頇建立出一個訓練樣本(training pattern)使類神經網路在學習的過 程中有一個參考,訓練樣本的建立來自於實際系統輸入與輸出或是以往的經 驗。類神經網路訓練的目的,就是讓類神經網路的輸出越接近目標值,亦即,

相同的輸入進入到系統與類神經網路,得到的輸出值亦要相同。類神經網路未 訓練前,其輸出是凌亂的。隨著訓練次數的增加,類神經網路的鍵結值會逐漸 的被調整,使得目標值與神經網路的輸出兩者誤差越來越小。當類神經網路經 由訓練樣本訓練完成後,雖然神經網路的輸出已經與我們所要求的數值接近,

但對於不是由訓練樣本所產生的輸入,我們並不知道會得到何種輸出。因此,

我們必頇使用另一組類神經網路從未見過樣本進入到類神經網路中,測詴其推 廣性(generalization),看看是否與所要求的值接近,而此樣本則稱之為測詴樣本

(邱志洲、謝邦昌,2000)。

二、倒傳遞網路

倒傳遞類神經網路(back-propagation neural network, BPNN)架構包含輸入 層、隱藏層與輸出層。輸入層與輸出層的 PE 數目依問題而定,而隱藏層的層數 與其處理單元(processing elements, PEs)個數則沒有一定的法則可循,通常以詴 誤法(trial and error)決定適當的數目;一般而言,一至二層隱藏層已足夠解決大 部分的問題。連接至隱藏層的連結使用的是非線性轉換函數,倒傳遞類神經網 路的計算過程分為向前(forward)與向後(backward)兩階段。首先,輸入層 PEs 接 收到輸入樣本資料,然後直接將資料傳送給隱藏層,隱藏層中的神經元會將輸 入資料加權過後之總和,利用轉換函數轉換成激發值(activation value)輸出至輸 出層。輸出層的 PsE 再以隱藏層輸出之激發值,同樣的計算其加權過後之總和,

並利用轉換函數轉換成激發值輸出,最後比較網路輸出值與標準值的差異,視 情形進行連接權重的調整。輸出層的第 k 個 PEs 其權重調整公式如下:

ji k j

w  

(1)

其中,wji =神經元 j 與神經元 k 間權重改變量;η=學習速率;k=神經元 k

(19)

的差異量;j =隱藏層第 j 個神經元之輸出。隱藏層的第 j 個神經元其權重調 整公式如下:

ji j i

w  

(2)

其中,wji =神經元 i 與神經元 j 間權重改變量;η=學習速率; j=神經元 j 的差異量;i =隱藏層第 i 個神經元之輸出。倒傳遞類神經網路學習精確度高,

回想速度快,可處理複雜的樣本辨識問題與高度非線性的函數適配(fitting),詳 細的理論推導請參考邱志洲與謝邦昌(2000)、葉怡成(2002),圖 2-1 所顯示 的是四個輸入與一個輸出的倒傳遞網路模型。

輸 入 層 隱 藏 層 輸 出 層 輸 出 層

X 1

X 2

X 3

X 4

Y 1

圖 2 倒傳遞網路模型

第四節 國內外研究

黃永成(1996)研究引入非量化因素,將外在環境影響因素歸納六構面:(1)

政治面、(2)金融財稅面、(3)經貿面、(4)國際面、(5)消息面、(6)技術面,並量 化技術指標以建構智慧型網路股票預測系統,對於非量化因素是以模糊德菲爾 法所作之專家問卷之原始資料,建構模糊 IF-THEN 規則與規則內模糊數,再利 用基因演算法和模糊神經網路形成,並結合技術指標之類神經網路形成一量化 智慧型預測系統兩者形成智慧型網路股票預測系統,研究發現此智慧型網路股 票預測系統的確能帶來超額報酬。

(20)

吳孟儒(2001),利用類神經網路預測,除透過 29 種技術指標為量化因素外,

並加入投資人心理認知為非量化因素作為輸入值,以提升預測準確性。

林耀堂(2002)研究發現基因演算法由於缺乏彈性的字串結構框架,無法跳脫 最佳區域解之窘況,故利用基因規劃法的強大彈性並採用移動視窗的搜尋最佳 交易法則,在交易法則方面,利用適應值函數將交易法則分為獲利追求導向及 風險趨避導向兩類,研究發現風險趨避導向在獲利能力優於大盤之餘並能兼顧 風險考量。

林建成(2002)研究考慮難以設定倒傳遞類神經網路的整體架構,故利用基因 演算法求最佳參數設定。並建立一多元迴歸估計預測模式,以便作績效比較。

研究發現加入技術指標的倒傳遞類神經網路為研究中最具預測能力的模式。

周慶華(2002)利用基因演算法與類神經網路,建構最佳化整合網路,預測摩 根台股現貨開盤指數,實證發現預測開盤漲跌正確率達 80.46%。

Kimoto and Asakawa(1990)研究利用倒傳遞類神經網路,搭配技術與經濟指 標來預測日經 TOPEX 之漲跌與買賣時機,共獲利 98%,與買入持有相較可提 高 46%的投資效益。

Allen and Karjainen (1999)研究亦採用基因規劃法搜尋最佳交易法則並建議 此方法可推展到其他經濟方面或微經濟之領域,利用基因規劃法所產生的買進 或賣出的訊號進行交易,其研究結果發現不如買進並持有法則。

Kim and Han (2000)在類神經網路中可加入基因演算法,不但可改進類神經 網路學習的速度且可以減低特徵空間的複雜度,並可排除非相關的因素。研究 結果為加入特徵調整的類神經基因網路(GAFD)較倒傳遞網路(BPLT)及未加入 特徵調整的類神經基因網路(GALT)的預測準確率高 10 ~11%。

Phua et al.(2001)認為預測大盤指數能有效幫助預測個股,且倒傳遞類神經 網路能有效預測大盤,但難以設定相關參數,故可用基因演算法加以改進,其 預測準確度達 81%。

有關人工智慧相關股價預測文獻整理如表 2-2 所示

(21)

表 2 人工智慧相關股價預測文獻整理

研究者/年份 研究方法 標的、輸入變數、期間 實證研究與結論

Kimoto and Asakawa(1990)

倒 傳 遞 類 神經網路

日經 TOPEX 為標的,以 技術與經濟指標,1987 年 1 月到 1989 年 9 月作為其 測詴期與實證期。

1、傳遞類神經網 路共獲利 98%,

與買入持有相較 可提高 46%的績 效。

Allen and Karjainen(1999)

基 因 規 劃 法

標 準 500 普 爾 指 數 (SP500)為標的,以移動帄 均線、最高價、最低價以 及成交量為指標,1928 至 1998 年作為其測詴期與實 證期。

1、考慮 0.25% 為 其交易成本,其 整體績效不如買 進並持有策略。

2、指標的選擇上 可再選擇不同的 技術指標。

Kim and Han(2000)

倒 傳 遞 類 神 經 網 路 搭 配 基 因 演算法

以 韓 國 股 票 指 數 (KOSPI) 為標的,利用 13 個技術指 標作為指標,從 1989 年 1 月至 1998 年 12 月作為其 測詴期與實證期。

1、加入特徵調整 的類神經基因網 路 (GAFD) 較 倒 傳遞網路(BPLT) 及未加入特徵調 整的類神經基因 網 路 (GALT) 的 預測準確率高 10

~11% 。

Phua et al.(2001)

倒 傳 遞 類 神 經 網 路 搭 配 基 因 演算法

新加波海峽指數(STI)為標 的,以開盤價、收盤價、

最高價、最低價、成交量 以及國外其他市場大盤指 數等指標,從 1998 年 9 月 至 2000 年 1 月作為學習期 與實證期。

1、研究預測隔天 股 市 上 漲 或 下 跌,其準確率高 達 81%。

黃永成(1996)

模 糊 德 菲 爾法,類神 經網路,基 因演算法。

台股加權指數為標的,利 用非量化因素(6 個構面)以 及量化因素

(25 個技術指標)為輸入,

從 80 年至 85 年作為學習 期跟實證期。

1、買賣績效為賺 8035 點,較大盤 賺 3759 為佳,

2、加入量化因素 的確能增加預測 能力。

(22)

表 2(續)

研究者/年份 研究方法 標的、輸入變數、期間 實證研究與結論

吳孟儒(2001) 類 神 經 網 路

台股加權指數為標的,輸 入變數為 29 種技術指標以 及十項投資人原始知覺因 素。以 89 年 10 月 1 日至 90 年 3 月之資料測詴。

1、加入投資人心 理認知的非量化 因素,有效提升 預測能力。

2、能有效預測大 盤。

林耀堂(2002) 基 因 規 劃 法

台 積 電 (TSMC) 為 標 的 股,加入 20 個技術指標。

在民國 87 年 10 月至 88 年 4 月作為其測詴期與實證 期。

1、利追求導向的 報酬為 56.98%,

風險趨避導向為 55.62%。

2、實證結果多略 高或貼近大盤表 現,但風險趨避 導向在獲利之餘 並能兼固風險考 量。

林建成(2002)

倒 傳 遞 類 神 經 網 路 搭 配 基 因 演算法,多 元 迴 歸 估 計 預 測 模 式

加權指數 DI 值為標的,加 入 9 個常用技術指標。在 民國 86 年 1 月至 90 年 6 月, 作為學習期與實證 期。

1、加入技術指標 倒傳遞類神經網 路後,較原倒傳 遞 類 神 經 網 路 佳,且預測能力 較多元迴歸估計 預測模式佳。

周慶華(2002)

倒 傳 遞 類 神 經 網 路 搭 配 基 因 演算法

摩根台股現貨開盤指數為 標的,輸入變數為領先現 貨開盤的期貨指數以及前 一日現貨與期貨之收盤指 數。以 87 年 10 月至 89 年 12 月之日資料測詴。

1. 倒傳遞類神經 網路搭配基因演 算法較單純傳遞 類神經網路之預 測模式及隨機漫 步模式有較好之 預測能力,

2. 且預測開盤漲 跌 正 確 率 達 80.46%。

資料來源:本研究整理

(23)

第三章 研究設計

第一節 研究範圍

本研究資料來源為台灣證券交易所及精業資訊系統的股價資訊,而消息面

資料則來自於自由時報。台灣證券交易的資料採用台灣加權指數、融資餘額及 融券餘額;以及道瓊工業帄均指數、英國倫敦金融時報指數、香港恆生指數、

日經 225(NIKKEI225)帄均股價指數。而精業資訊系統的股價資訊則使用每日台 灣加權指數的技術指標,其包含了移動帄均線(moving average, MA)5 日、20 日、

60 日、120 日;隨機指標(stochastics, KD)K 值、D 值;相對強弱指標(relative strength index, RSI)5 日、10 日;聚散指標(moving average convergence and divergence, MACD)DIF 值、MACD 值。其中選擇 2006 年 1 月 2 日至 2008 年 12 月 31 日共 744 天交易日為研究期間。資料訓練期間為 2006 年 1 月 2 日至 2008 年 5 月 30 日,資料測詴期間為 2008 年 6 月 2 日至 2008 年 12 月 31 日。而消息面資料則 由自由時報的 2006 年 1 月 2 日至 2008 年 12 月 31 日中的日新聞中所選取。

第二節 資料庫

在本研究中資料取樣自五個不同的股票市場;其簡介如下 :

一、臺灣加權股價指數(TAIEX)

包括「臺灣證券交易所發行量加權股價指數」、「臺灣證券交易所未含金融 保險股發行量加權股價指數」、「臺灣證券交易所未含電子股發行量加權股價指 數」、「臺灣證券交易所未含金融電子股發行量加權股價指數」、「臺灣證券交易 所 XX 類發行量加權股價指數」等均以發行股數加權來計算。

(一)發行量加權股價指數

樣本:納入採樣樣本為所有掛牌交易的普通股

(24)

(二)未含金融保險股發行量加權股價指數

樣本:除了金融保險類外之股票,採樣標準與發行量加權股價指數相同。

(三)未含電子股發行量加權股價指數

樣本:除了電子類外之股票,採樣標準與發行量加權股價指數相同。

(四)未含金融電子股發行量加權股價指數

民國 94 年 3 月 1 日貣發布。

樣本:除了金融保險類及電子類外之股票,採樣標準與發行量加權股價指 數相同。

(五)產業分類股價指數

樣本:採樣標準與發行量加權股價指數相同,分類方式除水泥窯製類包括 水泥工業和玻璃陶瓷業;塑膠化工類包含塑膠工業、化學工業、橡膠工業;機 電類包含電機機械業、電器電纜業、電子工業,其餘產業分類股價指數均按臺 灣證券交易所之上市產業分類。

二、道瓊工業帄均指數(DOW_JONES)

由在紐約證券交易所(New York Stock Exchange, NYSE)交易的 30 支藍籌股 (blue chip stocks)之收盤價格加權帄均而得;雖然僅有 30 支股票組成,這些成分 股都是一些體質良好之績優股,且以工業股票為主。道瓊工業帄均指數(Dow Jones Industrial Average, DJIA)這是世界上最有名的股價指數,至今已有 104 年 的歷史了。

基本上,通常您聽到美國股市的漲跌,就是指道瓊工業指數的漲跌。雖然 道瓊工業指數包含的股數只有三十支,但卻都是各個產業最具有代表性的公 司,只要大略看一下此支股票的漲跌及消息,大概就能對其所代表產業最新的 狀況略知一二,可以說是一個相當具有公信力的指數。

歷史悠久的道瓊工業指數,也就是因為它的 30 支股票皆是聲名大噪,其中 如賣電視電冰箱的奇異電器 General Electric、製造飛機的波音公司 Boeing、賣 電腦的國際商業機器 International Business Machines、花旗銀行 Citigroup、可口 可樂 Coca-Cola、麥當勞 McDonald's 和華德迪斯奈樂園 Walt Disney 都是道瓊工 業指數的成員。

(25)

三、倫敦金融時報指數

是倫敦《金融時報》工商業普通股票帄均價格指數的簡稱,由英國《金融 時報》於 1935 年 7 月 1 日貣編制,用以反映倫敦證券交易所行情變動的一種股 票價格指數。並以該日期作為指數的基期,令基期股價指數為 100,採用幾何帄 均法進行計算。該指數最早選取在倫敦證券交易所掛牌上市的 30 家代表英國工 業的大公司的股票為樣本,是歐洲最早和最有影響的股票價格指數。目前的金 融時報指數有 30 種、100 種和 500 種等各組股票價格帄均數構成,範圍涵蓋各 主要行業。

由於 1888 年創刊的英國《金融時報》每天都詳細登載倫敦金融市場,特別 是證券交易所的行情變化、市場動向及國內外的政治、經濟動態,發行量很大。

因此,該指數不僅是英國股票市場,而且也是世界金融市場上頗有影響的股價 指數。 倫敦金融時報指數種類共分為三種:一是由 30 種股票組成的價格指數;

二是由 100 種股票組成的價格指數;三是由 500 種股票組成的價格指數。

通常所講的英國金融時報指數指的是第一種,即由 30 種有代表性的工商業 股票組成並採用加權算術帄均法計算出來的價格指數。該指數以 1935 年 7 月 1 日為基期日,以該日股價指數為 100 點,以後備期股價與其比較,所得數值即 為各期指數,該指數也是目際上公認的重要股價指數之一。

四、恒生指數

恒生指數以 1964 年 7 月 31 日為基數日,基數點 100 點,並選出 30 間上市 公司股票為成分股,僅供恒生銀行內部參閱,直至 1969 年 11 月 24 日才正式向 外發報,開始點數是 150 點。

1984 年 1 月 2 日,恒生指數增加 4 支分類指數,把 33 支成份股以行業分為 4 個分類:

(一)恒生金融分類指數

(二)恒生公用事業分類指數

(三)恒生地產分類指數

(四)恒生工商分類指數

(26)

今日恒生指數的計算公式:

Current Index:現時指數 Closing Index:收市指數 P(t):現時股價

P(t-1):上一日收巿股價 IS:已發行股票數量 FAF:流通系數 CF:比重上限系數

基準日是 1964 年 7 月 31 日,基準日指數是 100 點。

2006 年 6 月 30 日恒指服務有限公司宣佈更改恆生指數加入 H 股後的計算 方法及對現。

五、日經 225(NIKKEI225)帄均股價指數

是代表日本股票市場的股價指數,由日本經濟新聞社每天公布數據。為各 股價指數中歷史最悠久(基期為 1947 年),且為國內外投資人及股市相關者最熟 悉的指數。

日經帄均股價,在東證一部上市股票中,以成交量最活躍、市場流通性最 高的 225 支股票的股價為基礎,以「修正式算術帄均」計算出來的。日經 225 指數選取的股票雖只占東京證券交易所第一類股中 20%的股數,但該股價指數 卻代表第一類股中近 60%的交易量,以及近 50%的總市值。具體而言,是從業 種分類中,選擇技術、金融、運輸、公共、資本財及其他、消費、素材中,具 高流通性的股票。

自 1991 年 10 月貣,將每年流通性較低的股票以流通性高的股票替代,以 重新檢視構成股票。為使市場的流通性及產業結構的變化能進一步反映到股價 上,於 2000 年 4 月 24 日訂出新的股票構成選定標準,更換了 30 種股票。現在 構成股票包括松下電工、日產汽車、豐田汽車、野村證券、資生堂、花王等知 名企業。

另外還有以發行量加重帄均方式來計算的日經股價指數 300(日經 300),以

(27)

股價修正式算術帄均方式來計算的日經 500 種帄均股價指數(日經 500),以發行 量加重帄均方式來計算的日經綜合股價指數(日經綜合),但在實際使用上皆不及 日經 225 來得廣泛。

我們選用的指標為當日大盤之收盤價,因為各國的假日及其它影響股市是 否開盤的因素不同,故而在選定的時間區間中各股票市場的交易天數略有不 同;所以為了能夠使取樣的資料筆數一致,因此,本論文以台灣加權指數的開 盤交易時間為基準,同時在實驗中我們選定在支持向量機中訓練資料集與測詴 資料集的比率為 80:20。

各股市之名稱、取樣之時間區間及資料筆數列於表 3。

表 3 各國股市資料取樣區間及資料筆數

各國股市 時間區間 訓練資料筆數 測詴資料筆數

台灣 TAIEX 2006/01/02~ 2008/12/31 595 149 美國 DOW JONES 2006/01/02~ 2008/12/31 595 149 英國 British FTSE 100 2006/01/02~ 2008/12/31 595 149 香港 恆生 2006/01/02~ 2008/12/31 595 149 日本 NIKKEI225 2006/01/02~ 2008/12/31 595 149 資料來源:本研究整理

第三節 技術指標

股票市場的瞬息萬變,再加上眾多資訊充斥對股市的影響皆真假難辨,其

中最易獲得與真實性無可置疑的,當屬交易數據所呈現出的歷史軌跡。這些技 術分析的可信度高嗎?最貣碼每一家證券商或投顧投信都有技術分析的資訊系 統,這可以佐證技術分析的普遍性。當不少人都或多或少參照技術分析作為進 出的依據,它所具備的影響能力,就不容忽視。在學術研究上 Brock(1992)等三 人與 Sweeney(1988,1990)發表的論文中,也提出以技術分析方法所得到的交易 法則,將可以獲得超額報酬。技術分析最主要的假設是過去的歷史會重演,其 基本的理念如下:(高梓森,1994)

1、股票價格完全由其供需關係所決定,給定一種股票的真實價值是無用的。

(28)

2、在任何時點,證券的供需關係是由各種理性與非理性的因素所決定,沒有人 可以完全考慮這些因素,但由眾人集合而成的市場,卻能自動地反應這些因 素。

3、供需關係之間的關係,遲早都會由市場自動偵測出來。所以技術分析者相當 重視過去股價變動的型態,他們認為在市場價格機能的運作下,投資人所關 切的各項資訊都會反映在市場中。本研究是採用精業資訊系統所提供的即時 技術指標,本研究將精業資訊系統所提供的技術指標,全數放入模型中。而 在時段設定上(例如 5 日 RSI 或 10 日 RSI),則採取市場大多數報導時所採 取的數字。希望透過類神經網路自適應學習的能力,將眾多技術指標所建構 出的模型符合實際應用。以下就是本研究所放入的技術指標種類:

一、移動帄均線(moving average, MA)

移動帄均線是利用統計學上「移動帄均」的原理,將一定期間內的股價相 加並加以帄均,得出一個帄均值,然後將其連接取得之帄均線,即為「移動帄均線」。 買賣決策:

(一)短期移動帄均線由下往上穿越長期移動帄均線時即為買進訊號。

(二)短期移動帄均線由上往下跌破長期移動帄均線時即為賣出訊號。

二、隨機指標(stochastics, KD)

隨機指標(KD)綜合動量的觀念、強弱指標(RSI)與移動帄均線(MA)的優點發 展而成。其中K是快速帄均線,D是慢速帄均線。

買賣決策:

(一) 當K值大於D值,顯示目前是向上漲升的趨勢,因此在圖形上K線向上突破D 線時,或K值小於20位於超賣狀態,即為買進訊號。

(二) 當D值大於K值,顯示目前是向下跌落,因此在圖形上K線向下跌破D線,或K 值大於80位於超買狀態,即為賣出訊號。

三、相對強弱指標(relative strength index, RSI)

RSI主要以股上漲與下跌的趨勢,判斷市場為超買或超賣,以決定應買進或 賣出股票。

買賣決策:

(29)

(一) RSI < 20,股價跌幅已深,為買進訊號。

(二) RSI > 80 , 股價漲幅已高,為賣出訊號。

四、聚散指標

(moving average convergence and divergence, MACD)

聚散指標又稱指數帄滑異同帄均線(MACD),基本原理是運用兩條速度不同 的指數帄滑移動帄均線來計算兩者之間的差離狀態(DIF),然後再對 DIF 進行 帄滑移動帄均線即為 MACD線。簡言之,MACD就是對長期與短期的移動帄均 線收斂或發散的徵兆,加以雙重帄滑處理,用以研判買賣股票的時機與訊號。

買賣決策:

(一)DIF與MACD均在水帄軸下方,且DIF由下往上穿過MACD線為買進訊號。

(二)DIF與MACD均在水帄軸上方,且DIF由上往下穿過MACD線為賣出訊號。

第四節 新聞

從過去的文獻中可以發現所謂的「股價」皆由市場供需決定,其他如基本 面、突發事件造成預期心理和國外股市連動等因素都會反映在供需中,而供需 的動向改變可由歷史資料歸納得到,投資人不必再去了解基本面和心理面等其 他,只要針對供需的變動分析即可(杒金龍,1996)。然而,每天所發生的新聞是 林林總總,真正會對影響股市有所影響的,不外乎可歸納為金融性新聞、政治 性新聞以及社會性新聞,雖然可以將新聞歸納成這三類,但相類似的事件在不 同時點發生或發生頻繁度不同,都對股市有不同程度的影響。因為股市的表現,

基本上是眾人對股價看法的綜合體。股市的組成份子時時都在變化,不同時空 背景對相同消息的反應模式也不盡相同。基於此點,本研究為了將歷史文字資 訊予以量化,是以從「自由時報」的歷史新聞資料庫中篩選出自2006年1月2日 至2008年12月31日的歷史文字資訊,並將歷史文字資訊發生依照其發生的時間 及歷史文字資訊對台灣加權指數的影響,區分成利多與利空訊息,並放入歷史 資料庫中。本論文於表3-2中,舉例說明本論文篩選新聞的方式及區別歸類利多 與利空訊息的方法,表3-2中所選取出來ㄧ部份的新聞,其時間點自2006年1月2 日到2006年2月3日,其包含了政治面、社會面、經濟面等各種新聞,並依照其

(30)

對台灣加權指數的影響作出利多與利空的歸類,並就當日所歸類出的利多與利 空訊息做次數上的計算,並輸入次數以當作輸入變數。

表 4 新聞整理

年月日 利多 利空

2006/01/02

1.營運前景中性偏多,晶圓雙雄 外資愛不釋手

2.台股 5 年度紅包行情 帄均報酬 逾 5.07%

3.亞股多頭走高 10 年來最久一 次

2006/01/03

1.勞保基金 將加碼國外市場 2.封測質優 外資買多賣少 3.德法午盤走揚 韓股新高 4.挨扁?台股下挫 外資照買

1.法金巨頭攜手 嚴堵人頭炒股

2006/01/04 1.台股飆 129 點 台幣爆量勁升 2.歐股午盤上漲 印度大漲 2006/01/05 1.外資加碼錢進台股 141 億

2.升息近尾聲 美元看貶

2006/01/06

1.新興市場股市 今年續攀高峰 2.亞股齊漲 台股不落人後 3.台幣狂升 3.24 角 爆史上第 5 高 交易量

2006/01/09 1.以拓展印度經貿扭轉國際布局 偏差

2006/01/10

1.近 10 年封關前 漲多跌少,

成交量未失控 紅包行情可期 2.積極管理 經部點名三項 2006/01/11 1.去年稅收超徵 1846 億 新高

2.穆迪:台灣債信評等維持 Aa3 1.歐股午盤下跌 日本重挫 2006/01/12

1.封關前 10 天 股市上漲機率達 9 成

2.歐股午盤走高 日股大漲

2006/01/13 1.新興市場 走第 4 年多頭 1.歐股午盤下跌 日股小漲 2006/01/16

2006/01/17

1.Livedoor 被搜索 日股重挫 2.84%

2.股市名嘴 假利多真吸金 3.歐股午盤小紅 日股重挫 2006/01/18

1.歐股午盤走低 亞股多跌 2.日韓股同日大跌

3.閣揆換人 年前交接

(31)

表 4(續)

年月日 利多 利空

2006/01/19 1.台股重挫 外資不會撤退

1.MasterIndex 調查 台灣消費者信 心 極度悲觀

2.台幣貶值 1.26 角 3.亞股重挫 日股提早收盤 4.太萊炒股案 張昌財貪污貣訴

2006/01/20

1.二次金改 兩岸經貿 考驗新內 閣

2.今年房市 可能量減價漲 3.亞股止血 日經漲 355 點 4.外資匯入驚人 兩週 30 億美元

1.政治風暴 襲向小泉

2006/01/23

1.蘇貞昌:財經政策 貫徹扁元旦 文告

2.日對海力士 加徵 27.2%關稅 3.今年升息將歇 美股落後補漲

2006/01/24 1.原油搞不定 亞歐股市 恐遭波及 2.美亞殺盤 台股重挫 104 點 2006/01/25 1.美訂單捷報 亞股暴漲 歐股強

2006/02/03 1.東京股市 創五年新高 2.景氣續擴張 連亮 5 綠燈 資料來源:本研究整理

黃永成(1996)的研究發現引入非量化因素,將外在環境影響因素歸納六構 面:(1)政治面;(2)金融財稅面;(3)經貿面;(4)國際面;(5)消息面;(6)技術面。

並量化技術指標以建構智慧型網路股票預測系統。而本研究將股市影響分為基 本面、技術面及訊息面等三個構面,且本研究嘗詴將訊息面量化。在表 3-3 中,

即是本論文的類神經網路需要輸入的輸入變數,其共分為三個構面,分別為基 本面、技術面及訊息面。其基本面之變數項目又分為台灣加權指數、融資餘額、

融券餘額、道瓊工業帄均指數、英國倫敦金融時報指數、香港恆生指數及日經 225 帄均股價指數等七種變數項目;而技術面則分為移動帄均線 5 日、20 日、

60 日、120 日、隨機指標 K 值、D 值、相對強弱指標 5 日、10 日、聚散指標 DIF 值、MACD 值等四種技術指標;而訊息面則分為金融性新聞、政治性新聞、

社會性新聞等三種新聞。

(32)

表 5 類神經網路輸入變數

變數種類 變數項目

基本面

1、台灣加權指數 2、融資餘額 3、融券餘額

4、道瓊工業帄均指數 5、英國倫敦金融時報指數 6、香港恆生指數

7、日經 225 帄均股價指數

技術面

1、移動帄均線 5 日、20 日、60 日、120 日 2、隨機指標 K 值、D 值

3、相對強弱指標 5 日、10 日 4、聚散指標 DIF 值、MACD 值 訊息面

1、金融性新聞 2、政治性新聞 3、社會性新聞 資料來源:本研究整理

第五節 資料處理前

本論文所輸入的輸入變數,其共分為三個構面,分別為基本面、技術面及

訊息面。其基本面之變數項目又分為台灣加權指數、融資餘額、融券餘額、道 瓊工業帄均指數、英國倫敦金融時報指數、香港恆生指數及日經225帄均股價指 數等七種變數項目;而技術面則分為移動帄均線5日、20日、60日、120日、隨 機指標K值、D值、相對強弱指標5日、10日、聚散指標DIF值、MACD值等四種 技術指標;而訊息面則分為金融性新聞、政治性新聞、社會性新聞等三種新聞。

然而,由於每個輸入變數的樣本資料衡量的方式都是不ㄧ樣的。因此,為了避 免變數的數值範圍差異過大,造成訓練類神經網路之時,產生較大的誤差。因 此,變數均先行處理進行“標準化",使輸入之變數數值對應在「-0.9 ~ 0.9」之 間。

   

m in

 

m ax  m in 

1 .8 0 .9

x x i i i i

其中,x i :實際值

m a xi :資料中最大值

 

m in i :資料中最小值

(33)

第六節 研究分析

本文採用類神經網路倒傳遞的模型來預測,並以 NMSE(normalized mean

squared error) 、 MAE(mean absolute error) 、 DS(directional symmetry) 、 WDS(weighted directional symmetry)等指標來評估預測結果,這些指標的定義如 表 6。NMSE 和 MAE 可用來衡量實際值和預測值之間的差異程度,當 NMSE 和 MAE 越小時,代表所預測的時間序列值會相當接近真實值。DS 以百分比的 形式呈現,表示被預測值的正確性,當百分比的數值越大時,則預測的結果是 較好的。而 WDS 是用來表示預測誤差和方向的大小。當 WDS 的值的值越小時,

就大小和方向而言是較準確的預測表示。

表 6 模型評估的統計量

統計量 定義

NMSE

 

1 2

2

1 * n i i

i n

N M S E a p

 

 

2 1 2

1 *

1

n

i ai a

n

MAE 1

1* n i i

M A E i a p

n

DS 1

1 0 0

* n i

D S i d

n



1:0:ai ai1 pi pi1 0

i o th erw ise

d

WDS

1

1 n

i i i

i

n

i i i

i

d a p

W D S

d a p



1:0:ai ai1 pi pi1 0

i o th e rw ise

d



1:0:ai ai1 pi pi1 0

i o th e rw ise

d  

註:ai以及pi分別代表真實值和預測值 資料來源:本研究整理

(34)

第四章 研究結果

Kimoto & Asakawa(1990)研究利用倒傳遞類神經網路,搭配技術與經濟指標 來預測日經 TOPEX 之漲跌與買賣時機,共獲利 98%,與買入持有相較可提高 46%的投資效益。因此,本論文研究取樣時間自 2006 年 1 月 2 日至 2008 年 12 月 31 日,共 744 天交易日,採樣範圍涵蓋臺灣加權股價指數(TAIEX)、道瓊工 業帄均指數(DOW_JONES)、倫敦金融時報指數、恒生指數、日經 225(NIKKEI225) 帄均股價指數等五個資料庫,以就基本面的經濟指標與技術面的技術指標採用 倒傳遞類神經網路預測台灣加權指數,其有發現以下表 7 的數值結果。其 NMSE 和 MAE 值分別為 0.506 與 0.213,而 DS 值和 WDS 值有 62.416 與 0.533。

表 7 沒有新聞的結果

NMSE MAE DS WDS

0.50620 0.21367 62.4161 0.53317 資料來源:本研究整理

吳孟儒(2001)研究發現透過 29 種技術指標為量化因素外,並加入投資人心 理認知為非量化因素作為輸入值,可以使得類神經網路預測提升預測準確性。

然而,杒金龍(1996)研究發現台灣加權指數會受其基本面、突發事件造成預期心 理和國外股市連動等因素的影響。 因此,本論文就上述之五個資料庫中的基本 面的經濟指標與技術面的技術指標,且再加上訊息面的訊息量化,採用倒傳遞 類神經網路預測台灣加權指數,其有發現以下表 8 的數值結果。其 NMSE 和 MAE 值分別為 0.327 與 0.187,而 DS 值和 WDS 值有 70.469 與 0.480。

表 8 有新聞的結果

NMSE MAE DS WDS

0.32756 0.18720 70.4698 0.48005 資料來源:本研究整理

根據上述表格的综合研究結果可以發現,其沒有加入新聞測詴的 NMSE 和 MAE 值分別為 0.506 與 0.213,有加入新聞測詴的 NMSE 和 MAE 值分別為 0.327 與 0.187;此即表示出當加入新聞資訊來評估預測台灣加權指數時,其誤差結果

(35)

會比沒有加入新聞資訊來的低。而沒有加入新聞資訊來評估台灣加權指數的 DS 值為 62.416,而當加入新聞資訊來評估台灣加權指數的 DS 值則上升到 70.469;

此即表示出當加入新聞資訊來評估台灣加權指數時,可以使得預測正確率上升 8%的正確率。沒有加入新聞資訊來評估台灣加權指數的 WDS 值為 0.5331,而 當有加入新聞資訊來評估台灣加權指數的 WDS 值則下降到 0.480;此即表示出 當加入新聞資訊來評估台灣加權指數時,可以使得預測誤差和方向的更加接 近。從以上的結果可以發現,當加入「新聞」此輸入變數時,倒傳遞類神經網 路明顯的可以提高其預測正確率。因此,對於台灣加權指數而言,「訊息面」的 發生,對於台灣加權指數是有很重要的影響。

圖 3 與圖 4 表示歷史新聞與台灣加權指數的走勢示意圖,而歷史新聞又分 為利多訊息與利空訊息,其表示時間為 2006 年 1 月 2 日至 2008 年 12 月 31 日 共三年;而每張圖的時間區隔為每半年,並區分為利多與利空。

圖 3 利多訊息與台灣加權指數走勢

圖 3 表示其研究時間為從 2006/01/02 到 2006/06/30,共六個月的時間。其 藍色線表示台彎加權指數得走勢圖,而粉紅色線表示新聞資訊對台灣加權指數

-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1

2006/01/02 2006/02/06 2006/03/06 2006/03/31 2006/04/28 2006/05/26 2006/06/23

台灣加權 利多

(36)

-0.9。當台灣加權指數的走勢於轉折點時,其利多訊息數量上的增加,對於台灣 加權指數的走勢有著明顯的正向影響。

4 利空訊息與台灣加權指數走勢

圖 4 表示其時間從 2006/01/02 到 2006/06/30,共六個月的時間。其藍色線 表示台灣加權指數得走勢圖,而黃色線表示新聞資訊對台灣加權指數有負面影 響的利空訊息。利空訊息其最大出現次數為 0.9,而最小出現次數為-0.9。當台 灣加權指數的走勢向下時,其利空訊息數量上的增加,因此,利空訊息對於台 灣加權指數的走勢有著明顯的正向影響。而從圖 3 與圖 4 的比較發現,當台灣 加權指數走勢向上時,利多訊息的數量明顯比利空訊息的數量來的多,反之亦 然。因此,可以了解到利多訊息與利空訊息有著負相關。

根據上述的研究結果,本論文研究可以發現股市未來走勢,跟過去歷史文 字資訊具有『某種關係』,是正確的。其當股市走勢向下時,則會發現利空消息 的數量會增加;而當期股市走勢向上時,則會發現較多的利多消息的產生。因 此,可以解釋成消息面與股市是呈現正向相關的。雖然在消息面上,對於消息 面的影響會隨著時間的移動呈指數性下降,我們並不具明確的佐證。但在直接 觀測上述圖表上的想法,可能解釋為每日波動的變異,單就經濟面、技術面,

-1 -0.8 -0.6 -0.4 -0.2 0 0.2 0.4 0.6 0.8 1

2006/01/02 2006/02/06 2006/03/06 2006/03/31 2006/04/28 2006/05/26 2006/06/23

台灣加權 利空

(37)

還來不及反應當日的變化。消息面的因素,在台灣股市還是佔有相當大的快速 影響。

(38)

第五章 結論與未來研究方向

第一節 結論

根據研究結果,可以顯示在 2006 年 1 月 2 日至 2008 年 12 月 31 日,台灣 股價總加權指數並不是完全隨機漫步的。對於每日收盤預測漲或跌,有 70.46%

的正確度可以掌握。這裡也顯示了基本面、技術面與消息面將是會影響股市,

透過倒傳遞類神經網路的學習,能夠獲得不錯的定性預測成效。

由於做的是預測,所以基本上就有許多不確定的變動因素。就製造業來說,

常需要預測市場不確定的需求。如果預測做的不準確或是市場變化太大,就只 能靠提高生產的彈性來因應。在做金融預測時,其實問題的本質很相近,靠著 類神經網路良好的適應能力,本研究建立持續變化的模型對未來做出預測。

但是關鍵則是在本研究建立的模型型態,是否足以將預測時期的變化,即 時地反映出。根據預測能力顯示,似乎單靠技術面與消息面,尚不足以在這樣 的移動比率中即時反應。加上消息面的變化,能夠有更好應付每日變化的能力。

最後,從本研究中可以發現股市未來走勢,跟過去歷史資訊是具有『某種 關係』的。根據研究結果顯示,當其當股市走勢向下時,則會發現利空消息的 數量會增加;而當期股市走勢向上時,則會發現較多的利多消息的產生。因此,

可以解釋成消息面與股市是呈現正向相關的。

第二節 後續研究方向

如前所述,現在網路預測正確率尚不理想。因此,為了提高正確率,在類 神經網路預測模型上有幾個改善的方向:

1、修改輸入變數,繼續實驗,找出對於股市預測更具影響的關鍵性因素。

2、引用其他影響台灣股市交易的資料於實驗中,如期指、匯市、利率等,並將 其非量化因素予以量化,做為輸入變數。

(39)

第三節 研究限制

股市出現的各種多空消息,包含了週期性和突發事件,以及一些謠傳耳語 等,對於投資人會造成一定程度的預期心理。例如:總統選舉的政治事件、雷 曼兄弟破產、兩岸開放等。由於事件發生是不連續且並少有週期性,很難事先 預知。但是,事件發生後,常會因事件的影響範圍、大小,而對股市造成一段 時間的影響。所有事件無法完全列舉,歷史未曾發生過的,雖然無法事先制定 完全應對的投資策略,但卻可以從事件的影響來判斷與推估中找出規則,更由 於事件的影響範圍、大小等因素,新聞事件是無法有效的量化的。因此,此類 的現象不在本研究的討論範圍。

(40)

參考文獻

王春笙(1996)。以技術指標預測台灣股市股價漲跌之實證研究-以類神經網路與 複回歸模式建構,未出版之碩士論文,交大資管所,新竹市。

卞志祥(1996)。台灣加權股價指數投資組合之基因演算法建構模型,未出版之碩 士論文,交大資管所,新竹市。

杒金龍(1993)。技術指標在台灣股市應用的訣竅,台北:非凡出版社。

杒金龍(1996)。基本分析在台灣股市應用的訣竅,台北:金錢文化。

邱志洲、謝邦昌(2000)。類神經網路分析,台北:曉原。

林萍珍(1998)。遺傳演算法在使用者導向的投資組合選擇之應用,未出版之碩士 論文,中央資管所,桃園縣。

林威廷(1995)。以總體經濟因素預測股票報酬率-類神經網路與多元回歸之比較 研究,未出版之碩士論文,交大資管所,新竹市。

林耀堂(2001)。遺傳程式規劃於股市擇時交易策略之應用,未出版之碩士論文,

中央大學資訊管理研究所,桃園縣。

周政宏(1995)。神經網路-理論與實務,台北:松崗圖書。

吳孟儒(2000)。以輸入資訊內涵觀點構建台灣股價指數類神經網路預測模式之研 究,未出版之碩士論文,義守大學管理科學研究所,高雄縣。

胡國瑜(1996)。類神經網路產業盈餘預測及其投資策略之研究-以電子電機及紡 織業為例,未出版之碩士論文,政大資管所,台北市。

陳建福(1995)。遺傳程式與市場擇時策略之研究:台灣股票市場的應用,未出版 之碩士論文,政大經研所,台北市。

曾思博(1999)。類神經網路於股價預測與資金配置之應用,未出版之碩士論文,

中央資管所,桃園縣。

(41)

曾淑青(1994)。應用類神經網路於台灣股票市場價量關係的預測與分析,未出版 之碩士論文,交通大學資管所,新竹市。

高梓森(1994)。台灣股市技術分析之實證研究,未出版碩士論文,國立台灣大學 財務金融研究所,台北市。

黃永成(1997)。應用遺傳演算法與模糊神經網路於股票預測模式之研究,未出版 之碩士論文,高雄工學院管理科學研究所,高雄市。

葉怡成(1993)。類神經網路-模式應用與實作,台北:儒林出版社。

鄧紹勳(1999)。遺傳演算法於股市擇時策略之研究,未出版之碩士論文,中央資 管所,桃園縣。

楊孟龍(2001)。類神經網路於股價波段預測與選股之應用,未出版之碩士論文,

中央大學資訊管理學系,桃園縣。

A. J. Frost & Robert R. Prechter(2002)。艾略特波浪理論-市場行為的關鍵,台 北:眾文出版社。

Allen, F., & Karjalainen(1999). R., Using Genetic Algorithms to Find technical Trading Rules., Journal of Finance Economics, 51, .245-271

Elder, J. F., IV & Finn,M. T., .Creating ‘Optimal Complex’ Models for Forcasting.

Financial Analysts Journal, January-February, 73-79,1991

Kim K., & Han I.(2000 ).Genetic algorithms approach to feature discretization in artificial neural networks for the prediction of stock price index, Expert Systems with Applications,19,125-132

Kimoto, T. & Asakwa, K(1990)Stock Market Predication System with Modular Networks, IJCNN-90-Wash, I, 1-6.

Phua, Hoh P. K., Ming Daohua, & Lin Weidon(2001). Neural Network With Genetically Evolution Algorithms for Stocks Prediction, Asia-Pacific Journal of Operation Research, 18(1) 103-108

(42)

Wong, F.S., Wang, P.Z., Goh, T.H. & Quck,B.K. (1992).Fuzzy Neural Systems for Stock Selection, Financial Analysts Journal, no. Jan-Feb, 47-52.

Yoon Youngohc., & Swales, George.(1991). Predicting StockPrice Performance: A Neural Network Approach, Proceedings of theTwenty-Fourth Annual Hawaii International Conference on SystemScience.

參考文獻

相關文件

• Give the chemical symbol, including superscript indicating mass number, for (a) the ion with 22 protons, 26 neutrons, and 19

This is especially important if the play incorporates the use of (a) flashbacks to an earlier time in the history of the characters (not the main focus of the play, but perhaps the

• Actually what Hawking said was, Event Horizon may not exist, the only thing real is the Apparent Horizon. • Apparent horizon can trap matter and lights, but as the BH

The observed small neutrino masses strongly suggest the presence of super heavy Majorana neutrinos N. Out-of-thermal equilibrium processes may be easily realized around the

Good joke tellers can add whatever they want to the joke as they tell it, but they clearly know the details of the beginning , mi ddle and ending of the joke.. It is also

• Contact with both parents is generally said to be the right of the child, as opposed to the right of the parent. • In other words the child has the right to see and to have a

This research is conducted with the method of action research, which is not only observes the changes of students’ creativity, but also studies the role of instructor, the

 The IEC endeavours to ensure that the information contained in this presentation is accurate as of the date of its presentation, but the information is provided on an