• 沒有找到結果。

5-1 結論與建議

一.Apriori 挖掘概念股與 T 檢定驗證

本研究使用文字探勘技術將新聞做處理後,再以關聯法則做階層式 Apriori 分析(第一階段 minsupport:0.5&第二階段 minsupport:0.3),挖掘出新聞中隱藏 的蘋果相關概念股:鴻海、大立光、台積電、玉晶光&台郡並以 T 檢定驗證概念 股與大盤共同移動程度之差異, 發現此五檔股票相較於大盤有較高的共同移動 性,發現此五檔股票相較於大盤有較高的共同移動性,因此本研究將此五檔股票 歸納為蘋果概念股。

依據本研究方法找尋概念股,相對一般報章雜誌有較嚴謹的方法證實所找出 的概念股具有關連性。

二.輿情分析找尋目標個股選擇與尋找領先(影響)天數

找出蘋果相關概念股後,本研究再以輿情分析計算概念股的每日情緒,並以 技術指標-周移動平均對歷史股價做處理,將情緒與移動平均做相關係數比對,

做進一步的挑選(最低相關係數 0.7)得到:鴻海、玉晶光,作為預測目標。

將鴻海及玉晶光設為預測目標後,本研究將每日情緒做位移處理,發現處理 後的情緒與此兩檔股票的移動平均歷史股價,於 0~3 天內有相當大的相關性,

因此推斷情緒領先(影響) 0~3 天。依本研究方法選擇目標概念股及找尋影響天 數,相對於股市名嘴有較多的依據證明相關性。

57

三.SVM 模型指數選擇及切割%數檢定

本研究將國際指標、總體經濟及技術指標作為參考指數以建立滾動式 SVM 模型預測每段 SVM 後 3 天之台積電及玉晶光漲跌,並以 T 檢定做驗證發現,

以 70%做為切割方法之預測率較高,因此本研究以 70%作為後續 SVM 模型修 改之基準。

四.SVM 預測模型建立與修改&推薦

本研究將國際指標、總體經濟及技術指標作為參考指數的 SVM 模型,加入 本研究之操作變數:蘋果股價或新聞輿情及兩者,重新建立滾動式 SVM 預測 模型。結果發現加入新聞輿情後的 SVM,其預測率相較於其他變數上升許多,

從中本研究推斷:新聞輿情對於股價預測有相當的助益。此外透過上章 SVM 模型結果顯示,以本研究方法建立 SVM 預測台積電與玉晶光相比,預測台積 電有較好的預測準確率。

因此本研究推薦以蘋果概念股為投資方向時,應選擇常被新聞媒體與蘋果公 司一同提到、與蘋果相關概念股新聞輿情有較高的相關系數及相關指標建立 SVM 預測模型有較高準確率的概念股-台積電,作為投資標的。

58

5-2 後續研究

本研究透過文字探勘技術找尋概念股,再以輿情分析探討相關概念股之新聞,

最後再將新聞輿情與國際指標、總體經濟、分析指標建立 SVM 模型預測,期望 能給予投資者一個較有依據地選擇概念股、較可信的基準篩選概念股&較準確的 模型以預測未來股價之漲跌。而經過實驗結果的分析,本研究仍有改善之處,如 下:

一.新聞來源多樣性:

過去研究中顯示,國內投資人投資有其從眾性於陳志宏(2007),而在新聞消 息發布後,一般散戶會參考其資訊,調整其投資行為(呂岳峰 2008);未來可以抓 取多家國內外媒體有關於蘋果公司的相關新聞,擴充新聞來源及數量,更了解一 般大眾之輿情。

二.概念股選擇探討

本研究目前參考證卷投顧報告所列出的概念股作為候選概念股群,再以關聯 分析找出與蘋果概念股共同出現在新聞之台股,投顧報告有其參考價值;但未來 可針對供應鏈作探討,找群較佳的概念股群作為分析標的。

三.建立財金詞庫與權重探討:

本研究採取 NTUSD 之字詞庫做輿情比對,若詞彙比對正面詞庫則+1、若詞 彙比對付面詞庫則-1,依此方式分析每篇新聞輿情數值;然而每個文字對不同種 類文章之重要性及權重有所不同,因此未來可透過文字探勘技術探討蘋果新聞中 的字詞來擴充詞庫以建立專屬財金詞庫並計算各詞彙之權重。

59

四.SVM 相關指數相互影響性探討

由過去研究發現,本研究所選取的十個指數:道瓊、S&P500、NASDAQ、

匯率、外匯存底、消費者信心指數、消費者物價指數、RSI、MACD&KD 對股價 有影響性及對股價預測有助益。但影響股市之指數有非常多種,因此未來可以針 對指數的影響性做進一步的探討,找尋出較佳的指數組合以提升 SVM 預測準確 率。

五.提升預測準確率:

本研究目前採取操作變數(新聞輿情)、國際指標、總體經濟指標及技術指標 以建立 SVM 預測模型,其結果為判斷滾動型態 SVM 未來 3 天內股價之漲/跌,

無法得知相關的漲幅。未來可以再搭配 SVR 預測股價之漲跌幅,希望能更精準 的預測股價之波動。

60

參考文獻

英文文獻

Alexander Pak, Patrick Paroubek (2010).Twitter as a Corpus for Sentiment Analysis and Opinion Mining.

Ahmad, K., Oliveira, P. C. F. D., Manomaisupat, P., Casey, M. & Taskaya, T. (2002).

Description of events: An analysis of keywords and indexical names. Proceedings of the third international conference on language resources and evaluation, LREC 2002:

Workshop on event modeling for multilingual document linking, 29-35.

Chen Keh-Jiann and Liu Shing-lluan (1992). Word Identification For Mandarin Chinese Sentence,Proceeding of Fifth International Conference on Computational Linguistics ,P101~P107.

Feldman, R. (2013). Techniques and applications for sentiment analysis. Commun.

ACM, 56(4), 82-89.

Li, N., & Wu, D. D. (2010). Using text mining and sentiment analysis for online forums hotspot detection and forecast. Decision Support Systems, 48(2), 354-368.

R.Agrawal and R.Srikant.(1994) Fast algorithm for mining association rules”,in Proc.

1994 Int. Conf. Very Large Data Bases (VLDB’94), pp. 487-499.

61

R.Sproat and C.Shih.(1990) A Statistical Method For Finding Word Boundaries In Chinese Text,Processing of Chinese and Oriental Languages,P336-P351.

Robert P. Schumaker and Hsinchun Chen.(2006)Textual Analysis of Stock Market Prediction Using Breaking Financial News: The AZFinText System,Americas Conference on Information Systems.

Turney, P. D. (2002).Thumbs up or thumbs down?: semantic orientation applied to

unsupervised classification of reviews. Paper presented at the Proceedings of the 40th

Annual Meeting on Association for Computational Linguistics, Philadelphia, Pennsylvania.

中文文獻

伍尚文,台指選擇權及期貨操作之研究-運用買賣權結構比例及週技術指標,台 灣科技大學,財務金融碩士論文,2006

呂岳峰,股市資訊對散戶投資者與外國機構投資者交易行為的影響,台北科技大 學,商業自動化與管理研究所碩士論文,2008

吳振和,應用文件探勘技術於概念股股價共同之研究,國立政治大學資訊管 理學系研究所碩士論文,2011

李家政,利用關聯法則探勘個股之間的關聯性,大同大學,資訊工程研究所碩士 論文,2009

62

李晉寧,台灣股票市場從眾行為探討暨分量回歸應用,中山大學,財務管理學系 研究所碩士論文,2010

何彥慶,九零前後,台股加權股價指數與美國道瓊工業指數、日本股價指數的連 動關係之研究,成功大學,企業管理學系研究所碩士論文,2001

林澄源,概念股宣告對股價異常報告之研究,開南大學企業與新管理學系碩 士論文,2008

林育龍,對使用者評論之情感分析研究-以 Google Play 市集為例,政治大學,資 訊管理研究所, 2014

林揚書,網際網路新聞文章心情偵測之研究,交通大學,資訊管理學系研究所碩 士論文,2009

林煜城,S&P500 指數期貨與 NASDAQ 指數期貨之關聯性及波動外溢與跳躍現 象之探討-VEC-GAECG 模型建立及避險比率與績效評估,台北大學,國際企業 研究所碩士論文,2008

高麗萍、謝佳臻&邵姵雅,新產品宣告對供應鏈廠商股價影響之研究- 以蘋果 iPad 與 iPhone 宣告為例,管理資訊計算期刊 2014,

張獻文,概念股之共同移動研究-已任天堂遊戲機『Wii』概念股為例,雲林科技 大學企業管理碩士倫文,2007

63

張偉諒,消費者信心指數與台灣股票市場相關性之研究,中央大學,財務金融學 系碩士在職專班碩士論文,2007

張瑛淑,台股指數、美國指數的預測及兩者關聯性分析,屏東教育大學,應用數 學系碩士論文,2010

陳伯仁,證券交易策略發掘,中央大學資訊管理學系研究所碩士論文,2002

陳志宏,台灣股市從眾行為之分析,中山大學,財務管理學系研究所碩士論文,

2007

陳思蒨,股市從眾效應:以台灣股市為例,淡江大學,財務金融學系碩士在職專 班論文,2014

陳鳳琴,台灣股匯市與美國股市連動性之在探討,中華管理評論國際學報第 15 卷 2 期,2012

陳玟志,RSI 與威廉指標於台灣加權指數操作績效實證,輔仁大學,金融與國際 企業學系金融碩士在職專班論文,2013

許溪南、何怡滿與張瓊如,KD 與MA 技術指標在避險時機之應用:以台指選擇 權為例,輔仁管理評論,第十九卷第一期,2012

游合正,領域相關詞彙極性分析及文件情緒分類之研究,國立台灣大學資訊工程 學系研究所碩士論文,2012

64

喻欣凱,運用支援向量機與文字探勘於股價漲跌趨勢之預測,輔仁大學資訊 管理學系研究所碩士論文,2008

葉文華,運用文字探勘在財經新聞內容即時偵測股價反轉時點之研究,元智大學 資訊管理學系研究所碩士論文,2011

楊惠淳,以客觀分析與相互資訊檢索探討情感分析之準確度-以電影評論為例,

台北科技大學資訊與運籌管理學系研究所碩士論文,2011

鄒函升,新聞輿情與民意偵測追蹤之研究-大資料之研究取向,政治大學,資訊 管理學系研究所碩士倫文,2014

蔡正修,台灣上市電子類股股價指數走勢預測之研究,成功大學,統計學研究所 碩士論文,2007

鄧俊明,台灣地區股價指數、利率、匯率與消費者物價指數相關性之研究,世新 大學,經濟學研究所,2012

謝中琮&李淑麗,國際資金流動對我國股票市場的影響,經濟研究處,2001

相關文件