• 沒有找到結果。

立 政 治 大 學

Na tiona

l Ch engchi University

第五章 結論與建議 第一節 研究結論與貢獻

首先先簡單回顧第四章三個實驗的結果,實驗一是針對各上市公司的新 聞做新聞分類,透過技術指標與關鍵字來提高分類能力,其分類結果皆達到 預期目標,整提投資準確率在 0.55 至 0.658 之間,然而在檢視投資正確率時 會發現,台積電的下跌投資正確率與鴻海的上漲投資正確率偏低,導致此結 果的原因除了兩間公司本身的新聞量略少外,台積電的整個新聞取樣期間內 的股價是呈現穩定上漲趨勢,鴻海的股價則是持續下探趨勢,因此,兩間公 司在下跌與上漲的新聞量確實較為不足,分類能力因此受到影響。

而為了提高少量新聞在投資預測上的準確率,因此本研究提出了將上漲 與下跌分類內的新聞再做分群之方法,藉由專注於重要群集內之新聞與股價 間的關係來預測未來股價,從實驗二的結果我們可以發現,當我們將注意力 從類別內的大量新聞,轉移至類別內與漲跌幅相關度較高群集之小量新聞時,

各公司之整體投資準確率提高約 15%~30%,最高準確率來到 0.846,這也呼 應著注意力有限之理論(Peng and Xiong, 2006),當我們專注力由大量資料移 往小量重要資料時,其預測能力將會大幅提升,而這正是資料探勘之精隨所 在:從大量資料內找出(小量)有價值的資訊。

本研究的另外一個重點即是企圖跳脫針對股價漲跌幅度與趨勢的預測,

而是找出漲跌轉折的關鍵點所在,進而提供投資人一個準確的進場操作時機 點,實驗三便是對此目的所做的研究,其研究結果顯示依照轉折點預測結果 進場投資,在 7 交易日的操作規則下,可以在風險極低的前提下獲得 2.82%

至 17.68%不等的投資報酬率,另外視投資人操作手段,在此預測模型之下可 獲得的最高投資報酬率為 22.03%,無論是股市新手或是老手,皆能在此預測

53

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

模型的協助之下提高能獲取的投資報酬率。

檢視所有研究之結果後,本研究之貢獻可歸納為以下五點:

1. 透過個股新聞對於股價之分析,證實新聞資訊的發布確實會影響股價,且 本研究之預測模型確實能提供有效的獲利模式,也證實台灣股票市場介於 弱式與半強式效率市場之間的假設成立。

2. 透過技術分析指標與關鍵詞之輔助,確實能有效提高新聞之分類能力。

3. 透過類別內的分群結果,能找出各群集與股價漲跌幅之間的關係,而與股 價漲跌幅相關程度較高之群集,能提供比分類結果更高的投資正確率。

4. 透過與股價漲跌幅相關程度較高之群集所做的轉折點預測,能夠提供明確、

高成功率且高報酬率的獲利模式,能夠確實的幫助注意力有限之投資人在 短期內,穩當的獲取高額報酬。

5. 由 3、4 兩點,可得知先分類再分群之方式,對於投資預測有顯著的幫助。

54

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

第二節 未來方向與建議

本研究參考許多過往學者之研究方法與結果,試圖提出一個新的預測模型:

在新聞分類後針對類別內再做分群,希望不僅是提高在股價漲跌預測的能力,

並能提供一個擁有明確的進出場時間點的投資模式,幫助投資人在台灣股市的 投資上能夠成功且穩當的獲取投資報酬,迅速的累積個人財富。而針對實驗數 據上的不足,未來的改進方向則是已蒐集更多新聞資料為最重要,最好是能夠 經歷幾段股價漲跌轉折,如此才能夠健全分類能力,並提供更佳的分群結果與 轉折點預測能力。

而本研究的重點雖然在於新的預測模式上之建立,但其結果不僅只是股價 預測能力,投過類別內分群之後所得到重要群集之結果,可利用來建立股價相 關漲跌之詞庫,在未來如果能夠擁有更龐大的新聞資料,我們可以針對各群集 的關鍵詞彙做漲跌幅度權重之設定,對於往後新聞分析而言,我們只需針對斷 詞結果做兩個步驟:排除無關詞彙(原持平類別內之詞彙)與計算漲跌相關詞彙之 權重,透過這兩個步驟即可得出該則新聞可能會對股價造成漲跌幅之影響,而 轉折點分析只要針對每篇新聞做累加統計即可。

55

20. 曾憲雄、蔡秀滿、蘇東興、曾秋蓉、王慶堯(2005),資料探勘(Data Mining),

旗標出版社。

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

25. 廖述賢、溫智皓(2009),資料採礦與商業智慧,雙葉書廊。

26. 蔡瀚賢(2000),成交量放大訊號及技術指標綜合策略在台灣股市之實證 研究,國立成功大學企業管理學系碩士論文。

27. 歐智民(2011),整合文件探勘與類神經網路預測模型之研究-以財經事件 線索預測台灣股市為例,國立政治大學資訊管理研究所碩士論文。

28. 戴尚學(2003),運用事件偵測與追蹤技術於中文多文件摘要之研究,國 立雲林科技大學資訊管理系碩士論文。

29. 盧廷當(1996),以參考成交量之濾嘴法則檢定資本市場弱勢效率性—台 灣股票市場之實證研究,國立交通大學管理科學研究所碩士論文。

30. 賴勝章(1990),台灣股票市場若是效率性實證研究─以技術分析檢驗,國 立臺灣大學商學院研究所碩士論文。

58

1. Ahmad, K., Oliveira, P., Manomaisupat, P., Casey, M. & Taskay, T.

(2002).Description of Events: An Analysis of Keywords and Indexical Names, ThirdInternational Conference on Language Resources and Evaluation, LREC 2002:Workshop on Event Modelling for Multilingual Document Linking, p29-35.

2. Berry, M.J.A., and Linoff(1997), L. “Data Mining Techniques: For Marketing, Sales, and Customer Support,” John Wiley & Sons, Inc.

3. Chen, K. J., Kiu, S. H. (1992). Word Identification for Mandarin Chinese Sentences. Fifth International Conference on Computational

Linguistics,101-107.

4. Christopher D. Manning, Prabhakar Raghavan and Hinrich Schütze(2008), Introduction to Information Retrieval, Cambridge University Press.

5. Elliott, R. K., and P. D. Jacobson., (1994).“Costsand Benefits of Business InformationDisclosure”, Accounting Horizons, Vol. 8,80-96.

6. Fama, E. (1970). “Efficient Capital Markets: A Review of Theory and Empirical Work”,Journal of Finance, Vol.25, p.383-417

7. Granville, Joseph E. (1960). A Strategy of Daily Stock Market Timing for Maximum Profit, Englewood Cliffs: Prentice-Hall, Inc.

8. Ham, J. & Kamber, M. (2001).Data Mining: Concepts and Techniuqes.

Morgan Kaufmann Publishers, San Francisco, CA

9. Ham, J. & Kamber, M. (2006). Data Mining: Concepts and Techniques, 2nd, Morgan Kaufmann Publishers

10. Hand,D.J.,Blunt,G., Kelly, M.G. & Adams,N.M.(2000).Data Mining for fun and profit.Statistical Science,15(2),111-131

59

11. Keim, D. A., Panse, C., Sips, M., North, S. C.(2004). Pixel based visual data mining of geo-spatial data, Computers & Graphics, Vol 28, 327–344.

12. L da F Costa, P R Villas Boas, F N Silva and F A Rodrigues. (2010). A pattern recognition approach to complex networks, Journal of Statistical Mechanics: Theory and Experiment Vol 2010, Nov 2010.

13. Lavrenko, V., M. Schmill, D. Lawrie, P. Ogilvie, D. Jensen, and J. Allan (2000). “Mining of concurrent text and time series. ” In: Proceedings of the 6th international conference on knowledge discovery and data mining, pp.37-44.

14. Mittermayer, M. A. (2004). “Forecasting intraday stock price trends with text mining techniques. ” Proceedings of the 37th Hawaii international conference on system sciences, pp.64-73.

15. Nie, Jian-Yun, Brisebois, Martin & Ren, Xiaobo (1996). On Chinese Text Retrieval. Conference Proceedings of SIGIR, pp.225-233.

16. Peng, L. and Xiong, W. (2006). “Investor Attention, Overconfidence and Category Learning,” Journal of Financial Economics 80, 563-602.

17. Samuelson, Paul A. (1965). Proof That Properly Anticipated Prices Fluctuate Randomly ,. Industrial Management Review, Vol.6, p.41-49.

18. Salton, G., Wong, A. & Yang, C. S. (1975). A Vector Space Model for Automatic Indexing.

19. Sebastiani, F. (2002). Machine learning in automated text categorization.

ACM Computing Surveys, 34(1), p1-47.

20. Sproat, R, Shih , C., (1990). A Statistical Method for Finding Word

Boundaries in Chinese Text. Computer Processing of Chinese and Oriental Languages,336-351.

60

‧ 國

立 政 治 大 學

Na tiona

l Ch engchi University

21. Sullivan, D. (2001). Document warehousing and text mining: techniques for improving business operations, marketing and sales. Wiley, New York.

22. Yang , Yiming, Lin, Xin (1999). A Re-examination of Text Categorization Methods. Proceedings of the 22nd Annual International ACM-SIGIR Conference on Research and Development in Information Retrieval, pp.12-29.

23. Yang, Y., Ault, T., & Pierce, T. (2000). Improving Text Categorization Methods for Event Tracking. Proceedings of the 23rd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, pp.65-72.

61

相關文件