國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
第一章 、緒論
1.1 研究背景
上市櫃公司若發生經營不善問題,不僅會對公司內部有影響,也會對投資人 產生巨大傷害,引起金融秩序的混亂造成金融危機,並引發金融秩序的連鎖效 應,甚至會造成國內或國際性的金融危機,例如 2001 年的安隆案與 2008 年雷曼 兄弟的倒閉都造成了全球金融市場的大變動,嚴重影響了全球經濟的發展,然而 不只在國外,在我國近年來也發生很多震驚社會的金融弊案例如:知名的力霸 案、和近期(2017 年)被查緝的必翔實業涉及旗下子公司揚明實業對陸企不正常 放貸,都對國內的金融市場與投資人的信心造成巨大的衝擊,更是嚴重影響台灣 的經濟發展。所以,若能提早察覺公司的財務惡化,提早發覺公司可能發生問題 的癥兆,防微杜漸,對投資人發出警訊,降低公司經營失敗對金融市場的衝擊是 十分重要的,也對國際與國外的金融市場中,預防與降低其造成的傷害(吳琮璠,
2011)。
預警上市櫃公司的財務衰退已經是近十年來熱門的研究主題之一,因為不 僅僅影響到公司內部,也對股東投資人的權益有極大的影響,財務的不良甚至 擴及到一個國家的經濟(Wanke, Barros, & Faria, 2015)若管理者有一個良好 的財務預警系統,管理者就能及時制定決策來避免掉財務風險的發生,並減輕 投資人對公司財務狀況上的疑慮。
然而近幾年來大資料數據分析的興起,許多資料探勘的技術日新月異,在 資料探勘技術的幫助下,能讓我們更容易的理解成千上萬財務報表資料背後所 隱藏的資訊,並更進一步的分析財務新聞等非結構化的資料,運用這些巨量的 資料與技術讓我們能更精準的預警上市櫃公司是否有不良的財務狀況發生
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
1.2 研究動機
在財務領域中,有兩種重要的資訊:分別是軟資訊與硬資訊(Petersen, 2004),軟資訊代表的是非結構化的資料,例如財務新聞、市場評論與年報,
而硬資訊則代表結構化的數值資料,例如:股價與財務報表上的指標,在過去 財務與會計的研究中,大多數是以硬資訊也就是量化的財務資料做為分析問題 及解釋現象的變數,探討財務報表上會計數字上的內涵,而有關財務新聞的非 結構化的資訊則較少去探討,然而在非結構化的財務新聞中也蘊藏著許多豐富 的資訊可供利用。
在國外運用文本分析(textual analysis)於財務及會計上的研究正在成 長,以公司的 10-k 年報與財經社交網站上的發文與評論作為財務現象的指標,
觀察其對公司財務狀況之影響,文本分析包含了主題分析、語意分析、句構分 析與情緒上的分析,Cecchini, Aytug, Koehler, and Pathak (2010)發現文 本資訊較數量資訊有競爭性,若能將文件與數量資訊合併分析,因其具有互補 性而可以呈現出最好的結果。
而在華語系國家,很少研究中文文字資訊的內涵,也沒有像英語系國家文 字分類系統,也缺乏財經方面專業的情緒字庫,導致在國內發展的財務預警模 型大多只以數值化的指標當作變數進行預測如:以 z-score 模型中國新能源公 司的經濟狀況(Tongshui & Yanli, 2015)、採用三種分類方法:類神經網路、
決策樹、支援向量機,比較三種方法得預警準確度(Geng, Bose, & Chen, 2015),因此本研究根據(吳琮璠,2011)之研究擴增專業的財經中文情緒字庫,
並以文字探勘的技術探索文本資料對於財務預警系統間的關係,進而比較不同 演算法的財務預警準確率。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
1.3 研究目的
由於企業的財務狀況深深影響到投資人與國家的經濟發展,經由上述背景 與動機的討論,整理出來的研究目的有以下三點:
1. 根據 2000 年 altman 所提出的財務預警模型(zeta 模型)七大類財務報表 指標為基礎做擴充,根據台灣上市公司的財務報表資訊,以結構化的財務 報表比率建立模型,藉由模型來預測出台灣上市公司近幾年的財務狀況,
並根據結果做出警示。
2. 現今的財務年報與財經新聞當中都是非結構化的文本資料,然而這些資料 也蘊藏著許多資訊,在過往的財務預警研究中較少著墨到這一塊,因此本 研究模型也考慮到非結構化的文本資料做情緒分析,根據過往一季的新聞 評論來預測公司是否面臨著倒閉危機。
3. 使用邏輯式回歸、隨機森林、隱藏式馬可夫模型結合情緒分析來提升財務 預警系統預測的準確度。
1.4 研究方法
在本研究中,在文本情緒分類方面採用監督式學習的方式判斷文章情緒的 正負,採用三種分類演算法(SVM、KNN、Naive Bayes)建立情緒分類器,比較 其分類演算法的好壞,並以邏輯式回歸的方式建立財務預警模型,因樣本數屬 於小樣本的抽樣,所以亦用 bootstrap 的隨機採樣的隨機森林演算法,來比較 以邏輯式回歸所建立的財務預警模型,然而為了更精準的觀察財務狀況長期的 波動,本研究建立「隱馬可夫模型」(HMM)來比較其是否會提高模型的預測能 力。
在結構化的財務數值指標方面,採用 2000 年 altman 所提出的財務預警模 型(zeta 模型)七大類財務報表指標為基礎做擴充,以結構化的財務比率建立模
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
1.5 研究架構
本篇研究架構總共有 5 個章節如圖 1.1 所示,第一章為緒論在緒論中將討論 研究背景、動機與目的,說明此研究主題的重要性;第二章將針對與本篇研究相 關的主題與方法進行文獻探討;第三章將會介紹本研究的研究方法與所建立的模 型;第四章為實驗的設計與結果的評估;第五章將討論此研究的貢獻與結論及未 來研究方向的建議。
圖 1.1 研究架構