• 沒有找到結果。

中 華 大 學

N/A
N/A
Protected

Academic year: 2022

Share "中 華 大 學"

Copied!
107
0
0

加載中.... (立即查看全文)

全文

(1)

中 華 大 學 碩 士 論 文

題目:結合 SVD 與模糊叢集分群法於財務危機之預測

Financial Crisis Prediction by Hybrid SVD Method and Fuzzy Clustering

系 所 別:資訊工程學系碩士班 學號姓名:M09502035 許永慶 指導教授:周智勳 博士

中華民國 99 年 1 月

(2)

I

摘 要

本論文針對公司財務危機預測模型進行研究,主要內容包括(特徵)財務變數篩選及 預測模型建立。

在財務變數篩選方面,本論文結合 Singular Value Decomposition(SVD)與模糊叢集 分群法(FCM)對財務資料進行統計分析,篩選出其代表性的財務變數。在建立預測模型 方面,本論文用三種預測模式包括 FCM,倒傳遞神經網路(BPNN)及線性區別分析(LDA),

並與特徵篩選方法結合進行比較。

實驗樣本的選取是以 1991~2006 年間被證卷交易所判定為全額交割股或下市的 125 間危機公司與 375 間正常公司為實驗的對象。在半年報的實驗對象是以 109 間危機公司 327 間正常公司作實驗對象。另外也將半年報與一年報的樣本分別代入作實驗,在實驗 的結果,我們發現只有在使用半年報的 FCM 在辨識率方面有稍微的提升,半年報對 BP 與 LDA 第二種方法辨識率的影響不大。

(3)

II

ABSTRACT

In this thesis, the prediction model for bankruptcy is studied, which includes the extraction of fincial variables and the establish of prediction model.In the variable extraction, this study integrals the singular value decompostition (SVD) and the fuzzy c-mean (FCM) clustering algorithm to analysis the financial data to extract representatize financial variables.In the establish of prediction model, three models include FCM, Back-propagation neural network and Linear Discriminate Analysis (LDA) are applied.

Two types of financial data, one-year and half-year, are applied in the experiment.The results show that the proposed financial variables extraction method, when combinating with the FCM prediction model, achieves the best results no matter which type of data is applied.

(4)

III

致 謝

在研究所的這一段時間,感謝實驗室的同伴陪我走過了這一段漫長而辛苦的歲月,

在我能力不足的情況下,經過於實驗室同伴們與老師的討論,使得我突破了我自己的瓶 頸。謝謝老師努力不懈的指導,才有今日的我。感謝朋友、學弟、學妹與實驗室的同伴 在我研究之餘,可以陪我談天說笑,讓煩悶的心情一掃而空。感謝女友在我憤怒難過的 時候給我安慰。

感謝家人對我的支持,無論是精神與物質上的支援,讓我有勇氣繼續從研究所念下 去,念了三年半,已經快等於再念一個大學學位了,這麼久的時間,讓我真的萬念俱灰,

所幸有以上的助力讓我完成了這個艱辛的研究所之路。另外要特別感謝的是銘傳大學財 金系的助理候信安,提供我台灣經濟新報半年報的資料,使得我能研究半年報對財務預 測的影響。感謝口試委員韓欽銓教授、石昭玲教授、李建興教授、李遠坤教授與周智勳 教授的寶貴意見,使這篇論文更臻完整。

要感謝的人真的太多了,如果在感謝的名單中有所遺漏的,請原諒我的疏忽。幫助 我的人,我將來必定以吃人一口,還人一斗的精神來報答你們的。謝謝愛我的人與我愛 的人,因為有你們,我才得以展翅遨翔迎向人生的另一個階段,感謝你們。

許永慶 謹誌於 中華大學資訊工程研究所 民國 99 年 2 月

(5)

IV

目 錄

摘 要 ... I ABSTRACT ... II

致 謝 ... III 目 錄 ... IV 圖 目 錄... VI 表 目 錄... VIII

第一章 緒論... 1

1.1 研究背景與動機 ... 1

1.2 研究目的 ... 3

1.3 章節結構 ... 3

第二章 文獻探討 ... 4

2.1 相關研究 ... 4

2.2 研究問題定義 ... 10

第三章 資料前處理與財務變數篩選 ... 12

3.1 樣本資料收集與資料前處理 ... 13

3.1.1 公司樣本選取與分組 ... 13

3.1.2 正規化 ... 14

3.2 變數篩選方法 ... 15

3.2.1 以 FCM 篩選變數 ... 17

3.2.2 結合 SVD 與 FCM 篩選變數 ... 20

第四章 財務危機預測模型 ... 24

4.1 線性區別分析 (L

INEAR

D

ISCRIMINANT

A

NALYSIS

, LDA) ... 24

4.2 倒傳遞類神經網路(B

ACK

-P

ROPAGATION

N

EURAL

N

ETWORK

) ... 29

4.3 模糊叢集分群法(F

UZZY

C M

EAN

, FCM) ... 32

第五章 實驗分析 ... 36

5.1 實驗參數設定 ... 36

5.2 FCM 篩選變數實驗比較 ... 37

5.3 加入 SVD 的實驗結果 ... 42

5.3.1 結合 SVD 與篩選變數方法 1 實驗結果 ... 42

(6)

V

5.3.2 結合 SVD 與篩選變數方法 2 實驗結果 ... 56

5.4 使用半年報的實驗結果 ... 69

5.4.1 半年報與年報篩選變數方法 1 實驗結果比較... 69

5.4.2 半年報與年報篩選變數方法 2 實驗結果比較... 74

5.4.3 半年報與年報篩選變數方法 1 加 SVD 的實驗結果比較 ... 79

5.4.4 半年報與年報篩選變數方法 2 加 SVD 的實驗結果比較 ... 84

第六章 結論與建議 ... 89

6.1 結論 ... 89

6.2 未來展望 ... 90

參考文獻 ... 91

附錄一 ... 93

線性區別分析(Linear Discriminant Analysis,LDA) ... 93

附錄二 ... 95

財務變數說明 ... 95

(7)

VI

圖 目 錄

圖 1-1 財務危機預測模型 ... 1

圖 2- 1 EBM model 架構流程圖[15] ... 6

圖 2- 2 EGP+MEP 架構圖[14] ... 7

圖 2- 3 財務危機預測決策樹模型[7] ... 7

圖 2- 4 DAG 圖[8] ... 8

圖 2- 5 利用貝氏網路預測財務危機流程圖[8] ... 8

圖 2- 6 基因演算法混合 FCM 分群法財務危機預測流程圖[19] ... 10

圖 2- 7 方法流程圖 ... 11

圖 3- 1 財務危機預測之方法流程圖 ... 12

圖 3- 2 篩選變數細部流程圖 ... 16

圖 3- 3 方法流程圖與分組示意圖 ... 17

圖 3- 4 分組後計算變異數說明圖 ... 18

圖 3- 5 矩陣重建流程圖 ... 20

圖 4- 1 LDA 原理示意圖 ... 25

圖 4- 2 LDA 流程說明圖 ... 25

圖 4- 3 LDA 作財務危機預測流程圖 ... 28

圖 4- 4 倒傳遞類神經網路作財務預測流程圖 ... 30

圖 4- 5 倒傳遞類神經網路運作說明示意圖 ... 31

圖 4- 6 FCM 作財務危機預測流程圖 ... 32

圖 4- 7 正常群與危機群的判斷示意圖 ... 34

圖 4- 8 破產群與正常群示意圖 ... 35

圖 5- 1 35-25 組篩選變數方法 1 與方法 2 總辨識率折線圖比較 ... 38

圖 5- 2 40-20 組篩選變數方法 1 與方法 2 總辨識率折線圖比較 ... 39

圖 5- 3 45-15 組篩選變數方法 1 與方法 2 總辨識率折線圖比較 ... 40

圖 5- 4 50-10 組篩選變數方法 1 與方法 2 總辨識率折線圖比較 ... 41

圖 5- 5 35-25 組篩選變數方法 1 加入 SVD 總辨識率折線圖比較 ... 51

圖 5- 6 40-20 組篩選變數方法 1 加入 SVD 總辨識率折線圖比較 ... 52

圖 5- 7 45-15 組篩選變數方法 1 加入 SVD 總辨識率折線圖比較 ... 53

圖 5- 8 50-10 組篩選變數方法 1 加入 SVD 總辨識率折線圖比較 ... 54

圖 5- 9 35-25 組篩選變數方法 2 加 SVD 辨識率折線圖比較 ... 64

圖 5- 10 40-20 組篩選變數方法 2 加 SVD 辨識率折線圖比較 ... 65

圖 5- 11 40-20 組篩選變數方法 2 加 SVD 辨識率折線圖比較 ... 66

圖 5- 12 50-10 組篩選變數方法 2 加 SVD 辨識率折線圖比較 ... 67

圖 5- 13 35-25 組半年報與年報篩選變數方法 1 總辨識率折線圖比較 ... 69

(8)

VII

圖 5- 14 40-20 組半年報與年報篩選變數方法 1 總辨識率折線圖比較 ... 70

圖 5- 15 45-15 組半年報與年報篩選變數方法 1 總辨識率折線圖比較 ... 71

圖 5- 16 50-10 組半年報與年報篩選變數方法 1 總辨識率折線圖比較 ... 72

圖 5- 17 35-25 組半年報與年報篩選變數方法 2 總辨識率折線圖比較 ... 74

圖 5- 18 40-20 組半年報與年報篩選變數方法 2 總辨識率折線圖比較 ... 75

圖 5- 19 45-15 組半年報與年報篩選變數方法 2 總辨識率折線圖比較 ... 76

圖 5- 20 50-10 組半年報與年報篩選變數方法 2 總辨識率折線圖比較 ... 77

圖 5- 21 35-25 組半年報年報篩選變數方法 1 加 SVD 總辨識率折線圖比較 .. 79

圖 5- 22 40-20 組半年報年報篩選變數方法 1 加 SVD 總辨識率折線圖比較 .. 80

圖 5- 23 45-15 組半年報年報篩選變數方法 1 加 SVD 總辨識率折線圖比較 .. 81

圖 5- 24 50-10 組半年報年報篩選變數方法 1 加 SVD 總辨識率折線圖比較 .. 82

圖 5- 25 35-25 組半年報年報篩選變數方法 2 加 SVD 總辨識率折線圖比較 .. 84

圖 5- 26 40-20 組半年報年報篩選變數方法 2 加 SVD 總辨識率折線圖比較 .. 85

圖 5- 27 45-15 組半年報年報篩選變數方法 2 加 SVD 總辨識率折線圖比較 .. 86

圖 5- 28 50-10 組半年報年報篩選變數方法 2 加 SVD 總辨識率折線圖比較 .. 87

(9)

VIII

表 目 錄

表 1-1 財務危機定義整理表 ... 2

表 3- 1 分組意義示意圖 ... 13

表 3- 2 分組後公司資料 ... 14

表 3- 3 簡化過的原始資料 ... 15

表 3-3( 1) 未進行 SVD 運算的原始矩陣 ... 21

表 3-3( 2) 計算交互乘積矩陣 ATA ... 21

表 3-3( 3 ) 特徵值矩陣 ... 22

表 3-3( 4 ) V 矩陣特徵向量 ... 22

表 3-3( 5 ) Singular value 矩陣 ... 22

表 3-3( 6 ) U 矩陣特徵向量 ... 23

表 3-3( 7 ) 得到重建後的矩陣 ... 23

表 4-1( 1 ) LDA 實作原始資料表 ... 26

表 4-1( 2 ) LDA 實作計算總平均表 ... 26

表 4-1( 3 ) LDA 實作計算組平均表 ... 26

表 4-1( 4 ) LDA 實作組內差異矩陣 ... 26

表 4-1( 5 ) LDA 實作組內差異矩陣 Eigenvalue 表 ... 26

表 4-1( 6 ) Eigenvector 矩陣 ... 27

表 4-1( 7 ) LDA 實作組平均-總平均表 ... 27

表 4-1( 8 ) LDA 實作 0 組與 1 組矩陣相乘表 ... 27

表 4-1( 9 ) LDA 實作組間差異矩陣表 ... 27

表 4-1( 10 ) LDA 實作組內差異矩陣特徵矩陣表與特徵向量表 ... 27

表 4-1( 11 ) 選取特徵值表 ... 28

表 4-1( 12 ) LDA 實作主軸轉換矩陣相乘表 ... 28

表 4-1( 13 ) LDA 實作計算群體特徵值 ... 28

表 4- 2 原始的公司資料 ... 34

表 4- 3 已經過分群原始矩陣 ... 34

表 4- 4 分群後的辨識結果 ... 35

表 5- 1 FCM 群數設定 ... 36

表 5- 2 LDA 篩選變數參數實驗 ... 37

表 5- 3 35-25 組篩選變數方法 1 與方法 2 總辨識率比較表 ... 38

表 5- 4 35-25 組篩選變數方法 1 與方法 2 正常與危機公司辨識率比較表 ... 38

表 5- 5 40-20 組篩選變數方法 1 與方法 2 總辨識率比較表 ... 39

表 5- 6 40-20 組篩選變數方法 1 與方法 2 正常與危機公司辨識率比較表 ... 39

表 5- 7 45-15 組篩選變數方法 1 與方法 2 總辨識率比較表 ... 40

(10)

IX

表 5- 8 45-15 組篩選變數方法 1 與方法 2 正常與危機公司辨識率比較表 ... 40

表 5- 9 50-10 組篩選變數方法 1 與方法 2 總辨識率比較表 ... 41

表 5- 10 50-10 組篩選變數方法 1 與方法 2 正常與危機公司辨識率比較表 .... 41

表 5- 11 篩選變數方法 1 與方法 2 組總平均辨識率 ... 42

表 5- 12 35-25 組篩選變數方法 1 加 SVD 總辨識率 ... 43

表 5- 13 35-25 組篩選變數方法 1 加 SVD 正常與破產公司辨識率表 ... 43

表 5- 14 40-20 組篩選變數方法 1 加 SVD 總辨識率 ... 45

表 5- 15 40-20 組篩選變數方法 1 加 SVD 正常與破產公司辨識率表 ... 45

表 5- 16 45-15 組篩選變數方法 1 加 SVD 總辨識率 ... 47

表 5- 17 45-15 組篩選變數方法 1 加 SVD 正常與破產公司辨識率表 ... 47

表 5- 18 50-10 組篩選變數方法 1 加 SVD 總辨識率 ... 49

表 5- 19 50-10 組篩選變數方法 1 加 SVD 正常與破產公司辨識率表 ... 49

表 5- 20 35-25 組篩選變數方法 1 總辨識率 ... 51

表 5- 21 35-25 組篩選變數方法 1 加 SVD 總辨識率 ... 51

表 5- 22 40-20 組篩選變數方法 1 總辨識率 ... 52

表 5- 23 40-20 組篩選變數方法 1 加 SVD 總辨識率 ... 52

表 5- 24 45-15 組篩選變數方法 1 總辨識率 ... 53

表 5- 25 45-15 組篩選變數方法 1 加 SVD 總辨識率 ... 53

表 5- 26 50-10 組篩選變數方法 1 總辨識率 ... 54

表 5- 27 50-10 組篩選變數方法 1 加 SVD 總辨識率 ... 54

表 5- 28 篩選變數方法 1 總平均辨識率 ... 55

表 5- 29 篩選變數方法 1 加 SVD 總平均辨識率 ... 55

表 5- 30 35-25 組篩選變數方法 2 加 SVD 總辨識率 ... 56

表 5- 31 35-25 組篩選變數方法 2 加 SVD 正常與破產公司辨識率表 ... 56

表 5- 32 40-20 組篩選變數方法 2 加 SVD 總辨識率 ... 58

表 5- 33 40-20 組篩選變數方法 2 加 SVD 正常與破產公司辨識率表 ... 58

表 5- 34 45-15 組篩選變數方法 2 加 SVD 總辨識率 ... 60

表 5- 35 45-15 組篩選變數方法 2 加 SVD 正常與破產公司辨識率表 ... 60

表 5- 36 50-10 組篩選變數方法 2 加 SVD 總辨識率 ... 62

表 5- 37 50-10 組篩選變數方法 2 加 SVD 正常與破產公司辨識率表 ... 62

表 5- 38 35-25 組篩選變數方法 2 總辨識率 ... 64

表 5- 39 35-25 組篩選變數方法 2 加 SVD 總辨識率 ... 64

表 5- 40 40-20 組篩選變數方法 2 總辨識率 ... 65

表 5- 41 40-20 組篩選變數方法 2 加 SVD 總辨識率 ... 65

表 5- 42 45-15 組篩選變數方法 2 總辨識率 ... 66

表 5- 43 45-15 篩選變數方法 2 加 SVD 總辨識率 ... 66

表 5- 44 50-10 組篩選變數方法 2 總辨識率 ... 67

(11)

X

表 5- 45 50-10 組篩選變數方法 2 加 SVD 總辨識率 ... 67

表 5- 46 篩選變數方法 2 總辨識率 ... 68

表 5- 47 篩選變數方法 2 加 SVD 總辨識率 ... 68

表 5- 48 35-25 組半年報與年報篩選變數方法 1 總辨識率表 ... 69

表 5- 49 40-20 組半年報與年報篩選變數方法 1 總辨識率表 ... 70

表 5- 50 45-15 組半年報與年報篩選變數方法 1 總辨識率表 ... 71

表 5- 51 50-10 組半年報與年報篩選變數方法 1 總辨識率表 ... 72

表 5- 52 半年報與年報篩選變數方法 1 總平均辨識率表 ... 73

表 5- 53 35-25 組半年報與年報篩選變數方法 2 總辨識率表 ... 74

表 5- 54 40-20 組半年報與年報篩選變數方法 2 總辨識率表 ... 75

表 5- 55 45-15 組半年報與年報篩選變數方法 2 總辨識率表 ... 76

表 5- 56 45-15 組半年報與年報篩選變數方法 2 總辨識率表 ... 77

表 5- 57 半年報與年報篩選變數方法 2 總平均辨識率表 ... 78

表 5- 58 35-25 組半年報篩選變數方法 1 加 SVD 總辨識率表 ... 79

表 5- 59 35-25 組年報篩選變數方法 1 加 SVD 總辨識率表 ... 79

表 5- 60 40-20 組半年報篩選變數方法 1 加 SVD 總辨識率表 ... 80

表 5- 61 40-20 組年報篩選變數方法 1 加 SVD 總辨識率表 ... 80

表 5- 62 45-15 組半年報篩選變數方法 1 加 SVD 總辨識率表 ... 81

表 5- 63 45-15 組年報篩選變數方法 1 加 SVD 總辨識率表 ... 81

表 5- 64 50-10 組半年報篩選變數方法 1 加 SVD 總辨識率表 ... 82

表 5- 65 50-10 組年報篩選變數方法 1 加 SVD 總辨識率表 ... 82

表 5- 66 半年報篩選變數方法 1 加 SVD 總平均辨識率表 ... 83

表 5- 67 一年報篩選變數方法 1 加 SVD 總辨識率表 ... 83

表 5- 68 35-25 組半年報篩選變數方法 2 加 SVD 總辨識率表 ... 84

表 5- 69 35-25 組年報篩選變數方法 2 加 SVD 總辨識率表 ... 84

表 5- 70 40-20 組半年報篩選變數方法 2 加 SVD 總辨識率表 ... 85

表 5- 71 40-20 組年報篩選變數方法 2 加 SVD 總辨識率表 ... 85

表 5- 72 45-15 組半年報篩選變數方法 2 加 SVD 總辨識率表 ... 86

表 5- 73 45-15 組年報篩選變數方法 2 加 SVD 總辨識率表 ... 86

表 5- 74 50-10 組半年報篩選變數方法 2 加 SVD 總辨識率表 ... 87

表 5- 75 50-10 組年報篩選變數方法 2 加 SVD 總辨識率表 ... 87

表 5- 76 半年報篩選變數方法 2 加 SVD 總平均辨識率表 ... 88

表 5- 77 一年報篩選變數方法 2 加 SVD 總平均辨識率表 ... 88

(12)

1

第一章 緒論

1.1 研究背景與動機

近年來因為經濟的不景氣,造成許多企業公司紛紛倒閉。在 2007 年的金融風暴下,

台灣的經濟部最新統計顯示,在 2007 年十一月解散撤銷及廢止公司登記的家數高達四 萬零八百家。小公司如此,大公司更是無法幸免於此劫難,如記憶體大廠-茂德,更是 爆發了財務危機,面臨著倒閉的命運。此情形發生,社會上的投資大眾更是間接地受到 衝擊,股市中一片的哀鴻遍野。但是,如果有一套財務危機預測系統可以警告我們,我 們就可以減少損失。

近年來,許多學者紛紛投入研究財務預測的研究。目的是要找出一個能有效預測公 司的財務狀況且能普遍被應用的方法。來幫助社會大眾能降低投資失敗的機率。對於財 務模型,大致上說有一個具體的雛形,如圖一所示

關於上述財務危機的預測模型,一開始先將資料作前處理或是將資料正規化的動作,

然後利用統計模型或是人工智慧等數學的方法來挑選財務變數。利用篩選到的財務變數 再代入財務危機預測的方法,進而得到公司會不會有財務危機的結果。如圖所示此章節 的內容會論述相關文獻的探討與介紹。

針對財務危機的定義,研究財務危機預測的外國文獻中,Beaver(1966)[4]將企業的財 務危機定義企業發了以下這四種形式即為財務危機,包括無法支付特別股股利、債卷違 約、發生銀行帳戶透支、宣布破產。公司假使發生上述四種情形的其中一項,就代表公 司有財務方面的危機。學者 Altman(1968)認為達到法律規定的破產條件,即為財務危機 的發生。Deakin(1972)[6]則認為是當企業無法清償債務、宣告破產、跳票或遭清算,即

財務危機的定義

資料前處理 篩選財務變數 財務危機預測

公司資料

圖 1-1 財務危機預測模型

(13)

2

為財務危機的發生。

國內學者陳明賢(1986)[24]、邱志榮(1991)[24]及陳淑萍(2003)[24]對於財務危機的定 義上,大部分都是依據法律上與臺灣證卷交易法的規定的為主。

而臺灣的公司法也有財務危機的定義:

1、公司法第二百十一條規定:「公司虧損達實收資本額二分之一時,董事會應即召集股 東報告,公司資產顯有不足抵所債務時,除得依二百八十二條辦理者外,董事會應 即聲請宣告破產。」

2、公司法第二百八十二條規定:「公開發行股票或公司債之公司,因財務困難或有停業 之虞者,法院得依法定關係人之聲請,裁定准予重整。」

在台灣經濟新報中,對財務危機的定義如下表所示:

表 1-1 財務危機定義整理表

事件 說明──以下述 9 類事件的「爆發」,作為違約計入時點

(C)跳票擠兌 公司跳票、或銀行擠兌。

違約日=事件宣告日(見報日)

(D)倒閉破產 宣告倒閉、惡性倒閉、或破產 違約日=事件宣告日(見報日)

(E) CPA 意見 對其繼續經營假設提出疑慮、或就重大科目作保留、無法表示意見、

否定意見。

違約日=見報日/財報日孰早

(H)重整 聲請重整。違約日=見報日/重整日孰早

(G)紓困求援 向財政部申請紓困、或向銀行要求展延、減息並掛帳、個別要求或召

開債權人會議,全面要求都算。與銀行之展延,原則上以見報曝光、

或財報上明確寫明「展延」者為限。

不過,若僅向銀行要求降息,暫不列為財務危機,特別是 89 年以來利 率持續走跌,如中工。

違約日=見報日/紓困協商日孰早

(I)接管 雖未跳票,但原經營者下台看似沒有違約之事,不過,接管後多半會

跟銀行協商展延債務,還是會落入第(G)種狀況。

違約日=見報日/接管日孰早 (N)全額下市

( 不 含 因 每 股 淨 值 不及 5 元者)

轉列全額交割股、或下市

之所以受到交易所這類處分,原因主要有 3 類

Ⅰ財務危機、或

Ⅱ虧損過鉅以致每股淨值不及 5 元;或

Ⅲ違反資訊揭露、不在期限內召開股東會、改選董事

其中,第Ⅲ項屬經營代理成本過高之疑慮,看似與違約無關,但事後 來看,多半會發展為財務危機。故本類不再細分。

反倒是第Ⅱ項,可能因減資、或現金增資,提高每股淨值後,就回復 普通交易,並非立即發生財務危機,故將其由財務危機事件中排除,

歸於準財務危機事件。

違約日=交易所處分日/見報日孰早 (S)財務吃緊停工 停工未必涉及違約,但若停工消息見報時,已確定是因財務吃緊,則

續 後 必 發 展 成 財 務 危 機

違約日=見報日/停工日孰早

(Z)淨值為負 公司淨值為負數,且經營層無增資打算。

違約日=見報日/財報日孰早

根據上述學者對財務危機的定義,與臺灣公司法第二百十一條與第二百八十二條的規定,

在本論文中該公司被判定為變更交易方式為全額交額股或裁定暫停交易公司者,屬於財 務危機公司,其餘為正常公司。

(14)

3

1.2 研究目的

因為經濟問題對我們的影響甚大,所以本研究最主要的目的,就是對於企業發生的 財務危機,能建立一個數學的模型,針對公司的財務報表,能過找出比較重要的變數,

然後透過這些重要的變數,建立財務危機預測的模型。對於財務危機預測這個議題,在 之前就有許多人已做過相關的研究,例如:利用類神經網路或是基因演算法對財務危機 做預測。本論文將以一種全新的方法來建立一個財務預測的模型。另外在以往的研究都 是以一年報的資料再建立財務危機預測模型,本研究將使用半年報的資料來建立財務危 機預測,來研究使用半年報與一年報的效果差異。

1.3 章節結構

本研究主要分為 6 個部份,依序是緒論、文獻探討、資料前處理與變數篩選、財務 危機預測模型、實驗分析與結論。第一章介紹整個研究動機、背景與本研究的目的。第 二章將近年來對財務危機預測這方面的國內外論文作一個整理與簡介。第三章是介紹在 財務預測中的資料如何作處理與財務變數的篩選。第四章則是介紹本論文所採用的財務 預測模型。第五章是介紹本研究的方法與其它方法的比較。第六章是結論與建議,介紹 整個研究最後的結論與未來所要研究的方向。

(15)

4

第二章 文獻探討

在第一章中,我們介紹財務危機的定義與對我們的影響。在第二章中會介紹財務危 機預測的模型的發展與近年來的研究成果。在 2.1 節的相關研究中,我們會介紹歷年來 的研究方向與研究方法。在 2.2 節中研究問題定義中會介紹本論文的方法。

2.1 相關研究

財務變數的篩選與財務危機的預測資料需要特定的資料型式,所以需要將財務資料 作前處理。而前處理往往會影響到篩選財務變數與財務危機預測的結果。眾多的財務變 數之中,有些財務變數對於辨識結果沒有影響,或是使辨識率降低。因此,篩選出重要 的財務變數是相對重要的,不但增加財務危機預測的準確性,還可減少資料處理的速度。

本節將資料前處理與篩選財務變數的方法作一個整理與介紹。

在財務危機預測模型,Beaver(1966)[4]是第一位利用財務比率作為預測財務危機的 學者,選取 79 間介於西元 1954 年至 1964 年間的公司作為樣本,並對每一家公司針對 產業與規模相似的作 1:1 的配對,然後選出 32 個財務變數後,使用單變量分析(Univariate analysis )的二分類檢定法(Dichotomous Classification Test)作財務危機預測,發現「現金 流量/總負債」、「稅後淨利/總資產」、「總負債/總資產」等 3 項財務變數對於預測財 務危機中有較佳的效果。

單變數分析的缺點在於以單一財務變數進行分析預測,沒有考慮到整體的情況。因 此,Altman(1968)[1]與 Ohlson 延續 Beaver 的研究。Altman 採用 Beaver 的公司配對方式,

以多變量分析法(multivariate discriminant analysis,MDA)將財務變數以流動性、獲利能利、

財務槓桿、償債能力及週轉能力等五類構面,22 個財務變數,透過逐步區別分析(Stepwise discriminant analysis),選出 5 個變數,包括

X1:營運資產佔總資產比率( working capital/total assets);

X2:保留盈餘佔總資產比率((retained earnings/total assets);

X3:稅後息前淨利佔總資產比率(earnings before interest and taxes/total assets);

X4:股東權益市價佔總負債帳面價值比率(market capitalization/total debt);

X5:銷貨收入佔總資產比率(sales/total assets).

上述五個財務變數形成一個 Z 線性指標函式

Z=0.01X1+0.014X2+0.033X3+0.0064X4+0.999X5,

當一家公司之函數值 Z>2.675 時,則該公司屬於正常公司,否則為危機公司。

此模型的預測準確度會隨著預測年度的增加而遞減。預測公司財務危機前一年的辨 識率為 95%,而預測公司財務危機前二年辨識率只有 72%。辨識率會隨著預測年度的增 加而降低,其原因是模型中未加入風險的概念與未考慮到公司規模。因此,Altman 在 1977 年又提出了 ZETA 模型修正 Z 線性指標函式方法。在原本的 Z 線性指標函式加入

(16)

5

累計獲利與資本規模相關的變數,使得辨識率提升。

Deakin(1972)[6]採用 Beaver 的單變量分析-二分類檢定法(Dichotomous Classification Test)與 Altman 先前的 Z 線性指標函式方法加以合併。以 1964 年至 1970 選取 64 家公司,

以 Beaver 的單變量分析篩選出 14 項重要的財務變數,再以多變量分析建立模型。此方 法是以每年來建立模型,與 Altman 的只用全部的資料建立一個模型相異,因此,此方 法的辨識率高於前二位學者 Beaver 與 Altman 的辨識率。

Blum(1974)[5]延續了先前的研究,加入了與變異性相關的變數。以現金流量的觀點 來建立財務危機偵測的模型,利用多變量分析,採用 12 個變數,其中 6 個變數皆為變 異性相關的指標。研究發現「現在現金入量/總負債」、「淨值/總負債」、「速動資產/

存貨」等最能預測出公司的財務危機。

Martin(1977)[9]是第一位提出以 Logit 模型建立公司財務危機預測的學者,並找出六 個具有較佳辨識率的財務變數,包括淨利/總資產、呆帳/營業淨利、費用/營業收入、放 款/總資產、商業款/總負債、總資產/風險性資產。

Ohlson(1980)[11]延續了 Martin 的方法,發現以企業規模、財務結構、經營績效與 流動性能有效地預測公司財務危機,企業財務危機前一至三年辨識率為 96.12%,95.55%,

92.84%。

那些上述的方法都是以統計分析為主,到了 1990 年代,人工智慧的方法盛行。Odom 與 Sharda(1990)[11]使用了類神經網路(Neural Network)來建立公司財務危機預測模型。

Odom 與 Sharda 樣本選取 1975 到 1982 年 65 家財務危機公司與 64 家正常公司,採用了 Altman 的財務變數,其辨識率為 100%與區別分析(discriminant analysis)的辨識率 86%相 比,很明顯,類神經網路方法優於區別分析。

近年來,許多人工智慧與資料探勘的方法被廣泛地應用於財務危機預測模型。財務 預測的效果也漸漸提升。

首先是Myoung-Jong Kim與Ingoo Han(2003)[10]以基因演算法(GA)去作資料探勘,

找到公司破產的規則(Rule)。首先第一步沒有使用任何人工智慧或是資料探勘的方法來 篩選變數,此論文是由專家在眾多的財務變數下選出較重要的財務變數。然後專家再以 此重要的財務變數來衡量公司的狀況。

Myoung-Jong Kim與Ingoo Han提出針對公司的財務狀況,在衡量公司在每一個財務 變數的表現,給予低(編碼:001)、中(編碼:010)、高(編碼:100),三種程度的編碼。破產 規則(Rule)以二進位碼隨機產生,與公司財務狀況(Case)作的編碼作比對,計算規則(Rule) 的適應值(Fitness)。

適應值(Fitness)是以Rule最大的適用性率(Coverage)加辨識率(Predictive Accuracy)計 算而來。適用性(Coverage)需符合二個條件:

(1) 破產規則(Rule)的二進位碼一定要大於公司財務狀況(Case)的二進位碼,代表Rule所

(17)

代表 (2) rule 上述2個 再來利用 佳的預測 Tra Algorith 破產預測

第一 是以2進 第二個編 生的基因 後以此架 財務變數

Po 變數以羅 經網路(

相加,相 這一個方 (1)Evol 在EGP部 Swarm 挑到的變 (2)Mod 將第一個 會搭配一

表的財務狀況 所預測的財 個條件都符合

用基因演算 測財務危機 abelsi Abd hm,GA)與倒 測模型(Evo 一部分Inpu 進位編碼的基

編碼部分是 因傳到第二 架構作辨識 數與得到最

-Chang Ko 羅吉斯迴歸 (Neural Net 相加的結果 方法分成2個

utionary ge 部分,是利

Optimizatio 變數代入辨 dularized Ev

個部分所挑 一個容忍值

況一定是C 財務類別一 合的比率越 算法(GA)的 機的Rule。

delwahed和E 倒傳遞類神

olutionary b ut Selection 基因演算法 是NNO隱藏 二部分NNO 識,辨識的M 最佳BPNN隱

o 與 Ping-C 歸(Logistic

twork,NN)作 果即為適應值

個部分:

eneration(EG 利用基因演

on PSO),從 辨識的方法中

valuation Pr 挑選的變數代

值(tolerance

Case所代表的 一定要與Cas

越高越好。

的選擇(Selec Esseghir M 神經網路(Ba

bankruptcy n model部分 法來挑選財 藏層部分的節

O去解碼,我 MSE(Mean 隱藏層的架

圖 2- 1 EBM

Chen Lin(20 Regression 作財務危機

值(fitness)

GP)

演算法(Gene 從變數的候 中。

ocess(MEP 代入三個辨 e)θ。此容

6

的財務狀況 se所代表的

ction)、繁殖 Mohamed A

ack-propaga model, EBM 分分成2個部 財務變數,0代

節點(Node) 我們就可以 n square erro 架構。

M model 架構

006)[14]以基 ,LR)、區別 機預測,將 3

,之後利用

etic Algorith 候選區(Cand

P)

辨識的方法 容忍值作用在

況最差或最好 的財務狀況相

殖(Crossove Amir(2005)[

ation Neura M)。此論文 部分。第一 代表未選到

與NNO所用 以得到BPNN

or)當作GA的

構流程圖[15]

基因演算法 別分析(Disc

種方法的辨 用 GA 求出最

hm,GA)與粒 didate Popu

法中,產生辨 在訓練期間

好的情況。

相同。

er)、突變(M [15]結合基

l Network,B 文分成2個部 一個部分是挑 到此變數,1代 用到的參數 N隱藏層的節

的fitness,進

法與粒子群最 criminant A

辨識率乘以 最佳的結果

粒子群最佳 ulation,CP)中

辨識的結果 間,辨識率若

Mutation)來 基因演算法(

BPNN)形成 部分。

挑選變數的 代表選到此 數。然後將染 節點數與參 進而挑選到

最佳化演算 Analysis,DA 以一個權重(

果。

佳化演算法 中來挑選變

。每個方法 若大於此容

來尋找最

(Genetic 成革新式 的編碼,

此變數。

染色體產 參數,然 到最佳的

算法挑選 A)與類神 (Weight)

(Particle 變數,將

法的辨識 容忍值,

(18)

會對此方 較高的辨 變數量加

Jie 分,先計 值在平均 響 辨 識 (Attrib 後計算每 的變數 個支葉 結點代表

方法重新作 辨識率。此 加上最高的

e Sun,與Hu 計算所有公 均值在正負 識 率 。 在 篩

bute-orien 每個變數的

。在圖2-6中 (leaf)代表 表一個財務

作訓練,讓訓 此論文的基因

的辨識率。

ui Li(2008 公司的財務變 負三倍標準差 篩 選 財 務 變

nted induc 的資訊收益

中,以篩選 表預測結果 務變數,若公

訓練的樣本 因演算法與

圖 2- 2 E

8)[7]使用資 變數的平均 差的公司,

變 數 方 面 , ction,AOI 益(Informat

選的財務變 ,NM為正常 公司的財務

圖 2- 3 財務

7

本得到最佳的 與粒子群最佳

EGP+MEP 架

資料探勘(D 均值,然後在

,當作實驗樣 先 對 公 司 )建來關連式 tion Gain, 變數建來一個 常公司,ST為 務變數符合

務危機預測決

的權重。在 佳化演算法

架構圖[14]

Data Minin 在選取公司 樣本,避免 司 的 財 務 資

式資料庫(R IG),具有 個決策樹(D 為嚴重危機公 合此條件,判

決策樹模型[7]

在作財務預測 法的適應值是

ng)的方式在 司時,公司的 免挑選到特殊 資 料 , 使 用

Relation d 有較大IG值的

Decision Tr 公司,S為危 判定該公司

測的時候,

是考慮最少

在選取公司 的各財務變 殊性質的公 用 屬 性 導 向

database,D 的變數則為 ree)。決策 危機公司。

司正常或危機

能得到 少的財務

司樣本部 變數的數 公司,影 向 歸 納 法 DB)。然 為所篩選 策樹的一

。三角形 機。

(19)

Li model,B acyclic (depend 財務 相關程度 上財務變 較簡單的 資料會有 其它相關 在財 司的各財 透過EP 中、小的

P.

C discrete

li Sun與P BN) 來 篩 選 c graph,D dencies)程 務變數的相 度(relatio 變數保留,

的貝氏網路 有所遺漏的 關程度較高 財務預測中 財務變數的 -T方法找到 的財務狀況

Alam*, D.

A

Convert contin e( adapt extend

m

Prakash P.

選 變 數 與 測 DAG) 來 表 示 程度。

相依程度是使 on)與淨相關 表示該財務 路,縮短預測 的地方,根據 高的變數取代 中,公司財務

的資料代入 到財務資料的 況表示方式

Booth 與 K

A heuristic me

nuous variable ded Pearson-T ethod))

圖 2- 5 利

. Shenoy(

測 試 公 司 財 示 財 務 變 數

使用貝氏法 關(partia 務變數與公 測的時間。

據之前計算 代,然後再 務資料是屬 入乘以權重加

的最大值、

,再作財務

K. Lee, T. T

ethod for varia

es into Tukey (EP-T

Naïve B

利用貝氏網路

8

2007)[8]利 財 務 危 機 。

數 之 間 以 及 法則(Bayes

l relation 公司正常或破

。因為公司財 算的相關程度 再去作財務 屬於連續性的

加總,大於 中位數與最 務危機預測

2- 4 DAG 圖

Thordarson

able selection

Num

Bayesian mode

路預測財務危

利用貝氏網 在 篩 選 財 及 財 務 變 數

rule)計算 n)程度,篩 破產較相關 財務資料常 度與淨相關 務預測。

的數值資料 於1即為有破

最小值,將財 測。

圖[8]

n(2000)[13]提

in naïve mode

mber of states

el

危機流程圖[8]

網路模型(B 務 變 數 方 面 數 與 財 務 危 算財務變數與 篩選正負相關 關。將複雜的 常缺乏完整性 關程度,讓有 料,在其它相 破產危機。而 財務資料作

提出了以 F

els

s for discretiza

Bayesian n 面 是 使 用 ( 危 機 公 司 與財務危機 關程度大於 的貝氏網路 性,有些財 有遺漏值的 相關的論文 而在此論文 作轉換,轉換

Fuzzy Clust

ation

network (Direct 的 相 依 機公司的 於0.10以 路簡化為 財務變數 的變數被 文中,公 文中,是 換成大、

tering 分

(20)

9

群 法 為 基 礎 的 財 務 危 機 預 測 模 型 。 並 與 類 神 經 網 路 方 法 的 自 我 組 織 類 神 經 網 路 (Self-organizing Neural Networks,SONN)與自我競爭式類神經網路(Competitive Neural net,CNN)作比較。在此論文的實驗中,銀行樣本選取,是採用 1991 年底美國聯邦存款 保險公司(FDIC)所公布遭清算的 24 家銀行。在這 24 家銀行中隨機挑選 10 家,屏除其 中 2 家有遺漏值的銀行。依照選中來的這八家破產銀行的總資產。再根據統計原理,一 家財務危機銀行配對 30 家正常營運的銀行。再利用 net loand loesses plus provsision for loan losses/net income(NLLPLLNI)這個變數,找出 240 正常營運銀行,其中 35 家銀行的 NLLPLLNI 這個財務變數值超出-3 與+3 的範圍,代表該銀行,在未來有可能會有財務 危機。

所以公司分成三種類型,205 家正常營運銀行,35 家財務狀況異常銀行,8 家財務危機 銀行。

在挑選財務變數,作者根據參考他人的文獻中,挑出了 5 個財務變數,淨收入/總資 產(Net income to tottla assets,NITA)、淨放款損失/調整型資產(Net loan losses to adjested assets,NLLAA)、不良貸款損失/總資產(nonperforming loans to total assts,NPLTA)、淨放款 損失/總放款(Net loan losses to total loans,NLLTL)、淨放款損失+放款損失基金/淨收入 (Net loan losses plus provision for loan losses divivded by net income,NLLPLLNI)等財務變 數。使用 1~4 的財務變數分群,分完群後,先利用唐氏系數正規化(Dunn’s partition)正規 化每個公司的歸屬函數,之後再檢查各銀行的歸屬函數,判定該銀行隸屬為何群。再來 檢查每群中破產銀行與正常銀行的數量,來決定該群為正常銀行群或財務危機群。

實驗分析方面,導入 Kaufman 和 Rousseeuw 所提出之輪廓評估法(Silhouette Measure),

在輪廓評估法,正數代表群內樣本的資料相近。負數代表,群內樣本資料相異性較大。

利用輪廓評估法的特性,配合主成份分析法(principal component analysis),畫出正常銀 行與財務危機銀行的群分佈,與其它 2 個類神經方法比較效果。實驗結果顯示 3 種分群 結果,公司的分群分佈相異性不大,因此這 3 種方法效果差異不大。

邱垂傑(2007)[19]提出了一個以基因演算法為基礎的財務危機預測模型。利用基因 演算法來挑選最佳的特徵變數組合,使得財務危機預測模型更為準確。論文中基因演算 法提出了 2 種計算適應度(Fitness)的方法。一個以基因演算法結合了 Fuzzy C Mean(FCM) 分群法。此模型是以基因演算法隨機挑選變數,基因值 1 代表選到此變數,0 則否,然 後將此變數組合代入 FCM 分群法,對訓練資料之正常公司與危機公司各別分群,並計 算群心,然後將測試資料以訓練資料的群心來進行樣本正常或危機公司對歸類,測試資 料歸類的正確率,則作為基因演算法的適應值。

(21)

10

由相關文獻中發現在許多財務變數篩選的方法都是以演算法或資料探勘為基礎,因 此本論文提出了一個以資料探勘相關的篩選財務變數的方法。然後搭配 Fuzzy C Mean 分 群 法 (Clustering) 來 進 行 財 務 危 機 預 測 模 型 , 並 與 BPNN( 倒 傳 遞 類 神 經 網 路 ) 和 LDA(Linear Discriminant Analysis)作比較。

2.2 研究問題定義

在財務危機預測的流程中如圖所示,一般的作法是先將公司所的財務報表的資料作 前處理,使得公司的資料可以帶入我們的方法。作完前處理後,我們將公司的資料分成 三種類型。第一種類型的實驗資料為篩選變數之公司資料。本研究以此種資料作篩選變 數。第二種類型的資料為建立預測模型之公司資料。此類資料是等篩選變數資料作完 SVD 與 FCM 篩選變數的方法,取得最佳財務變數的組合後,再以第二類型的資料代入

族群初始化

染色體 (變數選取)

運算元 (計算新族群)

突變 交配 選擇與複製

篩選變數 用樣本

篩選變數 用樣本

篩選變數 用樣本

FCM 分群法

樣本分類判斷

達終止條件

染色體 (變數選取)

隨機分配

適應度計算 (分群法)

圖 2- 6 基因演算法混合 FCM 分群法財務危機預測流程圖[19]

(22)

11

本研究的財務預測模型,透過訓練的方式建立預測的模型。第三種類型的資料為預測公 司資料,我們以此類的資料,驗證我們的預測模型的辨識率,作模型的效能評估。

圖 2- 7 方法流程圖

所有公司財務資料

資料前處理

篩選變數之公司資料 建立預測模型之公司 資料

結合SVD與FCM篩選變 數

最佳財務變數組合

以FCM建立預測模型

預測公司資料

效能評估(辨識率)

65組 60組

(23)

12

第三章 資料前處理與財務變數篩選

在作財務危機預測之前,我們必須要作資料前處理與篩選變數,才能使預測模型可 以達到我們要的效果,因此本章節中針對資料前處理與財務變數篩選方法作說明。

在方法流程圖中,3.1 節會先將介紹資料樣本的選擇與資料正規化。將資料作正規 化後,將資料分成三個組別,分為篩選變數組、訓練組與測試組。然後篩選變數組的資 料專門使用於篩選出重要的財務變數用,然後對訓練組別建立一種具有系統的模型,之 後再將試測組的資料帶入建立的財務危機預測的模型中,驗證其財務危機預測的效果。

在 3.2 節中介紹的是變數篩選的方法。在篩選變數中主要是利用 Fuzzy Clustering 中 的 Fuzzy C Mean 分群法作分群,然後利用計算變異數的方式,進而篩選出具有代表性 的財務變數。在 3.2.1 節中加入 2 種 FCM 分群法的前處理幫輔助 FCM 篩選變數。在 3.2.2 節中結合 SVD 與 FCM 來篩選變數,在 3.2.2 節中會作方法的說明。

以上述的方法篩選出具有重要性的變數後,在第四章中會介紹財務危機測試模型。

以 3.2 節中篩選的變數,帶入財務危機預測的模型,以 FCM 分群來預測財務危機的公 司,然後與倒傳遞類神經網路(BP-NN)與線性區別分析(LDA)作比較。

圖 3- 1 財務危機預測之方法流程圖

所有公司財務資料

資料前處理

篩選變數之公司資料 建立預測模型之公司 資料

結合SVD與FCM篩選變 數

最佳財務變數組合

以FCM建立預測模型

預測公司資料

效能評估(辨識率)

65組 60組

(24)

13

3.1 樣本資料收集與資料前處理

本研究的資料來源是以台灣經濟新報資料庫中,在台灣證卷交易所之股票上市公司 的財務報表為研究的母體。並根據台灣證卷交易所營業細則第四十九條之定義,變更交 易方式為下市或全額交割之上市公司為財務危機的樣本,如未變更交易方式之公司,均 為正常公司。在資料前處理的流程,會先將公司分組 125 組,之後再將資料正規化 0 至 1 之間。

3.1.1 公司樣本選取與分組

將公司分組是因為我們可以透過危機公司與正常公司變數的比對,找出財務危機具 有影響力的變數。如圖所示,四家正常公司的資產與負債都差不多,而危機公司的現金 由圖中很明顯可以看得出來,危機公司的現金值很小,因此我們就可以判斷出現金變數 為影響公司財務危機較重要的變數。

表 3- 1 分組意義示意圖

在樣本的選取中,是採用 Beaver(1996)[2]所提到的配對條件:

(1) 相同產業:非財務危機公司與財務危機公司需同樣產業別。

(2) 相似規模:非財務危機公司與財務危機公司需經濟規模相當,在本研究中選取以資本 額(普通股股本)差異在±25%以內的公司樣本編列為同一組。

(3) 相似營業:以上述 2 個條件配對為同一組的公司數大於 4 家,則依據配對公司中,與 財務危機公司主要營業項目較相似比對最高者為配對樣本。

本研究從台灣經濟新報資料庫中,針對在民國 80 至民國 94 年間的資料,共找出 125 間 符合財務危機定義的公司。採取 Beavor 的配對方法,以 1:3 的比例來分組(1 家財務危機 公司與 3 家非財務危機公司)。以表來顯示我們分完組後的結果。

正常公司 正常公司 正常公司 危機公司

資產 0.55 0.6 0.55 0.5

負債 0.63 0.65 0.58 0.6

現金 0.6 0.7 0.7 0.1

0.1 0 0.2 0.3 0.4 0.5 0.6 0.7 0.8 財 務 變 數

圖表標題

(25)

14

表 3- 2 分組後公司資料

組別 公司代碼 公司名稱 產業名 選取年份 普通股股本 是否危機

4

8724 立大 食品 1999 2,319,999 是

1203 味王 食品 1999 2,092,537 否

1215 卜蜂 食品 1999 2,221,838 否

1219 福壽 食品 1999 2,463,300 否

60

2445 南方 資訊電子 2002 753,450 是

5344 立衛 資訊電子 2002 750,000 否

5388 中磊 資訊電子 2002 750,408 否

3074 群環 資訊電子 2002 757,000 否

112

5524 捷力科技 營建 2003 525,000 是

5532 竟誠建築 營建 2003 416,706 否

6401 助群 營建 2003 455,040 否

2572 大棟 營建 2003 504,000 否

3.1.2 正規化

本研究的財務資料是由台灣經濟新報資料庫中取得,因為財務變數眾多,如附錄 2 所示,共有 64 個財務變數,主要是以資產負債表與損益表裡面的財務變數為主,並採 用參考文獻中較常使用也較具有代表性的財務變數,另外再加上一些非財務變數,如 TCRI(信用評比)。

在作財務危機預測之前,我們先前已將公司間進行分組,共分為 125 組(500 家公司),

然而由於公司間的財務變數數值差異不小,因此必須將資料以分組為單位作適當的正規 化,使得各組內的資料數值介於 0 到 1 之間。

正規化的方式為

組內變數資料最小值 組內變數資料最大值

組內變數資料最小值 組內變數資料值

− (公式 3-1)

以表 3-2 的資料組別 1 為例,在變數 1 中最小值為 1.95,最大值 6.19,於是嘉泥變數 1 的數值,採用 3-1 後的正規化值為(1.98-1.95)/(6.19-1.95)=0.007。

(26)

15

表 3- 3 簡化過的原始資料

組別 是否危機 公司代碼 公司名稱 變數 1 變數 2 變數 3 變數 4 變數 5 變數 6

1

1 1107 建台 1.95 6.26 2.35 10.81 1.99 22.25

0 1103 嘉泥 1.98 1.99 1.99 0.16 -0.55 25.99

0 1110 東泥 3.82 1.89 3.3 2.1 3.01 22.73

0 1104 環泥 6.19 4.37 6.44 4.95 4.47 17.97

組別 是否危機 公司代碼 公司名稱 變數 1 變數 2 變數 3 變數 4 變數 5 變數 6

66

1 2335 清三 -2.58 -12.29 -5.07 -40.43 -40.43 1.31

0 8058 耐特 3.27 2.2 3.69 1.03 1.03 13.58

0 8036 光華 12.84 7.79 11.14 9.26 9.28 37.77 0 8086 宏捷科 -5.14 -10.22 -5.14 -16.47 -16.65 -29.3

組別 是否危機 公司代碼 公司名稱 變數 1 變數 2 變數 3 變數 4 變數 5 變數 6

1

1 1107 建台 0 1 0.081 1 0.506 0.534

0 1103 嘉泥 0.007 0.0229 0 0 0 1

0 1110 東泥 0.441 0 0.294 0.1822 0.7092 0.594

0 1104 環泥 1 0.5675 1 0.4498 1 0

組別 是否危機 公司代碼 公司名稱 變數 1 變數 2 變數 3 變數 4 變數 5 變數 6

66

1 2335 清三 0.142 0 0.004 0 0 0.456

0 8058 耐特 0.468 0.7216 0.542 0.8344 0.834 0.639

0 8036 光華 1 1 1 1 1 1

0 8086 宏捷科 0 0.1031 0 0.4822 0.4784 0

3.2 變數篩選方法

此節介紹變數篩選的方法。變數篩選為財務危機模型中,重要的一環。因為財務報 表的變數中,有少數的變數只是顯示現金的運用,對財務危機預測沒有什麼影響。而且 變數太多會增加財務危機預測的處理時間。因此,我們要透過篩選變數,使我們的財務 預測模型可以達到快速與準確預測的目標。為了使得 FCM 分群法後的分群是正常公司 一群與危機公司一群,預測樣本能夠以離群心的遠近來判斷該公司是正常公司或危機公 司。所以,在本論文中提出了 2 個 FCM 前處理。在圖 3-3 中,在 FCM 前處理有 2 個方 法,第一個方法是將正常公司與危機公司分成 2 組,然後各自分群。第二個方法將篩選 變數組的公司實際的類別(正常與危機)當成變數代入分組。

3.2.1 節是以 FCM 分群法篩選變數。FCM 的原理是把性質相近的樣本分群在一起。

因此,我們以公司的變數來作為分群的座標。透過分群法來了解財務危機公司中較具辨 識力的變數,使得我們可以準確地預測公司的財務危機。因為公司與財務變數的資料量 龐大,因此在 3.2.2 節是提出 SVD 的方法加入 3.2.1 節的模型中,提升計算的效益。

(27)

16

公司財務資料分組

公司財務資料正規化 財務資料

亂數挑選公司資料組別-篩 選變數資料

計算組內群間變異數

計算組外群間變異數

預測模型與效能評估 以公司實際的類別分組(破

產與未破產)

以 Fuzzy C mean 分群法篩 選變數

計算群間變異數

計算群內變異數

將變異數排名篩選變數

取前 n 名的財務變數作辨 識

訓練與預測用財務資料

以公司實際的類別 (破產與未 破產)當成一個財務變數 財務資料作SVD(奇異值矩

陣分解)

取K個Singular vaule作資 料重建

以 Fuzzy C mean 分群法篩 選變數

計算群間變異數

計算群內變異數

將變異數排名篩選變數

取前 n 名的財務變數作辨 識

FCM 前處理

圖 3- 2 篩選變數細部流程圖

(28)

17

3.2.1 以 FCM 篩選變數

本研究的實驗變數篩選是以 Fuzzy Clustering 將公司的財務變數當作座標代入,然 後以公司進行分群。在分群之前,我們會先將資料作一個前處理。共有 2 種方式,如圖 3-2 所示。第一種方式先將公司依危機與否作一個分組分成 2 組,如圖 3-2 所示,一組 為正常組,另一組為危機組。

將要篩選變數的公司資料,依照公司的實際類別(0:正常公司,1:財務危機公司)分組,

分成 2 組後,再各別依 Fuzzy Clustering 分群。分完群之後,再計算組內群間變異數、

組外群間變異數與組內群內變異數三個變異數。

第二種方式為公司的破產與否,將公司的類別(0:未破產、1:破產)當作成一個變數,

以 65 個變數代入作分群法作分群。

圖 3- 3 方法流程圖與分組示意圖 全部的公司

未破產公司 破產公司

分群法

群1 群2 群3 群1 群2 群3

組內群間變異數

組外群間變異數 組內群內變異數

依公司破產與否分 成 2 個部分 針對前步驟 2 部分

各自分群 計算群間變異數 計算群內變異數 將變異數排名篩選

變數 取前 n 名的財務變

數作辨識

(29)

18

此分組的目的,是為了使群內皆為同為正常公司或危機公司,我們可以分析群內樣 本的財務變數,了解危機公司是因何種財務變數而分群在一起。分完群之後,計算群內 與群間變異數。群間變異數因為每群都具有不同的特性,因此代表性越大越好。群內變 異數為群內差異小,代表群內公司的特性越相同,因此越小越好。計算完成之後,將群 內變異數、群間變異數作排名,排名越前面代表著此財務變數越重要。本研究將以此排 名選取 15%、30%,45%、60%,75%的財務變數作組合,代入財務預測的模型中進行 訓練與測試。

接下來使用模糊 C-Mean 分群法分群。模糊 C-Mean 分群法是 Bezdek(1973)提出,

利用模糊理論的觀念來提升分群的效果。此方法就是將資料點(p)與中心點以一個 0~1 之間的數字來表示 p 點屬於某個群的程度。利用不斷地更新中心點,直到中心點的變動 值小於我們設定的臨界值就停止分群。以下說明 FCM 分群法的步驟。

Fuzzy C Mean 分群法步驟:

步驟1: 群心的座標(vi)以亂數產生 0~1 的值,本研究是將 64 個財務變數加入分群,因此 群心的座標共有 64 個。

步驟2: 計算各公司(x)與各群心(v)的歸屬函數值(μij ),

1 1 1

1

2 2

||

||

||

||

= ⎥⎥⎥

⎢⎢

⎟⎟

⎜⎜

=

cm

k j k

i j

ij

x v

v μ x

(公式 3-2)

步驟3: 利用公式更新群心的座標

c i x

v

n

j

m ij n

j

j m ij

i = ≤ ≤

=

= ,1

) (

) (

1 1

μ μ

(公式 3-3)

全部的公司

分群法

群1 群2 群3

群間變異數 群內變異數

圖 3- 4 分組後計算變異數說明圖

(30)

19

步驟4: 重新計算所有公司與各群心的歸屬函數值

1 1 1

1

) 2 (

) 2 ( )

1 (

||

||

||

||

= +

⎥⎥

⎢⎢

⎟⎟

⎜⎜

=

cm

k

t k j

t i j t

ij

x v

v

μ

x

(公式 3-4)

步驟5: 當|Jm(U(t+1),V(t+1))-Jm(U(t),V(t))|≦ε,代表這一次中心點座標與上一次的座標小於臨 界值,則停止,否則 t=t+1,回到(2)。U 與 V 代表群心的座標。

步驟6: 取公司樣本 (membership)與各中心點最大的歸屬函數值,來決定公司的分群。

將公司分完群之後,我們利用到變異數的計算。變異數乃是計算樣本之中差異性的 大小。我們計算變異數利用其特性來篩選變數。因為我們把公司分成危機與非危機公司,

因此群間變異數有分為組內與組外的群內變異數。

(1) 組內群間變異數:分別計算正常公司與危機公司分完群,群與群之間的變異數。計算 此變異數的原因是因為正常公司中,有許多類型的公司有些擁有相似的特徵,因此 計算組內群間變異數,此變異數越大越好,代表公司與公司之間差異性越大,越有 分群的效果。

(2) 組間群間變異數:計算正常公司與危機公司的群間變異數。正常公司與危機公司差異 越大,我們越能預測公司財務危機的發生。因此,此組間群間變異數越大越好。

(3) 組內群內變異數:計算正常公司與危機公司各自分群的群內變異數。群內差異性要小,

代表此群的分類效果良好,把同類型的公司都分在同一群內。

將分完群的每一群所計算的三種變異數作排名的排列,我們再依排名來取多少個的 變數來代入財務危機預測的模型中。

(31)

20

3.2.2 結合 SVD 與 FCM 篩選變數

在公司的財務報表的資料裡,我們總共選取了 500 公司,64 個財務變數作為本研究 的實驗樣本。在這龐大的資料集中,要快速地找出對預測結果影響重大的財務變數實在 不是一件容易的事。因此,我們使用奇異值分解(SVD)的方法來解決這個問題。SVD 可 以找出資料的相似性,保留原來的變數資訊,以少數幾個代表性的資料構面取代原來的 資料,只需要分析這幾個代表性的變數構面,就可以分析出我們想要的結果,達到計算 分析的效率。

奇異值分解(Singular Value Decomposition,SVD)是一種正交矩陣分解法。可以說是 對角化應用的特例,此分解與 Eigenvalue 與 Eigenvector 具有相同的特性。

我們設 A 為一個 m×n 的矩陣,rankA=r, SVD 具有以下的型式 A=UΣVT,其中 U 矩陣維 度為 m×m 大小的矩陣,Σ矩陣維度為 m×n 大小的矩陣,V 矩陣維度為 n×n 大小的矩陣,U 與 V 皆為正交矩陣。Σ為主對角矩陣,形式為

⎥⎥

⎥⎥

⎥⎥

⎥⎥

⎢⎢

⎢⎢

⎢⎢

⎢⎢

=

0 0 0 0 ...

0

0 0

0 ...

0

0

0 0 0 0

0

0 0 0

0

0 0 0 0

1 0

O M M M

M M

L O

δ

r

δ

δi >0 為奇異值(singular value),其中 i=1,2…r。利用奇異值的轉換,我們可以將奇異值 作排序,其中奇異值越大的,代表著此數值越重要,因此,我們可以透過 SVD,利用此 特性 A=UΣVT作矩陣重建,重建原始矩陣 A,去除不重要的資訊,使得我們能有效地 篩選變數,將篩選的變數代入預測的模型中,提升我們財務危機預測的辨識率。

原始資料矩陣

計算交互乘積矩陣A

T

A

從A

T

A求出U、Σ與V

排序Σ矩陣、篩選奇異值

USV

T

矩陣重建

圖 3- 5 矩陣重建流程圖

(32)

21

範例 1:SVD 範例說明

步驟1: 在表 3-3(2)為簡化的資料矩陣,簡單取 9 家公司,12 個財務變數,該資料矩陣已 作了分組與正規化處理。

步驟2: 接下來對表 3-3(1)的原始矩陣(A),計算交互乘積矩陣 ATA 得到一個方陣(表 3-3(2)),對此方陣求特徵值(表 3-3(3))與特徵向量(表 3-3(4))。

步驟3: 將步驟 2 的特徵值矩陣(表 3-3(2))開平方根,即為奇異值矩陣(表 3-3(5))。特徵向 量矩陣(表 3-3(4))即為 V 矩陣。

步驟4: 由公式 i

i

i

Av

u

= 1

δ

得到 U 矩陣(表 3-3(6))。U、Σ、V 三個矩陣得到答案後,再 來取 k 個奇異值作矩陣的重建。在本例中是取一個奇異值

在本實驗中,因為取奇異值個數沒有一個定理可以決定,所以本論文是利用試誤法,以 10、20、…60 個分別實驗。將取完特徵值個數的Σ矩陣,以 UΣVT的方式相乘作矩陣 重建。在本例中是以取一個奇異值(singular value)為例所得到的結果(表 3-3(7))。以表 3-3(7)的矩陣代入 FCM 分群法中當作座標,作分群法的運算。

表 3-3( 1) 未進行 SVD 運算的原始矩陣

變數

公司 1 2 3 4 5 6 7 8 9 10 11 12

建台 0 1 0.08089 1 0.50597 0.53366 0 1 1 0 1 0.08089 嘉泥 0.00707 0.02288 0 0 0 1 1 0 0 0.00707 0.02288 0 東泥 0.44103 0 0.29438 0.18216 0.70916 0.59351 0.87422 0.38623 0.27194 0.44103 0 0.29438 環泥 1 0.56750 1 0.44976 1 0 0.39715 0.32038 0.31997 1 0.56750 1

聯成食 0 0 0 0 0 0 0 0 0 0 0 0

宏亞 0.83714 0.70764 0.92887 0.72609 0.75820 0.64350 0.71953 0.59903 0.65915 0.83714 0.70764 0.92887 天仁 0.98215 0.95168 0.93380 0.95009 0.94645 1 0.94257 1 1 0.98215 0.95168 0.93380 聯華食 1 1 1 1 1 0.58518 1 0.93602 0.98478 1 1 1

台鳳 0 1 0.08089 1 0.50597 0.53366 0 1 1 0 1 0.08089

表 3-3( 2) 計算交互乘積矩陣 A

T

A

3.86 3.0948 3.8246 3.0711 3.8771 2.3749 3.3179 2.9104 2.9587 3.86 3.0948 3.8246 3.0948 4.729 3.2753 4.6733 4.0167 3.0825 2.6545 4.4934 4.5845 3.0948 4.729 3.2753 3.8246 3.2753 3.8345 3.2268 3.8787 2.3778 3.203 3.0221 3.0927 3.8246 3.2753 3.8345 3.0711 4.6733 3.2268 4.6654 4.0407 3.178 2.7559 4.5355 4.6069 3.0711 4.6733 3.2268 3.8771 4.0167 3.8787 4.0407 4.4856 2.9805 3.4548 3.9429 3.9558 3.8771 4.0167 3.8787 2.3749 3.0825 2.3778 3.178 2.9805 3.6784 3.5096 3.2298 3.2292 2.3749 3.0825 2.3778 3.3179 2.6545 3.203 2.7559 3.4548 3.5096 4.3282 2.7745 2.7665 3.3179 2.6545 3.203 2.9104 4.4934 3.0221 4.5355 3.9429 3.2298 2.7745 4.4868 4.5242 2.9104 4.4934 3.0221 2.9587 4.5845 3.0927 4.6069 3.9558 3.2292 2.7665 4.5242 4.5806 2.9587 4.5845 3.0927 3.86 3.0948 3.8246 3.0711 3.8771 2.3749 3.3179 2.9104 2.9587 3.86 3.0948 3.8246

(33)

22

3.0948 4.729 3.2753 4.6733 4.0167 3.0825 2.6545 4.4934 4.5845 3.0948 4.729 3.2753 3.8246 3.2753 3.8345 3.2268 3.8787 2.3778 3.203 3.0221 3.0927 3.8246 3.2753 3.8345

表 3-3( 3 ) 特徵值矩陣

42.616 0 0 0 0 0 0 0 0 0 0 0

0 5.467 0 0 0 0 0 0 0 0 0 0

0 0 2.58 0 0 0 0 0 0 0 0 0

0 0 0 0.27076 0 0 0 0 0 0 0 0

0 0 0 0 0.069313 0 0 0 0 0 0 0

0 0 0 0 0 0.058299 0 0 0 0 0 0

0 0 0 0 0 0 0.010509 0 0 0 0 0

0 0 0 0 0 0 0 2.1352e-031 0 0 0 0

0 0 0 0 0 0 0 0 7.3285e-034 0 0 0

表 3-3( 4 ) V 矩陣特徵向量

-0.27029 0.35143 -0.16055 0.0065063 0.18191 -0.13002 -0.39332 -0.072359 -0.051459 -0.62088 -0.42023 -0.05434 -0.31341 -0.29263 -0.1241 -0.31144 -0.28234 0.2067 -0.26708 -0.70292 0.00035111 0.12187 7.2236e-005 0.031907 -0.27488 0.29944 -0.20308 -0.24109 0.0079167 -0.10334 0.38206 -0.072189 0.10336 -0.015804 0.29138 -0.69113 -0.31339 -0.29237 -0.059591 -0.02685 0.076621 0.096317 0.46322 0.098537 -0.68232 -0.04257 -0.32381 0.019509 -0.31518 0.1102 -0.099739 0.70827 -0.59051 -0.017996 0.092676 0.002854 0.10523 0.048157 -0.075434 -0.01497 -0.23946 -0.054565 0.67678 -0.19934 -0.21356 -0.6262 -0.018229 0.0093857 -0.015287 0.015586 -0.057112 -0.0043193 -0.25351 0.33879 0.60205 0.029975 0.11052 0.66398 0.026463 -0.0093051 0.014287 -0.015796 0.057081 0.0043903 -0.30384 -0.30323 0.033883 0.36012 0.3894 -0.12784 -0.13738 -0.083936 -0.11625 -0.23934 0.64443 0.070067 -0.30795 -0.30835 0.0044053 0.13035 0.45852 -0.021115 0.11372 0.015436 0.57161 0.26144 -0.4093 -0.081272 -0.27029 0.35143 -0.16055 0.0065063 0.18191 -0.13002 -0.39332 0.15587 -0.31065 0.67022 0.031561 0.044009 -0.31341 -0.29263 -0.1241 -0.31144 -0.28234 0.2067 -0.26708 0.67359 0.1553 -0.12797 0.12145 -0.031812 -0.27488 0.29944 -0.20308 -0.24109 0.0079167 -0.10334 0.38206 -0.016195 0.22074 -0.059782 0.15123 0.70941

表 3-3( 5 ) Singular value 矩陣

6.5281 0 0 0 0 0 0 0 0 0 0 0

0 2.3382 0 0 0 0 0 0 0 0 0 0

0 0 1.6062 0 0 0 0 0 0 0 0 0

0 0 0 0.52035 0 0 0 0 0 0 0 0

0 0 0 0 0.26327 0 0 0 0 0 0 0

0 0 0 0 0 0.24145 0 0 0 0 0 0

0 0 0 0 0 0 0.10252 0 0 0 0 0

0 0 0 0 0 0 0 4.6209e-016 0 0 0 0

0 0 0 0 0 0 0 0 2.7071e-017 0 0 0

參考文獻

相關文件

• A delta-gamma hedge is a delta hedge that maintains zero portfolio gamma; it is gamma neutral.. • To meet this extra condition, one more security needs to be

6 《中論·觀因緣品》,《佛藏要籍選刊》第 9 冊,上海古籍出版社 1994 年版,第 1

The first row shows the eyespot with white inner ring, black middle ring, and yellow outer ring in Bicyclus anynana.. The second row provides the eyespot with black inner ring

Teachers may consider the school’s aims and conditions or even the language environment to select the most appropriate approach according to students’ need and ability; or develop

O.K., let’s study chiral phase transition. Quark

• We have found a plausible model in AdS/CFT that captures some essential features of the quantum hall eect as well as a possible experimental prediction. • Even if this is the

Microphone and 600 ohm line conduits shall be mechanically and electrically connected to receptacle boxes and electrically grounded to the audio system ground point.. Lines in

We showed that the BCDM is a unifying model in that conceptual instances could be mapped into instances of five existing bitemporal representational data models: a first normal