• 沒有找到結果。

摘要

N/A
N/A
Protected

Academic year: 2022

Share "摘要"

Copied!
108
0
0

加載中.... (立即查看全文)

全文

(1)
(2)
(3)
(4)
(5)

摘要

本研究旨在針對股票上市公司之財務危機及信用卡顧客之逾期繳款風險個案研 究,作六種資料探勘方法之比較。結果發現,就分類誤判率而言,邏輯迴歸、判別 分析在公司財務風險個案的表現很好,但在個人信用卡風險個案的表現很差;貝氏 分類、分類樹正好相反,在公司財務風險個案表現很差,但在個人信用卡風險個案 表現很好。類神經網路在二個個案的表現都很好,而最近鄰居分類則都很差。因此,

類神經網路可能是預測財務風險的最強健的方法。但就風險管理的觀點來看,預測 模型推估的預測風險機率是否能代表真實風險機率比分類誤判率更重要。經由預測 風險機率(x)與真實風險機率(y)的線性迴歸分析(y=ax+b)顯示,類神經網路產生的預 測模型具有最高的判定係數,且只有其迴歸係數 a 值接近 1,b 值接近 0。因此,類 神經網路是六個方法中唯一可以準確估計真實風險機率的方法。

關鍵詞:資料探勘、風險預測、最近鄰居分類、邏輯迴歸、判別分析、貝氏分類、

類神經網路、分類樹

(6)

Abstract

This research aimed at comparisons of six data mining methods on two financial risk case studies, financial distress of company on the stock market, and credit score of credit card customers. Based on classification error rate, the results showed that logistic

regression and discriminant analysis are accurate at the financial distress case but inaccurate at the credit card case; naïve Bayes classifier and decision tree are accurate at the credit card case but inaccurate at the credit card case; artificial neural network is accurate at both cases; and k-nearest-neighbor classification is in accurate at both cases.

Therefore, artificial neural network could be the most robust method to forecast financial risk. But based on viewpoint of risk management, whether the forecast risk probability estimated by the predict model can represent the real risk probability is more important than the classification error rate. Using the regression analysis (y=ax+b) of forecast risk probability (x) and real risk probability (y), the predict model produced by artificial neural network has the highest determination coefficient, and the regression coefficient

“a” of regression formula based on forecast risk probability estimated by artificial neural network is close to 1, and b to 0. Therefore, in these six data mining methods, artificial neural network is the only method which can accurately estimate the real risk probability.

Key word: data mining, risk forecast, k-nearest-neighbor classification, logistic regression, discriminant analysis, naïve Bayes classifier, artificial neural network, decision Tree.

(7)

誌謝

回顧在研究所的求學階段中,首先要感謝我的指導老師 葉怡成教授,老師很有 耐心與用心的教導我,不論在專業知識上或者是論文研究的整體架構,都給予我很 大的引導與協助,讓我在完成論文的過程中獲益良多;另外在待人處事方面,老師 也時常教導我們許多良好的價值觀與正確的態度,所以不論在專業研究上以及待人 處事的觀念,誠心感謝老師給予我的教導!

另外要感謝 劉瑞瓏老師,老師在我剛進研究所半年多的時間,教導我許多專 業知識,並且從老師身上學習到許多為人處事應有的態度,讓我產生很深的醒悟,

非常感謝老師的教導。

另外要特別感謝 徐政義老師與 鄭雅穗老師在百忙之中撥冗細閱,指導我的論 文口試,並給予我許多寶貴的意見,使我的論文更臻完善。更感謝 李御璽老師,

給予我寶貴的資料,讓我的論文添加了不少內容。也感謝謝資管系老師,在課業上 不斷的教導,讓我在基本知識上有所領會與融會貫通,使我成長不少。

在此還要感謝楊怡雰學姐及研究所同學們文盟、暉智、崇愷、其彬以及學弟妹 們冠呈、謹豪、韋綸、兆瑜、逸芸,在求學過程中,因為有你們的鼓勵與陪伴,使 得我的研究所生涯中,更添加許多美好的回憶。

最後感謝我的家人,親愛的爸爸、媽媽以及姊姊、哥哥,因為有你們無怨無悔 的付出與全力支持,才讓我有機會完成研究所的學位,非常感謝你們。

謹識于中華大學資訊管理研究所 九十五年七月

(8)

目錄

摘要... i

Abstract ... ii

誌謝... iii

目錄... iv

圖目錄... vi

表目錄... viii

第一章 導論... 1

1-1 研究背景 ... 1

1-2 研究目的 ... 2

1-3 研究流程 ... 2

1-4 研究內容 ... 3

第二章 文獻回顧... 5

2-1 風險預測問題 ... 5

2-1-1 新巴賽爾協定... 5

2-1-2 風險... 8

2-2 資料探勘技術 ... 9

2-3 資料探勘技術在風險預測問題之應用 ... 19

第三章 上市公司之風險預測... 24

3-1 導論 ... 24

3-2 方法 ... 24

3-3 結果 ... 32

3-4 自變數數目的影響 ... 46

3-5 重要自變數的比較 ... 50

3-6 預測機率與真實機率的關係 ... 57

3-7 結論 ... 59

(9)

第四章 個人信用卡之風險預測... 60

4-1 導論 ... 60

4-2 方法 ... 60

4-3 結果 ... 62

4-4 自變數數目的影響 ... 74

4-5 重要自變數的比較 ... 78

4-6 預測機率與真實機率的關係 ... 85

4-7 結論 ... 86

第五章 結論與建議... 88

5-1 結論 ... 88

5-2 建議 ... 91

參考文獻... 93

(10)

圖目錄

圖 1-3-1 研究架構及流程圖... 3

圖 2-2-1

β

0 +

β

i

x

i

θ

關係圖... 12

圖 2-2-2 人工神經元模型... 17

圖 3-3-1 不同 K 值下之訓練資料與驗證資料之誤判率 ... 33

圖 3-3-2 最近鄰居分類訓練資料與驗證資料之提升圖... 34

圖 3-3-3 選用 15 個自變數邏輯迴歸訓練資料與驗證資料之提升圖... 35

圖 3-3-4 判別分析訓練資料與驗證資料之提升圖... 36

圖 3-3-5 貝氏分類訓練資料與驗證資料之提升圖... 40

圖 3-3-6 提升圖... 41

圖 3-3-7 類神經網路訓練資料與驗證資料之提升圖... 43

圖 3-3-8 分類樹訓練資料與驗證資料之提升圖... 44

圖 3-3-9 分類樹(P(1)代表有財務危機的機率) ... 45

圖 3-4-1 逐步邏輯迴歸其不同係數下的誤差方差和... 47

圖 3-4-2 逐步邏輯迴歸訓練資料與驗證資料之提升圖... 47

圖 3-4-3 篩選變數過後最近鄰居分類訓練資料與驗證資料之提升圖... 48

圖 3-4-4 篩選變數過後判別分析訓練資料與驗證資料之提升圖... 48

圖 3-4-5 篩選變數過後貝氏分類訓練資料與驗證資料之提升圖... 48

圖 3-4-6 選變數過後神經網路訓練資料與驗證資料之提升圖... 49

圖 3-4-7 篩選變數過後分類樹訓練資料與驗證資料之提升圖... 49

圖 3-5-1 邏輯迴歸與判別分析的變數重要性比較... 55

圖 3-5-2 邏輯迴歸與類神經網路的變數重要性比較... 55

圖 3-5-3 判別分析與類神經網路的變數重要性比較... 56

圖 3-6-1 最近鄰居分類之機率圖... 58

圖 3-6-2 邏輯迴歸之機率圖………58

圖 3-6-3 判別分析之機率圖... 58

(11)

圖 3-6-4 貝氏分類之機率圖………58

圖 3-6-5 類神經網路之機率圖... 59

圖 3-6-6 分類樹之機率圖………59

圖 4-3-1 不同 K 值下之訓練資料與驗證資料之誤判率 ... 62

圖 4-3-2 最近鄰居分類訓練資料與驗證資料之提升圖... 63

圖 4-3-3 選用 23 個自變數邏輯迴歸訓練資料與驗證資料之提升圖... 64

圖 4-3-4 判別分析訓練資料與驗證資料之提升圖... 66

圖 4-3-5 貝氏分類訓練資料與驗證資料之提升圖... 70

圖 4-3-6 類神經網路訓練資料與驗證資料之提升圖... 71

圖 4-3-7 分類樹訓練資料與驗證資料之提升圖... 73

圖 4-3-8 分類樹 (P(1)代表有財務危機的機率) ... 73

圖 4-4-1 逐步邏輯迴歸其不同係數下的誤差方差和... 75

圖 4-4-2 逐步邏輯迴歸訓練資料與驗證資料之提升圖... 75

圖 4-4-3 篩選變數過後最近鄰居分類訓練資料與驗證資料之提升圖... 76

圖 4-4-4 篩選變數過後判別分析訓練資料與驗證資料之提升圖... 76

圖 4-4-5 篩選變數過後貝氏分類訓練資料與驗證資料之提升圖... 76

圖 4-4-6 選變數過後神經網路訓練資料與驗證資料之提升圖... 77

圖 4-4-7 篩選變數過後分類樹訓練資料與驗證資料之提升圖... 77

圖 4-5-1 邏輯迴歸與判別分析的變數重要性比較... 82

圖 4-5-2 邏輯迴歸與類神經網路的變數重要性比較... 83

圖 4-5-3 判別分析與類神經網路的變數重要性比較... 83

圖 4-6-1 最近鄰居分類之機率圖... 85

圖 4-6-2 邏輯迴歸之機率圖………..85

圖 4-6-3 判別分析之機率圖………... 86

圖 4-6-4 貝氏分類之機率圖………..86

圖 4-6-5 類神經網路之機率圖... 86

圖 4-6-6 分類樹之機率圖………..86

(12)

表目錄

表 2-1-1 巴塞爾條約發展歷程... 6

表 2-1-2 新舊巴賽爾資本協定比較表... 7

表 2-3-1 彙整各個學者之方法正確率比較表... 23

表 3-2-1 發生危機之公司... 25

表 3-2-2 依據各年度發生之財務危機公司... 27

表 3-2-3 有無財務危機公司之自變數中位數... 32

表 3-3-1 最近鄰居分類訓練資料與驗證資料之混亂矩陣... 33

表 3-3-2 選用 15 個自變數之迴歸模型... 34

表 3-3-3 邏輯迴歸訓練資料與驗證資料之混亂矩陣... 35

表 3-3-4 判別分析分析模型... 36

表 3-3-5 判別分析訓練資料與驗證資料之混亂矩陣... 36

表 3-3-6 貝氏分類之條件機率表... 37

表 3-3-7 貝氏分類訓練資料與驗證資料之混亂矩陣... 40

表 3-3-8 類神經網路比較表... 42

表 3-3-9 類神經網路訓練資料與驗證資料之混亂矩陣... 42

表 3-3-10 不同分類樹參數之誤差結果之比較... 43

表 3-3-11 分類樹訓練資料與驗證資料之混亂矩陣 ... 44

表 3-3-12 比較各方法之誤判率與面積率... 45

表 3-4-1 逐步迴歸執行之結果... 46

表 3-4-2 逐步迴歸執行之迴歸模型... 47

表 3-4-3 篩選變數後之誤判率與面積率... 49

表 3-5-1 邏輯迴歸之變數重要性分析... 50

表 3-5-2 判別分析之變數重要性分析... 51

表 3-5-3 類神經網路變數重要性分析... 53

表 3-5-4 貝氏分類的變數重要性分析... 54

(13)

表 3-5-5 彙整各種方法之顯著變數... 56

表 3-5-5 彙整各種方法之顯著變數(續)... 57

表 4-3-1 最近鄰居分類訓練資料與驗證資料之混亂矩陣... 62

表 4-3-2 選用全部自變數之迴歸模型... 63

表 4-3-3 邏輯迴歸訓練資料與驗證資料之混亂矩陣... 64

表 4-3-4 判別分析模型... 65

表 4-3-5 判別分析訓練資料與驗證資料之混亂矩陣... 65

表 4-3-6 貝氏分類之條件機率表... 66

表 4-3-7 貝氏分類訓練資料與驗證資料之混亂矩陣... 69

表 4-3-8 類神經網路比較表... 70

表 4-3-9 類神經網路訓練資料與驗證資料之混亂矩陣... 71

表 4-3-10 不同分類樹參數之誤差結果之比較... 72

表 4-3-11 分類樹訓練資料與驗證資料之混亂矩陣 ... 72

表 4-3-12 比較各方法的分類準確度... 74

表 4-4-1 逐步迴歸執行之迴歸模型... 75

表 4-4-2 篩選變數後之誤判率與面積率... 77

表 4-5-1 邏輯迴歸之變數重要性分析... 78

表 4-5-2 判別分析之變數重要性分析... 79

表 4-5-3 類神經網路之變數重要性分析... 80

表 4-5-4 貝氏分類的變數重要性分析... 81

表 4-5-5 彙整各種方法之顯著變數... 84

表 5-1-1 公司風險準確度之名次比較... 89

表 5-1-2 個人風險準確度之名次比較... 89

(14)

第一章 導論

1-1 研究背景

近年來我國金融市場逐步開放,朝向自由化、國際化,以及政府開放新銀行的 設立,加快台灣的資本市場的發展,並積極推動公開發行公司辦理股票上市,使市 場朝向「資本證券化、證券大眾化」的目標發展。政府核准外國投資機構直接投資 我國股市,透過許多放寬措施,其目的皆在活絡我國的資本市場。

近年來國內上市上櫃公司接連發生財務危機,公司被迫依法進行重整,以及股 票暫停交易或列入全額交割股,這些情況都使該公司的員工、債權人、往來客戶、

廠商及放款銀行等遭受極大損失,對擁有該公司股票的投資大眾更是血本無歸,造 成整個社會資源的損失、成本的增加,受影響層面相當廣泛。

另外,在金融體系的卡債風暴,因為金融機構對於個人信用未能謹慎審核,為 了業績而過度核發信用卡及現金卡,再加上持卡人無法掌握自身的財務能力,不斷 累積高額的循環利息債務,相對於金融機構則產生許多壞帳,對於持卡人以及發卡 銀行都是相當大的危機。

在健全的金融體系發展中,危機處理是下游,而風險預測則是上游。風險預測 的主要目的,為透過企業財務報表等相關資料,以及個人金融交易紀錄,來預測企 業及個人未來所存在風險及不確定因素,以期可事先對於可能產生的危機與損害,

做出防範與因應之策略,將可能造成的損失降至最低。

許多統計方法,如判別分析、邏輯迴歸、貝氏分類與最近鄰居分類等,都可用 來建構風險預測模型。人工智慧興起後,類神經網路與分類樹等方法也被用來建構 風險預測模型,目前這兩類方法已經整合為資料探勘(Data Mining)。本文的研究 目的即在於探討各種資料探勘方法在風險預測模型建構的適用性。

本研究的主題分為二個:

1. 股票上市公司之風險預測

運用資料探勘方法中之最近鄰居分類、邏輯迴歸、判別分析、貝氏分類、類神

(15)

經網路與分類樹此六種方法,建立預測股票上市公司財務風險之預測模型,並且比 較六種方法之訓練範例與驗證範例之提升圖、誤判率、面積率,以比較對各種資料 探勘方法在預測股票上市公司財務風險的適用性,幫助使用者衡量股票上市公司之 財務風險。

2. 個人信用卡之風險預測

運用資料探勘方法中之最近鄰居分類、邏輯迴歸、判別分析、貝氏分類、類神 經網路與分類樹此六種方法,建立個人信用卡逾期繳款風險之預測模型,並且比較 六種方法之訓練範例與驗證範例之提升圖、誤判率、面積率,以比較各種資料探勘 方法在預測信用卡風險預測的適用性,幫助銀行衡量個人信用卡之逾期繳款風險。

1-2 研究目的

本研究希望回答下列問題:

一、 各種資料探勘方法的風險預測能力有何差異?

二、只用少量重要的自變數與使用全部的自變數建模,在風險預測能力上 有何差異?

三、各種資料探勘方法找出的重要自變數相同嗎?

四、各種資料探勘方法預測的風險機率能正確估計真實的風險機率嗎?

1-3 研究流程

本論文其研究架構及流程繪成如圖 1-3-1 所示。

(16)

導 論

文 獻 探 討

股 票 上 市 公 司 之 風 險 預 測

個 人 信 用 卡 之 風 險 預 測

最 近 鄰 居

邏 輯 迴 歸

判 別 分 析

貝 氏 分 類

類 神 經 網 路

分 類 樹

最 近 鄰 居

邏 輯 迴 歸

判 別 分 析

貝 氏 分 類

類 神 經 網 路

分 類 樹

探 討 顯 著 變 數 與 衡 量 方 法 適 用 性 探 討 顯 著 變 數 與 衡 量 方 法 適 用 性

結 論

探 討 預 測 機 率 與 真 實 機 率 的 關 係 探 討 預 測 機 率 與 真 實 機 率 的 關 係

圖 1-3-1 研究架構及流程圖

1-4 研究內容

將本文之章節詳細介紹如下:

第一章為導論。說明本研究之背景、動機及目的,並且透過研究流程圖來說明 本研究之架構。

第二章為文獻探討。分別就與本研究相關之領域,彙總分析相關領域中之現有

(17)

文獻,以作為本研究之理論基礎。

第三章為股票上市公司之風險預測。使用最近鄰居分類、邏輯迴歸、判別分析、

貝氏分類、類神經網路與分類樹此六種方法,分別建構模型,並比較六種方法在股 票上市公司之風險預測適用性與準確度。

第四章為個人信用卡之風險預測。使用最近鄰居分類、邏輯迴歸、判別分析、

貝氏分類、類神經網路與分類樹此六種方法,分別建構模型,並比較六種方法在個 人信用卡之風險預測適用性與準確度。

第五章為結論。根據前述章節的研究結果,進行分析比較,探討各種資料探勘 方法之優缺點,並給予產業界實務應用的建議與學術界後續研究上的建議。

(18)

第二章 文獻回顧

2-1 風險預測問題

2-1-1 新巴賽爾協定

巴塞爾資本協定制定機構-國際清算銀行(The Bank for International

Settlements,簡稱BIS)於1930年成立,是世界上最久的國際金融機構,是重要國際 央行合作的主要據點。國際清算銀行是一個國際機構,主要的功能在於促進中央銀 行以及其他專業行政機構的合作,同時尋求財政與金融的穩定(陳寶清 2005)。

在1988年7月國際清算銀行(BIS)下的巴塞爾銀行監理委員會(The Basel Committee on Banking Supervision)提出以規範信用風險為主的「巴塞爾資本適足條 約」,規定最低資本適足比率為8%,以確定國際銀行維持在適足的資本水平,並建 立標準的最低資本。從此巴賽爾資本協定被廣泛的認同,也被超過100個國家採用,

成為全球金融業界公認的準則(周憲慶 2004)。

雖然被全球金融業界認同,但隨著環境的變遷,銀行除了放款業務外,也積極 的開發衍生性金融商品,以增加收益來源,而風險的控管更為重要,巴賽爾協定越 來越不適合,因為巴賽爾協定著重單一風險衡量,其管制資本計提與日漸複雜的銀 行內部經濟資本之計算產生衝突,無法有效認定信用風險避險計算方式。因此巴賽 爾委員會於1999年6月提出更具風險敏感性的新架構,亦增加作業管理風險,並比照 市場風險及信用風險計提資本,以支撐作業風險可能損失。

由表2-1-1彙整巴塞爾條約的重要發展歷程。

(19)

表 2-1-1 巴塞爾條約發展歷程

年代 條約 內容

1988 巴塞爾資本適足條約

(International

Convergence of Capital Measurement and Capital Standards)

1. 訂定自有資本佔風險性資產比率8%之 標準。

2. 規範表內及表外項目信用風險(credit risk,又稱交易對手信用風險counter party risk)之計算方法。

1991/11 巴塞爾資本協定修正案

(Proposed Amendments to the Basel Capital Accord)

述明「備抵呆帳」中屬於針對劣質資產或 已知負債所提列未來可能遭受之損失,不 得計入第二類資本,僅針對尚未辨明可能 損失及非為彌補特定資產之損失所提列者

( 即一般損失準備)始得計入第二類資本 1995/4 巴賽爾資本協定-表外項

目潛在保險額之處理

(The Basel Capital Accord--Treatment of Potential Exposure for Off-Balance-Sheet Items)

1. 修正資產負債表外項目信用風險的範 圍及計算方法。

2. 若符合該委員會所訂有關「資產負債表 內金額沖抵」之各項條件,於使用當期保 險法計算信用風險時,得依所訂公式減少 信用風險之計算,並明定自市場風險實施 後,原始暴險法停止適用。

1996/1 資本協定涵蓋市場風險 修正案(Amendment to theCapital Accord to Incorporate Market Risks

1. 將市場風險納入資本適足率之計算。增 列第三類資本,並規範市場風險之衡量方 法,得擇一使用標準法或自有模型法。

2. 要求G10集團國家的金融監理機關於 1997年底實施此新制。

1999/6 新式資本適足性架構(A New Capital Adequacy Framework)

將外國政府、公共部門、銀行、一般企業 等放款對象之風險權數,依風險程度分為 3~5 等級,2002 年底實施。

2001/1 新版巴塞爾資本協定

(New Basel Capital Accord)

1. 首次將作業風險納入最低資本要求,

修改信用風險加權風險性資產計算方式。

2. 強調主管機關的審查程序、市場自律與 最低資本適足三大支柱。

資料來源:陳寶清(2005)

而新舊版巴賽爾資本協定比較彙整如表2-1-2。由表可知,資本比率計算公式、

信用風險之資本計提、作業風險之資本計提、監理審查程序、市場制約機能皆有重 大改變(潘雅慧 2002)。

(20)

表 2-1-2 新舊巴賽爾資本協定比較表 項目 1988年「巴賽爾資本協

定」

2001年「巴賽爾資本協定」

1. 主要差 異點

1. 強調銀行應維持適當 之資本結構

2. 1988年協定僅涵蓋信 用風險,採標準法計 提

3. 1996年增列市場風 險,並允許銀行使用 內部模型計提市場風 險所需資本

1. 除強調「最低資本需求」外,增加「監理 審查程序」及「市場制約機能」兩個支柱。

2. 大幅修訂信用風險之資本計提方式,包括:

(1)地區銀行使用內部信用評等模型計提 信用風險所需資本。

(2)為使用內部評等模型者,依外部信用 評等結果適用不同之風險權數,以計提 資本;未接受評等者,原則上適用100

%風險權數。

3. 市場風險之資本計提方式不變。

4. 增列「作業風險」資本計提規定。

2. 資本比 率計算公式

資本總額/(信用風險加 權資產+市場風險應計 提資本*12.5)

資本總額/信用風險加權資產+(市場風險+作 業風險)應計提資本*12.5。

3. 信用風 險之資本計 提

1. 一律採用標準法 2. 風險權數按債務人類

別,粗略為0%、20

%、50%、100%四個 等級(我國共分五級

(我國共分五級,增 加10%一級)

3. 不考慮銀行採取之降 低信用風險措施,如 擔保品、保證、淨額 清算或信用衍生性商 品

1. 銀行可採方法包括:

(1)標準法

(2)基礎內部評等法 (3)進階內部評等法

2. 無論標準法或內部評等法,均允許銀行採 計信用風險之抵減,如徵提擔保品、保證、

信用衍生性商品、淨額清算、資產債券化。

4. 作業風 險之資本計 提

無 銀行可採方法包括:

(1) 基本指標法

(2) 標準法

(3) 內部衡量法 5. 監理審

查程序

未規定 金融監理機構應透過查核及早期矯正措施,

以確保銀行採行穩健之內部作業程序,確實 依其暴險程度計提足夠資本。

6. 市場制 約機能

未列入 要求銀行揭露其資本比率計算適用範圍、資 本內容、風險評估與管理資訊、資本適足比 率等四類資訊,透過市場制約機能以督促銀 行穩健經營。

資料來源:中央銀行季刊,91年6月

(21)

2-1-2 風險

一、 風險的定義

風險管理的意義,各個學者在界定上之用語不盡相同,Tames C. Cristy 界定風 險管理是企業或組織由控制偶然損失之風險,以保全所得能力與資產所做之集合努 力。Williams Jr. & Heius.(1964)謂風險管理係透過對風險之鑑定,衡量和控制而 以最少之成本使風險所致之損失達至最低程度之管理方法。Rosenbloom(1972)謂 所謂風險管理是處理純粹風險和決定最佳管理技術的一種方法。

採「主觀說」的學者認為風險係指未來所發生損失的不確定性。強調不確定性 和損失,不確定性是個人主觀的認定,其結果可能是利益亦有可能是損失。而另一 派採「客觀說」的學者認為,風險是客觀存在的事物,故可以客觀的尺度加以衡量,

並對風險、不確定性、機率三者加以區分。不確定性是不可衡量的,而風險是可能 達到鎖定期望結果的機率。

二、 風險的分類

風險分類之目的乃為了便於研究及決定不同之對策。由於分類基礎之不同,造 成風險有許多分類,在此整理成分為七大類。

純粹風險(Pure Risk)與投機風險(Speculative Risk):純粹風險較屬於被動式的,

處於純粹風險之下的結果只會變壞,不會改善;而投機風險多半是為了達成某些目 的去冒險而自找的,處於投機風險之下的結果可能會變壞,也可能變好。

靜態風險(Static Risk) 與動態風險(Dynamic Risk):靜態風險指的是風險的衡 量,均發生在一個極端而特定的時間之中;動態風險指危險的發生是由於人為故意 的、全面性的、沒有規則性的法則可依循,也沒有所謂可以預測的條件。

財務風險(Financial Risk)與非財務風險(Nonfinancial Risk):這裡所著重的是一般 有形物質的風險,並將與錢財有關的、流動性高的分為一類,而將與錢財較無關的、

流動性低的歸屬成一類。

基本風險(Fundamental Risk)與特定風險(Particular Risk):基本風險泛指由於外 在環境所造成的,如天災人禍、政治經濟因而造成整個環境下、個人與社會生命或 財產的損失;特定風險指的是某些特定的人、事、時、地、物,造成特定相關的個

(22)

人生命或財產的損失。

主觀風險(Subjective Risk)與客觀風險(Objective Risk):主觀風險是經由個人的 經驗、而非科學系統的方式來評估;而特定風險是經由專業的、精確的、以第三者 立場審慎評量。

人身風險(Personal Risk)、財產風險(Property Risk)與責任危險風險(Liability Risk):此種分類係以潛在之損失型態加以區分。人身風險係指人們因生、老、病、

死而遭致損失之風險;財產風險係指財產風險毀損、滅失和貶值之風險;責任風險 係指對於他人所遭受之體傷或財損應負法律賠償責任或無法旅行契約致度方受損失 應付之契約責任風險。

可管理之風險(Manageable Risk)與不可管理之風險(Non-Manageable Risk):可管 理風險係指可以預測及可以控制之風險;不可管理之風險則是不可預測及不可控制 之風險。

2-2 資料探勘技術

近年來,資料探勘(Data Mining)已成為企業熱門的話題。愈來愈多的企業想導 入這項技術,美國的一項研究報告更是將Data Mining視為21世紀十大明星產業,可 見它的重要性。一般Data Mining較常被應用的領域包括金融業、保險業、零售業、

直效行銷業、通訊業、製造業以及醫療服務業等。簡單來說Data Mining就是在龐大 的資料庫中尋找出有價值的隱藏訊息,籍由統計及人工智慧的科學技術,將「資料」

做深入分析,並根據企業的問題建立不同的模型,找出其中的「知識」,以提供企業 進行決策時的參考依據(葉怡成 2005)。

在今日資訊爆炸的時代裡,各個企業都會產生或收集到非常大量的資料。當今 對企業最大的挑戰,並不是資料不足,而是如何從汗牛充棟的資料中,發掘出有用 的知識,以提高企業的生產力與競爭力,強化顧客服務品質,增加顧客滿意度。Data Mining 是一個先進的大量資料分析與處理工具,它可將原先未知的有用資訊或知 識,從大量的資料裡發掘出來,並將這些資訊或知識用於公司決策。今日,Data Mining 已是決策支援系統中不可缺少的重要工具,尤其在市場行銷、顧客服務、詐

(23)

欺防弊、風險偵測與行為預測方面扮演關鍵的角色。

Data Miming 利用資料來建立一些模擬真實世界的模式(Model),並利用這些模 式來描述資料中的聚類(clusters)、規則(rules)、關聯(association)。這些模式有三種 用處:(1)「聚類」可以幫助你做了解,例如你可以從顧客特性資料區隔出許多聚類,

以針對各聚類擬定相應的產品設計、廣告行銷策略。(2)「規則」可以幫助你做預測,

例如你可以從顧客回應資料歸納出許多規則,再用此規則從一份郵寄名單中預測出 哪些客戶最可能對你的推銷做回應,所以你可以只對特定的對象做郵購推銷,而不 必浪費許多印刷費郵寄費而只得到很少的回應。(3)「關聯」可以幫助企業做規劃,

例如超級市場或百貨店可以從顧客消費資料歸納出許多關聯,再用此關聯幫助他們 規劃擺設貨品或設計促銷活動。

綜上所言,企業可利用Data Mining從大量資料中,建立相關模型,挖掘有價值 的知識,做為擬定規劃或決策的依據,進而改善設計、製造、銷售與服務。

以下介紹本文使用的資料探勘方法。

一、最近鄰居分類法(K-Nearest-Neighbor Classification)

最近鄰居分類法的基本原理是「相似的輸入有相似的輸出」。它的基本步驟入下:

(1)對變數進行變換處理。

(2)決定分類時所參考的最近鄰居數目 K。

(3)計算未知分類的樣本對已知分類的樣本距離。

(4) 找出 k 個距離最短的已知分類的樣本,以擁有最多樣本的分類為未知分類的 樣本之預測分類。

最近鄰居分類法根據的基礎是「物以類聚」,換句話說,同一類的物件應該會聚 集在一起,換成數學語言來說,也就是同一類別的物件,若以高度空間中的點來表 示,則這些點的距離應該會比較接近。因此,那麼對於一個未知類別的一筆資料,

我們只要找出來在訓練資料中和此筆資料最接近的點,就可以判定此筆資料的類別 應該和最接近的點的類別是一樣的。

最近鄰居分類法是一個最直覺的分類法,在測試各種分類器時,被當成是最基 礎的分類器,以便和其他更複雜的分類器進行效能比較。最近鄰居分類辨識器辨識 訓練樣本是藉著它鄰近的幾個樣本點中來分配它所屬的類別,換句話說要決定它所

(24)

屬的類別是靠它鄰近的幾個樣本點並進行投票,以最多票的類別來決定新樣本點它 所屬是哪個類別。

二、邏輯迴歸 (Logistic Regression, LR)

傳統的迴歸分析只適用在因變數是連續變數的情形,當因變數是二元變數時並 不適用。二元變數是指變數只有兩種可能結果,例如「有」或「無」,「是」或「否」。

邏輯迴歸 (Logistic Regression, LR),又譯為邏輯式迴歸,或音譯為羅吉斯迴歸,是 一種適用於二元變數的迴歸技術,它可用來建立估計一個二元變數出現「有」或「是」

的機率。

由於傳統的迴歸分析的因變數值域不受限制,但邏輯迴歸的因變數值為「機率 值」,故其值域必須受到不超過[0,1]的限制,因此傳統的迴歸分析無法適用。為解決 這個問題,首先定義 logit 函數如下:

⎟⎠

⎜ ⎞

= −

θ θ θ

ln 1 ) (

log it 公式2-2-1 其中

θ

是二元因變數出現「有」或「是」的機率。

假設

log it ( θ )

是自變數的線性函數:

+

=

i i i

x β

it(θ

) 0

β

log 公式2-2-2 由上式可反推

θ

) exp(

1

) exp(

0 0

+ +

+

=

i i i i

i i

x β

x β

β β

θ

公式2-2-3

由公式2-2-3可知,當

β

0 +

β

i

x

i 趨近正無限大時,

θ

趨近1;當

β

0 +

β

i

x

i為0

時,

θ

為0.5;當

β

0 +

β

i

x

i趨近負無限大時,

θ

趨近0。因此,無論

β

0 +

β

i

x

i

值多少,

θ

的值必在[0,1]之間,滿足其值域必須受到不超過[0,1]的限制。

(25)

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

-6 -4 -2 0 2 4 6

theta

+ i

x

i

β

0

β

圖 2-2-1

β

0+

β

i

x

i

θ

關係圖

由上述可知,如果能推導出

β 與

0

β

i,即可建立分類模型。步驟為 (1) 由公式2-2-1得log

it

(

θ

)

(2) 由公式2-2-2式以基於最小平方法原理的線性迴歸分析得

β ,

0

β

i

但事實上,上述步驟並不可行,因為在樣本中,因變數是二元變數,其值只有 兩種可能結果:「有」或「無」,因此

θ

不是「1」就是「0」,如此一來,就不能以(14-1) 式得log

it

(

θ

),因此無法以傳統的迴歸分析所用的最小平方法解公式2-2-1中的

β 與

0

β

i。為了求log

it

(

θ

)估計值,以函數展開得

( ) θ

θ

θ θ

ˆ

ˆ ˆ) ( ) log

(ˆ log )

log ⋅ −

∂ +∂

it θ

it

it(θ

公式2-2-4 其中

θ

ˆ 為

θ

的估計值,它可以是[0,1]之間的任何數值。

ˆ) 1 ˆ(

1 1 ˆ

ˆ ˆ ln ˆ

ˆ) ( log

θ θ θ θ θ

θ θ

= −

⎟⎟

⎜⎜

⎟⎟

⎜⎜

= ∂

it

公式2-2-5 代入公式2-2-4得

(26)

ˆ) 1 ˆ(

ˆ ˆ)

( log )

log

θ θ

θ θ

− + −

θ

it

it(θ

公式2-2-6

因此,可以不用公式2-2-1得log

it

(

θ

)的正確值,而用公式2-2-6得log

it

(

θ

)估計 值。如此一來,就可以用傳統的迴歸分析所用的最小平方法解公式2-2-2中的

β ,

0

β

i。 這個程序採迭代程序進行,使得以公式2-2-6得到的log

it

(

θ

)估計值逐步逼近公式 2-2-1log

it

(

θ

)的正確值。

綜合上述推導,為求解

β ,

0

β

i可用下列迭代程序:

(1) 假設

β ,

0

β

i初值,一般可令

β

0 =0,

β

i =0。 (2) 由公式2-2-3得

θ

ˆ 。

(3) 由公式2-2-6得log

it

(

θ

)估計值。

(4) 由公式2-2-2以基於「最小平方法原理」的線性迴歸分析得

β ,

0

β

i。 (5) 重複步驟(2)~(4)直到收斂。

三、判別分析(discriminant analysis)

判別分析(discriminant analysis),又譯為區別分析,是解決待判樣品分別屬於已 知分組中哪一組中的問題。兩組判別分析是解決待判樣品分別屬於已知兩組中哪一 組中的問題。不妨以 A 與 B 代表兩組總體,A、B 兩組中各有一批抽樣樣品數據,

每個樣品有 P 個變量(P 個判別指標)。

A 組中有

n

1個樣品:

x

11

( ) A

x

12

( ) A

, Λ ,

x

1p

( ) A

x

21

( ) A

x

22

( ) A

, Λ ,

x

2p

( ) A

x

n11

( ) A

x

n12

( ) A

, Λ ,

x

n1p

( ) A

A 樣品各判別指標的平均值為:

x

1

( ) A

x

2

( ) A

, Λ ,

x

p

( ) A

B 組中有

n 個樣品:

2

x

11

( ) B

x

12

( ) B

, Λ ,

x

1p

( ) B

(27)

x

21

( ) B

x

22

( ) B

, Λ ,

x

2p

( ) B

x

n21

( ) B

x

n22

( ) B

, Λ ,

x

n2 p

( ) B

B 組樣品各判別指標的平均值為:

x

1

( ) B

x

2

( ) B

, Λ ,

x

p

( ) B

在兩組間進行判別的處理方法是基於統計上的「費歇準則」,即判別的結果應使

「兩組之間區別最大,每組內部區間最小」。假設線性判別函數如下:

p p

x c x

c x c

y

= 1 1+ 2 2+Λ + 公式 2-3-1 其中

c

1 , c2, Λ cP為待求的判別函數係數。

則「兩組之間區別」可用下式表達:

( ) ( )

( y A

y B )

2 公式 2-3-2

其中

( ) ∑ ( )

=

= p

k k

k

x A

c A

y

1

= A 組樣品的重心; 公式 2-3-3

( ) ∑ ( )

=

= p

k k

k

x B

c B

y

1

= B 組樣品的重心。 公式 2-3-4

而「每組內部區間」可用下式表達:

( ) ( )

( )

2

1

1

=

n i

i

A y A

y

+

( ( ) ( ) )

2

1

2

=

n i

i

B y B

y

公式 2-3-5

其中

( ) ∑ ( )

=

= p

k ik k

i

A c x A

y

1

公式 2-3-6

( ) ∑ ( )

=

= p

k ik k

i

B c x B

y

1

公式 2-3-7

而費歇準則的「判別的結果應使兩組之間區別最大,每組內部區間最小」,可

(28)

綜合以上二式得到

( ) ( )

( )

( ) ( )

( ) ( ( ) ( ) )

∑ ∑

= =

− +

= −

1 2

1 1

2 2

2

n i

n i

i

i

A y A y B y B

y

B y A

I y

公式 2-3-8

最大化上式即可滿足費歇準則。

公式 2-3-1 中的判別函數的係數

c

k

( k

=1,2,Λ,

p )

可由最大化公式 2-3-8 得到。

由數學極值原理知極值發生在偏微分為 0 時,故

( k p )

c I

k

Λ 2 1

0 =,,

∂ =

∂ 公式 2-3-9

由於公式 2-3-8 為複雜的除式,偏微分不易,但由於使

I 取得極大值與使 nI

λ 取得極 大值等價,故公式 2-3-9 與下式等價

( k p )

c nI

k

λ Λ

2 1

0 =,,

∂ =

∂ 公式 2-3-10

由公式 2-3-10 可得到 p 個方程式,可解得一組判別函數的係數。

解得判別函數的係數

c

k

( k

=1,2,Λ,

p )

後,待判樣品的判別步驟如下:

(1) 由判別函數

y

=

c

1

x

1 +

c

2

x

2 +Λ +

c

p

x

p,計算得 A,B 兩類重心:

( ) ∑ ( )

=

= p

k k

k

x A

c A

y

1

公式 2-3-11

( ) ∑ ( )

=

= p

k k

k

x B

c B

y

1

公式 2-3-12 (2) 對它們進行以所含樣品數為權數的加權平均,得:

( ) ( )

2 1

2 1

n n

B y n A y y

AB

n

+

= + 公式 2-3-13

加權平均數

y 稱為兩組判別的綜合指標。

AB

(3) 對待判樣品

( x

1

x

2, Λ

x

P

)

,計算判別函數

y

=

c

1

x

1+

c

2

x

2+Λ +

c

p

x

p (4) 如果

y ( ) A

>

y

AB,則將

y

>

y

AB樣品判其屬 A 組;

y

y

AB判其屬 B 組。

(29)

如果

y ( ) B

>

y

AB,則將

y

>

y

AB樣品判其屬 B 組;

y

y

AB判其屬 A 組。

四、貝氏分類(naïve Bayes classifier)

貝氏分類方法是一種基於機率理論的計算樣本屬於某一個類別的可能性之分類 方法。為了降低計算複雜度,貝氏分類假設「一個屬性值對給定類別的影響獨立於 其他屬性值,即在屬性值之間不存在依賴關係,屬性值相互條件獨立。」故又稱為

「樸素貝氏分類」(naïve Bayes classifier)。雖然這個假設在實際應用中常不成立,但 是一般而言,屬性值之間經常是近似相互條件獨立,故樸素貝氏分類常能得到良好 的分類效果。

由貝氏定理可知

) (

) ( )

| ) (

|

(

P Attr

Dec P Dec Attr Attr P

Dec

P

j jj

= 公式2-4-1 其中

Attr 是一組特徵。

)

| (

Dec Attr

P

j 是在特徵

Attr 的條件下類別 Dec 的條件機率,又稱「後機率」。

j )

( Attr

P

是特徵

Attr 的機率。

)

| (

Attr Dec

j

P

是在類別

Dec 下特徵 Attr 的條件機率。

j )

(

Dec

j

P

是分類

Dec 的「前機率」。

j

由於對各分類而言,

P

( Attr)均相同,因此可用下式對樣本進行分類 )

( )

| ( )

|

(

Dec

j

Attr Max P Attr Dec

j

P Dec

j

P

Max

= ⋅ 公式2-4-2

能使上式最大化的類別

Dec 就是該樣本的分類。但是

j

P

(

Attr

|

Dec

j)的機率 並不易得到,因為假設有20個二元特徵

Attr

1,

Attr

2,Λ ,

Attr

20,則特徵

Attr 的組

合有2 種,因此需計算超過100萬種的20

P

(

Attr

|

Dec

j),更何況不一定每種組合 都曾在資料庫中出現過,根本無從計算條件機率。因此採統計獨立假設。

(30)

)

| ( )

| ( )

| (

)

| (

)

| (

2 1

2 1

j k j

j

j k j

Dec Attr P Dec Attr P Dec Attr P

Dec Attr Attr

Attr P Dec Attr P

Λ Λ

=

= 公式2-4-3

因此公式2-4-2改寫成 )

| (

Dec Attr P

Max

j

) ( )

| ( )

| ( )

|

(

Attr

1

Dec

j

P Attr

2

Dec

j

P Attr

k

Dec

j

P Dec

j

P

Max

⋅ ⋅

= Λ 公式2-4-4

如此,有20個二元特徵

Attr

1,

Attr

2,Λ ,

Attr

20,只需計算20個條件機率 )

| (

Attr

1

Dec

j

P

,

P

(

Attr

2 |

Dec

j),…,

P

(

Attr

20|

Dec

j)

五、類神經網路(Artificial Neural Network)

類神經網路,是指模仿生物神經網路的資訊處理系統。類陳經網路較精確的定 義為「類神經網路是一種計算系統,包括軟體與硬體,它使用大量簡單的相連人工 神經元來模仿生物神經網路的能力。人工神經元是生物神經元的簡單模擬,它從外 界環境或者其他人工神經元取得資訊,並加以非常簡單的運算,並輸出其結果到外 界環境或者其他人工神經元」。

神經網路是由許多人工神經元(artificial neuron)所組成,人工神經元又稱處理 單元(processing element)(如圖 2-2-2 所示)。

圖 2-2-2 人工神經元模型

每一個處理單元的輸出,成為許多處理單元的輸入。處理單元其輸出值與輸入 值之間的關係式,一般可用輸入值的加權乘積和之函數來表示,公式如下:

X

i

X

2

X1

X

n

θ

j

net

j

f Y

j

(31)

) (

=

i

j i ij

j

f W X

Y θ

公式 2-5-1

其中

Y =模仿生物神經元模型的輸出訊號。

j

f =模仿生物神經元模型的轉換訊號。

W =模仿生物神經元模型的神經節強度,又稱加權值。

ij

X =模仿生物神經元模型的輸入訊號。

i

θ

j=模仿生物神經元模型的閥值。

介於處理單元間的訊號傳遞路徑稱為連結(connection)。每一個連結上有一個 數值的加權值

W ,用以表示第 i 處理單元對第 j 個處理單元之影響強度。

ij

一個神經網路是由許多個人工神經元與其連結所組成,並且可以組成各種網路 模式(network model)。其中以倒傳遞網路(Back-Propagation Network,BPN)應用 最普遍。一個 BPN 包含許多層,每一層包含若干個處理單元。輸入層處理單元用以 輸入外在的環境訊息,輸出層處理單元用以輸出訊息給外在環境。此外,另包含一 重要之處理層,稱為隱藏層(hidden layer),隱藏層提供神經網路各神經元交互作用,

與問題的內在結構處理能力。

六、分類樹(Decision Tree)

分類樹是在分類時的決策判斷過程以樹狀結構來表示,其中包含了節點(nodes) 與枝幹(branch)。節點分為內部節點(interior nodes)與末稍節點(terminal nodes),而內 部節點表示在作決策時所依據的屬性;末稍節點表示最後分類的類別。枝幹則表示 所對應的屬性,依照屬性的不同將資料區分到不同的枝幹,由上而下一層層的往下 將資料分類,最後形成分類樹(胡婉鈞 2005)。

不過分類樹的階層數不宜過多或過少,如果過少,則表示分割的過程太早結束,

可能會有忽略重要變數的情形發生;相反的,如果過多,即表示做了太多的分割動 作,所做出來的決策原則將沒有意義。

(32)

Hastie, Friedman, Tibshirani(2001) 提到目前最被廣泛使用的分類樹演算法包括 CART (classification and regression trees)、C4.5、CHAID (chi-square automatic interaction detector) 等。

CART 是建構分類樹時最常用的演算法之一。CART 藉著一個單一輸入變數函 數,在每一個節點分隔資料,建構一個二分式分類樹。CART 會決定哪一個自變數 可以成為最好的分隔變數,最好分隔的定義是能夠將資料最完善的分配到一個單一 類別支配的群體。分散度是用來評估一個分隔變數的衡量標準,如分散度很高,表 示此組合包含多個類別,而分散度很低則表示單一類別的成員居多,因此分散度愈 低愈好。在CART選擇變數過程中,無法找到任何分隔可以顯著降低一個節點分散 度時,就將其標示為葉部節點。

C4.5 是較晚出現的分類樹演算法,早期版本為ID3。C4.5 與CART 建構過程非 常類似,兩者之間最大不同就在於節點分枝的數目,C4.5 會在每一個節點產生不同 數目分枝,分枝數目會決定於行為變項中類別的個數。

CHAID 是最古老的分類樹演算法,其與CART、C4.5 之差異在於CHAID 只限於處理類別變數,如連續變數必須採用區段的方式,轉換成類別變數。

另一差異部分在於修剪的部分,CART、C4.5 是先產生已過度學習的大型分類樹,

之後再修剪。但CHAID 則是在早期停止分枝,避免產生過度學習的分類樹。

2-3 資料探勘技術在風險預測問題之應用

一、 國外文獻

Ohlson (1980)

以1970年~1976年作為研究期間,以美國上市和上櫃的製造業為樣本,選擇了9 個財務比率做為變數,選取105家財務危機公司與2058家正常公司,採用Logit模型 來建立三年的財務預警模型。三年的正確率分別為96.12%、95.55%、92.84。

Dutta & Shekhar (1988)

分別採用10個財務比率(負債、銷貨/淨值、財務強度、過去5年的收益成長、營 運資金/銷貨、負債比率、利潤銷貨、利潤固定成本、未來5年預估收益的成長及公

(33)

司主觀前景與6個財務比率(只含前述的前6個變數)對企業的債券進行評等。研究結 果顯示,使用6個財務比率其正確率:類神經網路為82.4%、迴歸分析則為64.7%;

使用10個財務比率其正確率:類神經網路為88.3%;迴歸分析則為64.7%。

Surkan & Singleton (1990)

以 1982~1988 年做為研究期間,選取 18 家自 ATT 公司分割出的電話公司之債 信評等,採用 7 個財務變數(槓桿程度、利息支付能力、淨值報酬率(ROE)、ROE 變 動幅度、總資產、現金流量、獲利能力),採用一個隱藏層與兩個隱藏層的類神經網 路來建構模型。其一個隱藏層正確率達 65%、兩個隱藏層正確率達 88%。

Odom & Sharda (1990)

以1975~1982作為研究期間,以Altman (1968)提出的5個財務比率做為變數,選 取65家財務危機公司與64家正常公司,採用倒傳遞類神經網路來建立預警模型,並 與區別分析來比較。研究結果顯示:採用90%/10%的訓練範例與驗證範例,判別分 析正確率為78.57%、類神經網路之正確率為85.71%。

Tam & Kiang (1992)

以1985~1987作為研究期間,選擇了19個財務比率做為變數,選取了59家失敗 銀行與59家正常銀行。研究結果顯示:判別分析正確率為85.8%、Logit模型85.2%、

最近鄰居迴歸75.3%、分類樹81.8%、類神經網路89.5%,類神經網路之正確率最高。

Salchenberger (1992)

以1986~1987年作為研究期間,以儲蓄機構為研究對象,選擇了經逐步迴歸分 析之顯著區別變數,選取了100家失敗及100 家正常之儲蓄機構,採用類神經網路與 迴歸分析建立財務預警模型。研究結果顯示:類神經網路之正確率達95.8%、迴歸 分析正確率為92.3%,類神經網路之正確率高於迴歸分析。

Udo(1993)

選取了16個財務比率做為變數,收集了200家倒閉公司與200家正常公司資料,

採用倒傳遞網路與迴歸模型建立兩年財務預警模型。預測第一年財務預警模型之類 神經網路正確率為94.7%、迴歸分析為80%;預測第二年分別為82%、72%。類神 經網路之正確率高於迴歸分析。

Coats & Fant (1993)

(34)

以1970年至1989年作為研究期間,選擇了5個財務比率做為變數,選取94 家失 敗公司及188 家正常公司,採用多變量區別分析與類神經網路建立預警模型。研究 結果顯示:類神經網路之正確率(95%)高於多變量區別分析(87.9%)。

Wilson & Sharda (1994)

以1975年~1982年作為研究期間,選擇了5個財務比率做為變數,選取64家正常 公司與65家失敗企業,採用多變量線性區別分析與倒傳遞網路。研究結果顯示:倒 傳遞網路之正確率高於多變量線性區別分析。

Koh & Tan (1999)

以1978 至1985作為研究期間,選擇了6個財務指標做為變數,選取了165 家破 產公司165家正常公司,採用Probit模型與類神經網路模型中倒傳遞類神經網路 (Back-Propagation Neural Network)建構企業危機預警模型。研究結果顯示:類神經 網路的正確率高於Probit 模型。

West (2000)

以多種資料探勘方法應用在信用評分。研究結果顯示:multilayer perception(正 確率為87.1%)、mixture-of-experts(正確率為87%)、radial basis function(正確率為 85.4%)、 learning vector quantization(正確率為79.1%)、 fuzzy adaptive resonance

(正確率為71%)、區別分析(正確率為72%)、邏輯迴歸(正確率為89.1%)、最近 鄰居分類(正確率為84%)、分類樹(正確率為80%)。邏輯迴歸是最準確的方法。

Amir (2001)

使用神經網路與一些傳統財務比率指標以外的指標來預測財務危機。研究結果 顯示可以顯著改善樣本外的準確度(from 81.46% to 85.5% for a three-year-ahead forecast)。

McKee & Lensberg (2002)

以遺傳規劃演算法結合粗糙集(rough set)建構破產預測模型。研究使用從1991 到1997年291家美國公司。研究結果顯示:本法可將準確度從67%提升到80%。

Baesens (2003)

神經網路的主要缺點為缺少良好的解釋能力。本研究以神經網路法則擷取分析 三個實際的信用風險資料集。研究結果顯示,所擷取的規則具有良好的解釋能力。

(35)

Zan (2004)

以支持向量機(SVM)與倒傳遞神經網路(BPN)建構公司信用評等模型。研究結果 顯示,二者的準確度都在80%左右。本文並提出分析輸入變數在神經網路中相對重 要性的方法,並分析在美國與台灣市場的決定因子的差異性。

二、 國內文獻

潘玉葉(1990)

以1972~1986作為研究期間,選擇20個財務比率做為變數,選取18家財務危機 公司與32家正常公司,採用Logistic來建立預警模型。研究結果顯示,危機前一年正 確率達80%。

呂美慧(2000)

以 1996~1997 年作為研究期間,選擇了 6 個變數(婚姻狀況、學歷、金融往來、

貸款期間、借款人與擔保人關係、借款人通訊地址與擔保品位置),選取 760 件正常 繳息與 104 件已列催收之個人房貸授信案件,採用 Logistic 來建立信用評分模型。

研究結果顯示,正確率達 98.62%。

吳楷華(2000)

以1986~1989年為研究期間,選擇5個財務比率(應收帳款天數、淨值成長率、

現金流量比率、現金流量比率、負債比率)做為變數,選取33家財務危機公司與33 家正常公司,採用Logistic來建立預警模型並與區別分析來比較。研究結果顯示,危 機前一年正確率達93.1%,危機前兩年正確率達81.2%。

沈大白、張大成、劉宛鑫(2001)

以 1997~2001 年做為研究期間,選取 60 家上市公司,包含 30 家危機公司與 30 家正常公司,採用類神經網路來建立財務預警模型,其正確率達 80%。

唐甜恩(2005)

選擇12個財務比率做為變數,選取152家財務危機公司與152家正常公司,採用 Sum-of-Product類神經網路與多層次類神經網路來建立預警模型,並與區別分析來比 較。研究結果顯示:Sum-of-Product類神經網路正確率達92.8%、多層次類神經網路 正確率達86.8%。

(36)

表 2-3-1 彙整各個學者之方法正確率比較表

方法 文獻

最近鄰 居分類

邏輯 迴歸

判別 分析

貝氏 分類

神經

網路 分類樹

Ohlson(1980) 96.1%

Dutta & Shekhar(1988)

64.7% 88.3%

Surkan & Singleton(1990)

88%

Odom & Sharda(1990)

78.57% 85.71%

Tam & Kiang(1992)

75.3% 85.8% 89.5% 81.8%

Salchenberger(1992)

92.3% 95.8%

Udo(1993)

80% 94.7%

Coats & Fant(1993)

87.9% 95%

West(2000)

84% 89.1% 72% 87% 80%

Amir(2001)

85.5%

潘玉葉(1990)

80%

呂美慧(2000)

98.62%

吳楷華(2000)

93.1%

沈大白等人(2001)

80%

唐甜恩(2005)

92.8%

資料來源:本研究整理

(37)

第三章 上市公司之風險預測

3-1 導論

1997 年亞洲金融風暴後,經濟景氣下滑、產業外移,台灣的股市、匯市受到了 極大的衝擊及影響,造成許多上市、上櫃公司發生了財務危機。這些企業雖然受到 政府主管機關監督,均有制訂相當嚴謹的內部控制制度及內部稽核制度,但仍然發 生了財務危機。而企業一旦面臨倒閉,接之所受到影響的則是投資人的心血付諸流 水與社會經濟亮起紅燈。本研究目的主要是針對各種資料探勘方法在預測上市公司 財務風險的適用性。

本研究主要資料來源於台灣經濟新報資料庫,研究對象為台灣上市公司,將資 料分為兩種,一種是正常的上市公司,本身並沒有財務的問題;另一種是發生下市、

曾經全額交割過的公司。

3-2 方法

本研究主要利用台灣經濟新報資料庫中的下市資料庫中所標示的一些發生過全 額交割或者是下市的公司作為有財務危機的公司,共有 65 家公司,如表 3-2-1 所示。

(38)

表 3-2-1 發生危機之公司

全額交割日 公司簡稱

下市日

危機發生 日

起(一) 迄(一) 起(二) 迄(二) 1107 建台 2000/8/16 2004/9/6 1204 津津 2005/10/4 2005/4/22 1982/9/25 1988/9/21 2005/7/22 2005/10/4 1230 聯成食品 2001/11/1 1998/11/17 1999/12/10 2001/11/1 1239 味丹 2004/12/30 1407 華隆 2005/1/26 2001/5/22 2002/5/7 2003/11/10 1408 中紡 2001/4/2 2004/5/6 1422 民興 2003/5/6 2000/9/6 2001/11/7 2003/5/6 1431 新燕 2002/11/8 1999/5/21 2001/5/8 2002/11/8 1432 大魯閣 2005/4/4 2005/4/13 1438 裕豐 2001/8/10 2001/11/7 1450 新藝 2005/7/5 2001/8/24 2002/5/9 2002/7/2 2003/11/6 2005/7/5 1505 楊鐵 2001/1/29 2000/9/6 1985/9/16 1995/4/21 2000/9/30 2001/1/29 1510 台安 2003/9/30 1534 新企 2004/12/16 2004/9/24 2004/9/6 2004/12/16 1602 太電 2004/4/28 2002/9/6 2003/5/8 2004/4/28 1805 凱聚 2002/6/2 2003/6/20 2016 名佳利 2002/4/17 1998/11/2 2001/3/26 2002/4/17 2019 桂宏 2001/1/29 2000/9/16 2000/9/18 2001/1/29 2202 三富 2001/4/10 1994/6/30 1997/11/10 2001/4/10 2304 誠洲 2002/11/8 2001/7/28 2001/8/2 2002/11/8 2310 旭麗 2002/11/4 2318 佳錄 2005/7/5 2001/9/28 2003/7/7 2005/7/5 2319 大眾 2004/8/30 2322 致福 2002/11/4 1999/4/1 2326 亞瑟 2001/12/21 2001/12/25 2002/4/19 2002/5/7 2003/5/8 2335 清三 2004/3/12 2005/1/5 2005/1/7 2005/2/15 2348 力廣 2000/9/7 2002/5/7 2003/4/1 2005/5/6 2370 匯僑工業 2005/9/1 2407 陞技 2005/1/19 2004/12/16 2435 台路 2005/5/3 2001/12/31 2004/9/6 2445 南方 2003/6/18 2003/3/20 2003/3/26 2003/6/18 2490 皇統 2004/12/16 2004/9/15 2004/9/17 2004/12/16 2491 訊碟 2004/8/23 2004/9/8

(39)

表 3-2-1 發生危機之公司(續)

全額交割日 公司簡稱

下市日 危機發生

日 起(一) 迄(一) 起(二) 迄(二) 2494 突破 2004/4/15 2004/5/6 2496 卓越 2005/10/28 2005/9/7 2512 寶建 2003/11/12 2002/4/16 2002/6/28 2002/9/30 2002/11/5 2003/11/12 2517 長谷 2003/1/22 2000/11/30 2002/1/7 2003/1/22 2518 長億 2003/4/23 2000/9/6 2002/7/30 2003/4/23 2522 啟阜 2001/8/24 1999/4/18 1999/11/8 2001/8/24 2525 寶祥 2005/1/5 2001/6/30 2002/9/10 2005/1/5 2528 皇普 2000/4/28 2003/5/8 2537 春池 2001/1/12 2002/5/7 2003/5/8 2004/5/6 2004/9/6 2540 林三號 2001/5/25 2003/4/24 2005/5/6 2005/9/7 2604 立榮 2002/11/1 2904 匯僑 2001/8/3 2005/5/6 3001 協和 2004/11/15 2004/3/5 2004/3/11 2004/11/15 3004 宏達科 2004/9/23 2004/9/22 3021 衛道 2004/7/26 2004/7/28 3053 鼎營 2003/4/26 2003/9/8 3054 萬國 2005/5/6 3084 光威 2005/4/29 2005/5/5 3116 寬頻 2004/11/30 2005/4/6 3177 阿肯 2004/9/8 2004/8/31 3184 微邦 2005/5/17 2004/7/30 3295 宇極 2005/1/7 2005/3/17 4118 友合生

技 2005/6/6 2005/3/12 4403 東榮工 2001/9/3 2001/5/28 5502 龍田 2002/1/24 2001/8/28 5503 榮美開發 2001/10/15 2001/7/18 6252 艾爾法 2004/10/11 2005/2/28 8007 商合行 2002/10/9 2002/8/31 8061 東聖科 2004/7/7 2005/8/23 8910 五洲 2001/4/25 2001/1/31 9913 美式 2002/1/17 1999/1/18 1999/2/1 1999/5/24 1999/8/20 2002/1/17 9936 欣錩 2005/6/20 2004/10/20 2005/3/4 2005/6/20

資料來源:台灣經濟新報

(40)

而本研究依造危機發生年度,將所有發生財務危機公司彙整如表 3-2-2

表 3-2-2 依據各年度發生之財務危機公司 年 度 財 務 危 機 公 司

2000 1107 建台、1422 民興、1505 楊鐵、2019 桂宏、2348 力廣、2528 皇普、2517 長谷、2518 長億、2019 桂宏

2001

1230 聯成食品、1407 華隆、1408、中紡 1431 新燕、1438 裕豐 1450 新藝、1505 楊鐵、2019 桂宏、2202 三富、2304 誠洲、2318 佳錄、2326 亞瑟、2435 台路、2435 台路、2904 匯僑、2525 寶 祥、2537 春池 2540 林三號、2522 啟阜 4403 東榮工、8910 五 洲 5503 榮美開發、5502 龍田、1422 民興、1431 新燕、1438 裕 豐、2016 名佳利、2304 誠洲、2326 亞瑟

2002

1431 新燕 1602 太電、1805 凱聚 2016 名佳利、2304 誠洲 2310 旭麗、2322 致福 2512 寶建、2604 立榮 9913 美式、8007 商合 行、5502 龍田、1407 華隆、1450 新藝、2348 力廣、2518 長億、

2517 長谷、2512 寶建、2525 寶祥、2537 春池、3053 鼎營 2003

1422 民興 1510 台安、2445 南方 2512 寶建、2517 長谷 2518 長 億、3053 鼎營、1602 太電、1805 凱聚、2318 佳錄、2445 南方、

2540 林三號、2528 皇普

2004

1239 味丹、1534 新企、1602 太電、2319 大眾、2335 清三、2490 皇統、2491 訊碟、2494 突破、3001 協和、3004 宏達科、3021 衛 道、3116 寬頻、9936 欣錩、3184 微邦、6252 艾爾法 、8061 東 聖科、3177 阿肯、1107 建台、1408 中紡、1534 新企、2407 陞 技、2435 台路、2490 皇統、2494 突破、2491 訊碟、3001 協和、

3021 衛道、3004 宏達科

2005

1204 津津、1407 華隆、1432 大魯閣、1450 新藝、2318 佳錄、

2370 匯僑工業、2407 陞技、2435 台路、2496 卓越、9936 欣錩、

3084 光威、3116 寬頻、3184 微邦、3295 宇極、4118 友合生技、

6252 艾爾法、8061 東聖科、2525 寶祥、1432 大魯閣、2335 清 三、2496 卓越、3054 萬國、2904 匯僑

資料來源:本研究整理

本研究使用 15 個財務變數:流動比率、速動比率、負債比率、應收帳款週轉次、

存貨週轉率、總資產週轉率、稅前淨利成長率、本期稅後淨利、營業利益率、淨值 報酬率-稅後、總資產報酬成長率、利息支出率、借款依存度、營業收入淨額、總 資產成長率,做為預測的自變數;以財務年度的下一個年度是否發生財務危機(含全 額交割、下市、發生危機)當成預測的因變數。

參考文獻

相關文件

Number of laser modes depends on how the cavity modes intersect the optical gain curve.. In this case we are looking at modes within

Ken’s mother and his younger sisters are going swimming; Ken and his father are cooking a big meal. Later, they will play a ball at

! ESO created by five Member States with the goal to build a large telescope in the southern hemisphere. •  Belgium, France, Germany, Sweden and

The case where all the ρ s are equal to identity shows that this is not true in general (in this case the irreducible representations are lines, and we have an infinity of ways

The superlinear convergence of Broyden’s method for Example 1 is demonstrated in the following table, and the computed solutions are less accurate than those computed by

The study explore the relation between ownership structure, board characteristics and financial distress by Logistic regression analysis.. Overall, this paper

• About 14% of jobs in OECD countries participating in Survey  of Adult Skills (PIAAC) are highly automatable (i.e., probability  of automation of over 70%).  ..

Midpoint break loops are useful for situations where the commands in the loop must be executed at least once, but where the decision to make an early termination is based on