• 沒有找到結果。

中 華 大 學

N/A
N/A
Protected

Academic year: 2022

Share "中 華 大 學"

Copied!
124
0
0

加載中.... (立即查看全文)

全文

(1)

中 華 大 學 碩 士 論 文

題目:結合基因演算法與類神經網路開發企業財務危 機預警模型

Development of Financial Crisis Prediction Models by Using Genetic Algorithm and Neural Network

系 所 別:資訊工程學系碩士班 學號姓名:M09302071 邱垂傑 指導教授:周智勳 博士

中華民國 97 年 1 月

(2)

摘 要

本論文主題在於設計一個企業財務危機預測模型,其內容主要包括財務危機 變數篩選及危機預測模型建立。

在財務特徵變數篩選階段,使用基因演算法來找出最佳的變數組合,其中搭 配Fuzzy C-Mean 分群法及變異數指標來做為基因演算法的適應度計算。在財務 危機預測模型階段,先將危機預測組隨機分成訓練用樣本及測試用樣本,訓練樣 本提供類神經網路與Fuzzy C-Mean 分群法來學習。

實驗過程以1991 ~ 2006 年間被證卷交易所判定為全額交割或下市的 125 間 危機公司及375 間正常公司為實驗對象。經過重複執行實驗比較後,發現利用基 因演算法搭配變異數指標做為適應度計算,再以Fuzzy C-Mean 分群法來做為預 測分類器,可以取得最佳的財務危機預警模型。

(3)

ABSTRACT

The subject of this thesis is to develop a financial crisis prediction model which contains two main products; the selection of financial feature variables and to establish of crisis prediction model.

In the feature variables selection stage, the Genetic Algorithms with two different fitness functions, one is the Fuzzy C-Mean algorithm and the other is a Variance Index, were applied. In the prediction model establish stage, two predictors include Neural Network and Fuzzy C-Mean cluster were used.

In the experiment, 125 full-catch delivery companies the crisis samples determined by the static exchange center and 375 normal companies were used as the experiment data. The experimental results concluded that the applied Genetic Algorithms with Variance Index fitness function incorporated with the Fuzzy C-Mean classifier achieved better results than the others.

(4)

致 謝

三年時光不算短,至少比我當兵的役期還要長,這段期間內,經過資訊工程 所的洗禮,終於從一個景觀建築畢業的景觀人,轉換為資工人。首先第一個要感 謝的,是指導教授周智勳老師的不離不棄,因為有周老師的指導,才有今天這篇 論文的完成;還有口試委員石昭玲老師、李遠坤老師、連振昌老師、韓欽銓老師 提出的建議及指導。

這一路要感謝的人太多太多,因此,謝謝所有曾經在我生命中路過的每一個 人,不管停留時間的長短;謝謝所有我愛的人及愛我的人。謝謝你們!

邱垂傑 謹誌於 中華大學資訊工程研究所 民國94 年 2 月

(5)

目 錄

摘 要 ...I ABSTRACT... II 致 謝 ...III 目 錄 ...IV 圖 目 錄 ...VI 表 目 錄 ... VII

第一章 緒論 ...1

1.1 研究背景與動機...1

1.2 研究目的...1

1.3 研究流程...2

第二章 文獻探討 ...3

2.1 財務危機預警模型...3

2.2 財務危機的定義...4

2.3 特徵變數的選取...5

2.4 財務危機的預測...9

第三章 研究方法 ...13

3.1 資料前處理...13

3.1.1 樣本選取...13

3.1.2 變數定義...15

3.1.3 資料前處理...15

3.2 以基因演算法特徵變數選取...18

3.2.1 族群初始化與變數選取...18

3.2.2 適應度計算...20

3.2.3 相關運算元計算...30

3.3 財務危機預測...33

3.3.1 類神經網路...33

3.3.2 分群法...36

第四章 實驗結果與分析 ...38

4.1 特徵變數的選取...38

4.1.1 相關文獻整理之變數(變數組合 1)...38

4.1.2 相關基因演算法方式(變數組合 2)...39

4.1.3 基因演算法方式...40

4.2 財務危機預測...41

4.2.1 類神經網路...42

(6)

4.2.2 Fuzzy C-Mean分群法...47

4.3 實驗分析...51

4.3.1 特徵變數的比較...51

4.3.2 預測分類器的比較...52

4.3.3 實驗結論...54

第五章 結論與展望 ...55

5.1 結論...55

5.2 展望...56

參考文獻...57

附錄一...61

附錄二...65

附錄三...82

附錄四...85

附錄五...101

(7)

圖 目 錄

圖2.1 財務危機預警模型...3

圖2.2 系統架構圖...10

圖2.3 Evolutionary Bankruptcy Model...10

圖2.4 Genetic Fuzzy Neural Learning Algorithm...11

圖2.5 New Hybrid Iterative Evolutionary Learning Algorithm...11

圖3.1 系統架構圖...14

圖3.2 基因演算法流程圖...19

圖3.3 染色體編碼範例...19

圖3.4 分群法做適應度計算流程圖...21

圖3.5 範例選取之變數 1、2 的數據...27

圖3.6 範例選取之變數 1、2 的相關變異數...27

圖3.7 變異數指標做為適應度計算流程圖...28

圖3.8 單點交配...32

圖3.9 雙點交配...32

圖3.10 均勻交配...32

圖3.11 人工神經元模型...34

圖3.12 以倒傳遞網路做為預測分類器的流程圖...35

圖3.13 以Fuzzy C-Mean分群法作為預測分類器流程圖...37

圖4.1 利用類神經網路做為分類器的平均正確率...51

圖4.2 利用Fuzzy C-Mean做為分類器的平均正確率...52

圖4.3 變數組合 1 在不同分類器上的比較表...52

圖4.4 變數組合 2 在不同分類器上的比較表...53

圖4.5 變數組合 3 在不同分類器上的比較表...53

圖4.6 變數組合 4 在不同分類器上的比較表...53

(8)

表 目 錄

表2.2 財務比率列表...7

表3.1 配對樣本範例...15

表3.2 財務變數名稱...16

表3.3 第 18、53、83 組原始資料...17

表3.4 原始資料經上述正規化後之範例數據...18

表3.5 經染色體選取後的訓練用資料之範例數據...20

表3.6 範例資料分群後之群心...26

表3.7 選取的變數...30

表3.8 範例資料建議選取之特徵變數比較表...30

表4.1 變數組合 1...39

表4.2 變數組合 2...39

表4.3 變數組合 3...41

表4.4 變數組合 4...41

表4.5 變數組合 1 以類神經網路為分類器的預測正確率...43

表4.6 變數組合 1 以類神經網路為分類器的歸類矩陣...43

表4.7 變數組合 2 以類神經網路為分類器的預測正確率...44

表4.8 變數組合 2 以類神經網路為分類器的歸類矩陣...44

表4.9 變數組合 3 以類神經網路為分類器的預測正確率...45

表4.10 變數組合 3 以類神經網路為分類器的歸類矩陣...45

表4.11 變數組合 4 以類神經網路為分類器的預測正確率...46

表4.12 變數組合 4 以類神經網路為分類器的歸類矩陣...46

表4.13 變數組合 1 以分群法為分類器的預測正確率...47

表4.14 變數組合 1 以分群法為分類器的歸類矩陣...47

表4.15 變數組合 2 以分群法為分類器的預測正確率...48

表4.16 變數組合 2 以分群法為分類器的歸類矩陣...48

表4.17 變數組合 3 以分群法為分類器的預測正確率...49

表4.18 變數組合 3 以分群法為分類器的歸類矩陣...49

表4.19 變數組合 4 以分群法為分類器的預測正確率...50

表4.20 變數組合 4 以分群法為分類器的歸類矩陣...50

(9)

第一章 緒論

1.1 研究背景與動機

近幾年來,企業發生倒閉或重整的事件頻傳,多家上市上櫃及深受投資大 眾信任的企業陸續發生危機,例如2004 年 9 月宣稱在該領域全球市占率擁有坐 二望一的大廠博達公司,發生數拾億空前的掏空案後宣布公司重整;之後相繼 有衛道、訊碟、皇統等假帳案,2004 年 12 月檢察署又以胡洪九涉嫌挖空太電 資產而遭起訴。就在這些看似財力雄厚、全球也是數一數二的大型企業,接二 連三在無預警的情況下宣布重整、跳票或被證卷交易所判定為全額交割或下 市。一連串企業淘空與金融超貸案件,使民眾與銀行猶如受了震撼教育一般,

此時影響的不再單單只是企業本身,對於股東、投資人、員工及銀行,甚至對 國家整體經濟發展,都有極大的衝擊,造成龐大的社會成本損耗。

為了降低企業的損失擴大或對社會產生衝擊,若能夠利用一套財務預警模 型來提供預測,提早察覺可能發生的危機,不但對於企業有所幫助,亦可提供 資訊給投資大眾、相關主管機關部門或是銀行金融機構等,以做出最利於所有 人的決策。

1.2 研究目的

有鑑於上述企業發生財務危機對於各方面的影響甚鉅,本研究試圖從上市 公司財務報表中,以基因演算法找出對於財務危機具有解釋能力的特徵變數,

然後利用類神經網路中的倒傳遞與 Fuzzy C-Mean 分群法[9][11]等來建立一個 預警模型,用來解釋並預測財務危機。資料來源為台灣經濟新報(TEJ),以台灣 各產業財務報表作為研究標的,樣本期間為民國80 年起至 95 年止。本研究的 主要目的整理如下:

(10)

1. 傳統的企業財務危機預警模型大都以經驗來選取較有代表性的財務比率,

搭配統計方法的區別分析[2]、Logit[17]等方式來做預測,本研究嘗試利用 基因演算搭配不同的適應度計算方式,期望從中找出更具有解釋能力的財 務變數來提供預警模型的學習與預測。

2. 本研究將非財務資訊也納入篩選,如信用評等和股價指數等,並結合傳統 財務比率做為搭配,找出更能準確預測出財務危機發生的變數組合。

3. 在財務危機的相關文獻裡可以發現,大部分的研究樣本都是屬於較小量或 經過篩選之後的資料,本研究將實驗樣本更為擴大,以不同領域的產業,

試圖找出更能多方面預測財務危機的預警模型。

為了提升企業財務危機預測的準確率,除了已被廣泛使用的類神經網路 外,本研究提出以分群法方式來做為預警的模型。

1.3 研究流程

本研究的主要分為緒論、文獻探討、研究方法、實驗分析及結論等部分。

第一章節緒論介紹研究背景與動機、研究目的及流程。第二章將介紹國內外有 關於企業財務危機預警模型的相關研究,對各學者的使用方法做一個簡單的介 紹。第三章為研究方法的論述,詳述本研究所採用特徵變數篩選與危機預測的 方法,並對相關理論及範例使用做說明。第四章實驗分析,說明實驗資料與結 果,並詳細列出個實驗後的數據。第五章總結本研究的結論,未來可以研究及 改善的方向。

(11)

第二章 文獻探討

利用財務報表對上市公司進行危機預測,不管是早期經濟學者依據本身經 驗來判斷,或是後來利用各種演算法來學習推論,都有相當多的研究,本章節 依據財務危機預警模型架構去探討各種不同的相關文獻及其貢獻。

2.1 財務危機預警模型

關於企業財務危機預警模型的研究,目的是期望能夠找出一個有效率且廣 泛被應用的方法,模型的架構主要根據流程順序分為財務危機定義、特徵變數 選取及財務危機預測等三大部分,如圖2.1 所示。

財務危機的模型建構,從開始的單變量分析到後來的多變量分析,學者們 試著使用不同的統計方法找出最佳的預警模型。直到 1990 年 Odom and Sharda[19]開始使用類神經網路,用其取代傳統的統計分析,並且有了非常好的 突破。因此許多學者,為了使財務預警模型的預測效能提高,也引入各種非傳 統運用統計學的研究方法,期望能達到更準確的預估能力。本章將針對國內外 代表性較具代表性、較新或準確率較高之相關論文,依據發展的順序進行介紹。

2.1 財務危機預警模型

(12)

2.2 財務危機的定義

關於財務危機的定義,國內外許多學者因為認知上的不同,並未有一個統 一的定義。下面根據相關文獻對財務危機的定義做一個討論。最早研究企業財 務危機的學者Beaver(1966)[3]定義如下:

1. 無法支付特別股股利 2. 債卷違約

3. 發生銀行帳戶透支 4. 宣布破產

當某企業發生上述四項中任一項目,則為危機公司。另外其他的學者部分 如 Altman (1968)[2]則認為當企業為法律所認定之破產以及重整則可稱之企業 危機的發生。Deakin(1972)[6]下的定義為,當企業面臨倒閉、宣告破產、跳票、

無償債能力或遭清算即為發生財務危機的公司。Blum(1974)[4]所定義之財務危 機為,當企業債務到期而無法履行債務時、進入破產程序與債權人協議減少債 務時則稱為財務危機。Zmijewski(1984)[26]定義當企業申請破產宣告時即為 之。Froster(1986)[8]將財務危機定義為:除非對經濟實體的經營或結構實行大規 模重組,否則就無法解決嚴重變現問題時則視為危機。Ward(1997)[22]認為當企 業沒有能力償付債務,進行重整者稱為發生財務危機的企業。

國內對財務危機定義上,也有許多學者提出不同的看法及意見,一部分認 為以公司財務狀況為來判斷,如洪榮華(1993)[30]、張正忠(2000)[31]等;但大 部 分 學 者 仍 認 為 必 須 依 據 法 律 定 義 為 主 , 如 池 千 駒(1999)[28] 、 賴 季 柔 (2000)[40]、王俊傑(2000)[27]、陳淑萍(2003)[34]、許志鈞(2003)[32]、賴以建 (2003)[39]等。

法律上所定義之變更交易方式、破產、重整、申請債務延展等,其詳細內 容如下:

(13)

1. 上市公司符合台灣證卷交易所股份有限公司營業細則第 49 條所規定 之狀況,變更交易方式為全額交割股或裁定暫停交易者。

2. 申請重整、破產或終止上市者。

3. 企業遭到併購或接管者。

根據上述相關文獻對於財務危機的定義,本論文為求客觀性,採用法律明 文解說方式,以台灣證卷交易所股份有限公司營業細則第49 條(附錄一)所規定 之狀況,並在 TEJ(台灣新經濟日報)資料中,被判定為變更交易方式為全額交 割股或裁定暫停交易者為危機公司,其餘為非危機公司。

2.3 特徵變數的選取

在傳統財務危機的預警模型中,使用的財務變數解釋財務危機能力的好 壞,會影響在財務危機預測的準確率,因此本節中針對國內外對財務變數選取 的方式做一個介紹。

Beaver(1966)[3]是第一位利用財務比率作為判斷財務危機的依據,他以 1954 年到 1964 年間取 79 間公司為樣本,利用 30 個財務比率去對兩組樣本做 單變量分析後,結果發現「現金流量/負載額度」是最能預測財務危機的特徵變 數。

Altman(1968)[2]延續 Beaver 的研究,認為單變量分析只以單一變數進行分 析預測,容易產生變數與變數間相互矛盾,且單一變數在解釋公司狀況上也有 缺點存在,因此他在首次進行企業財務危機預警模型的研究時,延續了Beaver 的配對方法,並首位使用多元區別分析(Multiple Discriminant Analysis)來建立預 警模型,以1964 年至 1965 年為研究區間,相同的隨機選取了 33 家發生企業危 機的製造業公司作為樣本來配對,並利用它們的流動性、獲利能力、財務槓桿,

償還能立及週轉能力等共計22 個財務比率,萃取出其中最具預測能力的五個財

(14)

標,稱為Z 模型。

Z = 0.01X1+0.014X2+0.033X3+0.0064X4+0.999X5 X1.營運資產佔總資產比率=營運資金/總資產 X2.保留盈餘佔總資產比率=保留盈餘/總資產

X3.稅前息前淨利佔總資產比率=稅前息前盈餘/總資產

X4.股東權益市價佔總資產負債帳面價值比率=權益市場價值/總負債 X5.銷售收入佔總資產比率 = 總資產周轉率

Z:總合指標(2.675)

研究結果顯示,危機公司與正常公司的分界點為2.675,當大於該分界點為 正常公司,反之為危機公司。該模型在危機前一年有高達95%的準確率,危機 前兩年則下降到 75%,到危機前三年時,準確率卻僅剩下 48%,因此 Altman 的Z 模型對企業財務危機的預警只限在短期,超過兩年以上的則不適用。Altman 的這5 項特徵變數的建立,也成為之後各學者遵循且比照的作為預測的財務比 率變數。

Martin(1977)[17]是第一位提出以 Logit 模型來建立財務危機預警的學者,

利用其選出的25 個財務比率作為原始變數,以預測財務危機前兩年可能的機率 實證中發現下列6 項財務比率,在財務預警上面有較顯著的能力:

總資產報酬率(利/總資產)

呆帳對營業淨利比(呆帳/營業淨利) 費用對營收比(費用/營業收入) 放款對資產比(放款/資產)

商業款對總貸款比(商業款/總貸款) 風險性之產比(總資本/風險性資產)

Kim, K. J., & Han, I. (2003)[15]使用他們的主觀知識來處理定性的資訊:初 步的研究調查、財務報告分析、存貨水準分析、產業水準分析、財務策略評估 以及違約風險評估(Caouette, Altman, & Narayanan, 1998)。定性資料能夠用來

(15)

找出這些具有風險的公司是由哪些因子構成違約風險評估的程序。這些元素可 以建立及分類為6 個風險因子

Industry Risk (IR):產業風險 Management Risk (MR):管理風險 Financial Flexibility (FF):財務彈性 Credibility (CR):信用

Competitiveness (CO):競爭力 Operating risk (OP):營運風險

透過風險推估程序和指定適當的水準來評估定性風險因素,例如:使用他 們主觀的知識用這些因素的正值、平均值、負值來推估。最後,他們把數個個 案分類為接受、緩議和拒絕。

陳肇榮(1982)[35]以民國 67 年到民國 71 年發生財務危機公司為基準,以 1:2 的方式選取 48 間危機公司及 96 間正常公司來做財務危機分析,研究方法 以多變量及單變量為主,實證結論變數為「營運資金淨額」和「總資產報酬率」

最能顯著代表財務危機的特徵變數。

學者黃國玉(1995)[36]即針對台灣電子業上市公司企業經營績效之衡量所 作之研究,其以民國78 年至民國 83 年的上市電子公司研究對象,計 34 家,

經過三次的因素分析法萃取出具有91.99%解釋能力的 5 種 16 項財務比率(下 表),因本篇即以上市電子業為研究之實證對象,所以之後實證研究將以表一為

2.1 財務比率列表

A. 獲利因素: 1.稅後淨利率 2.總資產報酬率 3.固定資產報酬率 4.純益率 5.毛利率 6.負債比率

B. 流動因素: 7.流動比率 8.速動比率 9.固定資產對淨值比率 C. 週轉因素: 10.固定資產週轉率 11.淨值週轉率

D. 盈利因素: 12.值報酬率 13.營業支出對收入比率 14.負債對淨值比率

E. 經營因素: 15.鎖貨對營運資金比率 16.總資產週轉率

(16)

財務比率之依據。如表2.1 所示。

陳淑萍(2002)[34]利用亞洲金融風暴發生期間,爆發財務危機的 52 間企業 和同時期的52 間正常營運企業,取其發生前五季的資料,先找出 47 項較能夠 顯著表達公司營運狀況的財務比率,再以因素分析來擷取29 項財務比率做為特 徵變數,接著以決策樹技術學習預測,結果發現經過因素分析所萃取出的特徵 變數經過學習後的預測正確率,遠高於單純以47 個財務比率所建立學習的預警 模型,其中因素分析次數以三次為最精準。

許志鈞(2003)[32]以 SAS8.0 中的基因演算法來做為特徵變數選取的基礎,

利用演化特性篩選出可以解釋財務危機的特徵變數,作為財務危機預測的基 礎。該研究所選取「營業利益率」、「每股營業額」、「稅前純益/實收資本」、「每 股淨值(A)(不含特別股股本)」、「每股淨值(B)」、「內部保留比率」、「現金流量允 當變動率」、「利息保障倍數」、「固定資產周轉率」、「營業費用率」共十個財務 比率作為特徵變數使用,並與過去相關文獻所發現的特徵變數作為比對,其使 用了三種模型評估比較,結果顯示利用 SAS8.0 的基因演算法在基因演化 500 代後,篩選出一組命中率(hit ratio)為 95.56%的基因組合,並以此變數作為其特 徵變數,預測率最高可達到 93.52%,而文獻中的解釋變數則達 83.33%,明顯 優於其他比對的特徵變數。最後還實證在相同的特徵變數之下,三種的模型評 估的比較上,Logit 模式和倒傳遞網路互有優劣,而遞迴網路預測的能力,則相 對於前兩者較為偏低。

賴以建(2003)[39]試圖透過基因演算法強大的搜尋能力,篩選出影響企業財 物危機的解釋變數,使其變數的解釋範圍更廣泛。接著利用基因演算法所找出 的變數,以類神經網路的倒傳遞網路及傳統區別分析來建構出財務預警模型,

並比較模型之間在企業財務危機發生前三年的預警能力。該研究所選出的財務 比率其實同許志鈞的十個特徵變數,分別為「營業利益率」、「每股營業額」、「稅 前純益/實收資本」、「每股淨值(A)(不含特別股股本)」、「每股淨值(B)」、「內部 保留比率」、「現金流量允當變動率」、「利息保障倍數」、「固定資產周轉率」、「營 業費用率」。由實驗結果可以比較出,經由基因演算法所萃取出的解釋變數所建

(17)

構之類神經網路預警模型,及區別分析模型皆有極佳的預測能力。並且顯示類 神經網路預警有較區別分析更能提早偵測出企業的財務危機。類神經在測試樣 本的危機前三年平均預測能力為86.11%(危機前一年最高可達 91.66%),而區別 分析的危機前三年平均預測能力為80.55%(危機前一年最高可達 91.66%)

2.4 財務危機的預測

早期研究財務危機預警的文獻,在預測上大都利用統計方式分析出一個模 型,找出關鍵的財務因素,再作比較與驗證。但近年隨著資料探勘及人工智慧 演算法的日漸成熟,開始使用各種分類及類神經網路研究財務危機的預警模 型。以下針對相關研究做一個簡單的介紹說明。

Kim, K. J., and Han, I. (2003)[15]研究提出一個以基因演算法為基礎的資料 探勘方法,從專家的定性決策中發覺破產決策法則。根據實驗結果顯示,基因 演算法所產生的法則與歸納式的學習方法以及類神經網路相比較,基因演算法 能夠擁有較高的準確率以及覆蓋範圍。他們也指出值得考慮的協議來實現在基 因演算法方法和專家的問題解決之間的知識。這意謂被提出來的方法是一個適 合做為誘出專家知識和陳述專家決策法則的工具,而因此它提供了有效的決策 支援來解決破產預測的問題。該架構利用基因演算法特性,進一步對原先的決 策法則作演化動作,最後找出最具代表的法則來做為破產預測使用。主要架構 如圖2.2 所示。

Abdelwahed and Amir(2005)[1]提出複合式方法做為財務危機預測的模型,

結合基因演算法、類神經網路的導傳遞,此方法分成兩個階段,如圖2.3 所示。

第一階段:The global optimization procedure

利用GA 來做變數的選取,而其中的 GA 演算法是 based on the standard algorithm of Goldberg;作者利用 GA 來找出較好的輸入變數提供企業破產 的預言。

(18)

Data Set

Training Data Set

Expert’s Decision

Training

Data Set Rules

Rrediction Bankuptcy

Genetic Algorithms Rule Conversion

Initialization of the Population

Genetic evolution process

Conversion

圖2.2 系統架構圖

初始的變數以隨機方式來決定變數是否選取,再將選取的變數交於 NN,把 GA 所選取的變數做 NN 的輸入值,接著設定誤差值來調整出最適 合該組變數的權重,最後進行預測的動作。

第二階段:Refining the learning

第一階段的整合模型,將NN 最後預測的錯誤率回傳給 GA,當作該 組變數適應程度,讓GA 可以根據此適應程度進行複製、交配、突變等動 作;經過重複的學習,找出能夠提供最佳預測能力的變數,及適合該組變 數的NN 權重。

2.3 Evolutionary Bankruptcy Model

(19)

2.4 Genetic Fuzzy Neural Learning Algorithm

L. Yu and Y. Q. Zhang(2005)[13]提出一個新的反覆混合進化的演算法 five-layer fuzzy NN,在演算法初始加入全部參數和權重,然後使用 GA 來優化 這些參數,並且在最後利用最陡坡降學習演算法繼續參數的最優化。論文中提 到的Fuzzy NN 裡只有兩個步驟:1)利用 GA 去做訓練及 2) 最陡坡度學習法。

改進傳統的Fuzzy NN,我們所提出新混合的反覆進化學習演算法,真的以反覆 模 式(iterative manner) 去 合 併 GA 和 最 陡 坡 度 學 習 演 算 法 (gradient-descent learning algorithm)。重要的是,為了迴避 local minima 的問題,利用 GA 來替 Fuzzy NN with Knowledge Discovery (FNNKD)產生盡可能完善的參數,接著在 使用這些被訓練出來的FNNKD 產生新的參數值;將這些新的參數值回傳給 GA 以便更進一步的優化,直到滿足終止的條件。以交替模式結合GA 和最陡坡度 下降的這樣的一種混合迭代培養訓練演算法。傳統的流程如圖 2.4 所示。此篇 所修改過後New hybrid iterative evolutionary learning algorithm 如圖 2.5 所示。

至於國內在財務危機預測的相關文獻部分,在2.3 特徵變數選取的章節中,

我們可以看到許多使用各種不同的技術來作為預測的學習方法。

2.5 New Hybrid Iterative Evolutionary Learning Algorithm

(20)

由以相關的文獻可以發現,利用演算法或人工智慧學習方式在分析預測的 準確率上,確實較傳統使用統計分析的方法為高,因此本研究採用了類神經網 路中最常被用來做財務危機預測的倒傳遞及Fuzzy C-Mean 分群法兩種,作為預 測學習的工具。

(21)

第三章 研究方法

傳統的財務危機預警模型中,須先對公司財務報表資料做特徵變數選取,

再利用此組特徵變數對一群訓練樣本(training samples)建立具規則性的預警模 型,最後以測試樣本(test samples)對此模型進行測試得到辨識結果。一個良好 的預警模型,最重要的在於所選取的特徵變數是否具有代表性,以及是否能透 過一個合適的分類器,正確的判讀出財務危機的警訊。

本研究主要是利用基因演算法及類神經網路等人工智慧方法,來對企業建 立財務危機預警模型。公司財務報表經由資料前處理後,以基因演算法配合變 異數指標進行特徵變數選取,並由選取之特徵變數以類神經網路為分類器,進 行預測測試。圖 3.1 是本研究所提出的財務危機預警模型架構,架構內各小單 元會在本章節中逐一介紹。

3.1 資料前處理

本研究以台灣新經濟資料庫中,在台灣證卷交易所之股票上市公司的財務 報表為研究母體,並根據台灣證券交易所股份有限公司營業細則第四十九條之 定義變更交易方法為下市或全額交割之上市公司為危機樣本。此外未變更交易 方式的上市公司則為非危機樣本,用來與危機樣本配對形成對照資料。

3.1.1 樣本選取

樣本選擇上,找出符合本研究設定的財務危機定義做為危機樣本。而做為 對照用的非危機樣本選取條件,則依據 Beaver(1996)[3]在其研究中所提到的配 對條件,Beaver 所提的配對法則須符合三項條件,敘述如下:

(22)

3.1 系統架構圖 1. 相同產業:

非危機樣本需與危機樣本屬於相同產業別及相同類股。

2. 相當規模:

非危機樣本需與危機樣本經濟規模相當,本研究以資本額為主要判斷依 據,設定在資本額±25%的條件下。

3. 相似營業

篩選出符合上述兩要件之配對樣本後,如條件內公司數超過所需數量,

再根據選取配對樣本之中與危機公司主要營業項目相似度比對最高者 為配對樣本。

本研究從台灣新經濟資料庫中,於民國80 年至民國 94 年間的資料,共找

(23)

出125 間符合財務危機定義的公司樣本。接著再以上述配對法則為條件,並以 1:3 的比例(1 間危機公司與 3 間非危機公司)來形成樣本組,即稱為配對樣本組,

此處根據財務危機公司樣本數配對出 125 組配對樣本(共 500 間公司)。表 3.1 所示為其中三組的配對比較。

3.1.2 變數定義

本研究所採用之變數是依據台灣新經濟報社資料庫中所發布為主,此處共 選取了 64 個財務變數,其中除包含文獻裡較常使用且較具代表性之財務比率 外,並加入其他可量化的非財務比率變數,如 TCRI(台灣經濟新報信用風險觀 測)信用評等,流動資產,固定資產及其他資產等。所有變數如表 3-2 所示。

3.1.3 資料前處理

在完成配對樣本組的選取及財務變數選取確定後,以每一樣本組裡發生危 機年度的前一年到前四年度的財務報表為我們所選取的資料範圍,在3.1.1 所配 對範例組中,危機前一年的原始資料如表3.3 所示。

3.1 配對樣本範例

組別 公司代碼 產業名 選取年份 普通股股本 是否危機 8706 金緯 紡織人纖 1998 1,621,188 是 1463 強盛 紡織人纖 1998 1,520,091 否 1452 宏益 紡織人纖 1998 1,646,000 否 18

1445 大宇 紡織人纖 1998 1,693,443 否 5385 瑩寶 資訊電子 2000 887,649 是 2387 精元 資訊電子 2000 880,000 否 2420 新巨 資訊電子 2000 880,825 否 53

2402 毅嘉 資訊電子 2000 896,000 否 3039 宏傳 資訊電子 2004 882,219 是 2423 固緯 資訊電子 2004 886,685 否 3030 德律 資訊電子 2004 888,271 否 83

5438 東友 資訊電子 2004 893,865 否

(24)

3.2 財務變數名稱

變數 財務變數名稱 變數 財務變數名稱

1 資產報酬率(稅前息前折舊前)% 33 負債比率%

2 資產報酬率(稅後息前)% 34 淨值/總資產%

3 資產報酬率(稅後息前折舊前)% 35 長期資金適合率(A)%

4 淨值報酬率(稅後)% 36 借款依存度%

5 淨值報酬率(常續性利益)% 37 或有負債/淨值

6 營業毛利率% 38 利息保障倍數

7 營業利益率% 39 存貨應收帳款/淨值

8 稅前淨利率% 40 總資產週轉率(次)

9 稅後淨利率% 41 應收帳款週轉率(次)

10 業外收支率% 42 存貨週轉率(次)

11 常續性利益率(稅後)% 43 固定資產週轉率(次)

12 每股盈餘(元) 44 淨值週轉率(次)

13 常續性EPS 45 營收成長率%

14 每股營業額(元) 46 營業毛利成長率%

15 每股營業利益(元) 47 營業利益成長率%

16 每股稅前淨利(元) 48 稅前淨利成長率%

17 營業利益/實收資本 49 稅後淨利成長率%

18 稅前純益/實收資本 50 經常淨利成長率%

19 現金流量比率% 51 總資產成長率%

20 有息負債利率% 52 淨值成長率%

21 稅率(B)% 53 總資產報酬成長率%

22 每股淨值(B)(元) 54 常續性利益成長率─稅後

23 每股淨值(A)(元) 55 營業費用率%

24 每股淨值(C)(元) 56 用人費用率%

25 每股現金流量(元) 57 研究發展費用率%

26 內部保留比率% 58 呆帳費用率

27 現金流量允當% 59 TCRI 信用評等

28 現金再投資% 60 已實現銷貨毛利成長率%

29 流動比率% 61 折舊性固定資產成長率%

30 速動比率% 62 流動資產

31 利息支出率% 63 固定資產

32 總負債/總淨值% 64 其他資產

(25)

3.3 第 18、53、83 組原始資料 組別 是否

危機 公司代碼 變數 1 變數 2 變數 3 變數 4 … 變數 63 變數 64 1 8706 金緯 10.78 5.7 7.31 -888 … 1147228 2707 0 1463 強盛 12.21 6.87 11.26 7.92 … 1,088,882 95,091 0 1452 宏益 9.14 6.91 7.95 8.73 … 1,081,011 9,326 18

0 1445 大宇 12.89 9.39 11.8 12.62 … 1,969,973 46,380 1 5385 瑩寶 3.84 2.63 3.16 1.68 … 861680 297586 0 2387 精元 9.03 5.87 6.42 7.52 … 381,202 76,650 0 2420 新巨 9.11 5.37 9.38 7.41 … 620,860 22,725 53

0 2402 毅嘉 22.77 19.27 20.46 25.02 … 995,030 7,112 1 3039 宏傳 -51.04 -52.98 -50.61 -221.76 … 628033 15941 0 2423 固緯 14.44 10.67 11.86 15.23 … 596,298 296,280 0 3030 德律 29.52 26.43 28.4 35.41 … 828,916 50,142 83

0 5438 東友 16.7 12.57 14.73 24.28 … 94,749 30,298

至此我們必須先對資料做以下之前處理動作,步驟如下所示:

1. 資料分組:

利用在3.1.1 中所建立的 125 組配對樣本組(一組配對樣本資料包含 1 間 危機公司及 3 間配對出來的正常公司),以組為單位,進行隨機的分配 成兩大組群,其中的65 組配對資料做為特徵變數選取階段使用,另外 的60 組配對資料則提供財務危機預測用。

2. 正規化

由於企業原始的財務變數資料中,包含有百分比、信用評等、金額等 數值,因此資料的範圍差異相當大,於是以配對組為單位進行正規化,

每一年內的四間公司進行資料正規化的動作。例如表3.3 組別 18 的資 料中的變數1 為例,設定最大值(大宇)為 1,最小值(宏益)為 0,其他 數值則介於0 與 1 之間。以範例資料經正規化後的結果如表 3.4 所示。

(26)

3.4 原始資料經上述正規化後之範例數據 組別 是否

危機 公司代碼 變數 1 變數 2 變數 3 變數 4 … 變數 63 變數 64 1 8706 金緯 0.437 0 0 0 … 0.0745 0 0 1463 強盛 0.818 0.317 0.879 0.994 … 0.009 1 0 1452 宏益 0 0.327 0.142 0.995 … 0 0.072 18

0 1445 大宇 1 1 1 1 … 1 0.473

1 5385 瑩寶 0 0 0 0 … 0.783 1 0 2387 精元 0.274 0.194 0.188 0.250 … 0 0.239 0 2420 新巨 0.278 0.164 0.359 0.245 … 0.391 0.054 53

0 2402 毅嘉 1 1 1 1 … 1 0

1 3039 宏傳 0 0 0 0 … 0.726 0 0 2423 固緯 0.812 0.801 0.791 0.921 … 0.683 1

0 3030 德律 1 1 1 1 … 1 0.122

83

0 5438 東友 0.840 0.825 0.826 0.956 … 0 0.051

3.2 以基因演算法特徵變數選取

基因演算法是在1975 年由 John Holland 首先提出的最佳化搜尋演算法。其 基本的精神是仿效達爾文進化論中「適者生存、不適者淘汰」的物競天擇發展 出來,利用數學方法去模擬演化機制,讓具有較優良的母代,進行隨機性的基 因資訊交換,以產生更優秀的子代。基因演算法是屬於廣義型最佳化法則,不 但可以比特定型最佳化的方法找到更好的解,並且較不容易落入區域最佳解的 狀態。

本研究以基因演算法對 3.1 節所彙整的資料進行變數篩選,做為預測危機 公司的依據。變數篩選的過程如圖3.2 所示,並說明如下

3.2.1 族群初始化與變數選取

為了能夠從彙整的財務變數中篩選出較具代表性的變數,初始族群的染色 體每個基因皆各自代表一個財務變數,藉由二位元的0,1 編碼方式來表現該變

(27)

3.2 基因演算法流程圖

數的選取情況(0 表示不選取,1 表示選取),因此二元編碼方式正好適用於本研 究做為財務變數的篩選判斷。此外,由表3.1 得知,彙整的變數共有 64 個,因 此染色體的長度為64 個基因,即一條編碼字串長度為 64 位元。我們希望藉由 基因演算法的演化,求得最佳的染色體,也就是最佳的財務變數選取組合。

本研究的初始族群,其染色體的基因值是以隨機的方式產生,例如圖 3.3 所示,為初始族群中隨機產生的其中某一條染色體。該染色體表示從表 3.1 的 變數中,建議選取的變數組合為第2 個、第 5 個、…、第 61 個及第 64 個變數,

來做為預測危機公司的特徵變數組合。

依據染色體建議的變數選取,去保留篩選變數用樣本的相關變數資料,並 以隨機方式將這些樣本分成訓練及測試用兩類樣本群組,以進行該染色體適應 度計算。表3.5 顯示範例資料經過上述步驟後的結果。

1 0 0 1 0 …

1 0 0 1 0

64 63 62 61 6 …

5 4 3 2 1

1 0 0 1 0 …

1 0 0 1 0

64 63 62 61 6 …

5 4 3 2 1

(28)

3.5 經染色體選取後的訓練用資料之範例數據 類別 組別 是否

危機

選取變數 1

選取變數 2

選取變數 3

選取變數

4 … 選取變數

n-1

選取變數 n

1 0 0.364 1 0 … 0 1

0 0.978 0 0.406 0.496 … 1 0.786 0 0.982 1 0 0.553 … 0.617 0.678 18

0 1 0.432 0.666 1 … 0.901 0

1 1 0.964 0.165 1 … 1 0.806

0 0 0 0 0 … 0 0

0 0.573 1 0.366 0.573 … 0.01 0.291 訓練

樣本

83

0 0.511 0.902 1 0.511 … 0.0131 1

1 0 0 0 0 … 1 0

0 1 0.945 0.922 0.109 … 0 1 0 0.938 1 0.963 1 … 0.384 0.615 測試

樣本 53

0 0.893 0.744 1 0 … 0.098 0.901

3.2.2 適應度計算

適應度計算在於反應某一染色體所對應的特徵變數,對於預測財務危機時 的適用性。本研究提出以分群法及變異數指標來做為適應度計算,接著會詳細 說明這兩種方法。

A. 分群法:

財務報表的數據往往非常複雜,較難找出一固定的規律來判斷公司是否有 財務危機發生的可能,但是在數據變化的過程中隱含著人為判斷較難發現的規 則,此處我們以分群法則,並利用3.1.3 節資料前處理中的特徵變數篩選群組內 的65 組配對樣本資料,來計算基因演算法的適應度,流程如圖 3.4 所示。根據 圖3.4,以分群法做為基因演算法適應度計算的步驟如下:

1. 將訓練用樣本中是否為危機轉換為二位元數值(0 表示危機公司,1 表示非 危機公司),接著利用 Fuzzy C-Mean 搭配 WB 最佳群數指標對其做分群,

找出危機與非危機兩類的數個群組之群心,以做為對測試樣本分類判斷的 依據。詳細方法如下:

(29)

3.4 分群法做適應度計算流程圖

Fuzzy C-Mean 進行分群

此方法是利用迭代方式不斷的更新群聚中心矩陣 V 與歸屬度矩陣 U,

以得到目標函數的最佳值,目標函數式子如下

∑∑

= =

= n

j c

i

i j m j i

J

m

1 1

) 2

,

(U V

μ

x v (3-1)

其中 m 值為大於 1 的實數,xj為第 j 個資料點,vi為第群聚 i 的中心,μij

為資料點 j 對群聚 i 的歸屬度,歸屬度矩陣 Uc×n 的數學式表示為

(30)

]

⎥ ⎥

⎥ ⎥

⎢ ⎢

⎢ ⎢

×

=

n c c

c

n n

n c

μ μ

μ

μ μ

μ

μ μ

μ

L M M

M

L L

2 1

2 2

2 1 2

1 2

1 1 1

U (3-2)

並滿足下列條件限制式子

] 1 , 0 [ , 1

, 1

1

=

=

j i c

i j

i

j n μ

μ

(3-3)

群聚中心矩陣V的數學式表示為

[

v1 v2 vc T

V= L (3-4)

FCM演算法流程如下:

步驟1: 設定t=0,初始化fuzzy c-partition U(t)

步驟2: 以式子

c

n

i

j

m j i n

j

j m j i

i = ≤ ≤

=

= , 1

) (

) (

1 1

μ μ

x

v (3-5)

計算fuzzy c-partition P( )t 的 c 個群心(cluster centers) v1(t),L,v(ct)

步驟3: 對所有xj

X

更新P( )t+1

1

1 () 2

) 2 ( )

1 (

1

1

= +

⎥ ⎥

⎥ ⎥

⎢ ⎢

⎢ ⎢

⎟ ⎟

⎜ ⎜

= ∑ −

c

k t

k j

t i t j

j i

m

v x

v

μ x (3-6)

(31)

步驟4: 當

(

(+1), (+1)

) (

m (t), (t)

)

ε

t t

m

J

J

U V U V 則停止,否則 ,回到

步驟2。ε為threshold值,本實驗設為0.0000000001。

+ 1

= t

t

分群適切性判斷:WB指標

使用Fuzzy C-Mean可以在設定的群數c條件下,將資料區分為

C

個群聚,而 判斷

C

是否為最佳的分解群數,就要做分群的適切性判斷。一般使用分類適切 性的指標有下列幾種

(i) 分割係數(Partition coefficient)[7][8]

∑∑

= =

= c

1 i

n

1 j

1 2

)

( ij

U n

PC μ

(3-7)

1 ≤ PC≤1

C

,PC值越大越佳,

PC

可得到最佳群數C。

c

max

(ii)

分割熵(Partition Entropy)[9]

⎟⎟ ⎠

⎜⎜ ⎝

− ⎛

= ∑∑

= = c

1 i

n

1 j

1 log )

(

ij a ij

U n

PE μ μ (3-8)

PE值越小越好,

PE 可得到最佳群數C

c

min

(iii) Fukuyama and Sugeno所提出的指標FS[20]

⎟ ⎟

⎜ ⎜

⎛ − − −

=

= =

∑∑

2

1 1

) X

(

U V x v v v

FS j i i

c

i n

j m

μij

(3-9)

v:所有資料的中心點,FS值越小越佳,

FS FS可得到最佳群數C。

c

min

(iv) Xie and Beni所提出的指標XB[19]

⎟⎠

⎜ ⎞

⎝⎛ −

=

∑∑

= =

2 ,

2

1 1

min )

X (

XB

j j i

i

i j c

i n

j m ij

v v n

v x V

U

μ

, (3-10)

XB值越小越好, XB 可得到最佳群數C

c

min

(32)

(v) WB指標

WB指標掌握了分群的二大要項:1〉不同群聚之間的資料點差異愈大

越佳;2〉相同群聚內的資料點差異愈小越佳,其表示為

)

; , ( / ) , ( )

; ,

(

U V X B U V W U V X

WB

=

(3-11)

其中 為群間變異程度, 為群內變異程度,WB 值愈大

表資料分割愈佳,最佳群數C可由 而獲得。

) , (

U V

B W

(

U

,

V

;

X

)

)

; , ( max

arg

WB

U V X

c

上述的五種評分方式,第五種WB指標,經過測試後發現可以找出較適合本研究 的分類群數。計算WB指標的

步驟

如下

步驟

1

: 第i群聚內資料點的緊密(稠密)性定義為

c Si i

j i i

i

1 K

C

j S

2

=

= ∑

μ

(3-12)

其中

⎩ ⎨

⎧ =

=

otherwise ,

0

max if

,

1

1 kj

c j k i j

Ii μ μ

(3-13)

{

=1

}

= ij

i

j I

S

(3-14)

C 是透過歸屬度來定義其稠密性,其值越大資料越稠密。

i

步驟

2

群內變異(離散)程度定義為

n j C

W

j i

c

i j S

i

i

=

∑ ∑

=

, 1

) ( )

; ,

( 2

1

1 x v

X V

U (3-15)

2 i

j v

x

定義同一群聚內兩資料點的離散程度,其值越小越聚集,而

Ci

愈大愈稠密,故

W

值越小越好。

(33)

步驟

3

資料點x

j

分屬於

λ

群聚和m群聚的分離貢獻性定義為 μ

λj

μ

mj

,其值越 小越好。舉例說明,假設有一歸屬度矩陣

⎥⎦

⎢ ⎤

=⎡

× 0.1 0.7 0.6 0.5 5 . 0 4 . 0 3 . 0 9 . 0

4

U2

μ11

μ21

= 0 . 09

,μ12

μ22

= 0 . 21

μ

13

μ

23=0.24,μ14

μ24

= 0 . 25

由於資料點x

1

隸屬於群聚1 的程度遠大於群聚2,則其分離貢獻性

21 11 μ

μ

的值較小。反之,如資料點x

4

隸屬於群聚1 的程度與群聚2相 當,因此其分離貢獻性

μ14

μ24

的值較大。

步驟

4

群間變異程度定義為

2 1

1

1 1

2 ) 1 ,

( m

c c

m m

S S j

j m j

v S v

C S

B

m

⎟⎟

⎜⎜

+

×

⎟⎟⎠

⎜⎜ ⎞

=⎛

= = +

∑ ∑

λ λ λ λ

λ

λ

μ μ

V

U (3-16)

m S S j

mj j

S S

m

+

∑ ×

λ λ

λ

μ μ

可以表現出屬於

λ

群聚和m群聚的所有資料點,對

λ

聚和m群聚的分離貢獻性,其值越小越好。 v

λ

v

m 2

定義群聚分離程 度,值越大越好,故

B

(

U

,

V

) 值越大越佳。

最後結合群間和群內變異程度定義出

WB

指標,找出最適分群數

(3-17) )

; , ( max arg2

optimal

WB

U V X

C

c≤n

=

2. 將測試樣本,與上一步驟中以 Fuzzy C-Mean 所找出危機與非危機兩類的數 個群組之群心,進行樣本分類判斷,並計算測試用樣本是否正確分類到該 類所屬的群組之中,以其正確率做為基因演算法的適應程度值。

(34)

3.6 範例資料分群後之群心 群心 是否

危機

選取變數 1

選取變數 2

選取變數 3

選取變數

4 … 選取變數

n-1

選取變數 n

群心1 0 0.23 0.38 0.19 0.29 … 0.00 0.39 群心2 0 0.44 0.93 0.77 0.91 … 0.00 0.00 群心3 0 0.00 0.40 0.11 0.21 … 0.04 0.00 群心4 1 0.00 0.00 0.00 0.00 … 0.05 0.73 群心5 0 0.63 0.98 0.80 0.84 … 1.00 0.68 群心6 1 0.86 0.00 0.00 0.00 … 1.00 0.78

3. 判斷是否達基因演算法的終止條件(以演化的代數大小為終止條件)。若未 達終止條件,則執行運算元計算新的染色體族群後,重複執行1 – 2;若達 終止條件,則解碼輸出。

以範例資料進行上述方法後,在最佳分群數為六群時可以得到適應度最高的染 色體,該群心如下表3.6 所示。而適應度為最高的染色體如下所示:

[0,0,0,0,1,0,0,0,1,1,0,1,0,0,0,0,0,0,0,0,0,0,0,1,1,0,1,0,0,1,0,1,1,0,1,0,1,1,0,0,0,0,0,0,0 ,0,0,1,0,0,1,1,0,0,0,1,1,0,0,1,0,1,0,0]

經過解碼後我們得到建議選取的變數組合為:

第5、9、10、12、24、25、27、30、32、33、35、37、38、48、51、52、56、

57、60、62 個的變數

B. 變異數指標:

危機公司與非危機公司的判斷上,有兩個重要的前提。(1)正常公司之間的數據 差越小越好,亦即正常公司之間的數據相似度越大,關聯性越強。(2)危機公司 與正常公司之間的數據差越大越好,即危機與正常公司間的數據相似程度越 小,關聯性越低。因此當正常公司之間的數據越集中、越稠密,表示其擴散

(35)

0 0.364

0.978

0

0.982 1 1

0.433

0 0.2 0.4 0.6 0.8 1

危機公司 正常公司1 正常公司2 正常公司3

選取的變數1 選取的變數2

3.5 範例選取之變數 1、2 的數據

程度越低,則變異數會越小;若危機公司的數據與正常公司的數據越分離,則 加入危機公司後的新變異數會與之前差距變得更大。相反的危機公司數據與正 常公司數據越接近,則加入前與加入後的變異數差距變得更小。

以表3.5 範例資料裡,組別 18 的配對樣本中,染色體選取的變數 1 及變數 2 為例,其資料如圖 3.5 所示。

根據這些數值我們可以分別求得,由該組之3 間正常公司與全部 4 間公司 有關變數1 與 2 的變異數。如圖 3.6 所示。

由圖3.5 與 3.6 可以看到,當變數 1 的正常公司內數據差異越小、越集中,

其變異數會越小,而危機公司與正常公司的數據差異越大時,加入後的變異數 會明顯變大;而變數2 則因為危機公司與正常公司數據沒有明顯分離情形,使 得加入危機公司的數據後的變異數與加入前正常公司所求得之變異數差異不 大。根據此方向,本研究提出一變異數指標來做為基因演算法適應度的計算依 據。流程如圖3.7 所示。

0.0121

0.8282

0.5667 0.5572

0 0.2 0.4 0.6 0.8 1

選取的變數1 選取的變數2

正常公司變異數 全部公司變異數

3.6 範例選取之變數 1、2 的相關變異數

(36)

3.7 變異數指標做為適應度計算流程圖

根據圖3.7,以變異數指標做為基因演算法適應度計算的步驟如下:

步驟1: 以組為單位來做適應度計算,下面公式為計算其中第 y 組配對樣 本資料(包含1間財務危機與所配對的3間正常公司),被第 n 條染 色體選取到的財務變數 k 之平均值

μ

ka

μ

kb

4

4

1

=

i= ki ka

C

μ (3-18)

3

4

2

=

i= ki kb

C

μ (3-19)

其中C為財務變數值,k表示染色體選取到的財務變數,i表示為該 配對樣本組中的第幾間公司(當i=1時表示為危機公司資料,i = 2 - 4

(37)

為正常公司資料)。

步驟3: 分別計算出有包含財務危機公司資料與沒包含財務危機公司資料 的變異數

V

ka

V

kb

4 ) (

4

1

2

=

=

i ki ka

ka

C V

μ

(3-20)

3 )

4

(

2

2

=

=

i ki kb

kb

C V

μ

(3-21)

步驟4: 該染色體 n 對第 y 組資料所得的適應度分數

R

ny

=

= j

k

kb ka

ny

V V

R

1

(3-22)

其中, y 表示為資料樣本組別。重複步驟1 - 4,直到所有的配對 樣本組都計算完畢後跳到步驟5。

步驟5: 將65組配對樣本所計算出的 累加,即可得到染色體 n 的適應程 度值。選取染色體中適應程度值最高的前40%為提供運算元計算產 生新的染色體族群。

R

ny

步驟6: 重複執行步驟1到步驟5直到設定演化代數 Z 後停止,將 Z 次執 行結果所得適應程度最高的染色體,執行解碼輸出為建議選取之特 徵變數。

(38)

3.7 選取的變數

次數 被選取的變數

1 1、5、8、9、10、13、24、27、30、32、35、37、38、41、48、50、51、52、56、57、59、62 2 5、8、9、10、13、24、27、30、32、35、37、38、41、48、50、52、56、57、59、62 3 1、5、8、9、10、13、24、30、32、35、37、38、41、48、50、51、52、56、57、59、62 4 5、8、9、10、13、24、27、30、32、35、37、38、41、48、50、52、56、57、59、62 5 5、8、9、10、13、24、27、30、32、35、37、38、41、48、50、52、56、57、59、62 6 1、5、8、9、10、13、24、27、30、32、35、37、38、41、48、50、51、52、56、57、59、62 7 1、5、8、9、10、13、27、30、32、35、37、38、41、48、50、52、56、57、59、62

8 1、5、8、9、10、13、24、27、30、32、35、37、38、41、48、50、51、52、56、57、59、62 9 1、5、8、9、10、13、24、27、30、32、35、37、38、41、48、50、51、52、56、57、59、62 10 5、8、9、10、13、24、27、30、32、35、37、38、41、48、50、52、56、57、59、62

3.8 範例資料建議選取之特徵變數比較表

方法 相同建議之變數 相異建議之變數

Fuzzy C-Mean 分群法

第12、25、33、51、60 個的變數 變異數指標

第5、9、10、24、27、30、32、35、37、38、

48、52、56、57、62

個的變數 第8、13、41、50、59 個的變數

以範例資料進行上述方法後,經過10 演化搜尋,每次 200 代後,10 次演 化適應度最高的染色體解碼輸出後如表 3.7 所示。經過統計後選取出現次數達 90%以上,得到建議選取的變數組合為:第 5、8、9、10、13、24、27、30、

32、35、37、38、41、48、50、52、56、57、59、62 個的變數。以範例資料,

經過以 Fuzzy C-Mean 與變異數指標做為基因演算法後所建議選取的變數組合 比較如表3.8 所示:

3.2.3 相關運算元計算

經過適應度計算後,我們將適應程度較高的染色體透過運算元來產生新一代的 群族。基因演算法的運算元包含複製(selection)、交配(crossover)、突變(mutation) 三個部分,接下來將逐一介紹各運算元。

(39)

A. 複製

複製就是把族群裡所有的染色體,根據「適者生存,不適者淘汰」的原則,

利用每一個染色體的適應程度來做挑選,適應程度高的染色體可以在下一代族 群中被大量繁衍,而適應度低的染色體則會在下一代族群中被淘汰。複製常用 的 程 序 有 三 種 型 式 : 輪 盤 式 選 擇(Roulette Wheel Selection) 、 競 爭 式 選 擇 (Tournament Selection)和門檻式選擇(Genitor Selection),本研究所用的方法為競 爭式選擇。

競爭式選擇的方式,是對族群裡的染色體適應程度作高低排序,接著再將 較好的染色體直接複製入交配池中進行交配,此種挑選染色體的方式,可讓表 現適應程度高的染色體不被剔除。

B. 交配

交配過程是利用隨機或是其他方式選取,經由複製過程中所選入交配池的 染色體進行基因交換的動作,這是運用生物界中交配可以使基因相互的交流,

在交配後的子代可擁有母代基因混和之特性,而交配的主要目的是為了希望可 以產生出有更高適應程度的子代。產生的子代可能擁有母代的優點,也可能繼 承母代的缺點,所以適應度不佳的子代,會在下一個複製的程序中被淘汰。

交配的程序有三種型式:(1)單點交換、(2)兩點交換、(3)均勻交換,三種方 法的分述如下:

(1) 單點交換(One-Point Crossover)

對所選取欲進行交配的染色體,以隨機選取一個交換點,將該交換點 之後的基因作對換的動作。如圖3.8 所示。

(2) 兩點交換(Two-Point Crossover)

對所選取欲進行交配的染色體,以隨機選取兩個交換點,將交換點之

(40)

間的基因作對換的動作。如圖3.9 所示。

(3) 均勻交換(Uniform Crossover)

首先須產生與染色體長度相同的遮罩當作進行交配位置的指標器,其 中遮罩的字串是隨機的由0 或 1 所組成,當遮罩中為 1 的時候,即表 示該位置需要做基因對換的動作。如圖3.10 所示。

本研究同時採用三種方式,在每次染色體要進行交配時,先以隨機的從中 挑選一種方法來進行交配。

3.8 單點交配

3.9 雙點交配

3.10 均勻交配

(41)

C. 突變

突變亦是利用隨機的方法來進行,對欲進行突變的染色體隨意的選取一個 突變點(基因),並對該位置的基因做反轉動作(基因原先數值若為 0 時則將其轉 換為1,若為 1 時則轉換為 0)。突變的主要目的是為了避免基因演算法在演化 的過程中,陷入局部最佳解的狀況,使得整個過程較容易搜尋到全域最佳解。

但是突變率通常設得非常低,因為突變的機率如果過高,則可能破壞原先以找 到的優良基因結構。

3.3 財務危機預測

根據相關文獻的研究中發現,類神經網路的倒傳遞方式來做為財務危機預警 模型確實能夠獲得較好的結果,本研究中除了利用基因演算法來找出更好的特徵 變數組合外,也提出了以分群法來做為財務危機預警模型的預測工具,並以文獻 中建議的特徵變數來與基因演算法所找出的特徵變數,比較類神經網路與分群法 在預測學習上的效果。

3.3.1 類神經網路

類神經網路是指利用電腦來模仿生物神經網路的處理系統。更明確的定 義:類神經網路是一種計算系統,包括硬體與軟體,它使用大量簡單的相連人 工神經元來模仿生物神經網路的能力。人工神經元是生物神經元的簡單模擬,

它從外界環境或其它的人工神經元取得資訊,並加以運算後輸出其結果到外界 環境或其它人工神經元。基本類神經運作的概念如下圖3.11 所示。

其中X1、X2 … Xm為輸入變數;W1

W

2

… W

m為連結的權重值;b 為閥值,

有偏移的效果;∑為加法單元,此部分是要將每一個輸入與權重值相乘後做一

(42)

將∑的值做映射得到所需要的輸出;Yi輸出變數,即我們所需要的結果。

類神經網路在商業上的應用也相當的廣泛,例如債信評估、個人信用風險 評估、企業財務危機預測、股價預測等。自Odom and Sharda(1990)開始將類神 經網路開始應用在財務危機的預測後,後續也有許多應用類神經各種不同的模 型來做測試分析,經過多年後學者的交叉比較後,證實發現倒傳遞在預測財務 危機的能力上有較佳的表現。

倒傳遞網路(Back-Propagation Network,BPN)

倒傳遞網路(Back-Propagation Network)是目前類神經網路中,最具代表性 且最為普遍的模型,其基本的原理是利用最陡坡降法(the gradient steepest descent method)觀念來將誤差函數最小化。由於具有學習的高準確度,回想速 度快等優點,因此有許多學者便以倒傳遞網路做為預測財務危機的主要模型,

再者由於基本的架構流程與該財務預警的架構相當契合,本研究也以倒傳遞做 為其中一種預測模型。一個標準的倒傳遞網路(後面將以 BPN 做為取代用詞)架 構流程如圖3.12 所示。

3.11 人工神經元模型

參考文獻

相關文件

Estimated resident population by age and sex in statistical local areas, New South Wales, June 1990 (No. Canberra, Australian Capital

• A language in ZPP has two Monte Carlo algorithms, one with no false positives and the other with no

Too good security is trumping deployment Practical security isn’ t glamorous... USENIX Security

Real Schur and Hessenberg-triangular forms The doubly shifted QZ algorithm.. Above algorithm is locally

In this chapter we develop the Lanczos method, a technique that is applicable to large sparse, symmetric eigenproblems.. The method involves tridiagonalizing the given

Courtesy: Ned Wright’s Cosmology Page Burles, Nolette & Turner, 1999?. Total Mass Density

Teacher starts the lesson with above question and explains to students that making business decision is one of the basic functions of a

Cultivating a caring culture and nurturing humanistic qualities Building an ever-Learning School.. Targets Leading Key