• 沒有找到結果。

演化式多重組合羅吉斯迴歸模型-應用於信用評等

N/A
N/A
Protected

Academic year: 2021

Share "演化式多重組合羅吉斯迴歸模型-應用於信用評等"

Copied!
13
0
0

加載中.... (立即查看全文)

全文

(1)

演化式多重組合羅吉斯迴歸模型—應用於信用評等

林萍珍 國立高雄應用科技大學金融系 柯博昌 國立高雄應用科技大學資訊管理系 游俊忠 寶碩財務科技股份有限公司

摘要

新巴塞爾協定建議銀行採用內部評等法自建授信系統以減少人為錯誤帶來的作業損 失,並且能夠快速正確處理授信放款。目前被廣泛應用於信用風險預測模型的是羅吉斯 迴歸,此模型雖然可以分成多類,但其S曲線通常以等距或經驗法則切割門檻值做信用分 等,當違約機率產生變動時會造成評等等級變動的不對稱現象。因此,本研究提出演化 式多重組合羅吉斯迴歸模型(EMCRS),每一個信用評等設計一個羅吉斯迴歸模型進行 違約預測以決定評等的等級,希望能提供分類的準確性;模型的門檻值與預測變數是藉 由遺傳演算法以非線性方式做最佳化;以此研究模型建立一套演化式多重組合羅吉斯迴 歸信用評等系統。預測變數是擷取自財務變數、基本資料變數、會計師變數、總體經濟 變數及公司治理變數季資料等五個構面進行預測。另外,其目標函數是以新巴塞爾協定 建議的驗證方法對本研究模型進行違約預測效力、評等穩定性以及等級同質性三方向的 模型驗證。實驗結果發現,EMCRS信用風險違約評等的預測效力以及等級同質性方面相 較於其他四種評等模型(TCRI、區別分析、決策樹、羅吉斯)均有不錯的表現;多季的 違約時間點實證中,反應出最近期的財報與公司治理等相關資訊的揭露對模型具有較佳 的預測效力;代表穩定性指標的移轉矩陣率會隨著使用者設定的評等級數增加而呈下降 的常態現象;具有關鍵因子含財務變數:每股淨值、常續性EPS、每股稅前淨利、總資 產週轉率(次),其中常續性EPS被選擇的次數為最多,其次是公司治理變數的董監酬 勞佔稅前淨利%,足見EMCRS評等模型受財務變數類與公司治理變數較具影響力。本文 的發現對於建構信用評等模型有重要的貢獻與影響。 關鍵 字: 羅 吉 斯 迴 歸 模 型 、 遺 傳 演 算 法 、 新 巴 塞 爾 資 本 協 定 、 信 用 評 等 、 違 約機率

(2)

Evolutionary Multiple Combinatorial Logistic

Regression Model Applied in Credit Rating

Ping-Chen Lin

Department of Finance and Information, National Kaohsiung University of Applied Sciences

Po-Chang Ko

Department of Information Management, National Kaohsiung University of Applied Sciences

Chun-Chung Yu

APEX International Financial Engineering Res. Tech. Co., Ltd

Abstract

Some serious financial issues, such as the Asian Financial Crisis and Subprime Mortgage Crisis, have occurred in the last two decades. It is not self-evident that the real economy may suffer from the credit crunches as a result of the financial crises and bank inadequate management. Due to one of banks’ major sources of profits being loan growth, especially in enterprise loans, it is important to manage and evaluate corporate financial risk effectively. Published in June 2004, Basel II is a well-known international initiative that requires banks to have a more risk sensitive framework. It establishes regulatory expectations for credit risk through the Internal Ratings Based (IRB) approach, which allows banks to assess key risk drivers as the primary capital calculation. In statics, the logistic regression is only suitable for probabilistic binary classification, but it cannot provide multiple classifications. Although cumulative logic regression (CLR) introduces a multi-class algorithm, it is hard to decide the thresholds in CLR. This paper proposes an evolutionary MCLR credit rating system (EMCRS) that uses an evolutionary approach to optimize multiple combinatorial logistic regression models. We implement GA to estimate non-stationary time-series data with dynamic non-linear searching capabilities. Finally, the EMCRS is verified by (1) capably predicting the default rate (e.g. KS, ROC, CAP), (2) rating stability (e.g. TM), and (3) grade homogeneity (e.g. CIER). The experimental results demonstrate that EMCRS has better competence to predict the enterprise default rate than TEJ. It is reasonable that rating stability will decrease if the number of ratings increases. Profitability, earnings per share, and management factors are critical for evaluating

(3)

the performance of EMCRS.

Key words: Multiple Combinatorial Logistic Regression Model, Genetic Algorithm, Basel II、Credit Rating、Default Probability

(4)

壹、緒論

近年來國際間的金融重大事件頻傳,例如亞洲金融風暴與美國次貸風暴等,這些風 暴形成的原因與銀行金融機構的授信業務風險管理有著重要的關聯,銀行若資本計提 (指依授信戶的信用評等等級給予不同的風險權數,進而計算其應計提的資本)不足, 即可能發生重大損失。大部份銀行主要獲利來源為放款業務,而且多數都屬於企業放 款,故企業違約風險的管理顯得格外重要。新巴塞爾協定(Basel II)所定義的信用風 險是由貸方所產生的一種潛在損失風險;信用風險可經過客觀且系統化的方式轉換成 信用等級,使得授信人員可以根據信用等級,快速且正確的制訂放款決策。Shin與Han (2001)指出銀行過去常仰賴授信人員的主觀評估信用評等,易造成人為判斷標準不 一,使企業授信風險不能有效管理。 Basel II協定提到銀行若要有效控管信用風險必須系統化成為符合Basel規範的風險管 理系統。Basel II推薦的信用風險衡量方法是內部評等法(Internal Rating Based Approach; IRB)。IRB法允許銀行依據本身策略需求,建置較具自主性和彈性的信用風險評等系 統,頗獲各國金融機構推崇。在建置IRB系統過程中,銀行需考量違約機率(Probability of Default; PD)、違約損失率(Loss Given Default; LGD)、違約暴險額(Exposure at Default; EAD)以及有效到期期間(Maturity; M)這些因素。其中,PD為IRB的主要核 心,故銀行更為重視對PD的評估預測。 決定信用風險評等系統績效的關鍵因素在於建構評等模型以及選擇預測變數,羅吉 斯迴歸(Logistic Regression; LR)是目前被普遍應用在建置違約預測系統的統計模型。 LR特性允許估計值落於正、負無限大之間,再透過Logit函數轉換成值域0到1的機率值, 藉此門檻值協助判斷違約事件發生的程度。LR模型在應用上放寬對變數的假設限制,允 許使用質化或量化變數型態;自變數不須符合常態分配或任何機率分配假設。傳統統計 模型使用線性組合方式來挑選變數,例如逐步分析、因素分析等。在變數的挑選會以次 序加入或剔除的方式來組合,依特定順序選擇變數的方式不易找到最佳預測變數組合。 除了變數選擇是建構模型的重點外,模型門檻值的決定也是預測分類模型的重點。門檻 值是將風險程度相同的授信戶做歸類的判斷依據,門檻值的決定也將會影響模型預測分 類的效力。 本研究目的之一是藉由遺傳演算法挑選出在企業財務體質、公司自治以及總體環境 等變數中最具預測效力的因素,提昇預測企業的信用風險等級的準確性。各家銀行的文 化和特性不同,授信策略也會有所差異,故我們加入依銀行授信評等等級的設定來建立 一套準確、有效的信用風險評等管理資訊系統,每一個類別的評等是個別建立模型與門 檻值,以及藉由演化方式找尋最佳預測因果結合,期望能增添分類的效能,此 為目的 二。採用Basel II建議的違約預測效力驗證方法,分別是「接收者操作特性」(Receiver Operating Characteristic; ROC)曲線、「累積精確度」(Cumulative Accuracy Profiles; CAP)曲線、KS檢定;穩定性指標是「移轉矩陣」(Transition Matrix; TM);等級區別

(5)

同質性是「條件資料熵比率」 (Conditional Information Entropy Ratio; CIER)檢定。希 望透過這樣的比較及驗證,提昇此模型的評等分類能力,此為目的三。最後,提出一個 創新的評等模型,結合多重組合羅吉斯迴歸(Multiple Combinatorial Logistic Regression Model; MCLR)及遺傳演算法(Genetic Algorithm; GA)來建置出演化式多重組合羅吉斯 迴歸信用評等系統(Evolutionary MCLR Credit Rating System; EMCRS),盼能有助於銀 行管理企業授信風險以及建立符合銀行策略的內部評等系統,此為最重要的目的。

EMCRS系統需要一個穩定性佳且準確度高的分類評等模型,LR的擴充模型累積 羅吉斯(Cumulative Logistic Regression; CLR),具有預測次序多類別(ordered multi-category)的特性。但CLR分等的門檻值不易區分,容易隨著樣本資料變化造成等級變動 具有不對稱現象。為改善CLR模型的限制,本研究採用LR為基礎擴充為MCLR模型,依 據評等等級數目建構個別的CLR評等模型,每一個評等等級有自己的預測模型以及門檻 值,組合出MCLR模型。MCLR模型結合GA找出的最佳預測變數組合與各個等級的門檻 值,建立一套有效的EMCRS系統,銀行可以依據本身的策略與特性找出適用且有效的 企業信用風險評等模型。採用Basel II建議的驗證方法,分別以「違約預測力」、「 穩 定度」及「等級同質性」三方面做模型的驗證,並且與台灣經濟新報的信用風險指標 (Taiwan Corporate Credit Rating Index; TCRI)、區別分析、決策樹、羅吉斯來做比較, 希望透過這樣的比較及驗證,提昇此模型的穩定性與預測能力,提供銀行在授信放款業 務一個較佳的投資決策參考。

貳、文獻回顧與探討

企業發生違約非突發事件,應有跡可循,Basel協定提出之後學術界與實務界對信用 風險議題再度引起熱烈的討論。有必要對信用風險相關的議題包括違約預測模型特性、 預測變數選擇問題與門檻值決定方法相關文獻進行探討;另外介紹遺傳演算法在信用風 險相關文獻的討論,試圖從中發掘相關理論的優勢與限制以及整合應用的契機。

一、違約預測模型

根據Balcaen與Ooghe(2006)文獻整理違約預測方法分四大類:第一類,單變量分 析(Univariate Analysis),使用單一變數,該變數與預測結果呈線性的關係;第二類, 是風險指標模型(Risk Index Models),由Tamari(1966)提出簡單且直覺的分數系統, 可包含不同的變數,每個變數都有分數,使用者主觀的分配變數權重彙總後再做預測; 第三類,多元區別分析(Multiple Discriminant Analysis; MDA),由Altman(1968)應用 MDA於企業倒閉預測,MDA限制使用的變數符合常態分配並互相獨立,變數建構出的 線性方程式將產生一個區別分數介於 到 的值域,藉由門檻值來判斷企業是否違約; 第四類,條件機率模型(Conditional Probability Models; CPM),Hosmer與Lemeshow (1989)應用CPM發展出LR模型假設其機率呈現羅吉斯分配的機率模型,另假設變數和

(6)

違約機率之間呈線性關係的線性機率模型。 屬於條件機率模型的LR是由Ohlson(1980)將LR應用在企業違約機率預測,並嘗 試同時使用類別資料與數值型態的變數資料。Meyer與Pifer(1970)和Westgaard與Van der Wijst(2001)以及Tseng與Lin(2005)等文獻應用LR在銀行倒閉預測,準確率較其 他模型為佳。Baesens et al.(2003)指出迴歸中,LR較能容許多元變數的誤差,其績效 表現明顯的較佳於一般迴歸模型。Ugurlu與Aksoy(2006)探討企業面對環境不確定性和 動亂的情況下,比較MDA和LR模型對預測企業違約的效力,實驗結果指出LR模型優於 MDA。Ko與Lin(2006)以LR、NN、MDA預測企業發生財務危機,應用遺傳演算法與 粒子群演算法最佳化變數以及各模型預測權重,實驗結果顯示整合模型的預測力最佳。

二、預測變數選擇相關文獻

信用風險預測變數包含多種類別,本節依據過去一些學者使用預測變數的類型進行 探討做為本研究變數來源的參考。傳統風險預測模型挑選變數,通常是以線性搜尋的方 式進行,例如:逐步分析法Donato et al.(1999)、因素分析法Deakin(1972),其變 數組合方式是以次序加入或剔除,較不易找到最佳變數組合。Altman(1968)是最先使 用了財務變數及經濟變數投入多元區別分析MDA模型預測公司倒閉。Ohlson(1980) 是首先利用多元羅吉斯迴歸模型(Multiple Logistic Regression)來建立PD預測模型, 使用到的變數共有9個財務比率,包含流動比率、總負債是否大於總資產、總資產報酬 率、負債比率、淨利變動率、資產規模、營運資金佔總資產比率、是否連續兩年為負 淨利、營業活動淨現金流量/平均總負債。Laster(2003)發表的文章中使用到的財務變 數有七類:資本適足、負債財務槓桿、流動性資產(liquidity)、績效表現、現金流、 獲利能力(profitability)和規模大小(size),其在公司財務預測與評等上,有不錯的 表現。Ugurlu與Aksoy(2006)收集的預測變數有80個分成八類:獲利能力、流動性資 產、償付能力(solvency)、經濟危險程度(degree of economic distress)、槓桿作用leverage)、效率(efficiency)、波動度(variability)以及規模,並利用這八類的變數 來有效預測新興市場的公司違約與否。 Keasey與Watson(1987)以英國破產公司為研究樣本,來探討財務變數、非財務 變數與中小企業破產之關聯。非財務變數包括公司治理變數、會計資訊變數、可能窗 飾財報之變數及總體經濟變數4大構面。採逐步迴歸選取顯著變數,以Logit迴歸進行預 測,發現公司交付財報時間愈不正常、董事會成員愈少、債權受銀行擔保者、最近一次 財報受會計師認可且之前財報均未受會計師認可之中小企業發生財務危機機率愈大。 Huyghebaert et al.(2000)利用現金流量變數,如營運活動之現金流量、投資活動之現金 流量及融資活動之現金流量、營運資金現金流量、公司規模大小取對數及產業變數等, 透過Logit模型來評比現金流量模型與一般財務指標模型之預測能力。結果顯示,現金流 量模型預測能力優於一般財務指標模型。 綜合各國內外學者的研究成果,可以發現變數選取攸關模型的解釋能力,包含財務 變數及非財務變數的綜合模型解釋能力大多數優於僅考慮財務變數的財務變數模型,羅

(7)

吉斯迴歸模型對於預測企業財務危機,具有相當的效力。變數的選擇方法多是線性方 法,如逐步迴歸或經驗法則等方法。若應用非線性方法做變數的最佳化或許可以獲得更 好的預測結果。

三、門檻值相關文獻

Barniv et al.(2000)文中強調門檻值是構成預測模型效力主要因素。門檻值為預測 目標分類依據,若門檻值設定不恰當,容易提高錯誤率導致模型預測力下降。在巴塞爾 銀行監管委員會(The Basel Committee on Banking Supervision 2005)中提到收受者操作 特性(Receiver Operating Characteristic; ROC)驗證方法,即是針對模型門檻值區分預測 效力進行量化的計算,ROC值愈高代表模型愈佳。Fu與Simpson(2002)在累積羅吉斯 分類以等距分等方式決定門檻,此方法採用均分法分配多種評等等級的門檻值,在S曲線 的中間段的門檻值範圍較小而陡峭;曲線的頂端與底端的門檻值範圍較大而平滑,因為 門檻值大小不一致較容易影響評等效力。Foreman(2003)則是使用LR模型以一個常數 或機率的平均值0.5來當門檻值,但是此種分法只適用於單一類別並不適用於多類別評等 問題。由此看來,門檻值的決定對於信用評等模型的優劣佔有重要地位。

四、遺傳演算法

遺傳演算法乃Holland(1975)所提出,它是人工智慧中有力(powerful)的一種技 術,其本質上為一個機率性的演算法則(probabilistic algorithm),能在廣大的求解空 間中,快速的搜尋最適解。GA以非線性搜尋最適預測變數集合應用上,具有良好的表 現。Back et al.(1996)以GA最佳化變數後再應用類神經網路(Neural Network; NN)、 MDA、LR等模型進行企業倒閉預測。Kim與Han(2003)以資料探勘(Data Mining) 的觀念探討專家經驗與GA所決定的變數配合的MDA、LR、NN以及決策樹(Decision Tree)進行倒閉預測,實驗結果顯示以GA所挑選的變數預測企業倒閉的效力較專家經 驗為佳。Min et al.(2006)和Wu et al.(2007)結合GA與支援向量機(Support Vector Machine; SVM)做企業違約預測,研究結果指出藉由GA最佳化SVM參數後提昇預測的 績效。 Shin與Lee(2002)和Laitinen與Laitinen(2000)兩篇文章均指出,雖然很多研究的 實驗結果報導NN(或SVM)的績效優於其他模型,但應用NN模型的缺點歸納為:第 一,尋找變數與函數之間的非線性關係時容易產生過度配適(overfitting)問題;第二, 藉由不同參數設定(如神經元網路架構、學習函數、訓練函數等)找尋合適的類神經網 路成為一種藝術,意指以試誤法(try and error)設定相關參數以找尋類神經網路模型; 第三,NN學習後的網路結構不易讓使用者了解和使用,對其結構規則可讀性不佳而產生 黑箱(black boxes)作業的刻板印象;第四,其穩定性不足以及驗證困難使得實務界接 受度不高。

(8)

的限制做進一步的改善。改善的方向有:(1)提出多重組合羅吉斯迴歸,改善單一羅吉 斯迴歸模型在同一條S曲線上決定門檻值的限制,不論依均等法或經驗法則在同一條曲線 上決定門檻值均有不對稱性的問題;(2)不同的評等等級應該有各自的門檻值,亦即每 一個等級可以擁有各自的羅吉斯迴歸與其所屬的門檻值;(3)結合GA最佳化的能力, 協助LR挑選變數以及決定門檻值;(4)採用Basel II驗證方式,除預測效力外,進一步 加入模型穩定性與同質性的證明,強化評等的效能。

參、研究方法

本研究提出演化式多重組合羅吉斯迴歸信用評等系統,本節即針對其研究架構的運 作步驟進行說明;文中將闡述遺傳演算法的兩項重要工作為染色體編碼(包含變數與門 檻值編碼)與適應函數設計;細部說明多重組合羅吉斯迴歸模型計算流程以及Basel II五 種驗證方法。

一、研究架構

本研究提出EMCRS的研究架構說明共分成5個步驟見【圖1】:第一步驟,透過GA 的染色體編碼方式進行第一代族群的初始化。第二步驟,此步驟分成5個動作:(1)每 條染色體會依據兩部分進行解碼動作,包含預測變數及等級門檻值;(2)將解碼後的 門檻值排序完即決定各等級順序;(3)代入訓練樣本及等級門檻值並利用最大概似法 (MLE)來估計MCLR模型,即可求出違約機率,與各機率門檻比較,就可計算出該樣 本機率歸類為何種信用風險等級;(4)評等結果再由Basel II的驗證方法(預測效力、穩 定性以及等級同質性等)進行驗證,將不同的驗證方法產生的結果做彙總;(5)將驗證 結果及變數數量分數(愈少愈高分)取倒數,即為染色體的適應函數值。第三步驟,進 入選擇機制,此階段會依據適應函數值,依指定的選擇方法(如輪盤法或競爭法)選擇 適應函數值較佳的染色體到交配池進行交配;第四步驟,以交配池裡的染色體,利用兩 兩交配方式(如單點交配、均交配),進行部份基因的交換;第五步驟,每條染色體會 依據突變率來決定染色體基因是否要進行突變。經由前面的步驟產生新一代的族群,並 不斷重覆這樣的流程直到滿足設定的終止條件。EMCRS系統就是透過這樣的演化機制, 來尋找最佳的評等估計模型、預測變數組合以及適當的門檻值,學習出最具驗證效力的 信用風險模型。 在【圖2】中我們以迴歸殘差值 來代表樣本在MCLR所得到的預測值, 的範圍是從 負無窮大到無窮大,MCLR是由多個LR所互相累積而成,不同的 會對應不同的違約機 率,當樣本預測出來的 落入二個門檻值 少愈高分)取倒數,即為染色體的適應函數值。第三步驟,進入選擇機制,此 階段會依據適應函數值,依指定的選擇方法(如輪盤法或競爭法)選擇適應函 數值較佳的染色體到交配池進行交配;第四步驟,以交配池裡的染色體,利用 兩兩交配方式(如單點交配、均匀交配),進行部份基因的交換;第五步驟,每 條染色體會依據突變率來決定染色體基因是否要進行突變。經由前面的步驟產 生新一代的族群,並不斷重覆這樣的流程直到滿足設定的終止條件。EMCRS 系統就是透過這樣的演化機制,來尋找最佳的評等估計模型、預測變數組合以 及適當的門檻值,學習出最具驗證效力的信用風險模型。 圖1:演化式多重組合羅吉斯迴歸信用評等系統(EMCRS)架構圖 在圖2】中我們以迴歸殘差值ε來代表樣本在MCLR所得到的預測值,ε的範 圍是從負無窮大到無窮大,MCLR是由多個LR所互相累積而成,不同的ε會對 應不同的違約機率,當樣本預測出來的ε落入二個門檻值ε1c和ε2c之間,則樣本 的預測信用評等為第2 級,而等級愈高則違約風險愈高,本研究模型會依據使 用者的級別需求來產生適當並能有效區分企業的等級門檻值。在圖 2】是以評 等四級為例。 MCLR不同於CLR的地方,在於CLR不易在累積機率分配S曲線上,區分多 個門檻,因為S曲線特性是從 0 到 1,傳統採用均分法切割不同評等的門檻值, 造成中間的線段BC是急劇上升如圖 3】。BC段在設定多個門檻值的評等時,因 其違約機率值會過於接近,模型的預測規則容易受到樣本機率變動,使得預測 樣本等級結果較敏感,造成模型的預測結果較不穩定,而線段AB和線段CD則 9 和 少愈高分)取倒數,即為染色體的適應函數值。第三步驟,進入選擇機制,此 階段會依據適應函數值,依指定的選擇方法(如輪盤法或競爭法)選擇適應函 數值較佳的染色體到交配池進行交配;第四步驟,以交配池裡的染色體,利用 兩兩交配方式(如單點交配、均匀交配),進行部份基因的交換;第五步驟,每 條染色體會依據突變率來決定染色體基因是否要進行突變。經由前面的步驟產 生新一代的族群,並不斷重覆這樣的流程直到滿足設定的終止條件。EMCRS 系統就是透過這樣的演化機制,來尋找最佳的評等估計模型、預測變數組合以 及適當的門檻值,學習出最具驗證效力的信用風險模型。 圖1:演化式多重組合羅吉斯迴歸信用評等系統(EMCRS)架構圖 在圖2】中我們以迴歸殘差值ε來代表樣本在MCLR所得到的預測值,ε的範 圍是從負無窮大到無窮大,MCLR是由多個LR所互相累積而成,不同的ε會對 應不同的違約機率,當樣本預測出來的ε落入二個門檻值ε1c和ε2c之間,則樣本 的預測信用評等為第2 級,而等級愈高則違約風險愈高,本研究模型會依據使 用者的級別需求來產生適當並能有效區分企業的等級門檻值。在圖 2】是以評 等四級為例。 MCLR不同於CLR的地方,在於CLR不易在累積機率分配S曲線上,區分多 個門檻,因為S曲線特性是從 0 到 1,傳統採用均分法切割不同評等的門檻值, 造成中間的線段BC是急劇上升如圖 3】。BC段在設定多個門檻值的評等時,因 其違約機率值會過於接近,模型的預測規則容易受到樣本機率變動,使得預測 樣本等級結果較敏感,造成模型的預測結果較不穩定,而線段AB和線段CD則 9 之間,則樣本的預測信用評等為第2級,而 等級愈高則違約風險愈高,本研究模型會依據使用者的級別需求來產生適當並能有效區 分企業的等級門檻值。在【圖2】是以評等四級為例。 MCLR不同於CLR的地方,在於CLR不易在累積機率分配S曲線上,區分多個門檻,

(9)

因為S曲線特性是從0到1,傳統採用均分法切割不同評等的門檻值,造成中間的線段BC 是急劇上升如【圖3】。BC段在設定多個門檻值的評等時,因其違約機率值會過於接 近,模型的預測規則容易受到樣本機率變動,使得預測樣本等級結果較敏感,造成模型 的預測結果較不穩定,而線段AB和線段CD則較平緩,落入這兩線段 的門檻,因其違約 機率值間隔較大,樣本較容易被評等為該區段的等級。 階段會依據適應函數值,依指定的選擇方法(如輪盤法或競爭法)選擇適應函 數值較佳的染色體到交配池進行交配;第四步驟,以交配池裡的染色體,利用 兩兩交配方式(如單點交配、均匀交配),進行部份基因的交換;第五步驟,每 條染色體會依據突變率來決定染色體基因是否要進行突變。經由前面的步驟產 生新一代的族群,並不斷重覆這樣的流程直到滿足設定的終止條件。EMCRS 系統就是透過這樣的演化機制,來尋找最佳的評等估計模型、預測變數組合以 及適當的門檻值,學習出最具驗證效力的信用風險模型。 圖1:演化式多重組合羅吉斯迴歸信用評等系統(EMCRS)架構圖 在圖2】中我們以迴歸殘差值ε來代表樣本在MCLR所得到的預測值,ε的範 圍是從負無窮大到無窮大,MCLR是由多個LR所互相累積而成,不同的ε會對 應不同的違約機率,當樣本預測出來的ε落入二個門檻值ε1c和ε2c之間,則樣本 的預測信用評等為第2 級,而等級愈高則違約風險愈高,本研究模型會依據使 用者的級別需求來產生適當並能有效區分企業的等級門檻值。在圖 2】是以評 等四級為例。 MCLR不同於CLR的地方,在於CLR不易在累積機率分配S曲線上,區分多 個門檻,因為S曲線特性是從 0 到 1,傳統採用均分法切割不同評等的門檻值, 造成中間的線段BC是急劇上升如圖 3】。BC段在設定多個門檻值的評等時,因 其違約機率值會過於接近,模型的預測規則容易受到樣本機率變動,使得預測 樣本等級結果較敏感,造成模型的預測結果較不穩定,而線段AB和線段CD則 9 圖1:演化式多重組合羅吉斯迴歸信用評等系統(EMCRS)架構圖 較平緩,落入這兩線段内的門檻,因其違約機率值間隔較大,樣本較容易被評 等為該區段的等級。 圖2:MCLR 圖 圖3:CLR 圖 �、染色體編碼 碼 共有(m-1)×11 個bit,故染色體長度共有(m-1)×11 個bit。 在圖4】我們看到GA中染色體長度可分為二部分來解釋:(1)預測變數: 由於本研究參考許多的文獻來挑選不同面向的各種變數,假設共有n個原始變 數,因此在代表變數的部分是n bit,bit值為 0 則指該變數未被選擇,1 即變數 被選擇;(2)區分不同違約風險等級門檻值,EMCRS系統可依照使用者希望的 分等數量如m等,來決定MCLR迴歸的分等門檻數量,每個門檻值是以 11 bit來 表示(1 bit代表正負值、4 bit代表整數部分、6 bit代表小數部分),門檻值編

正負號 整數 小數部分

X1 X2 … Xn-1 Xn

模型所挑選原始變數n個 門檻值:系統使用

者欲評等的數量-1

1 bit 4 bits 6 bits

c 1 ε c m 1= ε 圖4:染色體編碼示意圖 門檻值,評等等級愈高,代表違約機率愈大。排 序過程可見圖5】示意圖。 染色體的編碼門檻值的部分,解碼之後會將門檻值進行由小到大的排序, 即代表評等低到高(1…m)的 10 圖2:MCLR圖 圖3:MCLR圖

二、染色體編碼

在【圖4】我們看到GA中染色體長度可分為二部分來解釋:(1)預測變數:由於本 研究參考許多的文獻來挑選不同面向的各種變數,假設共有n個原始變數,因此在代表 變數的部分是n bit,bit值為0則指該變數未被選擇,1即變數被選擇;(2)區分不同違約 風險等級門檻值,EMCRS系統可依照使用者希望的分等數量如m等,來決定MCLR迴歸

(10)

產組合,若資產的信用風險評等後被低估將產生實質虧損,反之高估風險將使產品訂價 無競爭力。就企業管理面而言,企業藉由評等機制進行信用評等,可以了解企業本身的 償債能力以及經營風險,改善公司財務體質,適時調整財務槓桿,協助公司獲得更佳的 融資條件,創造經營效益。就投資人來說,對信用評等較低的投資標的可以先行出脫持 股,可以選擇評等較高的企業進行投資決策,促進資本市場活絡,改善資訊不對稱投資 現況。因此,本研究無論對銀行、企業或是投資大眾都有正面的啟示意義。 本研究實驗結果發現:(1)在「模型的評等分類效果」、「評等模型準確性」、 「貼近完美模型」以及「模型鑑別力」方面EMCRS比其它評等方法更具有較佳的評等效 力,說明GA與MCLR整合應用,獲得不錯的信用風險評等效果;(2)距離違約時間點 愈遠等級同質性的效果較差,印證近期的財務資訊較能反應企業的營運狀況,其等級同 質性也有中上程度的表現;(3)預測變數中被選到最多是財務變數類,包含有(每股淨 值、常續性EPS、每股稅前淨利、總資產週轉率(次)),而常續性EPS被選擇的次數為 最多;其次是公司治理變數(董監酬勞佔稅前淨利% ),足見EMCRS評等模型受財務變 數類的影響較大。 未來研究建議朝幾個方向進行:(1)配合其他統計之變數挑選方式(如因素分析、 主成份分析或逐步回歸)事前檢定後再加入EMCRS驗證是否能改善評等效能;(2)樣 本的數量增加對於模型的建立更具代表性;或分析更多的總體經濟、會計師變數等或 許能找到相關的影響因子;(3)加入其它國際金融評等機構的信用評等模型做比較; (4)在建構評等模型時,不易兼顧所有構面(如同時要最具正確性、穩定性以及同質性 等),依評等使用者(如銀行、企業或投資人)的需求偏好設定不同的權重,依不同偏 好的優先順序最佳化其權重,期待建構更合適的模型,使評等模型發揮最大效用。

參考文獻

1. Altman, E. I.“Financial Ratios, Discriminant Analysis and the Prediction of Corporate Bankruptcy,"Journal of Finance (23:4), September 1968, pp. 589-609.

2. Back, B., Laitinen, T., and Sere, K.“Neural Networks and Genetic Algorithms for Bankruptcy Predictions,"Expert Systems with Applications (11:4), 1996, pp. 407-413. 3. Baesens, B., Van Gestel, T., Viaene, S., Stepanova, M., Suykens, J., and Vanthienen,

J.“Benchmarking State-of-the-Art Classification Algorithms for Credit Scoring,"The Journal of the Operational Research Society (54:6), June 2003, pp. 627-635.

4. Balcaen, S., and Ooghe, H.“35 Years of Studies on Business Failure: An Overview of the Classic Statistical Methodologies and Their Related Problems,"The British Accounting Review (38:1), March 2006, pp. 63-93.

5. Barniv, R., Mehrez, A., and Kline, D. M.“Confidence Intervals for Controlling the Probability of Bankruptcy,"Omega (28:5), October 2000, pp. 555-565.

(11)

Accounting Research (10:1), 1972, pp. 167-179.

7. Donato, J. M., Schryver, J. C., Hinkel, G. C., Schmoyer Jr., R. L., Grady, N. W., and Leuze, M. R.“Mining Multi-Dimensional Data for Decision Support,"Future Generation Computer Systems (15:3), April 1999, pp. 433-441.

8. Foreman, R. D.“A Logistic Analysis of Bankruptcy within the US Local Telecommunications Industry,"Journal of Economics and Business (55:2), March 2003, pp. 135-166.

9. Fu, L., and Simpson, D. G.“Conditional Risk Models for Ordinal Response Data: Simultaneous Logistic Regression Analysis and Generalized Score Tests,"Journal of Statistical Planning and Inference (108), November 2002, pp. 201-217.

10. Holland, J. H.“Adaptation in Natural and Artificial Systems,"University of Michigan Press, 1975, pp. 529-530.

11. Hosmer, D.W., and Lemeshow, S. Applied Logistic Regression, John Wiley & Sons, New York, 1989.

12. Huyghebaert, N., Gaeremynck, A., Roodhooft, F., and Van De Gucht, L. M.“New Firm Survival: The Effect of Start-up Characteristics,"Journal of Business Finance & Accounting (27), 2000, pp. 627-651.

13. Keasey, K., and Watson, R.“Non-Financial Symptoms and the Prediction of Small Company Failure: A Test of Argenti´s Hypotheses,"Journal of Business Finance & Accounting (14), 1987, pp. 335-354.

14. Kim, M.J., and Han, I.“The Discovery of Experts' Decision Rules from Qualitative Bankruptcy Data Using Genetic Algorithms,"Expert Systems with Applications (25:4), November 2003, pp. 637-646.

15. Ko, P.C., and Lin, P.C.“An Evolution-Based Approach with Modularized Evaluations to Forecast Financial Distress,"Knowledge-Based Systems (19:1), March 2006, pp. 84-91. 16. Laitinen, E. K., and Laitinen, T.“Bankruptcy Prediction: Application of the Taylor´s

Expansion in Logistic Regression,"International Review of Financial Analysis (9:4), 2000, pp. 327-349.

17. Laster, D.“Insurance Company Ratings,"Swiss Re sigma (4), 2003, pp. 23-39.

18. Lin, F.Y., and McClean, S.“A Data Mining Approach to the Prediction of Corporate Failure,"Knowledge-Based Systems (14:3), June 2001, pp. 189-195.

19. Mays, E. Handbook of Credit Scoring, Lessons Professional Publishing, 2001, pp 89-106. 20. Meyer, P. A., and Pifer, H. W.“Prediction of Bank Failures,"Journal of Finance (25:4),

September 1970, pp. 853-868.

21. Min, S.H., Lee, J., and Han, I.“Hybrid Genetic Algorithms and Support Vector Machines for Bankruptcy Prediction,"Expert Systems with Applications (31:3), October 2006, pp. 652-660.

(12)

22. Ohlson, J. A.“Financial Ratios and the Probabilistic Prediction of Bankruptcy,"Journal of Accounting Research (18:1), 1980, pp. 109-131.

23. Shin, K.S., and Han, I.“A Case-Based Approach Using Inductive Indexing for Corporate Bond Rating,"Decision Support Systems (32:1), November 2001, pp. 41-52.

24. Shin, K.S., and Lee, Y.J.“A Genetic Algorithm Application in Bankruptcy Prediction Modeling,"Expert Systems with Applications (23:3), October 2002, pp. 321-328.

25. Siriwardene, N. R., and Perera, B. J. C.“Selection of Genetic Algorithm Operators for Urban Drainage Model Parameter Optimization,"Mathematical and Computer Modelling (44), 2006, pp. 415-429.

26. Tamari, M.“Financial Ratios as a Means of Forecasting Bankruptcy,"Management International Review (4), 1966, pp. 15-21.

27. The Basel Committee on Banking Supervision“Studies on the Validation of Internal Rating Systems"Basel Committee on Banking Supervision Working Paper No. 14, February 2005.

28. Tseng, F.M., and Lin, L.“A Quadratic Interval Logit Model for Forecasting Bankruptcy,"Omega (33:1), February 2005, pp. 85-91.

29. Ugurlu, M., and Aksoy, H.“Prediction of Corporate Financial Distress in an Emerging Market: The Case of Turkey,"Cross Cultural Management: An International Journal (13:4), 2006, pp. 277-295.

30. Westgaard, S., and Van der Wijst, N.“Default Probabilities in a Corporate Bank Portfolio: A Logistic Model Approach,"European Journal of Operational Research (135:2), December 2001, pp. 338-349.

31. Wu, C.H., Tzeng, G.H., Goo, Y.J., and Fang, W.C.“A Real-Valued Genetic Algorithm to Optimize the Parameters of Support Vector Machine for Predicting Bankruptcy,"Expert Systems with Applications (32:2), February 2007, pp. 397-408.

(13)

參考文獻

相關文件

建模時,若我們沒有實際的物理定律、法則可以應用,我們 可以構造一個經驗模型 (empirical model) ,由所有收集到

线性拟合与二次拟合 数据拟合的线性模型 一次多项式拟合公式..

自從 Engle(1982)提出 ARCH 模型以來,已經超過 20 年,實證上也有相當多的文獻 探討關於 ARCH 族模型的應用,Chou(2002)將 GARCH

• 當我們在歸類一個問題為 問題時,等於不在乎他的複雜度是 還是 之類的,只要是多項式時間就好。.

[7] C-K Lin, and L-S Lee, “Improved spontaneous Mandarin speech recognition by disfluency interruption point (IP) detection using prosodic features,” in Proc. “ Speech

通常把这种过去时期的,具有滞后作用的变量 叫做 滞后变量(Lagged Variable) ,含有滞后变量

介面最佳化之資料探勘模組是利用 Apriori 演算法探勘出操作者操作介面之 關聯式法則,而後以法則的型態儲存於介面最佳化知識庫中。當有

蔣松原,1998,應用 應用 應用 應用模糊理論 模糊理論 模糊理論