行政院國家科學委員會專題研究計畫 成果報告
以服務導向架構為基礎的信用風險評估與預測系統
研究成果報告(精簡版)
計 畫 類 別 : 個別型 計 畫 編 號 : NSC 96-2622-H-151-001-CC3 執 行 期 間 : 96 年 11 月 01 日至 97 年 10 月 31 日 執 行 單 位 : 國立高雄應用科技大學資訊管理系 計 畫 主 持 人 : 柯博昌 計畫參與人員: 碩士班研究生-兼任助理人員:林伯融 碩士班研究生-兼任助理人員:林建瑋 碩士班研究生-兼任助理人員:謝鍚宗 處 理 方 式 : 本計畫為提升產業技術及人才培育研究計畫,不提供公開查 詢中 華 民 國 98 年 05 月 26 日
國際
以服務導向架構為基礎的信用風險評估與預測系統
摘 要
間各國銀行都積極以新巴塞爾協定為主要指導原則進行信用風險管理改 革,尋求信用風險控管的最佳策略。新巴塞爾協定建議銀行採用內部評等法自 建授信系統以減少人為錯誤帶來的作業損失,並且能夠快速正確處理授信放 款。銀行在建置內部評等系統時決定其優劣主要因素在於預測模型建構以及預 測變數的篩選,羅吉斯迴歸是目前被廣泛應用於違約風險預測的模型。傳統羅 吉斯迴歸僅適用於解決分成兩類的預測問題,雖然累積羅吉斯迴歸模型可以分 成多類,但是累積羅吉斯的S曲線通常以等距或經驗法則切割門檻值做分等, 當違約機率產生變動時會造成等級變動的不對稱現象。因此,本研究提出演化 式多重組合羅吉斯迴歸模型,每一個等級有個別的羅吉斯迴歸模型,可依使用 者需求設定不同等級的評等模型,並且模型的門檻值與預測變數是藉由遺傳演 算法以非線性方式做最佳化,以此研究模型建立一套演化式多重組合羅吉斯迴 歸信用評等系統。另外,其目標函數是以新巴塞爾協定建議的驗證方法對本研 究模型進行違約預測力、評等穩定度以及等級同質性三方面的模型驗證。實驗 結果發現,信用風險違約評等的預測效力以及等級同質性方面明顯優於台灣經 濟新報的信用風險指標;多期違約時間點的實證中,反應出近期的財報與公司 治理等相關資訊的揭露對模型具有較佳的預測效力;代表穩定性指標的移轉矩 陣率會隨著使用者設定的評等級數增加而呈下降的常態現象;財務變數的獲利 能力與每股收益以及公司治理的董監報酬、持股、財測與管理者異動等是影響 評等模型預測效力的重要因素; 關鍵字:演化式多重組合羅吉斯迴歸模型、遺傳演算法、新巴塞爾資本協定、 信用評等、違約機率。SOA Based Credit Rating Forecasting and
Evaluation Systems
ABSTRACT
The serious financial issues, such as Asian Financial Crisis, Subprime Mortgage Crisis, occurred recently. The real economy may suffer from credit crunches as results of the financial crises are not self-evident and bank inadequate management. Due to one of major profit of bank is loan growth, especially in the enterprise loans, it is important to manage and evaluate corporate financial risk effectively. Basel II published in June 2004 was a well-known international initiative that requires banks to have a more risk sensitive framework. It establishes regulatory expectations for credit risk through the Internal Ratings Based (IRB) approach, which allows banks to assess the key risk drivers as the primary capital calculation. In statics, the logistic regression is only suitable for probabilistic binary classification, but it cannot provide multiple classifications. Although cumulative logic regression (CLR) introduces a multi-class algorithm, it is had to decide the thresholds in CLR. In this paper, we propose an evolutionary MCLR credit rating system (EMCRS), which uses evolutionary approach to optimize multiple combinatorial logistic regression models. We use GA to estimate non-stationary time-series data with dynamic nonlinear searching capabilities. Finally, the EMCRS would be verified by (1) capability of predicting default rate (e.g. KS, ROC, CAP), (2) rating stability (e.g. TM) and (3) grade homogeneity (e.g. CIER). The experimental results demonstrate that EMCRS has better capability to predict the enterprise default rate than TEJ. It is reasonable that the rating stability will decrease if the number of rating increases. The profitability, earning per share and management factors are critical to evaluate the performance of EMCRS.
Keywords: Multiple Combinatorial Logistic Regression Model, Genetic Algorithm,
壹、緒論
近年來國際間的金融重大事件頻傳,例如亞洲金融風暴與美國次貸風暴 等,這些風暴形成的原因與銀行金融機構的授信業務風險管理有著重要的關 連,銀行若資本計提(指依授信戶的信用評等等級給予不同的風險權數,進而計 算其應計提的資本)不足,即可能發生重大損失。大部份銀行主要獲利來源為放 款業務,而且多數都屬於企業放款,故企業違約風險的管理顯得格外重要。新 巴塞爾協定(Basel II)所定義的信用風險是由貸方所產生的一種潛在損失風險; 信用風險可經過客觀且系統化的方式轉換成信用等級,使得授信人員可以根據 信用等級,快速且正確的制訂放款決策。Shin 與 Han(2001)指出銀行過去常仰 賴授信人員的主觀評估信用評等,易造成人為判斷標準不一,使企業授信風險 不能有效管理。 Basel II 協定提到銀行若要有效控管信用風險必須系統化成為符合 Basel 規 範的風險管理系統。Basel II 推薦的信用風險衡量方法是內部評等法(Internal Rating Based Approach, IRB)。IRB 法允許銀行依據本身策略需求,建置較具自主性和彈性的信用風險評等系統,頗獲各國金融機構推崇。在建置IRB 系統過
程中,銀行需考量違約機率(Probability of Default, PD)、違約損失率(Loss Given Default, LGD)、違約暴險額(Exposure at Default, EAD)以及有效到期期間 (Maturity, M)這些因素。其中,PD 為 IRB 的主要核心,故銀行更為重視對 PD 的評估預測。 決定信用風險評等系統績效的關鍵因素在於建構評等模型以及選擇預測 變數,羅吉斯迴歸(Logistic Regression, LR)是目前被普遍應用在建置違約預測系 統的統計模型。LR 特性允許估計值落於正、負無限大之間,再透過 Logit 函數 轉換成值域 0 到 1 的機率值,藉此門檻值協助判斷違約事件發生的程度。LR 模型在應用上放寬對變數的假設限制,允許使用質化或量化變數型態;自變數 不須符合常態分配或任何機率分配假設。傳統統計模型使用線性組合方式來挑 選變數,例如逐步分析、因素分析等。在變數的挑選會以次序加入或剔除的方 式來組合,依特定順序選擇變數的方式不易找到最佳預測變數組合。除了變數 選擇是建構模型的重點外,模型門檻值的決定也是預測分類模型的重點。門檻 值是將風險程度相同的授信戶做歸類的判斷依據,門檻值的決定也將會影響模 型預測分類的效力。 本研究目的之一是藉由遺傳演算法挑選出在企業財務體質、公司自治以及 總體環境等變數中最具預測效力的因素,提昇預測企業的信用風險等級的準確 性。各家銀行的文化和特性不同,授信策略也會有所差異,故我們加入依銀行 授信評等等級的設定來建立一套準確、有效的信用風險評等管理資訊系統,亦
即授信可依偏好設定分類的等級,每一個類別的評等是個別建立模型與門檻 值,以及藉由演化方式找尋最佳預測因果結合,期望能增添分類的效能,此為 目 的 二 。 提 出 一 個 創 新 的 評 等 模 型 , 結 合 多 重 組 合 羅 吉 斯 迴 歸(Multiple Combinatorial Logistic Regression Model, MCLR) 及 遺 傳 演 算 法 (Genetic Algorithm, GA)來建置出演化式多重組合羅吉斯迴歸信用評等系統(Evolutionary MCLR Credit Rating System, EMCRS),盼能有助於銀行管理企業授信風險以及 建立符合銀行策略的內部評等系統,此為最重要的目的。
EMCRS 系統需要一個穩定性佳且準確度高的分類評等模型,LR 的擴充模 型累積羅吉斯(Cumulative Logistic Regression, CLR),具有預測次序多類別 (ordered multi-category)的特性。但 CLR 分等的門檻值不易區分,容易隨著樣本 資料變化造成等級變動具有不對稱現象。為改善CLR 模型的限制,本研究採用 LR 為基礎擴充為 MCLR 模型,依據評等等級數目建構個別的 CLR 評等模型, 每一個評等等級有自己的預測模型以及門檻值,組合出MCLR 模型。MCLR 模 型結合 GA 找出的最佳預測變數組合與各個等級的門檻值,建立一套有效的 EMCRS 系統,銀行可以依據本身的策略與特性找出適用且有效的企業信用風 險評等模型。採用Basel II 建議的驗證方法,分別以「違約預測力」、「 穩定度」 及「等級同質性」三方面做模型的驗證,並且與台灣經濟新報的信用風險指標 (Taiwan Corporate Credit Rating Index, TCRI)來做比較,希望透過這樣的比較及 驗證,提昇此模型的穩定性與預測能力,提供銀行在授信放款業務一個較佳的 投資決策參考。
貳、文獻回顧與探討
企業發生違約絶非突發事件,應有跡可循,Basel 協定提出之後學術界與實 務界對信用風險議題再度引起熱烈的討論。有必要對信用風險相關的議題包括 違約預測模型特性、預測變數選擇問題與門檻值決定方法相關文獻進行探討; 另外介紹遺傳演算法在信用風險相關文獻的討論,試圖從中發掘相關理論的優 勢與限制以及整合應用的契機。 一、違約預測模型根據Balcaen et. al. (2006)文獻整理違約預測方法分四大類:第一類,單變
量分析(Univariate Analysis),使用單一變數,該變數與預測結果呈線性的關係; 第二類,是風險指標模型(Risk Index Models),由 Tamari(1966)提出簡單且直覺 的分數系統,可包含不同的變數,每個變數都有分數,使用者主觀的分配變數 權重彙總後再做預測;第三類,多元區別分析(Multiple Discriminant Analysis, MDA),由 Altman (1968)應用 MDA 於企業倒閉預測,MDA 限制使用的變數符
合常態分配並互相獨立,變數建構出的線性方程式將產生一個區別分數介於-∞到∞的值域,藉由門檻值來判斷企業是否違約;第四類,條件機率模型 (Conditional Probability Models, CPM),Hosmer et. al. (1989)應用 CPM 發展出 LR 模型假設其機率呈現羅吉斯分配的機率模型,另假設變數和違約機率之間 呈線性關係的線性機率模型。
屬於條件機率模型的LR 由 Ohlson (1980)是將 LR 應用在企業違約機率預
測,並嘗試同時使用類別資料與數值型態的變數資料。Meyer et al.(1970)與 Sjur
et. al.(2001)以及 Tseng et. al. (2005)等文獻應用 LR 在銀行倒閉預測,準確率較
其他模型為佳。Baesens et. al.(2003)指出迴歸中,LR 較能容許多元變數的誤差,
其績效表現明顯的較佳於一般迴歸模型。Ugurlu(2006)探討企業面對環境不確定
性和動亂的情況下,比較 MDA 和 LR 模型對預測企業違約的效力,實驗結果
指出LR 模型優於 MDA。Lin & Ko (2006)以 LR、NN、MDA 預測企業發生財務危 機,應用遺傳演算法與粒子群演算法最佳化變數以及各模型預測權重,實驗結 果顯示整合模型的預測力最佳。
二、預測變數選擇相關文獻
信用風險預測變數包含多種類別,本節依據過去一些學者使用預測變數的 類型進行探討做為本研究變數來源的參考。傳統風險預測模型挑選變數,通常
是以線性搜尋的方式進行,例如:逐步分析法Donate et. al.(1999)、因素分析法
Deakin(1972),其變數組合方式是以次序加入或剔除,較不易找到最佳變數組 合。Altman(1968)是最先使用了財務變數及經濟變數投入多元區別分析 MDA 模型預測公司倒閉。Ohlson(1980)是首先利用多元羅吉斯迴歸模型(Multiple Logistic Regression)來建立 PD 預測模型,使用到的變數共有 9 個財務比率,包 含流動比率、總負債是否大於總資產、總資產報酬率、負債比率、淨利變動率、 資產規模、營運資金佔總資產比率、是否連續兩年為負淨利、營業活動淨現金 流量/平均總負債。Laster(2003)發表的文章中使用到的財務變數有七類:資本適 足、負債財務槓桿、流動性資產(Liquidity)、績效表現、現金流、獲利能力 (Profitability)和規模大小(Size),其在公司財務預測與評等上,有不錯的表現。 Ugurlu(2006)收集的預測變數有 80 個分成八類:獲利能力、流動性資產、償付 能 力(Solvency) 、 經 濟 危 險 程 度 (Degree of Economic Distress) 、 槓 桿 作 用 (Leverage)、效率(Efficiency)、波動度(Variability)以及規模,並利用這八類的變 數來有效預測新興市場的公司違約與否。 Keasey 與 Watson (1987) 以英國破產公司為研究樣本,來探討財務變數、 非財務變數與中小企業破產之關聯。非財務變數包括公司治理變數、會計資訊 變數、可能窗飾財報之變數及總體經濟變數4 大構面。採逐步迴歸選取顯著變 數,以 Logit 迴歸進行預測,發現公司交付財報時間愈不正常、董事會成員愈 少、債權受銀行擔保者、最近一次財報受會計師認可且之前財報均未受會計師 認可之中小企業發生財務危機機率愈大。Huyghebaert et. al. (2000)利用現金流
量變數,如營運活動之現金流量、投資活動之現金流量及融資活動之現金流量、 營運資金現金流量、公司規模大小取對數及產業變數等,透過 Logit 模型來評 比現金流量模型與一般財務指標模型之預測能力。結果顯示,現金流量模型預 測能力優於一般財務指標模型。 綜合各國內外學者的研究成果,可以發現變數選取攸關模型的解釋能力, 包含財務變數及非財務變數的綜合模型解釋能力大多數優於僅考慮財務變數的 財務變數模型,羅吉斯迴歸模型對於預測企業財務危機,具有相當的效力。變 數的選擇方法多是線性方法,如逐步迴歸或經驗法則等方法。若應用非線性方 法做變數的最佳化或許可以獲得更好的預測結果。 三、門檻值相關文獻
Ran et. al.(2000)文中強調門檻值是構成預測模型效力主要因素。門檻值為 預測目標分類依據,若門檻值設定不恰當,容易提高錯誤率導致模型預測力下 降。在巴塞爾銀行監管委員會(Basel Committee on Banking Supervision) (2005) 中提到收受者操作特性(receiver operating characteristic, ROC)驗證方法,即是針
對模型門檻值區分預測效力進行量化的計算,ROC 值愈高代表模型愈佳。Limin 與Douglas(2002)在累積羅吉斯分類以等距分等方式決定門檻,此方法採用均分 法分配多種評等等級的門檻值,在S 曲線的中間段的門檻值範圍較小而陡峭; 曲線的頂端與底端的門檻值範圍較大而平滑,因為門檻值大小不一致較容易影 響評等效力。Foreman(2003)則是使用 LR 模型以一個常數或機率的平均值 0.5 來當門檻值,但是此種分法只適用於單一類別並不適用於多類別評等問題。由 此看來,門檻值的決定對於企業違約預測模型的優劣佔有重要地位。 四、遺傳演算法 遺傳演算法乃 Holland(1975)所提出是人工智慧中有力(powerful)的一種技 術,其本質上為一個機率性的演算法則(probabilistic algorithm),能在廣大的求 解空間中,快速的搜尋最適解。GA 以非線性搜尋最適預測變數集合應用上, 具有良好的表現。Back et. al.(1996)以 GA 最佳化變數後再應用類神經網路 (Neural Network, NN)、MDA、LR 等模型進行企業倒閉預測。Kim 與 Han (2003) 以資料探勘(Data Mining)的觀念探討專家經驗與 GA 所決定的變數配合的 MDA、LR、NN 以及決策樹(Decision Tree)進行倒閉預測,實驗結果顯示以 GA 所挑選的變數預測企業倒閉的效力較專家經驗為佳。Min et. al. (2006)與 Wu et. al. (2007)結合 GA 與支援向量機(Support Vector Machine, SVM)做企業違約預
測,研究結果指出藉由GA 最佳化 SVM 參數後提昇預測的績效。
Shin et. al. (2002)與 Laitinen et. al. (2000)兩篇文章均指出,雖然很多研究的
為:第一,尋找變數與函數之間的非線性關係時容易產生過度配適(overfitting) 問題;第二,藉由不同參數設定(如神經元網路架構、學習函數、訓練函數等) 找尋合適的類神經網路成為一種藝術,意指以試誤法(try and error)設定相關參 數以找尋類神經網路模型;第三,NN 學習後的網路結構不易讓使用者了解和 使用,對其結構規則可讀性不佳而產生黑箱(black boxes)作業的刻板印象;第 四,其穩定性不足以及驗證困難使得實務界接受度不高。 綜合前述文獻的討論,本研究選擇以 LR 模型為基礎,並針對 LR 模型應 用在分類評等的限制做進一步的改善。改善的方向有:1)提出多重組合羅吉斯 迴歸,改善單一羅吉斯迴歸模型在同一條S 曲線上決定門檻值的限制,不論依 均等法或經驗法則在同一條曲線上決定門檻值均有不對稱性的問題;2)不同的 評等等級應該有各自的門檻值,亦即每一個等級可以擁有各自的羅吉斯迴歸與 其所屬的門檻值;3)結合 GA 最佳化的能力,協助 LR 挑選變數以及決定門檻 值;4)採用 Basel II 驗證方式,除預測效力外,進一步加入模型穩定性與同質性 的験證,強化評等的效能。
參、研究方法
本研究提出演化式多重組合羅吉斯迴歸信用評等系統,本節即針對其研究 架構的運作步驟進行說明;文中將闡述遺傳演算法的兩項重要工作為染色體編 碼(包含變數與門檻值編碼)與適應函數設計;細部說明多重組合羅吉斯迴歸模 型計算流程;以及Basel II 四種驗證方法。 一、研究架構 本研究提出EMCRS的研究架構說明共分成 5 個步驟見【圖 1】:第一步驟, 透過GA的染色體編碼方式進行第一代族群的初始化。第二步驟,此步驟分成 5 個動作:1)每條染色體會依據兩部分進行解碼動作,包含預測變數及等級門檻 值;2)將解碼後的門檻值排序完即決定各等級順序;3)代入訓練樣本及等級門 檻值並利用最大概似法(MLE)來估計MCLR模型,即可求出違約機率,與各機 率門檻比較,就可計算出該樣本機率歸類為何種信用風險等級;4)評等結果再 由Basel II的驗證方法(預測效力、穩定性以及等級同質性等)進行驗證,將不同 的驗證方法產生的結果做彙總;5)將驗證結果及變數數量分數(愈少愈高分) 取倒數,即為染色體的適應函數值。第三步驟,進入選擇機制,此階段會依據 適應函數值,依指定的選擇方法(如輪盤法或競爭法)選擇適應函數值較佳的 染色體到交配池進行交配;第四步驟,以交配池裡的染色體,利用兩兩交配方 式(如單點交配、均匀交配),進行部份基因的交換;第五步驟,每條染色體會 依據突變率來決定染色體基因是否要進行突變。經由前面的步驟產生新一代的族群,並不斷重覆這樣的流程直到滿足設定的終止條件。EMCRS系統就是透過 這樣的演化機制,來尋找最佳的評等估計模型、預測變數組合以及適當的門檻 值,學習出最具驗證效力的信用風險模型。 【圖1】演化式多重組合羅吉斯迴歸信用評等系統(EMCRS)架構圖 在【圖 2】中我們以迴歸殘差值ε來代表樣本在MCLR所得到的預測值, ε的範圍是從負無窮大到無窮大,MCLR是由多個LR所互相累積而成,不同的 ε會對應不同的違約機率,當樣本預測出來的ε落入二個門檻值 c 1 ε 和 c 2之間, 則樣本的預測信用評等為第2 級,而等級愈高則違約風險愈高,本研究模型會 依據使用者的級別需求來產生適當並能有效區分企業的等級門檻值。在 ε 【圖2】 是以評等四級為例。 MCLR不同於CLR的地方,在於CLR不易在累積機率分配S曲線上,區分多 個門檻,因為S曲線特性是從 0 到 1,傳統採用均分法切割不同評等的門檻值, 造成中間的線段BC是急劇上升如【圖 3】。BC段在設定多個門檻值的評等時, 因其違約機率值會過於接近,模型的預測規則容易受到樣本機率變動,使得預 測樣本等級結果較敏感,造成模型的預測結果較不穩定,而線段AB和線段CD 則較平緩,落入這兩線段内的門檻,因其違約機率值間隔較大,樣本較容易被 評等為該區段的等級。
【圖2】MCLR 圖 【圖3】CLR 圖 二、染色體編碼 在【圖4】我們看到GA中染色體長度可分為二部分來解釋:1)預測變數: 由於本研究參考許多的文獻來挑選不同面向的各種變數,假設共有n個原始變 數,因此在代表變數的部分是n bit,bit值為 0 則指該變數未被選擇,1 即變數 被選擇;2)區分不同違約風險等級門檻值,EMCRS系統可依照使用者希望的分 等數量如m等,來決定MCLR迴歸的分等門檻數量,每個門檻值是以 11 bit來表 示(1 bit代表正負值、4 bit代表整數部分、6 bit代表小數部分),門檻值編碼共 有(m-1)×11 個bit,故染色體長度共有(m-1)×11 個bit。
X1 X2 … Xn-1 Xn
模型所挑選原始變數n個 門檻值:系統使用 者欲評等的數量-1 1 bit 4 bits 6 bits
整數 小數部分 正負號 … c 1 ε c m 1= ε 【圖4】染色體編碼示意圖 染色體的編碼門檻值的部分,解碼之後會將門檻值進行由小到大的排序, 即代表評等低到高(1…m)的門檻值,評等等級愈高,代表違約機率愈大。排序 過程可見【圖5】示意圖。
門檻值編碼未排序: 解碼值: 13.671875 -2.703125 門檻值編碼排序後: 解碼值: -2.703125 13.671875 【圖5】門檻值排序示意圖 三、多重組合羅吉斯迴歸模型 本研究是利用MCLR 模型來預測企業信用風險等級,MCLR 的累積機率分 配曲線,是由多個LR 間層層累積組合方式形成。 在LR方法中,首先假設自變數與因變數為線性關係如方程式(1): j n k jk k j x y =β +
∑
β +ε =1 0 * (1) 當連續變數y*j大於某一門檻值,即代表事件發生(yj =1),其歸屬函數如 方程式(2) : ⎪⎩ ⎪ ⎨ ⎧ = ≤ = > 0 , 0 1 , 0 * * j j j j y y y y (2) 可從P(
yj =1xj)
推導得到MCLR中第m-1 個LR迴歸估計值(
j =mxj)
, 表示MCLR LR (3) y P εc 中各 的門檻值,其推導過程如方程式 :(
)
⎟ ⎠ ⎞ ⎜ ⎝ ⎛ − >− + − = ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ >− + = ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ + + > = =∑
∑
∑
= − = = − j n k c m jk k c j n k j jk k j j j n k jk k j j x x P x x P x x P x m y P m 1 1 0 1 0 1 0 ) ( ) ( 0 1 β β ε ε ε β β ε ε β β (3)假設εj的機率分佈是互相對稱,因此方程式(3)可以改寫成方程式(4) :
(
)
⎟ ⎠ ⎞ ⎜ ⎝ ⎛ < + + = ⎟ ⎠ ⎞ ⎜ ⎝ ⎛ + + < − = =∑
∑
= − = − − j n k c m jk k j j n k c m jk k c m j j j x x P x x P x m y P 1 1 0 1 1 0 1 2 ) ( ) ( ε β β ε ε β β ε ε (4) MCLR的累積違約機率計算方式為:假設MCLR欲分 10 等則需分成 9 個LR 來組合,每個LR各佔有全部違約機率的 9 1 ,方程式(5)中m是LR的等級數量, c 1 < ε 個ε 的位置是透過以GA找出最佳分界點,以提高違約機c 率分等的效力,則違約機率累積分佈函數如方程式 c m c 1 2 < <ε − ε L ,每 (5):(
)
(
)
∑
∑
− = − +∑ + − = = + − = = − = = 1 1 ( 2 ) 1 1 1 0 1 1 1 1 1 1 m z x m z j j j j n k c z jk k e m x z y P m x D y P ε β β (5) 為了推估方程式中各個參數β值,我們利用最大概似法依據給定的樣本資 料使概似函數最大化,它們的聯合機率函數可表示為各邊際機率函數的乘積見 方程式(6):∏
∏
∏
∏
∏
= 4 4 3 3 2 2 1 1 ... ) ln( ) ( ln n nm m n n n P P P P P L θ (6) 為求出此事件機率最大值發生處,將已知之樣本資料代入L(θ)中,為計算 方便,故先對L(θ)取對數可得其對數概似值見方程式(7): ) .... ln( ) ( 3 3 2 2 1 1∑
∑
∑
∑
+ + + + = nm m n n n P P P P L θ (7) 為使L(θ)最大之估計值β值,分別對方程式(7)式中β0 ~βn n 值做偏導數, 並令其為0,則會產生n+1 條非線性方程式。在求出β0 ~β 之前,首先以泰勒 展開式( Taylor's Expansion )將此n+1 條的非線性方程式轉成多項式,假設χ已 知,∆χ未知,則如方程式(8): L + Δ × ′′ + Δ × ′ + = Δ + ( )2 ! 2 ) ( ) ( ! 1 ) ( ) ( ) (χ
χ
fχ
fχ
χ
fχ
χ
f (8)如果變動量∆χ趨近於 0,則可只擷取前兩項,其餘省略,此即為牛頓法 (Newton's Method)。為了求得其解,則其推導過程可見方程式(9)-(12)。 ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ = ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ Δ Δ Δ = Δ ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ = ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎥ ⎦ ⎤ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎢ ⎣ ⎡ ∂ ∂ ∂ ∂ ∂ ∂ = ∇ = 2 2 1 2 0 2 2 1 2 1 0 2 0 2 1 0 2 2 0 2 1 0 1 0 , , , n n n n n n n n n f f f f f f f f H f f f f g β β β β β β β β β β β β β β β β β β β β β β β β L M L L M M M (9)
(
β β)
β + Δ × ×Δ Δ × = Δf gT T H 2 1 (10)0
=
Δ
×
+
H
β
g
(11) g H × − = Δβ
−1 (12) 透過上列方程式取得β0 ~βn的值,再利用前面遺傳演算法得到 和 自變數 代回 c c m1 1 ~ε − ε jx
(5)式即可以求出樣本j的違約機率P(
yj Dxj)
而違約機率再與 各個機率門檻比較,可得知樣本機率歸類為何種信用風險等級。 = , 四、驗證方法本小節是介紹五種Basel II 的驗證方法:1)累積精確度(Cumulative Accuracy Profiles, CAP)曲線:用來評估模型的違約預測力;2) KS 檢定:檢定模型是否將 違約和非違約有效的區分;3)接收者操作特性 (Receiver Operating Characteristic, ROC)曲線:檢定模型評等門檻的設定,是否能有效判斷樣本的等級;4) 條件 資料熵比率(Conditional Information Entropy Ratio, CIER):檢定評等結果,是否 具有等級同質性以及等級間差異性;5) 移轉矩陣(Transition Matrix, TM):了解 模型的規則是否具有穩定性。以下將說明這5 個指標的用法。 (一)CAP CAP曲線為違約預測力之評估方法,其最終可求得一個準確值(Accuracy Ratio,AR),AR值愈接近 1,則表示違約預測力越具有可信度。計算方法是將 樣本的PD由高至低作排序(即由高違約的客戶至低違約的客戶),再根據累積PD 繪出CAP曲線。假設現在樣本有 300 筆資料,總樣本的累積樣本比率為S,有D 筆違約資料,N筆未違約資料,將它做PD的排序,由高至低,X軸為總樣本的 累積比率,Y軸為違約樣本的累積比率。依據每個等級的樣本依序加入,並將
累積至各等級總樣本的累積比率及違約樣本的累積比率繪成曲線見【圖6】。
【圖6】CAP 圖
資料來源: n Banking
【圖7】KS 圖
資料來源:B on Banking
模型(perfect model)、 odel),以及隨機模
型(ra Basel Committee o Supervision (2005) CAP圖是由完美 asel Committee Supervision (2005) 評等模型(rating m ndom model)。完美模型表示高違約機率客戶可以在X軸的前端將違約客戶 全部捕捉到,代表模型的偵測能力最完美;評等模型所繪出的ROC曲線越接近 完美模型曲線,則代表模型偵測能力越好;隨機模型的預測結果幾乎是隨機的, 也就表示這個模型不具有偵測能力。CAP中重要的指標為AR ,其計算方式就 是透過上圖中Ar的面積佔有三角形 0AB(Ap)的面積之比率。N等於樣本大小, AR值越接近 1,則表示模型偵測能力越好。Ar的計算見方程式(13)。 Ap Ar AR = (13) (二)KS 用是檢定兩個連續型隨機變數是否具有相同的機率分配,其模型的 【表2】KS 值表 KS檢定的功 檢定有三個步驟有:1)將樣本的違約數與非違約數依據評分等級做累積加總; 2)計算各評分等級的累積機率之差;3)找出最大累積機率之差,即為KS值。【圖 7】的X軸為分級等級,Y軸為累積(非)違約佔總(非)違約之比率。其中,實線為 非違約累積曲線,虛線為違約累積曲線,兩條線之間的最大差距為KS值。 Elizabeth(2001)曾針對各種情況下的KS值,進一步說明其與模型鑑別能力之關 係如【表1】。
KS 值 模型的優劣程度 <20 模型不具鑑別能力 20~40 好 ,應注意是否真實 模型鑑別能力普通 41-50 模型鑑別能力好 51-60 模型鑑別能力非常 61-75 模型鑑別能力優 >75 模型鑑別能力太好 (三)ROC ROC曲線是透過違約率高的客戶給予高的PD,以及給較低的得分;而非違 約的客戶,則給予低的PD,並給較高的得分。依序將各等級的違約人數繪製一 條違約客戶的等級分配曲線;另外將各等級的非違約人數繪製一條非違約客戶 的等級分配曲線。這兩條曲線可得到違約與非違約客戶的等級分配圖見【圖8】: 【圖8】ROC 等級分配圖
資料來源:Basel Committee on Banking Supervis
【圖9】ROC 圖
資料來源:Basel Committee on Banking Supervision 。【圖8】中C點的左邊是預測違約客戶群,右邊則是 非違 ion (2005) (2005) ROC做等級評分的目標是將違約與非違約兩群客戶完全的分開 部份愈少,模型預測愈準 ,兩群重疊 約的客戶群。當違約客戶小於門檻值 C的部分(著色區域),表示那一部分 違約客戶的分類是正確的;而非違約客戶小於門檻值C的部分(斑點區域),則表 示那部分的非違約客戶被誤判了。繪製ROC曲線時,需要依據各級的門檻值 C 來計算出各門檻值的誤判率以及命中率。以X軸為誤判率,Y軸為命中率,繪製 成ROC曲線。命中率HR(C)的計算如下方程式(14): D N H(C) HR(C) = (14) 其中H(C)為在門檻值 C下,真正被預測出來的違約客戶(著色區域),ND為
樣本的違約樣本總數。誤判率FAR(C)的計算如方程式(15): ND N (15) ) N F(C) FAR(C) = 其中F(C)為在門檻值C下被誤判的非違約客戶(斑點區域 , ND為樣本的非 違約樣本總數。依據各門檻值C的命中率及誤判率,可繪製出ROC曲線如【圖 9】。計算AUC(Area under curve)值,為【圖 9】著色面積A÷正方形面積。完
模型的AUC 100%,而沒有識別能力的隨機模型其AUC值為 50%,故AUC
值越高,則表示偵測違約的能力越好,AUC值則代表ROC檢定的結果。 首先會需要透過熵(Entropy)的計算,以求得CIER值。我們定義發生率為 p的信息熵H(p)為方程式(16)。 美 值為 (四)CIER CIER是用來評估評等模型的分等結果,是否具有等級同質性以及等級間差 異性,
( )
p(
p( ) (
p p)
(
p)
)
H =− ×log + 1− ×log1− (16) 可用下圖來說明信息熵H(p)跟發生率 p 的關係: 【圖10】信息熵 H(p)跟發生率 p 的關係資料來源:Basel Committee on Banking Supervision (2005)
H(p)若在p為 50%的時候會達到最高點,則表示不確定程度處在最大的狀 態。若是p等於 0 或 1,則表示事件一定會發生。將所有的客戶依據其違約機率 分成m等,K={K1,K 以Ki為前提下, 評估不確定 2,…Km},若將D定義成違約客戶。ce(Ki)是 性的條件熵(Conditional Entropy),計算如方程式(17)
( )
i = −{
p(
D Ki)
×log[
p(
D Ki)
]
+[
1− p(
D Ki)
]
×log[
1− p(
D Ki)
]
}
i)是第Ki等的PD,若Ki等有NDi個違 NNDi個未違約客戶, p(D|K ) (17): K ce (17) 其中p(D|K 約客戶, 則 i 計算如方程式NDi Di Di i N N N ) K | P(D + = (18) 條件熵CE(K)被視為各評等等級的加權ce(Ki)的平均值,則CE(K) 計算如方 程式(17):
∑
(NDi +NNDi)∑
= = × + = m i m i 1 i 1 NDi Di N ) ce(K (N CE(K) (19) 評 估 模 型 是 否 有 效 區 分 風 險 , 就 必 須 用 到Kullback-Leibler 距 離 (Kullback-Leibler Distance),其算式為:Kullback-Leibler距離= H(p) – CE(K), 其中H(p)為樣本違約機率的信息熵,而p計算如方程式(20)。 )∑
= + = m i i 1 NDi Di 1 ) N (N p∑
(20) = m Di N Kullback-Leibler距離介於 0 至H(p)之間,距離越長則表示評等模型越能有 效區分風險。可以利用Kullback-Leibler距離標準化,以產生CIER值,來評估評 等模型的等級同質性,可見方程式(21)。CIER 接近 1,表示評等模型所得 的結果,相同等級的樣本其性質相似,不同等的樣本差異很大,即等級內的樣 本同質性高,等級與等級之間異質性大。 越 到 H(p) CE(K) -H(p) CIER= (21) (五)TM TM是利用違約風險評等規則對於第n期(如:季)樣本進行預測的結果並紀 錄每個等級內的授信戶組成,再利用同樣的規則對第n+1 季的樣本預測評等 透過前後二季的評等結果來產生一個移轉矩陣,矩陣會表示出前季等級內的樣 移轉到各個等級,舉例來說:由【表 3】可見前季評等為第 1 級 的樣本到了後季時,繼續維持在第1 級的樣本只剩 58%,其中有 30%移轉到第 2 級且 【表3】移轉矩陣 , 本有多少比率 有14%移轉到第 3 級,其它等級以此類推,而矩陣對角線的集中度愈高, 代業決定模型預測的穩定性愈高。本系統是利用對角線加總值作為本系統判斷 穩定性的依據。 1 2 3 4 5 6 7 81 56% 30% 14% 0 0 0 0 0 2 0 42% 25.00% 14.00% 10.00% 9.00% 0 0 3 0 0 30.36% 48.21% 17.86% 3.57% 0 0 4 0 0 0.67% 12.66% 27.33% 38.67% 12.67% 8% 5 0 0 0 0 6.45% 8.06% 80.65% 4.84% 6 0 0 0 0 0 19.23% 46.15% 34.62% 7 0 0 0 0 0 0 15.38% 84.62% 8 0 0 0 0 0 0 0 100% 五、適應函數 MCR 統中 的適應 數計算 成四個 驟,首先 色 預 數組 及評等 檻值; 二步是 用訓練 本、選擇 變數組 檻值來產生MCLR迴歸式;第三步則是將訓練樣本帶入MCLR中得到違約風險 第四步是以Basel II建議的驗證方法檢定模型,適應計算如方程 式(22)。 、V V 、V V 是經由驗證方法的各個項目檢定 所得到的值 計算是利用變數選擇的數量來決定,當變數選擇的數量愈多, 其值愈小,最後將各項 值加總後的分數再除以 取倒數 染色體的適 應函數值,適應函數值愈大則代表染色體為愈優秀。 在E S系 GA 函 分 步 會將染 體解碼 出 測變 合 門 第 利 樣 的 合及門 預測評等結果;
其中,VCAP ROC、 KS TM、 CIER
,Vvars V Vvars ( ),就是 vars CIER TM KS ROC CAP V V V V V V value Fitness = + + + + (22)
肆、實驗結果分析
實驗之前需要收集樣本資料來源,如預測變數以及違約與非違約的授信樣 本。接著要說明遺傳演算法做訓練時的參數設定。實驗設計分兩部份,包括不 同違約時間點與變數顯著性檢定對評等效能分析。最後進行最佳化的變數分析 以及估計的MCLR 模型說明。 一、 計師變數(1)及總體經濟變數(5)等共 108 個初 始變數見附錄一。其中,外部評等變數是提供對照模型的代表,並不是EMCRS 研究採用台灣經濟新報(TEJ)的 TCRI 為外部評等變數,做為 EMCRS 驗證的比較基準 (benchmark)。樣本資料源自於台灣經濟新報資料庫中 不含金 與建築業等特殊 業之外的一般 業上市 櫃公司 產業、同期間、資產規模相似的正常公司與違約公司採取 資料來源 本研究收集的原始變數種類包含基本資料變數(1)、財務變數(60)、公司治 理變數(40)、外部評等變數(1)、會 的預測變數,本 融業 產 產 上 共402 家。以同 1:1 的方式做樣本配對,違約定義參考自TEJ。樣本資料時間從 1996 年 12 月至 2006 年 6 月共 39 季的季資料。實驗樣本分配是將402 家樣本中,每家樣本收集違約公司與配對 的正常公司的違約前一季、違約前二季、違約前三季和違約前四季的四組樣本 的變數資料,每一組透過亂數選擇出282 家的訓練樣本和 120 家的測試樣本, 分配比率為7:3。 二、實驗參數 在參數的設計部分,主要依據在多次的實驗中,選擇較穩定的參數設定做 為EMCRS系統的訓練參數。參數設定的選擇對EMCRS系統在找最佳解的速度 以及正確性不會有很明顯的差異。EMCRS系統的GA參數相關設定如【表 4】。 數設定 參數名稱 【表4】GA 參 參數值 族群數(Population) 100 染色體選擇方式(Selection Method) 競爭法 演化代數(Generation) 2000 突變率(Mutation Rate) 0.001(隨著代數增加而降低) 0.9 ssover Point) e Length) 11* n(欲分級數量-1) 交配率(Crossover Rate) 交配點(Cro 2 染色體長度(Chromosom 107+ 三、實驗設計 本實驗設計的目的是透過幾種實驗的結果,來觀察本研究模型在各個方面 的效力 向朝不同違約時間 與變數顯著性檢定,茲分述如下: 系統分析不同違約時間點評等的績效驗證,並與 TCRI 基準點 做比較,每一違約時間點均做10 種評等等級進行分析。 許使用者依需求設定不同的評等等級,因此本實驗的第一個目 的是希望 系統依使用者設定的評等等級數,觀察在不同違約時點 模型建構的評等效力;初始變數是否在有經過統計顯著性分析,對 CRS 的 評等績效有顯著的影響。 。實驗設計主要方 點 (一)實驗一 以 EMCRS (二)實驗二 EMCRS 允 了解EMCRS EM
四、實驗結果 EMCRS 的實驗結果分析將朝評等模型的驗證比較、不同違約時間的評等 效力、變數顯著性、最佳化後變數解析以及MCLR 估計模型進行說明。 (一)實驗一:TCRI與EMCRS模型比較 我們 利用Basel II 析兩者 異。驗證方向包含:違約預測力 陣率(如:TM)及等級同質性(如: CIER)等三個構面總共 5 個檢定指標做驗證。EMCRS 是採用 GA 做變數與各評 等門檻值的挑選後再以Basel II 10 種等級的評等,並將每個違約時點各等級的驗證 本做實驗。【表 5】是三個違約時間點分別的 5 個驗證指標比 較TCRI與EMCRS的評等績效。實驗結果顯示EMCRS模型在各項驗證中,幾乎 都明顯優於TCRI模型。其中CIER的三個違約時間點的平均值而言,EMCRS是 0.54 高於TCRI的 0.36,CIER值愈接近 1 表示模型的評等分類效果愈佳。CAP 優於TCRI的 0.68,CAP值愈接近 表示評等模型分等的準確 為0.91 TCRI的 0.84 C值愈接近 1 表示愈貼近 完美模型。KS 74.83 TCRI的 58.33,KS值愈高表示模型鑑別力 表示模型鑑別能力優良參考【表2】。另外, 0.5 TM值, EMCRS與TCRI則不分軒至 所選 擇的變數用來預測違約第四季後的結果,雖然準確度可以達到不錯的水準,但 在評估當季及下一季(第三季 信用風險移轉上,評估的穩定度較不理想,造成 違約前四季的前後二季的預測等級較不易維持不變。 【表5】TCRI 與 EMCRS 模型驗證結果比較表 違約前四季 違約前三季 違約前二季 平均 此實驗是將 TCRI 與 EMCRS 系統所建構的評等結果進行驗證比較。 建議的驗證方法來分 的差 (如:KS 檢定、ROC、CAP)、 穩定度-移轉矩 的驗證方法做為目標函數進行最佳化。依不同 違約時點,每個違約時點做 結果做平均。 由於在模型訓練時會利用到前後兩季來計算移轉矩陣,而違約前一季無法 和下一季的現在時間點樣本來做計算,因此只能選擇以違約前四季、前三季、 前二季的訓練樣 的EMCRS為 0.81 1 性愈高。ROC的EMCRS 大於 ,RO 的EMCRS為 高於 愈好,當KS值介於 61 到 75 之間, 在違約前四季的TM值為 0.11 低於TCRI的 1,違約前三季與前二季的 ,可能是因為樣本離違約時間點較遠,EMCRS )
指標 TCRI EMCRS TCRI EMCRS TCRI EMCRS TCRI EMCRS CIER 0.30 0.59 0.36 0.44 0.42 0.60 0.36 0.54
CAP 0.60 0.84 0.71 0.74 0.74 0.86 0.68 0.81 ROC 0.80 0.92 0.85 0.87 0.87 0.93 0.84 0.91 KS 55.00 77.96 58.33 66.94 61.67 79.58 58.33 74.83 TM 0.51 0.11 0.24 0.26 0.29 0.27 0.35 0.22 (二)實 顯 本實驗主要探討不同違約時間點的評等績效與變數顯著性分析,實驗結果 分別討論 效 2、7、10 三等,希望藉由不同的等級模型,來了解其模型驗 差異,這幾種模型都會依同 的參數設定去執行十次求其平均值代表 模型的驗證結果比較表,表中顯著性 驗二:變數 著性分析 如下。 1. 不同違約時間點的評等績 EMCRS可以依使用者需求設定評等的等級數目,本實驗設計 3 種評等等級 進行探討,分別是 證效力的 樣 該模型效力。【表6】是整理三種EMCRS 檢定標示為「無」者的違約前四季 10 級、7 級與 2 級的CIER值分別為 0.59、 0.45、0.39;違約前三季分別為 0.44、0.54、0.51;違約前二季分別為 0.60、0.60、 0.50。由趨勢看來,隨著訓練樣本距離違約時間點愈遠,其CIER愈低,可見以 時間點太遠的樣本所訓練出的規則,其等級同質性的效果較不佳,其中違約前 二季的三種等級模型則是比較優異的見【圖11】。並且CIER違約前四季三種評 等的平均值為0.48;違約前三季為 0.51;違約前二季為 0.57 以及總平均值 0.51 皆大於【表5】TCRI的平均值 0.36。另外,CAP、ROC與KS的總平均值(0.78、 0.89、73.88)也高於【表 5】的TCRI(0.68、0.84、58.33)。TM值隨著等級的增加 而降低,其意謂分等數量愈多,樣本在下一季的評等,愈不容易維持不變,而 2 級評等的TM值最大,隨著評等等級數增加其穩定性愈差,表示評等等級 7 等 與10 等穩定度不如 2 等。並且在違約前二季的TM值高於第三季與第四季,時 間點愈近TM值愈高見【圖 12】。 0 0.1 0.2 0.3 0.4 前四季 前三季 前二季 CIE R 0.5 0.6 0.7 10級 7級 2級 【圖11】不同違約時點與 3 種評等的 CIER 比較圖
0 0.1 0.2 0.3 0.4 0.5 前四季 前三季 前二季 TM 10級 7級 2級 【圖12】不同違約時點與 3 種評等的 TM 比較圖 2. 變數顯著性分析 在變數顯著性分析的實驗部份,不同於本節前一項實驗(不同違約時點評等 等級驗證比較)-GA的變數沒有「無」經過統計顯著性檢定;本節的實驗分析 重點是將原始變數107 個經由羅吉斯迴歸模型的變數顯著性分析,篩選出顯著 性p值小於 0.05 的 62 個變數後投入EMCRS系統進行信用風險評等。實驗結果 發現,投入變數事前有經過顯著性分析處理,再進行EMCRS所產生的評等結果 具有較佳驗證效力。【表6】中違約前四季與前二季的指標CIER、CAP、ROC、 KS以及TM中「有」經顯著性分析的平均值皆大於「無」經顯著性分析的平均 值;而違約前三季「有」經顯著性分析的平均值略低於「無」經顯著性分析的 以總平均值而言 該 5 項指標值(0.61、0.82、0.91、79.23 以及 0.33) (0.51、0.78、0.89、73.88 以及 0.30)。 整體 平均值; , 皆優於「無」經顯著性分析的總平均值 的實驗結果可以清楚了解,大部分經過顯著性挑選變數的EMCRS模型,比 起沒有顯著性分析挑選的模型有較佳的表現。以【表 6】的結果中依不同違約 時點與評等等級,我們建議以違約前二季樣本來訓練模型,並且模型級數設定 在7 級的效果較為理想。 【表6】顯著性分析 EMCRS 模型驗證比較表
樣本時點 顯著性檢定 級數 CIER CAP ROC KS TM
無 10 0.59 0.84 0.92 77.96 0.11 有 10 0.62 0.85 0.93 80.67 0.14 無 7 0.45 0.76 0.88 69.33 0.19 有 7 0.66 0.88 0.94 85.48 0.17 無 2 0.39 0.64 0.82 63.83 0.37 違約前四季 有 2 0.63 0.85 0.92 84.67 0.38 無 0.48 0.75 0.87 70.38 0.22 平均 0.64 0.86 0.93 83.60 0.23 有
無 10 0.44 0.74 0.87 66.94 0.26 有 10 0.54 0.74 0.87 71.50 0.24 無 7 0.54 0.83 0.91 75.33 0.28 有 7 0.64 0.83 0.91 78.75 0.32 無 2 0.51 0.76 0.88 76.33 0.42 違約前三季 有 2 0.26 0.54 0.77 54.33 0.43 無 0.51 0.78 0.89 74.06 0.33 平均 有 0.47 0.70 0.85 67.53 0.35 無 10 0.60 0.86 0.93 79.58 0.27 有 10 0.70 0.90 0.95 84.83 0.34 無 7 0.60 0.86 0.93 78.89 0.32 有 7 0.76 0.94 0.97 86.67 0.44 無 2 0.50 0.77 0.88 76.67 0.47 違約前二季 有 2 0.64 0.86 0.93 86.17 0.47 無 0.57 0.83 0.91 78.38 0.36 平均 有 0.70 0.90 0.95 85.89 0.42 無 0.51 0.78 0.89 73.88 0.30 總平均 有 0.61 0.82 0.91 79.23 0.33 (三)評估模型分 評估模型分析的部份,將針對 S 挑 的 估 式進行分析與說明,分述如下。 1. EMCRS 後的變 分析 原始變數經過顯著性分析後,再投入EM 【表 結果是 節第二 實 數 分 中「 顯 定的結果進行變數挑選分析。從【 被 財 依 力 收益 長能力 債能力做歸納 於 力 有 產 (稅後息前)、x3 資產報酬率(稅後息前折舊前 淨值報酬率 、 x11 業外收支率;每股收益率:x21 常續性EPS、x24 每 股營業利益、x25 每股稅前淨利;成長能力:x34 總資產成長率、x 產報 酬成長率;償債能力:x38 內部保留比率、x50 稅前純益/實收資本。其中,獲 利能力選到6 項指標;每股收益率選到 3 項指標;成長能力與償債能力各選到 頻繁被選到5 次;內部保留比率被選到 3 次;淨值報酬率(稅後)與稅前純益/ 2 次。公司治理變數則有: 股、x84 董監酬勞佔稅淨利 位董監酬勞、x96 財測次數、 9 理異動次數,其中董監酬 利被選到 3 次,由此可以看出公司 析 EMCR 選到 變數與 計的MCLR 方程 挑選 數 CRS模型進行變數最佳化的結果見 7】。其 以前 項 驗「變 顯著性 析」 有」經 著性檢 表 7】 選到的 務變數 獲利能 、每股 率、成 、償 。屬 獲利能 )、x4 的變數 :x2 資 (稅後) 報酬率 x6 營業 毛利率(常續性利益)、 37 總資 2 項指標。個別指標中,常續性EPS最 實收資本被選到 x70 董監持 、x85 平均每 x 9 總經 勞佔稅淨
治理因素中董監持股、酬勞比重、財測次數與總經理異動次數會影響企業的信 用風險評等。總共財務變數被選到11 項、公司治理變數被選到 5 項,而基本資 料變數、會計師變數與總體經濟變數在實驗中並未被挑選到。因此,可以看出 財務變數與公司治理變數對於信用風險評等最具影響力。 】顯 性分析EM 樣本時點 模型級數 選擇變數 【表7 著 CRS 模型選擇預測因子表 10 級 x4 x6 x21 x38 7 級 x2 x50 x84 違約前四季 2 級 x3 x50 x99 10 級 x21 7 級 x21 x70 違約前三季 2 級 x21 x37 x85 x96 10 級 x4 x34 x38 7 級 x11 x24 x25 x84 違約前二季 x84 2 級 x21 2. 估計的 MCLR 方程式 依照實驗二第二項「變數顯著性分析」的結果,我們選擇評等較佳的情境 模型-違約前二季中的評等數目為 ,所選到的變數見【表7】 灰色部份,其MCLR的估計方程式(23) 得殘差 下: 7 個等級來做說明 所求 項如 84 25 24 11-3.917 -4.677 -8.1021 2.4041 -0.8625 x x x x j = ε (23) EMCRS 7 個殘差 -0.48, 0.09, 0.98, 5.20, 10.84,透過方程式(24)計算出違約機率門檻,分別為 0. 7 3 0.8 , 0.8333,樣本將變數資料帶入方程式(24)求得 產生的 個評等等級中的 6 項門檻值ε1c~ c 6 ε 分別為-14.89, 0.1683, 5718, 0.6252, 0. 0 , 3 機率值即可與各等級門檻比較,即可計算該樣本所屬的評等等級。
(
)
∑
= + − + = = 6 11 ( 2 ) 1 6 1 Z j j C Z j e x D y P ε ε (24)伍、結論與未來建議
及 模型整合來建構出的 系統,從 等效力。 實驗結果發現:1) 在「模型的評等分類效果」、「評等模型準確性」、「貼近完美 本研究提出以GA MCLR EMCRS 實驗結 果可發現,利用非線性搜尋方式的 GA,能夠有效的找出最佳門檻值和預測變 數。本研究將LR 擴充為預測次序多類別的 MCLR,應用於預測信用風險評等 上。透過Basel II 所建議的評等模型驗證方法來檢驗 MCLR 模型的評模型」以及「模型鑑別力」方面 EMCRS 比 TCRI 具有較佳的評等效力, 明GA 與 MCLR 整合應用,獲得不錯的信用風險評等效果;2)距離違約時間 愈遠等級同質性的效果較差,印證近期的財務資訊較能反應企業的營運狀況, 不論其等級同 評等等級愈多移轉矩陣 會下降,因評等分為 高的現象合乎常理;4) 原始變數先經過顯著性分析,再投入EMCRS 所產生的評等結果在效力性、同 質性
參考文獻
., and Vanthienen, J. “Benchmarking state-of-the-art classification algorithms for credit scoring,” Journal of the Operational Research Society(54:6), June 2003, pp. 627-635.[4] Balcaen, S., and Ooghe, H. “35 years of studies on business failure: an
mittee on Banking Supervision “Studies on the Validation of Internal
更 說 點 質性與模型評等效力驗證均優於TCRI;3) 2 類與分成 7 與 10 類的穩定性較 與穩定性均有較的驗證效果;5)違約前二季的樣本資料以及評等級數設定 在 7 級的績效更好,EMCRS 模型可依使用者需求設定評等級數,找出適合的 信用風險評等模型;6)財務變數被選到最多是獲利能力指標(如:資產報酬率(稅 後息前)、資產報酬率(稅後息前折舊前)、淨值報酬率(稅後)、營業毛利率、業 外收支率,其次是每股收益率指標(如:常續性 EPS、每股營業利益、每股稅前 淨利)以及成長能力(如:總資產成長率、總資產報酬成長率)與償債能力(如: 內部保留比率、稅前純益/實收資本),足見EMCRS 評等模型受整體獲利、每 股收益、成長力以及償債力等變數的影響較大;7)公司治理因素中董監的酬勞 比重與持股以及財測公佈與高階管理者異動均是影響信用風險評等的重要因 素。未來研究建議朝幾個方向進行:配合其他統計變數挑選方式事前檢定後再 加入 EMCRS 或許可能進一步改善評等效能;樣本的數量增加對於模型的建 立,更具代表性;加入其它國際金融評等機構的信用評等模型做比較。
[1] Altman, E. I. “Financial ratios, discriminant analysis and the prediction of corporate bankruptcy,” Journal of Finance(23:4), September 1968, pp. 589-609.
[2] Back, B., Laitinen, T., and Sere, K. “Neural Networks and Genetic Algorithms for Bankruptcy Predictions,” Expert Systems with Applications(11:4), 1996, pp. 407-413.
[3] Baesens, B., Gestel, T. V., Viaene, S., Stepanova, M., Suykens, J
overview of the classic statistical methodologies and their related problems,”
The British Accounting Review(38:1), March 2006, pp. 63-93.
[5] Basel Com
Rating Systems” Basel committee on banking supervision, working paper, No. 14., February 2005.
[6] Deakin, E. B. “A discriminant analysis of predictors of business failure,”
mputer Systems(15:3), April 1999, pp. 433-441.
the US local
aptation in Natural and Artifical Systems,” Society for
iley & Sons,
al of Business
ction of
“The discovery of experts' decision rules from
recast Financial Distress,” Knowledge Based Systems(19:1),
national Review of Financial
for ordinal response
Failures,” The Journal of
prediction,” Expert Systems With Applications(31:3),
Journal of Accounting Research(10:1), Spring 1972, pp. 167-179.
[7] Donate, J. M., Schryver, J. C., Hinkel, C. C., Schmoyer Jr., R. L., Leuze, M. R., Grandy, N. W. “Mining multi-dimensional data for decision support,” Future
Generation Co
[8] Elizabeth M., "Handbook of credit scoring: the basics of scorecard development and validation", Lessons Professional Publishing, 2001.
[9] Foreman, R. D. “Logistic analysis of bankruptcy within
telecommunications industry,” Journal of Economics and Business(55:2), March 2003, pp. 135-166.
[10] Holland, J. H. “Ad
Industrial and Applied Mathematics(18:3),1975, pp. 529-530.
[11] Hosmer, D.W., Lemeshow, S. Applied logistic regression, John W New York,1989.
[12] Huyghebaert, N., Gaeremynck Ann, R. F., and Van De Gucht, L. M. “New Firm Survival : The Effect of Start-up Characteristics, " Journ
Finance and Accounting(27), 2000, pp.627-651.
[13] Keasey, K., and Watson, R.“Non-Financial Symptoms and The Predi
Small Company Failure:A Test of ARGENTIs Hypotheses," Journal of
Business Finance and Accounting(14), 1987, pp.335-354.
[14] Kim, M. J., and Han, I.
qualitative bankruptcy data using genetic algorithms,” Expert Systems with
Applications(25:4), November, 2003, pp. 637-646.
[15] Ko, P. C., and Lin, P. C. “An Evolution-Based Approach with Modularized Evaluations to Fo
March 2006, pp.84-91.
[16] Laitinen, E. K., and Laitinen, T. “Bankruptcy prediction application of the Taylor’s expansion in logistic regression,” Inter
Analysis(9), 2000, pp.327-349.
[17] Laster, D., "Insurance Company Ratings", Sigma Swiss Re (4), 2003, pp. 23-39. [18] Limin, F., and Douglas, G. S. “Conditional risk models
data: simultaneous logistic regression analysis and generalized score tests,”
Journal of Statistical Planning and Inference(108), October 2002, pp. 201-217.
[19] Meyer, P. A., Pifer, H. W. “Prediction of Bank
Finance(25:4), Septmeber 1970, pp. 853-868.
[20] Min, S. H., Lee, J., and Han, I. “Hybrid genetic algorithms and support vector machines for bankruptcy
[21] Ohlson, J. A. “Financial ratios and the probabilistic prediction of bankruptcy,”
Journal of Accounting Research(18:1), Spring 1980, pp.109-131.
search, Vol.
ent International Review(4), 1966, pp. 15-21.
nd Aksoy, H. “Prediction of corporate financial distress in an
H., Tzeng, G. H., Goo, Y. J., and Fang, W. C. “A real-valued genetic [22] Ran, B., Abraham, M., and Douglas, M. K. “Confidence intervals for
controlling the probability of bankruptcy,” Omega(28:5), October 2000, pp. 555-565.
[23] Shin, K. S., and Lee, Y. J. “A genetic algorithm application in bankruptcy prediction modeling,” Expert Systems with Applications(23:3), October 2002, pp. 321-328.
[24] Shin, K. S., and Han, I. “A case-based approach using inductive indexing for corporate bond rating,” Decision Support Systems(32:1), November 2001, pp. 41-52.
[25] Sjur, W. and Nico, V. D. W. “Default probabilities in a corporate bank portfolio: a logistic model approach,” European Journal of Operational Re
135(2), December 2001, pp. 338-349.
[26] Tamari, M. “Financial ratios as a means of forecasting bankruptcy,”
Managem
[27] Tseng, F. M., and Lin, L. “A quadratic interval logit model for forecasting bankruptcy” Omega(33:1), February 2005, pp. 85-91.
[28] Ugurlu, M., a
emerging market: the case of Turkey,” Cross Cultural Management: An
International Journal(13:4), 2006, pp. 277-295.
[29] Wu, C.
algorithm to optimize the parameters of support vector machine for predicting bankruptcy,” Expert Syst ems With Applications(32:2), February 2007, pp. 397-408.
附錄一
【表8】變數表 自變數 變數名稱 自變數 變數名稱 財務變數 x1 資產報酬率(稅前息前折舊前)% x31 稅後淨利成長率% x2 資產報酬率(稅後息前) % x32 經常淨利成長率─稅後% x3 資產報酬率(稅後息前折舊前) % x33 常續性利益成長率─稅後% x4 淨值報酬率(稅後) % x34 總資產成長率% x5 淨值報酬率-常續利益% x35 淨值成長率% x6 營業毛利率(常續性利益) % x36 折舊性固定資產成長率%x7 已實現銷貨毛利率% 總資產報酬成長率% x8 營業利益率% 內部保留比率% 率% x39 流動比率% % x11 業外收支率%每股營業利益 1 利息支出率% 元) 本% 元) 收資本% ) 款/淨值 次) ) 元) 次) 元) (次) ) 毛利成長率% ) 基本資料變 x37 x38 x9 稅前淨利 x10 稅後淨利率 x40 速動比率% x4 x12 常續性利益率(稅後)% x42 總負債/總淨值% x13 員工人數(人) x43 負債比率% x14 營業費用率% x44 淨值/總資產% x15 現金流量比率% x45 長期資金適合率(A)% x16 有息負債利率% x46 借款依存度% x17 稅率(A)% x47 或有負債/淨值% x18 每股淨值(B)(元) x48 利息保障倍數 x19 每股淨值(A)( x49 營業利益/實收資 x20 每股淨值(C)( x50 稅前純益/實 x21 常續性EPS(元 x51 存貨及應收帳 x22 每股現金流量(元) x52 總資產週轉率( x23 每股營業額(元) x53 應收帳款週轉率(次 x24 每股營業利益( x54 存貨週轉率( x25 每股稅前淨利( x55 固定資產週轉率 x26 營收成長率% x56 淨值週轉率(次) x27 營業毛利成長率% x57 淨營業週期(天 x28 已實現銷貨 x58 淨收款週轉率% x29 營業利益成長率% x59 每人營收(千元 x30 稅前淨利成長率% x60 每人營業利益(千元) 數 x62 公司年齡 會計師變數 x63 是否更換會計師事務所 總體經濟變數 x64 台灣地區失業率 x65 基準放款利率 x66 本國一般銀行對民營事業放款餘額 均值 x67 臺灣加權股價指數月 x68 出超 公司治理變數 x69 調整後負債權益比 x89 盈餘分配% x70 董監持股% x90 股份盈餘偏離倍數
x71 大股東持股% 席次盈餘偏離倍數 92 次股份偏離倍數 x73 家族總持股% 超額持股% 94 係人銷貨% 95 係人財產交易損益% 96 測次數 97 報重編次數 佔董監事席次比% 98 事長異動次數 x79 外部人士佔董監事席次比 總經理異動次數 次比% 次數 理 淨利% % 酬勞百萬 % 資 x91 x72 經理人持股% x 席 x93 x74 外部持股% x 關 x75 股權集中度 x 關 x76 法人持股% x 財 x77 自然人持股% x 財 x78 經理人 x 董 % x99 x80 獨立董監佔董監事席 x100 財務主管異動 x81 董事長兼總經 x101 發言人異動次數 x82 監察人內部化 x102 內部稽核異動次數 x83 董監質押% x103 員工流動% x84 董監酬勞佔稅前 x104 轉投資佔淨值 x85 平均每位董監 x105 轉投資佔資產% x86 董監席次控制 x106 背書保證% x87 控制持股% x107 員工平均年 x88 直接持股% x108 是否為集團公司 研究成果 本計劃是透過信用風險評估機制的建置,建立一客觀的評估系統,有效 管控企業信用風險。本計劃在研究過程中提出一個多重組合羅吉斯迴歸 模型模型結合遺傳演算法,根據不同企業進行風險值預測並評等,以便 相關授信、貸款額度設定。後續研究 SOA),建 立一更具彈性與成本效率的互通平台,其中 能有效整 合各功能模組與公司內部間資訊;透過整合、分享的方式,使得公司內 部的文件資料達到即時標準化,提升公司整體控管與溝通績效。本計劃 的 投稿到資管學報,目 入 自評: 可以運用服務導向架構( Web Service 技術 結案報告已經 前已進 修改階段。