• 沒有找到結果。

The Application of Data Mining in Accordance to basel Framework on Credit Risk Assessing in the Enterprise Industry

N/A
N/A
Protected

Academic year: 2021

Share "The Application of Data Mining in Accordance to basel Framework on Credit Risk Assessing in the Enterprise Industry"

Copied!
11
0
0

加載中.... (立即查看全文)

全文

(1)

應用資料採礦技術建置符合新巴賽爾協定之企業信用風險模型

鄭宇庭 國立政治大學統計學系 ting@nccu.edu.tw 摘 要:巴塞爾銀行監理委員會於 2001 年 1 月公佈新版巴塞爾資本協定,並於 2006 年底正式實施。新 協定鼓勵銀行能建立自己的內部評等系統評估違約風險,並重視銀行放款風險考量資訊的量化 和降低計提所需資本,進而提高金融機構風險敏感性,以彌補傳統標準法的不足。為因應此趨 勢,本研究以台灣公開資料庫的資料為實例,資料的觀察期間為 1996 至 2005 年,透過資料採 礦流程,以製造傳統產業公司之授信樣本為主要的研究對象,建構企業違約風險模型及其信用 評等系統。本研究分別利用類神經網路、羅吉斯迴歸和 C5.0 決策樹三種方法建立模型並加以評 估比較其預測能力。結果發現羅吉斯迴歸模型對違約戶的預測能力及有效性皆較其他兩者為佳, 因此,以羅吉斯迴歸方法所建立的模型為本研究最終模型。接下來便針對該模型進行各項驗證, 驗證後發現此模型即使應用到不同期間或其他實際資料,仍具有一定的穩定性與預測效力,確 實能夠在銀行授信流程實務中加以應用。 關鍵字:新巴塞爾資本協定;資料採礦;信用評等;羅吉斯迴歸模型

The Application of Data Mining in Accordance to Basel Framework on

Credit Risk Assessing in the Enterprise Industry

Yu-Ting Cheng

Department of Statistics National ChengChi University

Abstract:In January 2001 the Supervisory Review Process committee of Basel has announced the new version

of Basel capital requirements and has officially set forth the implementation of the requirements in 2006. The revised accord aims to improve risk violation assessment, make regulatory capital more risk sensitive, lower asset minimum requirements and enhanced risk sensitivity management in the banking industry. The data adopted in this study is based on the publicly published data from Taiwan banking industry database. The data used is from the period of 1996 to 2005. The study attempts to construct the model in assessing risk violation and credit evaluation against the traditional manufacturing industry. The methods used in this study is through the process of data mining using Neural Network, Logistics Regression and C5.0 Decision Tree Analysis to construct the model and evaluate the prediction accuracy among the three models. The result shows that the prediction accuracy of Logistics Regression analysis is more favorable than the other two models and therefore is the chosen choice of the model in this study. In addition, the study has adopted multiple testing criteria to validate the validity and accuracy of the model which after testing has confirmed its reliability to be accepted in its application in the banking industry.

(2)

1 緒論

1988 年,巴塞爾銀行監理委員會提出的銀 行資本適足協定,即巴塞爾資本協定(Basel Ⅰ), 奠定以風險為基準之資本適足基礎,藉以強化 金融體系的穩定性。有鑑於傳統的巴塞爾資本 協定已無法足以規範現今變化萬千的風險指 標,因此,巴塞爾銀行監理委員會於 2001 年 1 月公佈新版巴塞爾資本協定,並於 2006 年底正 式實施。新協定鼓勵銀行能建立自己的內部評 等系統評估違約風險,並重視銀行放款風險考 量資訊的量化和降低計提所需資本,進而提高 金融機構風險敏感性,以彌補傳統標準法的不 足。 近 年 來 , 產 業 的 違 約 機 率 (Probability Default,簡稱 PD)與總體經濟因數的關聯性一 直是政府、企業和學者所重視的問題,例如:產 業違約機率是否與總體經濟具有同向循環的特 性,即景氣不好時,違約率是否向上飆升,反 之亦然(沈中華、張家華,2005)。在既有的文獻 中,大部份的研究多是針對企業的經營績效或 財務結構進行分析,對於外在因素,例如:總體 經濟因數、景氣循環等因素的分析並不多見。 在過去,確實有分析與理論研究認為,金融業 實屬景氣循環產業:當景氣低迷時,銀行徵授信 經辦警覺提高,客戶亦可能因景氣影響其償債 能力;相反的,景氣熱絡時,銀行徵授信門檻 降低,企業未來營收看好,故償債可能性提高, 預期違約可能性亦降低,此時銀行授信核准率 相對增加。因此,本研究除了結合企業財務結 構與經營績效外,亦加入總體經濟因數建立企 業信用評等模型,希望金融機構可以達到早期 預警的效果。 2001 年 1 月,巴塞爾銀行監理委員會於公 佈新版巴塞爾資本協定,並於 2006 年底在成員 國間開始實施,其中的信用風險進階內部評等 法及作業風險進階衡量法亦於 2007 年底正式實 施。在信用風險的衡量方面,新巴塞爾協定中 規定了兩種方法:標準法及內部評等法(IRB), 其中內部評等法還分為基礎內部評等法(FIRB) 和進階內部評等法(AIRB)。尚未建置自己內部 信用風險模型的銀行,則採用標準法中所規定 的監理值來計提資本;而已建置內部信用風險 模型的銀行,則採用內部法。在新巴塞爾協定 的內部法評等中,不論是基礎法或是進階法, 違約機率(PD 值)的計算是架構內部法信用風險 模型最根本的基礎。同時,在決策方面,PD 值 越低(代表違約的機率越小)的公司則是屬於 可以積極承作的授信對象;反之,則是屬於拒 絕往來的授信對象。 另外,傳統的企業信用評分資料多是以財 務變數為主,但是中小企業的財務狀況並不完 全透明,財務變數可能失真,反而信用品質受 到企業負責人、企業基本特性及國內景氣的影 響程度增加(阮正治、江景清,2004)。故本研究 之信用評分模型變數的考量,不僅以財務變數 為主,也廣泛增加如企業基本特性及總體經濟 因數等非財務變數,期使企業信用評分更趨實 際與客觀。因此,本研究的目的,即根據新版 巴塞爾資本協定與金管會的準則,針對信用風 險中的內部評等法,希望透過財務報表資料, 結合企業基本特性變數,與總體經濟因數等相 關資料建立企業信用風險評等模型,來推估風 險成份中的違約機率。 本研究以台灣公開資料為實例,因加入總 體經濟因數等非財務變數,為了瞭解總體經濟 因數對企業信用風險的影響,故採長時間的授 信資料進行分析。在陳錦村、江玉娟與朱育男 (2006)產業信用評等模型的實證結果中,顯示產

(3)

業不同會具有不同的財務特性,會影響到建置 產業違約模型的解釋變數,故各產業有其對應 的主要解釋因數,應各別建置該產業特性的信 用評等模型。因此,後續研究以製造傳產業公 司之授信樣本為主要的研究對象,資料的觀察 期間為 1996 至 2005 年,來建立企業違約風險 模型及其信用評等系統。

3 文獻探討

1975 年,巴塞爾銀行監理委員會正式成立 於瑞士之巴塞爾,此委員會屬一銀行業務監理 機關,係由當時的經濟強國(G10)組成,成員 國包含比利時、加拿大、法國、德國、義大利、 日本、盧森堡、荷蘭、西班牙、瑞典、瑞士、 英國及美國共 13 個國家,並由各國之監理機關 及中央銀行資深代表共同執行事務。該委員會 的運作方式,是依照會員國所提出的金融相關 議題,提出一套廣泛的監理標準與指導原則, 並建議具體的運作方式做為參考。為了強化當 時各國金融體系的穩定性,巴塞爾銀行監理委 員會於 1988 年提出銀行自有資本計算與自有資 本之國際準則,即巴塞爾資本協定(簡稱 Basel I),其內容主要在於訂定銀行的資本與風險權 重的結構,建議擁有跨國業務的會員國銀行針 對其授信資產依規定權數計算信用風險性資產 總 額 , 並 據 以 提 列 8% 的 最 低 適 足 資 本 (Minimum capital standard),且在 1992 年底實 施,以避免營運風險準備的不足問題。 有鑑於巴塞爾資本協定未考慮信用風險、 作業風險及市場風險等缺失,並因應金融環境 變化與風險控制技術進步、改善巴塞爾資本協 定實施後所產生種種問題,巴塞爾銀行監理委 員會經過多次討論修正,並且廣徵各方意見之 下,終於在 2004 年 6 月定稿公佈新巴塞爾資本 協定(Basel II),並於 2006 年底在成員國間開 始實施。 新巴塞爾資本協定與 1988 年的巴塞爾資本 協定所不同在於巴塞爾銀行監理委員會更進一 步提出一相輔相成且完整的管理架構,此架構 主要由三大部分組成,即所謂三大支柱(Three pillars)-第一支柱為現行協定之最低資本需求: 定義資本對風險性資產最低比率之原則,第二 支柱為監理審查:要求主管機關對銀行資本計 提、分配技術以及是否符合相關標準進行定性 及計量評估,並作必要之早期幹預,第三支柱 即市場紀律: 規定資訊公開揭露條件,以促進市 場紀律。在最低資本需求的這一大項底下,還 可以細分為信用風險、市場風險及作業風險, 這樣的劃分方式將金融業的業務切割成為三個 不同的領域,然後就不同的領域風險項目分別 計算其相關資本。其中,信用風險的主要計算 方法分為標準法和內部評等法,而本研究主要 針對信用風險中所新增之內部評等法及估計企 業的違約機率。 當借款方拒絕償還或無法按時支付所欠的 債務時,給貸款方帶來的潛在損失,即為信用 風險。信用風險的範圍也可進一步擴展到信用 的接受者,例如借款方可能亦承受銀行帶來的 風險。信用風險的計算方法分為標準法和內部 評等法,前者是舊巴塞爾協定計算方法的延續, 由外部信用評等機構對資產的評級結果給予一 定的風險加權,以補充原協定在風險資產權數 不足的問題;後者是由銀行本身依據自己的商 品特色、市場區隔、客戶性質、以及經營方式 與理念等等因素,去建制一套適合自己的內部 評等模型以計量信用風險。新巴塞爾資本協定 最主要創新之一,即提出計算信用風險的內部 評等法。該法包括兩種形式:基礎內部評等法,

(4)

進階內部評等法。內部評等法與標準法的不同, 在於銀行對重大風險要素的內部估計值作為計 算資本適足的主要參數。以銀行內部評等模型 為基礎,可以大幅提高資本監管的風險敏感度。 銀行對信用風險的內部評等是根據與借款方的 交易記錄做分析,對借款方的違約情況進行評 定,並給予相應的評等。 信用評等,為一種徵信評估制度,乃指信 用狀況或償債能力之評等,對借款戶某一特定 債務的信用風險加以評估,並提出等級之意見。 換句話說,就是將借款戶的各項信用因素,包 含財務狀況、經營管理及產業特性等,予以量 化,再以具體的方式賦予權數,計算其評分與 等級,依評等等級判斷其信用水準的高低(張勝 春,2001)。信用評等結果提供一可比較的指標, 亦提供評等使用者是否與受評者建立信託關係 的建議。綜合來說,信用評等將借款戶信用要 素的各項屬性予以數量化,以評等結果作為核 准融資與否與借款額度大小的審核依據,此方 法較能排除授信人員主觀判斷的缺失。另外, 為求評等結果之公正性,常與第三人提供的外 部評等結果進行比較,分析差異來源和其差異 的合理性。 本研究是依新巴塞爾資本協定提出之內部 評等法中的企業型暴險,來建置基礎法下之信 用評等模型。

3 研究方法

研究應用資料採礦的技術,分析銀行對於 企業授信放款資料,以暸解公司財務情形與授 信行為所反應出的企業償還能力,並進一步建 立符合新巴塞爾協定下之企業違約機率模型。 本研究資料來源為台灣公開之資料,其中 資料包含從 1996 年至 2005 年(共計 10 年) 所有 申請案件之資料檔,內容包括企業屬性資料、 企業財務資料及企業違約與否。另外,有多位 學者認為外在環境的變化對於企業信用狀況的 影 響 亦 扮 演 著 相 當 重 要 的 角 色 (Sharma and Mahajan,1980;Rose, Andrews and Giroux, 1982;郭敏華,1999),故本研究亦廣泛增加總 體經濟因數等非財務變數進行分析。整理如表 一所示: 表一 資料摘要說明 資料屬性 資料層面 資料內容 企業財務資料 公司財務報表 財務結構 經營效率 償債能力 獲利能力 企業基本特性 公司基本資料 企業規模 組織型態 所屬產業別 負責人異動情形 總體經濟因數 經濟指標 包含物價指數、生產毛額以及放款利率等經濟指標 模型的建立是一套規律而有系統的過程, 本研究模型的建立,係依據 CRISP-DM 程式的

(5)

六個階段來進行。在此階段,需對建立出來的 模型及信用評分等級結果,應用在銀行企業授 信流程上,且需隨時更新或調整模型,以維持 模型的效力。

4 研究發現

在建模之前所進行之資料準備,目的就是 要建構一組完整而符合建模需求之資料,以期 讓往後的建模能更加流暢,在進行資料採礦過 程中是項相當重要的步驟。在此階段需選取適 合納入模型之變數,必要時再做變數的轉換, 以提升模型的預測能力。 本研究之研究變數相當龐大,故藉由不同 統計分析方法相互輔助來篩選變數,以下將逐 一介紹分析的方法與結果: 首先針對資料中的每個變數,對於違約機 率畫出個別的趨勢分佈圖,觀察該變數對違約 機率是否具有單調性質。從趨勢分佈圖,可以 觀察出違約機率與變數間皆具有較為明顯的單 調性質,違約機率隨著變數遞增或遞減呈線性 變化。如果單調的性質稍不明顯,可藉著找出 不同的切割點對連續變數做分段,轉換成間斷 型變數來嘗試是否提升對企業違約的預測能 力,再利用卡方檢定及 AUC 值來評估轉換後的 成效好壞。 上述方式是提供部分的連續變數經轉換 後,提升對企業違約的預測力,接著對各個變 數進行單變量分析,將變數對企業違約作模型 配適,求其預測能力的各項統計量,包括 KS 值、AUC 及 AR 等統計量,做為該變數是否對 企業違約有足夠區別能力之評估指標。另外, 針 對 資 料 中 類 別 型 變 數 , 輔 以 關 聯 係 數 (Cramer's V 值)觀察對企業違約的顯著性;而連 續型則計算變數兩兩之間的 Pearson 相關係數, 避免後續模型有共線性的問題存在。 經各項單變量分析的結果,綜合評估挑選 出後續建模的初步變數,共十九個變數,其中 類別型變數有 5 個變數,連續型變數有 10 個變 數,而經濟指標變數則有 4 個變數。 本研究因違約戶資料相較於非違約戶過於 稀少,因此在建置模型前,必須透過誤差抽樣 (Oversampling),分別建構抽樣比例(1:2、1:3、 1:4)的訓練資料集,以避免模型忽略了這些違約 之紀錄。另外,採用 C5.0 決策樹、類神經網路 與羅吉斯迴歸等三種模型方法,以分類矩陣比 較三種模型之優劣。首先,依比例(1:2、1:3、 1:4)抽樣出訓練資料集,再利用 C5.0 決策樹、 類神經網路與羅吉斯迴歸等三種模型技術,放 入挑選後的初步建模變數,建立 9 組不同抽樣 比例且技術相異之模型,依照此程式各進行十 次模擬,計算不同組合下模型表現指標的基本 統計量。 從表二模型的整體正確率(Accuracy)來看, 似乎抽樣比例為 1:4 最高,但必須考慮到模型對 違 約 戶 的 預 測 能 力 , 也 就 是 模 型 的 準 確 度 (Precision),就準確度上來說,則以 1:2 較其他 比例為佳。經上述結果評估,1:2 訓練資料集, 在模型對違約戶預測的準確度皆較其他抽樣比 例表現為高,整體正確率亦超過八成,以及反 查率亦有七成左右,後續將採 1:2 誤差抽樣比例 的訓練資料來建置模型。 本研究以企業是否違約為應變數,初步挑 選後的變數為自變數,配適羅吉斯迴歸模型, 採逐步迴歸法建構模型。在模型適合度檢定方 面,Hosmer and Lemeshow Test,其檢定結果 P 值 >0.05 , 顯 示 模 型 配 適 度 良 好 ; 另 外 -2Loglikelihood 值為 260.967,其 P 值<0.05,表 示模型內變數的效應是存在且顯著。

(6)

圖一呈現模型於訓練資料的預測能力,而 圖二則是模型預測原始資料的表現;兩者皆顯 示模型整體的預測能力都有相當不錯的表現, 且對於違約授信戶及非違約授信戶皆有足夠的 區別能力。表三則是整理各項預測力檢定統計 量。 建立信用評等系統之目的在於,使銀行能 依據信用評分等級,為不同等級之授信戶給予 不同的信用額度、行銷手法或是違約預警措施, 希望藉此做好授信管理並提高管理效率。依據 羅吉斯迴歸法所建構出的企業違約機率模型, 其所預測出來的是對於每一家企業違約的可能 機率,在此稱為模型分數(Model score)。接著利 用模型分數進行信用評等分級,但通常評等級 距內的違約機率不同於母體的違約機率,如同 表四所示。因此,率先進行模型分數校準的動 作,將模型分數由小至大排序後分成 20 等分, 再利用 20 個級距內實際違約機率與模型分數作 非線性估計。 圖三為配適的結果,模型分數經此函數對 映至母體違約機率,將此校準後的違約機率稱 為 PD 值,後續的信用評等分級必須仰賴校準後 的違約機率(PD 值)作為分等的依據,圖四為校 準後違約機率(PD 值)的分佈情形,可以發現模 型對違約戶及非違約戶在校準後違約機率上表 現出相當的區隔能力。 接下來依據 PD 值,分成九等級,評等越高 表示違約的機率越高,並視最大等級為違約授 信戶等級。為了符合新巴塞爾協定對評等分級 授信戶的規範,各等級之間人數須均勻分佈, 並希望能透過不同的等級,將不同信用特性的 授信戶區隔出來,使同一等級內授信戶的信用 特性同質。 由圖五及表五中可看出,此九等的人數分 配均勻,且違約機率呈現平滑的遞增趨勢,也 就是等級數越高者違約的機率越高;而各評等 的預測隱含違約機率,亦相當接近實際違約機 率,因機率分佈為右偏分配,以該級距內 PD 值 的中位數來表示該評等的隱含違約機率。

5 結論

本研究應用資料採礦技術,建置符合新巴 塞爾資本協定內部評等法(IRB)之企業信用評 等模型。利用類神經網路、羅吉斯迴歸和 C5.0 決策樹三種方法建立模型並加以評估比較其預 測能力,選擇羅吉斯迴歸模型為本研究最終模 型,依照該模型所產出之模型分數,來推估企 業型暴險中的違約機率(PD 值),進一步建立信 用評等系統。 企業信用評等模型的建立,目的是要預測 企業未來違約的可能性,目標變數即為違約與 否,投入建置模型資料的變數,分為企業財務 變數、企業基本特性變數以及總體經濟因素等 三個面向。在誤差抽樣比例與模型方法的比較 上,以 1:2 比例訓練資料集所建置出的模型在預 測違約戶的準確度(Precision)最好,其整體正確 率(Accuracy)超過八成,反查率(Recall)亦有七成 左右的預測力。 羅吉斯迴歸模型的配適結果中,在企業財 務資訊方面,企業的質押率、利息支出率、平 均收帳天數、借款比率或平均售貨天數,對模 型具有顯著的解釋能力;在總體經濟因素方面, 以民營固資毛額、全體金融機構逾放比率的解 釋能力較高。換句話說,即公司的董監事全體 質押股數占董監事總持股比例、利息支出占營 業收入比例、平均應收帳款票據占營業收入淨 額比例、借款占總資產比例與平均期末存貨占 營業成本的比例越高或當年民營固資毛額或者

(7)

全體金融機構逾放比率提升,則授信戶未來違 約的可能性就會增加。 而信用評等系統,共分為九個等級,授信 戶均勻分佈於九等級之間,違約機率隨評等增 加,並以第九等級視為違約授信戶等級,且各 評等的預測違約機率,相當接近實際違約機率。 綜合上述來說,此模型即使應用到不同期間或 其他實際資料,仍具有一定的穩定性與預測效 力,確實能夠在銀行授信流程實務中加以應用。

參考文獻

[1] 阮正治、江景清,2004年,台灣企業信用評分模型 建置與驗證,金融風險管理季刊,民國九十三年六 月號。 [2] 沈中華,2003年,BaselⅡ的缺點及改進建議,台灣 金融財務季刊,民國九十二年三月號。 [3] 沈中華、張家華,2005年,產業違約率及景氣循環, 金融風險管理季刊,民國九十四年十二月號。 [4] 沈中華、林昆立,2007年,台灣金融機構適足資本 之壓力測試,金融風險管理季刊,民國九十六年三 月號。 [5] 韋端、鄭宇庭、鄧家駒、匡宏波、謝邦昌,2003年, DATA MINING概述-以Clementine7.0為例,中華資 料採礦協會。 [6] 孫銘誼、王思芳,2004年,信用評等模型驗證之初 探-相關方法與文獻回顧,金融風險管理季刊,民 國九十四年三月號。 [7] 郭敏華,1999年,債信等級之決定因素(上) ,證券 暨期貨管理雜誌,第17卷第11期。 [8] 陳錦村、江玉娟、朱育男,2006年,商業銀行如何 建置符合新巴塞爾資本協定的信用評等制度,金融 風險管理季刊,民國九十五年三月號。 [9] 黃博怡、張大成、江欣怡,2006年,考慮總體經濟 因素之企業危機預警模型,金融風險管理季刊,民 國九十五年六月號。 [10] 永康、林思惟、黃寶慶,2005年,內建評等法之最 低作業要求(上),民國九十四年一月號。 [11] 謝邦昌、蘇志雄、鄭宇庭、葉劭緯,2006年,資料 採礦與商業智慧- SQL Server 2005,中華資料採礦 協會。 [12] 行政院金融監督管理委員會,2004年,新巴塞爾資 本協定全文中文版,行政院金融監督管理委員會全 球資訊網。 [13] 行 政 院 金 融 監 督 管 理 委 員 會,http://www.fscey.gov.tw [14] 金管會銀行局,http://www.banking.gov.tw [15] 財團法人金融徵信中心,http://www. jcic. org. tw [16] Mensah,Yaw M. (1984), An Examination of the

Stationarity of Multivariate Bankruptcy Prediction Models: A Methodological Study, Journal of Accounting Research, 22 Spring, 380-320.

[17] Rose, P. S., W. T. Andrews, and G. A. Giroux(1982), Predicting Business Failure: A Macroeconomic Perspective, Journal of Accounting, Auditing and Finance, 6(1), 20-31.

[18] Sharma S. and V. Mahajan (1980), Early Warning Indicators of Business Failure. Journal of Marketing, 44, 80-89.

[19] Wilson, T. (1997), Portfolio Credit Risk, Part I, Risk 10(9), 111-117.

(8)

表二 模型比較摘要

抽樣比例 建模技術 評估指標 mean min max S.D C.V

1:2 C5.0 Accuracy 84.14% 81.38% 86.22% 0.015 0.018 Precision 72.83% 67.43% 79.85% 0.037 0.051 Recall 86.79% 78.63% 93.89% 0.046 0.052 Neural Network Accuracy 77.19% 72.96% 80.32% 0.025 0.032 Precision 66.85% 57.49% 75.44% 0.051 0.076 Recall 68.40% 61.83% 73.28% 0.043 0.062 Logistic Accuracy 81.57% 79.79% 83.72% 0.014 0.017 Precision 74.41% 71.20% 79.17% 0.029 0.039 Recall 71.15% 67.94% 76.34% 0.026 0.037 1:3 C5.0 Accuracy 85.24% 82.80% 87.80% 0.017 0.020 Precision 67.38% 62.05% 73.47% 0.036 0.054 Recall 81.31% 74.81% 87.02% 0.032 0.040 Neural Network Accuracy 79.81% 75.25% 82.28% 0.024 0.030 Precision 63.39% 53.29% 74.19% 0.070 0.110 Recall 53.83% 35.12% 70.23% 0.100 0.186 Logistic Accuracy 83.10% 79.53% 85.26% 0.020 0.025 Precision 69.83% 59.85% 77.32% 0.052 0.074 Recall 58.69% 53.44% 65.65% 0.037 0.063 1:4 C5.0 Accuracy 87.91% 83.39% 89.94% 0.021 0.024 Precision 67.80% 57.49% 73.88% 0.054 0.080 Recall 80.00% 70.99% 90.84% 0.072 0.091 Neural Network Accuracy 83.71% 81.36% 85.62% 0.012 0.014 Precision 65.03% 55.86% 75.31% 0.057 0.088 Recall 46.64% 38.93% 55.73% 0.052 0.111 Logistic Accuracy 85.44% 83.55% 86.74% 0.010 0.012 Precision 69.35% 62.86% 77.27% 0.048 0.070 Recall 52.29% 48.86% 56.49% 0.026 0.049

(9)

表三 模型預測力檢定統計量 統計量 訓練資料 原始資料 判斷依據 Correlation < 0.6 < 0.6 變數之間相關係數<0.6 Gini 84.20% 79.00% 越大越好 KS值 70.10% 69.20% 越大越好 AUC 92.10% 89.50% 越大越好(以>0.7 為優) 表四 模型違約機率校準 分級 實際違約 機率 模型分數 (Model Score) 校 準 後 違 約 機 率(PD 值) 分級 實際違 約機率 模型分數 (Model Score) 校準後違約機 率(PD 值) 1 0.0000 0.0023 0.0000 11 0.0038 0.0775 0.0019 2 0.0000 0.0044 0.0000 12 0.0038 0.1039 0.0031 3 0.0000 0.0067 0.0001 13 0.0038 0.1391 0.0051 4 0.0000 0.0096 0.0001 14 0.0077 0.1864 0.0087 5 0.0000 0.0133 0.0001 15 0.0191 0.2450 0.0144 6 0.0000 0.0183 0.0002 16 0.0386 0.3243 0.0243 7 0.0038 0.0243 0.0003 17 0.0467 0.4398 0.0435 8 0.0038 0.0329 0.0005 18 0.0568 0.5822 0.0747 9 0.0038 0.0442 0.0008 19 0.1188 0.7620 0.1260 10 0.0038 0.0584 0.0012 20 0.1992 0.9411 0.1904 表五 信用評等結果 企業違約機率模型 評等 PD Min PD Max 隱含違約機率 (Mid PD) 實際違約機率 違約個數 授信戶數 1 0.00% 0.00% 0.00% 0.00% 0 507 2 0.01% 0.01% 0.01% 0.00% 0 501 3 0.01% 0.03% 0.02% 0.16% 1 623 4 0.03% 0.08% 0.05% 0.32% 2 618 5 0.08% 0.24% 0.14% 0.32% 2 633 6 0.25% 0.79% 0.43% 0.50% 3 595 7 0.80% 2.39% 1.37% 1.76% 10 567 8 2.40% 8.99% 4.69% 4.99% 30 601 9 9.00% 21.44% 15.01% 15.11% 86 569

(10)

圖一 模型於訓練資料之預測能力

圖二 模型於原始資料之預測能力

圖三 模型機率校準配適

AUC=0.921

(11)

圖四 PD 值之分佈情形

參考文獻

相關文件

Robinson Crusoe is an Englishman from the 1) t_______ of York in the seventeenth century, the youngest son of a merchant of German origin. This trip is financially successful,

fostering independent application of reading strategies Strategy 7: Provide opportunities for students to track, reflect on, and share their learning progress (destination). •

Now, nearly all of the current flows through wire S since it has a much lower resistance than the light bulb. The light bulb does not glow because the current flowing through it

For the data sets used in this thesis we find that F-score performs well when the number of features is large, and for small data the two methods using the gradient of the

Microphone and 600 ohm line conduits shall be mechanically and electrically connected to receptacle boxes and electrically grounded to the audio system ground point.. Lines in

We showed that the BCDM is a unifying model in that conceptual instances could be mapped into instances of five existing bitemporal representational data models: a first normal

The remaining positions contain //the rest of the original array elements //the rest of the original array elements.

• Thresholded image gradients are sampled over 16x16 array of locations in scale space. • Create array of