• 沒有找到結果。

第四章 實證分析

第二節 MODEL I

MODEL I 是引進顧客申請信用卡時之基本資料,根據過去文獻及可能影響 信用風險之因素,挑選出客戶之性別、申請時的年齡、子女數、學歷、工作年資、

婚姻狀況、聯絡人關係、住宅所有以及職業等九項屬性變數做為後選變數。利用 Logistic 逐步廻歸篩選出顯著的變數,並依最大概似法所做參數估計,如表 4.10 所示。

一.參數估計及 Odds Ratio

在顯著變數性別中,可發現男生較女生的信用風險高,odds ratio=2.9 表示在 其他條件不變下,男生成為逾期戶的比率為約為女生的 2.9 倍。年齡方面,發現 隨著年齡愈大成為逾期戶的比率會愈來愈小,由表中可觀察到 odds ratio 隨著年 齡愈大而遞減,其中 24 歲以下者成為逾期戶的比率約為 55 歲以上者的 2.6 倍,

是年齡變數中發生比率最高的類別,其次為 25-29 歲、30-34 歲,發生比都大於 2 倍以上者,而發生比率最低者則為年齡層最高的參照類,55 歲以上者。而變數 子女數中發現:子女人數為一人者事件發生比率最高,約為無子女者的 1.6 倍,

次之,為子女兩人以上者,與無子女者發生比率相差不多,幾乎是 1:1。

學歷該變數顯示,學歷愈高者成為逾期戶的比率愈小,因此,學歷為專科者 事發件發生比率為約博碩士大學的 3.4 倍(odds ratio=3.351),而高中者事發件發 生比率為約博碩士大學的 9.3 倍(odds ratio=9.289),學歷為其他者發生比率更高,

約為博碩士大學的 11.3 倍(odds ratio=11.338),而學歷為博碩士大學者成為逾期 戶的比率為最低。在工作年資方面, 年資愈長者事件發生比率愈低,工作年資 十年以上者 odds ratio=0.916,表示其事件發生比率為 4-9 年者的 0.9 倍,而年資 於一年以下以及 1-4 年者其事件發生比率,分別為 4-9 年者的 1.7 倍及 1.5 倍,

另外工作年資無填者其發生比率大致與參照組相當。婚姻狀況中,「其他」表分 居、離婚…等非明確狀態,從該變數的 odds ratio 可看出,婚姻狀況為其他者,

發生逾期戶的比率高於己婚與未婚者,而未婚者的事件發生比率為參照組的 0.86 倍,高於己婚者的 0.63 倍,因此,婚姻狀況中信用風險的高低,依序為其他、

未婚、己婚。

另外,聯絡人關係該變數中,參照組為有親屬關係者,其事件發生比率均較 無親屬關係及無填者低,無親屬關係的事件發生比率約為有親屬關係的 1.5 倍,

而聯絡人關係無填者發生比率為有親屬關係的 1.4 倍,顯示無親屬關係的聯絡人 其信用風險相對較高。而住宅所有該變數的情況,與聯絡人關係雷同,亦即無自 有住宅者(odds ratio=2.838)較住宅狀況無填(odds ratio=1.114)及有自有住宅 者,成為逾期戶的比率高,而有自有住宅者發生比率最低。最後一項變數「職業」

中,可發現初級產業的 odds ratio=2.696 最高,表示其事件發生比率約為公職的 2.7 倍,而金屬製造業(odds ratio=0.987)最低,較公職者發生比率更低。

另外,聯絡人關係該變數中,參照組為有親屬關係者,其事件發生比率均較 無親屬關係及無填者低,無親屬關係的事件發生比率約為有親屬關係的 1.5 倍,

而聯絡人關係無填者發生比率為有親屬關係的 1.4 倍,顯示無親屬關係的聯絡人 其信用風險相對較高。而住宅所有該變數的情況,與聯絡人關係雷同,亦即無自 有住宅者(odds ratio=2.838)較住宅狀況無填(odds ratio=1.114)及有自有住宅

者,成為逾期戶的比率高,而有自有住宅者發生比率最低。最後一項變數「職業」

中,可發現初級產業的 odds ratio=2.696 最高,表示其事件發生比率約為公職的 2.7 倍,而金屬製造業(odds ratio=0.987)最低,較公職者發生比率更低。

表 4.10 MODEL I 最大概似法參數估計

變數名稱 β S(β) p-vaule

Odds ratio

性別

0.4713 0.0312 <.0001* 2.9 女(ref.)

年齡

24 歲以下 0.279 0.0921 0.0024* 2.554 25-29 歲 0.2113 0.0737 0.0042* 2.335 30-34 歲 0.0931 0.0704 0.1864 2.061 35-39 歲 0.0406 0.0696 0.5593 1.946 40-44 歲 -0.1147 0.0763 0.1331 1.672 45-49 歲 -0.1088 0.0907 0.2301 1.704 50-54 歲 -0.1353 0.1127 0.2296 1.706 55 歲以上(ref.)

子女數

2 人以上 -0.1775 0.0578 0.0021* 1.019 1 人 0.2075 0.0752 0.0058* 1.601 無子女(ref.)

學歷

高中 0.727 0.0452 <.0001* 9.289 專科 -0.3099 0.057 <.0001* 3.351 其他 0.8872 0.0648 <.0001* 11.338 博碩士大學(ref.)

工作年資

1 年以下 0.3136 0.0605 <.0001* 1.683

1-4 年 0.1963 0.0549 0.0003* 1.48 10 年以上 -0.2122 0.078 0.0065* 0.916 無填 -0.2915 0.0586 <.0001* 1.026 4-9 年(ref.)

婚姻狀況

己婚 -0.3512 0.0604 <.0001* 0.627

未婚 -0.0547 0.0669 0.4136 0.857

其他(ref.)

聯絡人關係

無填 0.044 0.042 0.2945 1.402

無親屬關係 0.11 0.0423 0.0094* 1.499 親屬關係(ref.)

住宅所有

無填 -0.3035 0.043 <.0001* 1.114 非自有住宅 0.5808 0.0571 <.0001* 2.838 自有住宅(ref.)

職業

初級產業 0.2735 0.2952 0.3541 2.696 金屬製造業 -0.3493 0.0822 <.0001* 0.987 非金屬製造業 0.0538 0.0908 0.5533 1.494 商業 0.1609 0.0777 0.0384* 1.639 服務業 0.1888 0.0731 0.0098* 1.672

家管 -0.2066 0.1319 0.1172 1.231

高風險行業 -0.1024 0.2255 0.6497 1.611

無填 -0.0114 0.161 0.9434 1.56

公職(ref.)

截距項 -0.4381 0.0839 <.0001*

*表示 p-value<0.05,該變項具顯著性。

二.模型評價與區別準確性

MODEL I在模型的適合度(Goodness of fit)檢定上,利用Homser-Lemeshow Test 得到卡方值為10.06,對應之自由度為8,其p-value為0.26,表示此模型擬合適當。

另外,在參數不全為零的檢定下,Likelihood Ratio Test得到1363.08,自由度為31 的卡方值,p-value小於0.0001,表示MODEL I參數具顯著性,而該模型之R2=0.194,

稍嫌太低。

進一步,討論模型區別能力方面,可利用區別「分類表」,設定一切點(Cut point),在預測機率值大於此切點時,即表示事件發生,反之,當預測機率值小 於此切點時,表示事件未發生,依此做為分類的指標,即可形成模型分類表,來 評估模型之區別正確率。另外,利用模型精準度及敏感度,可繪出ROC曲線,計 算曲線下的面績(以C表示), C值介於0和1之間,愈接近1者,表示模型之區 別力愈佳。而K-S曲線則是在判別非逾期戶與逾期戶間的差異大小,利用非逾期 戶與逾期戶最大累積機率之直線距離,來評估該模型之優劣,以KS值表示,KS 值介於0~100之間,KS愈大表示非逾期戶與逾期戶之累積機率分布情況差異愈 大,該模型區別能力愈佳。

表4.11,MODEL I的模型區別能力,在切點為0.5時,非逾期戶之正確歸類 率為81.6%,而逾期戶之歸類正確率為54.1%,該模型對逾期戶之區別能力似乎 偏低,將無法有效判別風險型客戶,而MODEL I的整體區別正確率為71.1%。另 外圖4.1呈現MODEL I之ROC曲線,其曲線下之面績C=0.766,而KS圖之最大直 線距離KS值為39.7,對於逾期客戶之區別能力稍嫌不足。

表4.11 MODEL I之分類表 實際樣本

模型判別

非逾期戶 逾期戶 正確率 總正確率

非逾期戶 3,185 1,104 81.6%

逾期戶 716 1,303 54.1%

TOTAL 3,901 2,407 6,308

71.1%

圖 4.1 MODEL I 之 ROC CURVE 與 K-S CURVE

MODEL I 之 C 值為 0.766。

MODEL I 之 KS 值為 39.7。