第四章 數值結果
第二節 常態分配下
國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
第二節 常態分配下
本節討論評分分數的分配在常態下,非違約戶分數∼ N(µN, σN),以及違約戶分 數∼ N (µD, σD),比較五種估計方法。首先設定不同的參數變化,兩分配平均數的差 異µN − µD=2、3、4,以及標準差的差異|σN − σD|=0、0.4、0.8,再分別討論不同 的估計樣本違約機率p與預測樣本的違約機率q。
第一小節 估計樣本與預測樣本的違約率相同
在估計樣本與預測樣本的違約率相同時,即p=q,討論常態分配下的參數變化 下,五種估計P (D|S)方法的精確性與穩定性。
首先在平均數相差為2下討論,由表4.1可以得知,當變異數相同時,Tasche所提 出的Logit與Q.M.M方法的誤差較小,且穩定性也是較高的。由於Tasche在模型建構 時,假設分配來自常態且變異數相等,這也驗證Tasche的模型適用性,在常態分配下 不論違約機率為5%或10%,變異數相等時Tasche的估計方法是較佳的,至於本文所提 出的Gamma方法誤差也不會太大,而Van der方法在變異數相等時效果都是較不好 的。當變異數大小不相等時分為兩種,當σN > σD時,很明顯是Van der與Gamma方
表 4.1: 五種方法的估計標準誤(常態分配,µN − µD = 2,q=p)
S.E(S.E達到最小的比例)
p σN/σD True AUC Van der Robust logit Logit Q.M.M Gamma 2/2 0.76 2.38 ( 5) 1.43 (14) 1.25 (30) 1.37 (34) 1.73 (18) 5% 2.2/1.8 0.76 0.99 (61) 2.15 ( 1) 2.00 ( 2) 2.33 ( 3) 1.43 (33) 1.8/2.2 0.76 4.51 ( 0) 2.00 (19) 2.12 ( 7) 2.46 (13) 1.79 (61) 2/2 0.76 3.17 ( 1) 1.65 (12) 1.45 (36) 1.59 (37) 2.10 (14) 10% 2.2/1.8 0.76 1.53 (58) 3.06 ( 0) 2.90 ( 1) 3.22 ( 2) 1.90 (39) 1.8/2.2 0.76 5.98 ( 0) 2.58 (14) 2.70 ( 4) 3.10 ( 8) 2.07 (75) 單位:%
‧
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
距小時,|σN − σD| = 0.4,五種方法估計效果並無太大差異,惟有Van der方法在 違約戶變異數較大時,估計的誤差明顯高於其他四種方法。此外變異數差距較大 時,|σN − σD| = 0.8,Tasche所提的三種方法估計效果是相對不佳的,而Van der方 法相同在非違約戶變異數較大時表現較好,反之;違約戶變異數較大時,估計效果就非 常不好,至於Gamma方法估計效果則是表現較為精確且穩定。
整體來說,當兩分配的平均數相差3時,µN − µD=3,Tasche所提的三種方法在 變異數差距小的狀況,相對Gammaz方法估計效果並不會有太大差異,原因在於兩 分配平均數拉大,且變異數差距較小,對於分數較小的真實P (D|S),並不會明顯的 隨著分數變小而快速上升或趨於平緩,因此隨著兩分配的平均數拉大,Tasche的方 法對於變異數的差距會較不受影響。而Van der的估計方法,對於平均數拉大並無明 顯的改變,同樣是在非違約戶的變異數較大時,估計效果較好,而其他的狀況都是 相對於其他四種方法的誤差明顯較大。對於Gamma方法,平均數拉大時,變異數的 差距大小,對估計P (D|S)的效果並不有有太大影響,當違約機率p=5%時,估計誤 差S.E約1.9%左右,而違約機率10%時,S.E約2.2%。
表 4.2: 五種方法的估計標準誤(常態分配,µN − µD = 3,q=p)
S.E(S.E達到最小的比例)
p σN/σD True AUC Van der Robust logit Logit Q.M.M Gamma 2/2 0.86 3.97 ( 1) 1.69 (14) 1.46 (35) 1.74 (30) 1.94 (20) 2.2/1.8 0.85 1.84 (30) 2.31 (13) 2.09 (10) 2.43 (15) 1.91 (33) 5% 1.8/2.2 0.85 6.05 ( 0) 1.97 (23) 1.95 (20) 2.49 (13) 1.97 (43) 2.4/1.6 0.85 1.52 (47) 3.72 ( 0) 3.53 (00) 4.21 ( 0) 1.70 (52) 1.6/2.4 0.85 7.84 ( 0) 2.52 (14) 2.63 (09) 3.52 (04) 1.97 (73) 2/2 0.86 4.22 ( 1) 1.86 (10) 1.61 (40) 1.90 (33) 2.20 (18) 2.2/1.8 0.85 1.90 (44) 2.72 ( 9) 2.54 ( 5) 2.87 (11) 2.18 (30) 10% 1.8/2.2 0.85 6.60 ( 0) 2.31 (24) 2.27 (20) 2.80 (14) 2.24 (42) 2.4/1.6 0.85 2.89 (20) 5.09 ( 0) 4.93 ( 0) 5.50 ( 0) 2.18 (79) 1.6/2.4 0.85 8.79 ( 0) 3.21 ( 9) 3.28 ( 4) 4.15 ( 2) 2.27 (85) 單位:%
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
表4.3則是將兩分配的平均數差異再拉大,µN − µD = 4,觀察五種估計方法的差 異,平均數差異再拉大,兩分配交集的地方減少,因此AUC值會上升,約92%。在 之前已發現Tasche的三種方法,隨著平均數差異的變大,相同變異數差距對估計效 果影響會較小。這邊µN − µD = 4的情況中,可以更明顯看出這個特性,比起先前平 均數差距較小的狀況,表4.3中Tasche所提三種方法的估計效果比起Gamma方法都不 會太差,在變異數差距小時Logit方法的估計誤差S.E甚至比Gamma方法小,而Van der方法先前都在非違約戶變異數較大時估計效果表現較好,隨著兩分配的平均數拉 大,此情形會更加明顯,在違約機率5%下,估計誤差僅有1.59%,明顯低於其他方 法。Gamma的方法對於兩分配的平均數差距再拉大,變異數的差距大小對估計效果 依然變動不大,在違約機率5%時,估計誤差約2.1%,而違約機率10%時,估計誤差 約2.3%。
除了觀察變異數差距對五種估計方法效果的影響,也可以看出,在其他條件相 同下,兩分配平均數差距增加時,五種方法的估計誤差都會增加,此外在q=p的狀況 下,違約機率上升時,對五種方法的估計誤差也都有影響,違約機率越大估計誤差也 越大。
表 4.3: 五種方法的估計標準誤(常態分配,µN − µD = 4,q=p)
S.E(S.E達到最小的比例)
p σN/σD True AUC Van der Robust logit Logit Q.M.M Gamma 2/2 0.92 4.68 ( 1) 1.86 (10) 1.62 (42) 2.05 (27) 2.12 (20) 2.2/1.8 0.92 2.93 ( 8) 2.18 (15) 1.97 (23) 2.34 (21) 2.11 (33) 5% 1.8/2.2 0.92 6.23 ( 0) 2.02 (19) 1.85 (39) 2.40 (17) 2.15 (25) 2.4/1.6 0.92 1.59 (70) 3.29 ( 3) 3.14 ( 2) 3.80 ( 3) 2.11 (22) 1.6/2.4 0.92 7.72 ( 0) 2.22 (19) 2.18 (25) 3.00 (10) 2.07 (46) 2/2 0.92 3.65 ( 4) 1.98 (11) 1.73 (42) 2.09 (26) 2.33 (18) 2.2/1.8 0.92 2.21 (32) 2.43 (11) 2.22 (17) 2.63 (16) 2.31 (25) 10% 1.8/2.2 0.92 5.52 ( 1) 2.15 (20) 1.98 (40) 2.47 (17) 2.37 (23) 2.4/1.6 0.92 2.57 (44) 3.81 ( 2) 3.70 ( 1) 4.10 ( 1) 2.39 (53) 1.6/2.4 0.92 7.23 ( 0) 2.59 (17) 2.53 (23) 3.40 ( 8) 2.34 (51) 單位:%
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
第二小節 估計樣本與預測樣本的違約機率不相同
先前已討論過估計樣本與預測樣本的違約機率相同的情況,即p=q,本小節則設 定當預測樣本違約機率q皆等於3%的情況,亦即五種估計方法都是在相同估計樣本 下,對300個預測樣本估計違約機率,但是需要校正整體的違約機率至3%。當估計樣 本的違約機率上升時,理論上五種方法的估計誤差S.E都會減少,原因在於當違約戶 的樣本增多,增加25筆,對違約戶分數較小的資訊較充足,會使五種方法的估計較精 準。討論不同的樣本違約機率p變動與參數變動,對五種估計方法效果的影響。
在兩分配平均數相差2的情況下,µN − µD = 2,,從表4.4可以觀察出同樣 是預測違約機率=3%,當變異數相同時,五種方法的誤差S.E都會隨著p上升而下 降,其中logit與Q.M.M方法的S.E相對較小。當變異數不相等時,特別的是,Robust logit與logit方法,違約機率上升時誤差並不會明顯下降,而其他三種方法誤差則是會 下降。整體來說,Logit方法在變異數相等時表現較好,Van der方法在非違約戶變異 數較大時表現較好,而當違約戶變異數較大時,本文所提的Gamma方法是誤差較小且 穩定的。
表 4.4: 五種方法的估計標準誤(常態分配,µN − µD = 2,q=3%)
S.E(S.E達到最小的比例)
p σN/σD True AUC Van der Robust logit Logit Q.M.M Gamma 2/2 0.76 1.61 ( 5) 0.99 (16) 0.84 (26) 0.92 (36) 1.26 (17) 5% 2.2/1.8 0.76 0.62 (62) 1.56 ( 1) 1.40 ( 2) 1.70 ( 4) 1.00 (30) 1.8/2.2 0.76 3.15 ( 0) 1.44 (22) 1.56 ( 8) 1.81 (13) 1.36 (57) 2/2 0.76 1.40 ( 5) 0.85 (12) 0.66 (34) 0.72 (36) 1.09 (13) 10% 2.2/1.8 0.76 0.56 (58) 1.56 ( 0) 1.38 ( 1) 1.53 ( 1) 0.79 (40) 1.8/2.2 0.76 3.05 ( 0) 1.40 (22) 1.55 ( 5) 1.74 (10) 1.26 (63) 單位:%
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
同樣是預測樣本違約機率q固定在3%下,兩分配的平均數差距拉大,µN − µD = 3,表4.5討論不同估計樣本違約機率與參數變動,對五種估計方法的影響如何。
首先就估計樣本的違約機率p來看,除了在兩分配變異數相同的情況下,Robust logit與logit方法估計誤差會隨著p上升而減少,在變異數不相同時,p的變動對此兩種 方法的影響並不明顯。而Van der、Q.M.M、Gamma等方法則是可以明顯的看出當違 約機率p上升時,即違約樣本的資訊變多,三個方法的估計誤差都會減少,較特別的地 方在σN/σD = 2.4/1.6時,Van der的方法在p=5%下誤差反而比在10%下還要大。而 就變異數差距的變動來看,在兩分配變異數相等時,Tasche的三種方法是相對估計誤 差較小的,其中又以logit估計誤差是最小的,而Van der的方法依然是在非違約戶樣本 變異較大時表現較好,Gamma方法在所有的狀況皆有不錯的表現,估計誤差變動不 會太大,當p=5%時,估計誤差大多在1.6%左右,而p=10%時估計誤差會降低,大約 在1.4%左右,當兩分配變異數不相同時,Gamma也是相對比較穩定的,由其在變異 數差距較大時比較明顯,1000次模擬中約有75%的比例,S.E是五種方法中最小的。
表 4.5: 五種方法的估計標準誤(常態分配,µN − µD = 3,q=3%)
S.E(S.E達到最小的比例)
p σN/σD True AUC Van der Robust logit Logit Q.M.M Gamma 2/2 0.86 2.98 ( 3) 1.39 (13) 1.12 (36) 1.30 (32) 1.59 (18) 2.2/1.8 0.85 1.27 (32) 1.85 (12) 1.61 ( 9) 1.89 (13) 1.42 (34) 5% 1.8/2.2 0.85 4.66 ( 0) 1.56 (27) 1.55 (18) 1.90 (18) 1.64 (37) 2.4/1.6 0.85 1.07 (51) 2.92 ( 0) 2.71 ( 0) 3.19 ( 0) 1.26 (49) 1.6/2.4 0.85 6.26 ( 0) 2.13 (18) 2.25 (10) 2.88 ( 7) 1.72 (66) 2/2 0.86 2.57 ( 3) 1.26 (12) 0.95 (38) 1.14 (27) 1.41 (20) 2.2/1.8 0.85 0.91 (49) 1.87 ( 8) 1.65 ( 5) 1.81 ( 6) 1.24 (32) 10% 1.8/2.2 0.85 4.22 ( 0) 1.46 (26) 1.49 (15) 1.75 (14) 1.45 (45) 2.4/1.6 0.85 1.33 (22) 3.01 ( 0) 2.81 ( 0) 3.10 ( 0) 1.03 (79) 1.6/2.4 0.85 5.99 ( 0) 2.18 (16) 2.44 ( 4) 2.87 ( 6) 1.67 (74) 單位:%
‧
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
接下來討論將兩分配平均數差距再拉大,µN − µD = 4,討論五種估計方法,對 於估計樣本違約機率p的變化以及兩分配變異數差距大小,在估計效果的差異。同樣 的Robust logit與logit方法僅在變異數相同時,p的上升對估計誤差的減少有影響,變 異數不相同時,p的改變對估計誤差沒有太大影響。而Van der、Q.M.M、Gamma等 方法估計誤差大致會隨著p的上升而減少,與µN − µD = 3狀況時相同的是,Van der 的方法在σN/σD = 2.4/1.6時,p上升時估計誤差反而沒有下降。在變異數差距變動方 面,當兩分配的平均數差距再拉大時,Tasche的三種方法在變異數相等或是差距小 時,其估計誤差相對來說皆有不錯的表現,而Van der的方法依然僅在非違約戶的變異 數較大時,估計誤差相對較小,而變異數差距在其他狀況下,其估計誤差則是明顯高 於其他四種方法,本文所採用的Gamma在兩分配的平均數差距再拉大時,對於變異數 差距的各種的情況,相對其他方法估計誤差皆不會變動太大,p=5%時,估計誤差大 多在1.8%左右,而p=10%時估計誤差會降低,大約在1.7%左右。
表 4.6: 五種方法的估計標準誤(常態分配,µN − µD = 4,q=3%)
S.E(S.E達到最小的比例)
p σN/σD True AUC Van der Robust logit Logit Q.M.M Gamma 2/2 0.92 3.91 ( 2) 1.66 (10) 1.39 (39) 1.66 (28) 1.79 (20) 2.2/1.8 0.92 2.28 (13) 1.87 (14) 1.62 (24) 1.90 (21) 1.74 (28) 5% 1.8/2.2 0.92 5.33 ( 0) 1.70 (21) 1.56 (32) 1.98 (20) 1.82 (28) 2.4/1.6 0.92 1.16 (69) 2.81 ( 3) 2.64 ( 2) 3.13 ( 2) 1.59 (25) 1.6/2.4 0.92 6.58 ( 0) 1.91 (22) 1.93 (20) 2.56 (12) 1.81 (46) 2/2 0.92 2.76 ( 7) 1.50 ( 7) 1.17 (44) 1.42 (27) 1.69 (15) 2.2/1.8 0.92 1.51 (32) 1.87 (12) 1.61 (15) 1.79 (15) 1.58 (26) 10% 1.8/2.2 0.92 4.40 ( 1) 1.69 (24) 1.57 (28) 1.95 (20) 1.82 (26) 2.4/1.6 0.92 1.75 (45) 3.08 ( 1) 2.86 ( 1) 3.08 ( 0) 1.56 (53) 1.6/2.4 0.92 5.72 ( 1) 1.95 (21) 2.01 (17) 2.47 (11) 1.79 (50) 單位:%