• 沒有找到結果。

利用機器學習預測 P2P 網路借貸違約之相關研究

第二章 文獻探討

第三節 利用機器學習預測 P2P 網路借貸違約之相關研究

過去有許多學者利用多種機器學習探討 P2P 網路借貸的違約風險,有些是 針對於貸款申請目的、信用評分、貸款期間等來研究,有些是利用機器學習來預 測違約風險,本節將探討簡單貝氏(Naïve Bayes)、隨機森林(Random Forest)、邏 輯斯迴歸(Logistic Regression)三種演算法之相關文獻。

一、 簡單貝氏(Naïve Bayes)

Vedala & Kumar(2012)認為一個簡單的分類器在現實單表數據(single table data)上表現良好,但在多關係(multi-relational)設置應用時,它的準確率會受“加 入”期間各個屬性的統計資料改變而影響。作者利用簡單貝氏演算法來比較預測 兩者借款人的違約率。實證結果顯示,通過多關係簡單貝氏演算法後,獲得較高 的準確率及更高的靈敏度(預測違約者的違約比例)。

二、 隨機森林(Random Forest)

Jin & Zhu(2015)使用 Lending Club 歷史數據,探討貸款及借款人的特徵,並

使用隨機森林進行建模,與以往不同的是把違約預測分類為三類,更可以幫助投

Vinod-Kumar et al.(2016)利用 Lending Club 2013-2015 年的歷史數據,使用整 合機器學習演算法(Ensemble Machine Learning Algorithms)和預處理技術來分析 及預測貸款信用風險,機器學習演算法皆是基於樹的 決策樹、隨機森林及 bagging,研究結果顯示決策樹雖有最高的準確率,高達 97.1%,但隨機森林的精 確率為 88.5%,比決策樹高 7.2%。這表示隨機森林預測模型可以更好辨識違約 情況,而決策樹則在尋找優良信用方面更加強大。

Pan & Zhou(2019)提出一種基於隨機森林和可視圖模型的 P2P 借貸信用風險 評估新方法,解決 P2P 借貸不完善及風險高的問題。實驗總共收集 100 組數據並 依照級別從大到小分為五種不同級別的樣本做驗證,實驗結果準確率高達 98.63

%,證明提出的新方法在評估 P2P 借貸的信用風險方面是有效的。

Malekipirbazari & Aksakalli(2015)提出一種基於隨機森林的分類方法來預測 借款人的狀況。使用 Lending Club 2012 年 1 月至 2014 年 9 月的歷史數據,比較 演算法(Random Forest optimized by genetic algorithm with profit score, RFoGAPS),

其研究方法先進行參數調整及優化隨機森林。參數調整主要是確定隨機森林的最 佳參數。在使用基因演算法進行隨機森林優化,以優化參數優化隨機森林中決策 樹的組合,並在考慮實際收益、潛在收益及損失的情況下最大化利潤分數。研究

結果顯示,利潤分數可以更好地評估 P2P 借貸中貸方利潤的貸款評估模型績效,

且利用 RFoGAPS 可為貸方帶來更高的利潤,並且報酬更高。

三、 邏輯斯迴歸(Logistic Regression)

Dong et al.(2010)提出一種具有隨機係數(Random Coefficients)的邏輯斯迴歸 模型,用於構建信用評分卡。認為有許多新技術(例如支持向量機)模型預測準確 率高,但結果的可解釋性存在許多問題。實驗結果顯示,所提出的模型可以在不 犧牲理想變數(desirable features)的前提下,提高具有隨機係數的邏輯斯迴歸預測 準確率。

Guo et al.(2016)設計基於實例的信用風險評估模型,該模型具有評估每筆貸 款收益和風險的能力,可使投資人優化投資決策。認為預測貸款違約率的眾多模 型中,邏輯斯迴歸是文獻中使用最廣泛的模型。利用邏輯斯迴歸來預測兩個數據 集(Lending Club 和 Prosper 兩平台的歷史數據)中每筆貸款的違約率,實證結果顯 示該模型具有比其他演算法有更好的績效。

Sutrisno & Halim(2017) 使用邏輯斯迴歸和下山單純形法(Nelder-Mead)優化 AUC(曲線下面積)來優化信用評分模型,發現經過優化 AUC 後的模型擁有較 高的 AUC,但 KS-Score 較低。儘管得分較低,還是與原先處於同一類別。即使 優化後的模型表現更好,但該模型仍具有很大的誤差。模型預測結果召回率 (recall)僅有 18.06%,表示可能違約的申請人裡只有 18.06%機率是真實違約,這 代表模型在未違約的狀況下拒絕了分數低於閾值的所有申請人中的 81.94%,銀 行可能會損失許多潛在收入,但可利用深度分析降低風險。

Tsai et al.(2014)嚴格區分具有潛在違約風險的貸款,並將其優化。在相同風 險水平下,模型成果希望減少貸款違約風險並超過 Lending Club 的投資報酬率。

使用修正邏輯斯迴歸、支持向量機、簡單貝氏、隨機森林四種演算法做比較,實 證結果顯示邏輯斯迴歸的績效優於其他三種演算法,提高精確率(Precision)的秘 訣是增加否定因素的影響因子,這樣可以產生更高的精確率,但也相對會降低召 回率(Recall)及準確率(Accuracy)。

相關文件