第三章 研究設計
第三節 研究方法
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
21
本研究之目的為找出影響壽險業通訊處失敗之關鍵因素,而由於被解釋變數 為虛擬變數,即該通訊處於該年度之失敗與否,因此本研究將採用羅吉斯迴歸分 析,找出與被解釋變數顯著相關之解釋變數,此即為影響壽險業通訊處失敗之關 鍵因素。
本研究將先利用 Hosmer-Lemeshow 配適度檢定來檢測該迴歸模型的配適度 是否良好,若不拒絕該假設,則表示該迴歸式之配適度良好。接著,利用 G 統計 量檢定迴歸式中所有解釋變數之係數是否皆為 0,若拒絕此假設,則表示該迴歸 式中至少有一解釋變數能解釋被解釋變數。接著利用 Wald 統計量檢定該迴歸式 中某一個解釋變數之係數是否為 0,若拒絕此假設,即表示解釋變數 Xi能解釋被 解釋變數。最後,利用 Gamma 值與分類表(classification table)來檢測該迴歸 模型的預測能力。
一、 羅吉斯迴歸
羅吉斯迴歸模型與一般線性迴歸模型之最大不同處在於,前者用於被解釋變 數為二分類變數時,而後者用於被解釋變數為連續變數時。以本研究為例,本研 究之被解釋變數為通訊處之失敗與否,因此若該通訊處失敗則被解釋變數為 1,
若無失敗則被解釋變數為 0。故若以一般線性迴歸模型來檢定被解釋變數為二分 類變數之迴歸式,會發生該迴歸式將被解釋變數的 1 與 0 視為數值,而估算出解 釋變數之係數不代表任何意義,以及有可能計算出超過 1 至 0 範圍的預測值。故 若欲檢定被解釋變數為二分類變數之迴歸式,會利用羅吉斯迴歸模型。
此外,不同於一般線性迴歸,羅吉斯迴歸並無太多的統計前提。例如並無假 設解釋變數與被解釋變數間須為線性關係,無假設被解釋變數必須符合常態分配,
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
22
無假設被解釋變數之變異數應該相同,亦無要求被解釋變數需為連續性質或類別 性質。除此之外,應用於一般線性迴歸之其他相關統計前提仍適用於羅吉斯迴歸。
例如被解釋變數間須為獨立,並無忽略重要的解釋變數,並無加入不必要之解釋 變數等。因此,一般線性迴歸與羅吉斯迴歸在意義上是相同的,都是在探討解釋 變數對被解釋變數的影響,而其中兩者最大的不同在於被解釋變數的類別(陳順 宇,2009)。
而於羅吉斯迴歸式中解釋變數的係數所代表的意義也與一般線性迴歸不同。
一般線性迴歸解釋變數之係數βi代表「當 xi增加一單位時,Y 會增加βi單位」, 但羅吉斯迴歸解釋變數之係數βi代表「當 xi增加一單位時,Y=1 之機率相對於 Y=0 之機率會增加βi倍」,換言之也就是「當 xi增加一單位時,事件發生之機率 相對於事件不發生之機率會增加βi倍」,而該係數βi即為勝率比(odds ratio)
。一般而言,若勝率比大於 1,則表示我們認為某解釋變數的發生對於被解釋變 數具有正面的效果。
羅吉斯迴歸常表示成(1)式,其中各解釋變數之係數βi意義為勝算比。而將 (1)式代入(2)式即可求得 p(xi),其為該事件發生之機率。
f(xi) = β0 + ∑ki=1βi∗ xi (1)
p(xi) = ef(Xi)
1 + ef(Xi) (2)
例如:設通訊處業務員人數為解釋變數 x,該通訊是否失敗為被解釋變數 Y(若失敗,則 Y=1;若無失敗,則 Y=0)。若以羅吉斯迴歸求得方程式為(3)式,
則假設有一通訊處業務員人數為 31 人,其失敗之機率則為(4)式求出之 19.79%。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
23
f(x) = −3.6064 + 0.0712x (3)
p(x) = e−3.6064+0.0712∗31
1+e−3.6064+0.0712∗31 = 19.79% (4)
過去已許多研究利用羅吉斯迴歸探討企業財務困難之原因。林建智、王儷玲、
彭金隆(2001)認為基於人力成本的考量,發展一套保險業清償能力的預警機制為 未來趨勢,所以借鏡 FAST 在美國的經驗,利用羅吉斯迴歸找出造成台灣保險公 司失卻清償能力或破產之關鍵因素,藉此建構出一套監理機關可以有效率且準確 預測未來有清償能力的保險公司之預警機制。蔡火炎(2011)利用台灣壽險業 2000 年至 2009 年十年之財務業務資料進行羅吉斯迴歸分析,找出造成台灣壽險 業經營穩定度之關鍵因素。史治平(1997)同樣利用羅吉斯迴歸分析,得出造成台 灣產險業失卻清償能力的關鍵因素。張雅雯(2011)也利用羅吉斯迴歸分析,發現 造成台灣銀行業財務困難的關鍵因素。綜觀以上,本研究亦採用羅吉斯迴歸作為 分析影響壽險通訊處失敗關鍵因素之方法。而利用本章第二節之解釋變數建立本 研究之研究模型:
WRNi = β0+ β1Peoi+ β2Levi+ β3Sini+ β4Degi
+β5SinMgi+ β6Loci+ β7Moni+ ε (5)
p(WRNi) =1+eeWRNiWRNi (6)
其中, i 表第 i 間通訊處,WRN 為通訊處之失敗與否,當通訊處失敗時,WRN 為 1,當通訊處未失敗時,WRN 為 0,Peo 為通訊處業務員人數,Lev 為通訊處業務 員之平均職等,Sin 為通訊處業務員之平均年資,Deg 為通訊處處經理之學歷,
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
24
若大學以上則 Deg 為 1,其他則 Deg 為 0,SinMg 為通訊處處經理之年資,Loc 為通訊處之所在地,若位於台北市則 Loc 為 1,其他則 Loc 為 0,Mon 為通訊處 之成立月數,p(WRNi)為第 i 間通訊處預測之失敗機率。
二、 Hosmer-Lemeshow 配適度檢定
Hosmer-Lemeshow 配適度檢定是用以檢測一羅吉斯迴歸式配適度之良善與 否。其虛無假設為此迴歸式之配適度良善,因此若其 p-value>α則表示不拒絕 此假設,即表示在α之顯著水準下並無證據顯示此迴歸式之配適度不良善。
三、 G 統計量檢定
在瞭解 G 統計量前須先了解羅吉斯迴歸模式之卡方值 LL1及卡方值 LL0。羅 吉斯迴歸模式之卡方值 LL1由(7)式表示,其中 L(B)為羅吉斯迴歸模式之概似值,
由於計算過程複雜因此在此不特別表列,而本研究 LL1之值是藉由統計軟體 SAS 直接求得。卡方值 LL0由(8)式表示,其中 n0為事件失敗之個數,n1為事件成功 之個數,n 為事件數。
LL1 = −2 ∗ ln(L(B)) (7)
LL0 = −2 ∗ ln ((nn0)n0∗ (nn1)n1) (8)
一般線性複迴歸殘差平方和 SSE 與概似值取對數成正比,依此在羅吉斯模式 中,羅吉斯迴歸模式之卡方值 LL1類比於 SSE,而卡方值 LL0類比於 SSTO。模式
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
25
擬合好壞的程度,一般線性複迴歸以 SSE 為評估指標,SSE 越小模式擬合程度越 好;相對地,在羅吉斯迴歸中是以 LL1作為擬合指標,LL1越小表示擬合程度越好 (陳順宇,2009)。而 G 統計量為 LL0-LL1,用於檢定羅吉斯迴歸模型中所有解釋 變數之係數是否皆為 0。即檢定
H0:β1 = β2 = ⋯ = βn= 0 當
G > Xn,α2
表示在顯著水準為α下拒絕 H0,即不是所有解釋變數之係數皆為 0。換言之,在 顯著水準為α下至少有一解釋變數對於該模型具有解釋能力。其中 n 為解釋變數 個數。
四、 Wald 統計量檢定
Wald 統計量為βi /SE(βi),而作用如同一般線性迴歸中之 t 統計量,用來 檢定羅吉斯迴歸模型中某一解釋變數之係數是否為 0。即檢定
H0:βi = 0 而 W2稱為 Wald 之卡方值,當
W2 > X1,α2
表示在顯著水準α下拒絕 H0,即βi不等於 0。換言之,在顯著水準α下解釋變 數 Xi對該模型具有解釋能力。
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
26
五、 Gamma 值
Gamma 值可用於衡量一羅吉斯迴歸式之預測能力,其表示為
Gamma =nnc−nd
c+nd (9)
其中nc為預測與事實配對一致者數,nd為預測與事實配對不一致者數。
Gamma 值介於-1 與 1 之間。若該羅吉斯迴歸模型之預測與事實呈現完美一致 性,則 Gamma 值為 1;若呈現完美不一致性,則 Gamma 值為-1;若解釋變數與被 解釋變數間為互相獨立,則 Gamma 值為 0。因此,Gamma 值之絕對值越大表示其 預測能力越佳。
六、 分類表
除 Gamma 值外,建立分類表(classification table)亦可瞭解一個羅吉斯迴 歸模型預測能力之高低,其步驟如下:首先,計算出各解釋變數之係數βi,建 立起羅吉斯迴歸模型。接著,將建立該模型之資料代入該模型中,便可計算出每 一筆資料事件發生之機率。此時我們以一個稱為臨界值(cut-off point)的機率 作為分界點,若某筆資料計算出事件發生之機率大於臨界值,則視為預測事件發 生;反之若小於臨界值,則視為預測事件無發生。而我們早已知道每一筆資料事 件是否發生之事實,因此便可知道某筆資料預期與事實是否相符。只要將每一筆 資料做一次上述之比對,便可知道該羅吉斯迴歸式在所設定的臨界值下預測正確 率為何。接著,再不斷嘗試不同之臨界值,便可得出該模型預測正確率最高之臨
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
27
界值,及該模型最高之預測正確率。
例如以表 3-3 為例,利用資料建立一羅吉斯迴歸模型,此被解釋變數為通訊 處是否失敗。表 3-3 之左方為觀察值,即為實際上某通訊處是否失敗;而上方為 預測值,即利用羅吉斯迴歸模型將解釋變數之資料代入,計算出某通訊處失敗之 機率,在設定一臨界值後,該機率大於臨界值則視為預測某通訊處失敗,該機率 小於臨界值則視為預測某通訊處無失敗,在此假設其臨界值為 p=0.6。而預測正 確即為該通訊處實際上失敗且模型亦預測其失敗,以及該通訊處實際上無失敗且 模型亦預測其無失敗;反之,則為預測不正確。因此,若以臨界值為 p=0.6 為例,
該模型之預測正確率為 11+15/30=86.7%。但此預測正確率並不一定為該模型之 最高預測正確率,須經過反覆測試不同之臨界值才能得出最佳之預測正確率。
表 3-3、以 p=0.6 為臨界值之分類表 預測值
失敗 無失敗 總計
觀 察 值
失敗 11 2 13
無失敗 2 15 17
總計 13 17 30
‧ 國
立 政 治 大 學
‧
N a tio na
l C h engchi U ni ve rs it y
28