第四章 資料蒐集與迴歸分析
第三節 Probit, Logit, Tobit 與 Poisson 模型分析結果
本研究是以Probit, Logit模型來預測遊覽車事故是否會肇致乘客或司 機死亡,再分別以Tobit與Poisson模型預估事故死亡人數的實際數目。Probit 和 Logit 模 型 兩 者 功 能 相 似 , 只 是 Probit 模 型 以 常 態 分 配 ( Normal distribution)為基礎,而Logit模型則以Logistic分配(Logistic distribution)
為主,運算過程類似,但結果仍有些許的差異。主要是因為整體樣本到底 屬於何種分配並無定論,因此同時應用二種模型,從結果來觀察其預估的 準確率,這或許不失為一種折衷的方式。
經過Eviews 6.0軟體程式的運算,得到 Probit 迴歸模型的機率方程式 估計結果如下:
72
自變數 係數估計值 標準誤 z-統計量 p值
Intercept -0.571961 0.502652 -1.137886 0.2552
PLACE01 -0.000856 0.004206 -0.203498 0.8387
PLACE02 -0.337804 0.362220 -0.932592 0.3510
PLACE03 -0.516282 0.434554 -1.188071 0.2348
CATE01 -0.124112 0.419583 -0.295800 0.7674
CATE02 -0.811848 0.558366 -1.453970 0.1460
CATE03 -0.322897 0.356538 -0.905644 0.3651
REASON01 0.214295 0.376118 0.569755 0.5688
REASON02 0.844130 0.569251 1.482880 0.1381
REASON03 0.015338 0.702137 0.021844 0.9826
REASON04 0.029849 0.526101 0.056735 0.9548
REASON05 -0.466080 0.527746 -0.883153 0.3772
REASON06 -0.075864 0.628725 -0.120663 0.9040
REASON07 0.035925 0.481436 0.074621 0.9405
REASON08 0.764517 0.463409 1.649769 0.0990
REASON09 0.993740 1.017710 0.976447 0.3288
MayLin_DUMMY 0.020164 0.012574 1.603660 0.1088
Mean dependent var 0.279070 S.D. dependent var 0.450291 S.E. of regression 0.428457 Akaike info criterion 1.247532 Sum squared resid 20.56049 Schwarz criterion 1.624406 Log likelihood -63.46578 Hannan-Quinn criter. 1.400663 Restr. log likelihood -76.37737 Avg. log likelihood -0.491983 LR statistic (16 df) 25.82316 McFadden R-squared 0.169050 Probability(LR tat) 0.056568
由上表各係數估計值之p值(右邊最後一欄)可知,由於迴歸模型中之自變數 皆為0,1之虛擬變數,且可能虛擬變數過多以至於模型之係數估計值皆不顯 著,表示此一迴歸估計結果不佳,針對此一結果一般的補救方法為將自變 數中係數估計值最不顯著者逐一剔除後再重新做迴歸估計,並逐次參照 AIC (Akaike Information Criterion)值或SC (Schwarz criterion)值,看看是否 亦逐次下降,直至估計得最佳迴歸模型。準此,經過數回的反覆估計剔除
73
不顯著的自變項虛擬變數並參照AIC值,最後得到本文最佳之 Probit 迴歸 估計模型如下表所示:
自變數 係數估計值 標準誤 z-統計量 p值
Intercept -0.884578 0.213072 -4.151551 0.0000***
CATE02 -0.861906 0.517214 -1.666441 0.0956*
CATE03 -0.528512 0.292366 -1.807711 0.0707*
REASON02 0.775177 0.466861 1.660403 0.0968*
REASON08 0.823308 0.344868 2.387314 0.0170**
MayLin_DUMMY 0.027234 0.010697 2.545960 0.0109**
Mean dependent var 0.279070 S.D. dependent var 0.450291 S.E. of regression 0.419759 Akaike info criterion 1.125147 Sum squared resid 21.67233 Schwarz criterion 1.258161 Log likelihood -66.57197 Hannan-Quinn criter. 1.179193 Restr. log likelihood -76.37737 Avg. log likelihood -0.516062 LR statistic (5 df) 19.61078 McFadden R-squared 0.128381 Probability(LR stat) 0.001478
***、**、*分別表示在1%、5%、10%下以t分配雙尾檢定呈顯著。
將上表改寫成Probit迴歸估計方程式可以得到(方程式中括弧內之數字為z-統計量):
*** * *
Probility = -0.88 0.86 Cate02 0.53 Cate03 0.78 Reason02 (-4.15 ) (-1.67 ) (-1.81 ) (1.66 ) 0.82 Reason08 0.03 MayLin_Du
mmy
(2.39 ) (2.55 )
其中遊覽車事故地點對於是否造成死亡並不顯著,而遊覽車事故種類中的
「和他車追撞」與「和他車擦撞」皆相對於「遊覽車翻覆」以致造成死亡 之機率顯著為小,其他事故種類則皆不顯著;此外遊覽車事故疑似肇事原 因中的「酒後駕車」與「天候狀況」皆相對於「外在障礙閃避不及」以致 造成乘客或司機死亡之機率顯著為高,其他事故疑似肇事原因則皆不顯 著;最後對於在2006年梅嶺交通安全事故之後,交通部所提出的改善之方
74
案經實際執行結果,是否有顯著減少之後大型車交通安全事故發生死亡之 機率,經迴歸估計結果所得到的結果卻是令人訝異的,反而在梅嶺事故之 後的遊覽車事故肇致死亡的機率比梅嶺事故之前為高。
二、 Logit 迴歸分析實證模型
依上述Probit迴歸估計模型的方式,經過數回的反覆估計並逐一剔除較 不顯著的自變項虛擬變數並參照AIC值,最後得到本文最佳之Logit迴歸估 計模型如下表所示:
自變數 係數估計值 標準誤 z-統計量 p值
Intercept -1.487088 0.373772 -3.978597 0.0001***
CATE02 -1.614330 0.982629 -1.642869 0.1000*
CATE03 -0.872761 0.505554 -1.726347 0.0843*
REASON02 1.280570 0.747756 1.712549 0.0868*
REASON08 1.455634 0.612718 2.375702 0.0175**
MayLin_DUMMY 0.045817 0.018142 2.525525 0.0116**
Mean dependent var 0.279070 S.D. dependent var 0.450291 S.E. of regression 0.419078 Akaike info criterion 1.122811 Sum squared resid 21.60200 Schwarz criterion 1.255826 Log likelihood -66.42132 Hannan-Quinn criter. 1.176858 Restr. log likelihood -76.37737 Avg. log likelihood -0.514894 LR statistic (5 df) 19.91208 McFadden R-squared 0.130353 Probability(LRstat) 0.001298
***、**、*分別表示在1%、5%、10%下以t分配雙尾檢定呈顯著。
將上表改寫成Logit迴歸估計方程式可以得到:
*** * *
Probility = -1.49 1.61 Cate02 0.87 Cate03 1.28 Reason02 (-3.98 ) (-1.65 ) (-1.73 ) (1.71 ) 1.46 Reason08 0.05 MayLin_Du
mmy
(2.38 ) (2.53 )
Logit模型迴歸估計結果與Probit模型迴歸估計得到的結果相當類似,
75
且結論也相當一致,但仍有些微之差異。
最後我們再以預測準確評估方法 (Prediction Evaluation) 來比較究竟 是Probit 模型迴歸估計結果所作的死亡事故發生與否的預測較為準確亦或 是Logit模型迴歸估計結果所作的死亡事故發生與否的預測較為準確。下表 所得之結果顯示Probit模型在預測共93件的未發生死亡遊覽車事故之準確 度(87/93)較Logit模型(86/93)略勝一籌,但於預測共36件的死亡遊覽車事故 之準確度上Logit模型(12/36)卻又較Probit模型(11/36)準確些許,而整體共 129件事故的預測準確度其實Probit與Logit兩種模型之迴歸估計結果則不 分軒輊,皆為98/129 (=75.97%)。
三、 Tobit 迴歸分析實證模型
Tobit 模型是在 Probit 和 Logit 模型已經篩選出有發生死亡之遊覽 車事故後,再更進一步估計出每個事故發生後可能的死亡人數。以下是 Tobit 模型迴歸估計結果與其對應之迴歸方程式:
Probit Prediction Evaluation (success cutoff Prob = 0.5)
Estimated Equation Dep=0 Dep=1 Total
P(Dep=1)<=C 87 25 112
P(Dep=1)>C 6 11 17
Total 93 36 129
Correct 87 11 98
% Correct 93.55 30.56 75.97
% Incorrect 6.45 69.44 24.03 Total Gain* -6.45 30.56 3.88
Logit Prediction Evaluation (success cutoff Prob = 0.5)
Estimated Equation Dep=0 Dep=1 Total
P(Dep=1)<=C 86 24 110
P(Dep=1)>C 7 12 19
Total 93 36 129
Correct 86 12 98
% Correct 92.47 33.33 75.97
% Incorrect 7.53 66.67 24.03 Total Gain* -7.53 33.33 3.88
76
自變數 係數估計值 標準誤 z-統計量 p值
Intercept -0.837916 0.278355 -3.010240 0.0026***
CATE02 -0.922559 0.554497 -1.663777 0.0962*
CATE03 -0.567918 0.311272 -1.824507 0.0681*
REASON02 0.728314 0.456490 1.595465 0.1106
REASON08 0.829573 0.355238 2.335260 0.0195**
MayLin_DUMMY 0.024914 0.010598 2.350864 0.0187**
***、**、*分別表示在1%、5%、10%下以t分配雙尾檢定呈顯著。
將上表改寫成Tobit迴歸估計方程式可以得到:
*** * *
Y = -0.84 0.92 Cate02 0.57 Cate03 0.73 Reason02 (-3.01 ) (-1.66 ) (-1.82 ) (1.60 ) 0.83 Reason08 0.025 MayL
in_Dummy
(2.34 ) (2.35 )
四、 Poisson 分配計數資料迴歸分析實證模型
在此我們仍依上述Probit迴歸估計模型的方式,經過數回的反覆估計並 逐一剔除較不顯著的自變項虛擬變數並參照AIC值,最後得到本文最佳之 Poisson迴歸估計模型如下表所示:
77
自變數 係數估計值 標準誤 z-統計量 p值
Intercept -1.582245 0.393996 -4.015891 0.0001***
PLACE01 -0.007448 0.003323 -2.241642 0.0250**
PLACE02 0.425924 0.292211 1.457591 0.1450
CATE01 1.082275 0.241904 4.473977 0.0000***
REASON01 1.313495 0.245451 5.351343 0.0000***
REASON02 1.419294 0.363644 3.902977 0.0001***
REASON04 1.011405 0.429974 2.352248 0.0187**
REASON05 -1.167816 0.762735 -1.531090 0.1257
REASON07 0.934735 0.292193 3.199036 0.0014***
REASON08 0.558597 0.328585 1.700007 0.0891**
MayLin_DUMMY 0.024691 0.007971 3.097516 0.0020***
R-squared 0.405033 Mean dependent var 0.837209
Adjusted R-squared 0.354612 S.D. dependent var 2.393973 S.E. of regression 1.923223 Akaike info criterion 2.455740 Sum squared resid 436.4567 Schwarz criterion 2.699600 Log likelihood -147.3952 Hannan-Quinn criter. 2.554825 Restr. log likelihood -235.1007 Avg. log likelihood -1.142598 LR statistic (10 df) 175.4109 LR index (Pseudo-R2) 0.373055 Probability(LR stat) 0.000000
***、**、*分別表示在1%、5%、10%下以t分配雙尾檢定呈顯著。
將上表改寫成Poisson模型迴歸估計方程式可以得到:
*** * ***
log( ) = -1.58 0.007 Place01 0.43 Place02 1.08 Cate01 (-4.01 ) (-2.24 ) (1.46) (4.47 ) 1.31 Reason01 1.4
Y
2 Reason02 1.01 Reason04
(5.35 ) (3.90 ) (2.35 )
1.17 Reason05 0.93 Reason07 0.56 Reason08 0.025 MayLin_Dummy
( 1.53) (3.20
) (1.70 ) (3.10
)
根據上式,其中遊覽車事故地點發生於「國道」者其相對於事故地點為「山路」者會顯著造成較少死亡人數 0.99 (=e0.007)人,但是事故地點發生 於「省道」者其相對於事故地點為「山路」者雖會造成較多的死亡人數
78
但並不顯著;而遊覽車事故種類中的「事故引起火災」相對於「遊覽車 翻覆」以致造成死亡之人數顯著高約 2.95 (=e1.08)人,其他事故種類則皆 不顯著;此外遊覽車事故疑似肇事原因中的「疲勞駕駛」、「酒後駕車」、
「未保持安全距離」、「機件故障」與「天候狀況」皆相對於「外在障礙 閃避不及」以致造成乘客或司機死亡之人數分別顯著高約 3.72、4.13、
2.75、2.55 與 1.75 人,其中又以「酒後駕車」所造成的遊覽車事故死亡 人數為最高,其次分別為「疲勞駕駛」、「未保持安全距離」、「機件故障」
與「天候狀況」等遊覽車事故疑似肇事原因,其他事故疑似肇事原因則 皆不顯著;最後對於在 2006 年梅嶺交通安全事故之後,交通部所提出的 改善之方案經實際執行結果,是否有顯著減少之後大型車交通安全事故 發生死亡之人數,經 Poisson 模型迴歸估計結果所得到的結果亦是令人訝 異的,反而在梅嶺事故之後的遊覽車事故肇致死亡的人數比梅嶺事故之 前顯著為高,且高出大約 1.02 (=e0.02)人,此一結果與之前不論是有關 Probit、Logit 或是 Tobit 模型的估計結果皆相當一致的指出在 2006 年梅 嶺交通安全事故之後,交通部提出一系列的改善大型車行車安全之方案 經實際執行結果,反而造成遊覽車事故發生死亡的機率與人數皆顯著的 增加,這些迴歸模型估計結果相當值得政府相關交通主管機關作為後續 規劃改善大型車行車安全之參考。
79