第四章 空間分析
第三節 空間迴歸分析
在經過空間探索分析及 Moran’s I 檢定之後,證實民進黨獲票率差以及青年因 素是具有空間聚集的情形。而本文欲探討青年因素對於民進黨獲票率差的影響,也 就是說明青年因素是否為民進黨在九合一縣市長選舉獲票率增加的原因。故本研 究以「民進黨獲票率差」作為依變數,「青年因素」作為解釋變數,並尋找可能影 響之人口社經變數,透過迴歸建模希望能證實青年因素對民進黨獲票率差的影響。
自變數如前述表 1 所列。必須說明的是空間變數,空間變數為透過 geoda 建 立探討的 358 鄉鎮分析單位之鄰近變數,本研究中使用 Queen 的定義方式定義 鄰近地區,當中如澎湖縣(望安鄉、七美鄉)、台東縣(蘭嶼鄉、綠島鄉)、屏東縣 (琉球鄉)因為是島嶼無接壤地區,因此人工設定其鄰近地區分別為澎湖縣馬公市、
台東縣台東市以及屏東縣東港鎮。
在設定完各項變數後,依照 Anselin 所建立的空間分析流程,首先建立傳統迴 歸模型,利用解釋變數以及所列舉的人口社經自變數來觀察對於民進黨獲票率差 的影響。在傳統迴歸模型當中,需要檢驗迴歸模型的誤差是否呈現隨機分佈,如果 為隨機分布,即可以解釋選取的變數對於民進黨獲票率差是有影響的並且為何呈 現聚集的現象;如果不為隨機分布,即代表空間變數對於選取的變數與民進黨獲票 率差的關係是有影響的,透過空間落遲模型(SLM)或空間誤差模型(SEM)進行檢定。
壹、 傳統迴歸模型
各模型為解釋變數逐一加入人口結構(性別、年齡)、經濟條件(所得、都市化)、
社會發展(教育、職業、族群、台灣認同)、數位傳播(數位融入)及投票因素(投票率 差、期初值)等自變數並除去未達顯著水準之自變數。
除透過各項社經發展自變數建立模型外,因為本研究探討 2014 年縣市長選舉,
地方選舉會有空間異質現象發生,為降低空間異質發生的現象,試圖加入虛擬變數 (將台灣縣市分為北、中、南、東四區)探討空間異質問題。此外,因為九合一縣市 長選舉台北市、新竹縣、花蓮縣地區民進黨因無提名候選人,在前文中假設這三縣 市「非藍即綠」,民進黨獲票率以「1-國民黨獲票率」為代表,然而這樣可能會造 成該地區民進黨獲票膨脹的現象,因此亦設定虛擬變數(以民進黨是否提名做區分),
控制因假設造成選票膨脹的現象。
一、 最佳傳統迴歸模型建立
(一) OLS-1 迴歸模型將解釋變數─青年人口比例放入進行傳統迴歸分析。除 常數項未達顯著水準外,青年人口比例達到高度顯著水準,其
MULTICOLLINEARITY CONDITION NUMBER = 14.153988 但其 R-squared=0.024889,解釋力不高,需再進一步加入其他控制變數增加其解 釋力。
(二) OLS-2 迴歸模型將人口結構(性別比、壯年人口比例、老年人口比例)等 控制變數以及解釋變數(青年人口比例)進行傳統迴歸分析。所有變數皆 未達到顯著水準,且其 MULTICOLLINEARITY CONDITION NUMBER
= 5454.563634,R-squared= 0.054539,有明顯共線性、解釋力不足的問 題,需進一步做修正。
(三) OLS-3 迴歸模型除去 OLS-2 未達顯著水準之自變數,加入經濟條件(綜合 所得平均、人口密度)自變數與解釋變數(青年比例)進行傳統迴歸分析。其 中解釋變數(青年比例(+))達顯著水準,綜合所得平均與人口密度皆未達到。
MULTICOLLINEARITY CONDITION NUMBER = 20.235934,R-squared=
0.049071,共線性問題有所改善,但解釋力仍有是不足。
(四) OLS-4 迴歸模型除去 OLS-3 未達顯著水準之自變數,加入社會發展(教育、
職業、台灣認同)自變數與解釋變數(青年比例)進行傳統迴歸分析。其中解 釋變數(青年因素(+))未達到顯著水準,僅教育(高等教育比例(-)、中等教 育比例(-)、初等教育比例(+))達顯著水準,其 MULTICOLLINEARITY CONDITION NUMBER = 6669.539276,R-squared= 0.132872,解釋力有所 提升,但共線性問題再度發生。
(五) OLS-5 迴歸模型除去 OLS-4 未達顯著水準之自變數,加入數位傳播(數位 融入)自變數與解釋變數(青年比例)進行傳統迴歸分析。其中僅解釋變數 ( 青 年 因 素 (+)) 達 顯 著 水 準 , 其 MULTICOLLINEARITY CONDITION NUMBER = 459.158203,R-squared= 0.053921,共線性問題有所改善但仍 偏高,而解釋力卻大幅下降。
(六) OLS-6 迴歸模型除去 OLS-5 未達顯著水準之自變數,加入投票因素(投票 率差(-)、期初值(-))自變數與解釋變數(青年比例)進行傳統迴歸分析。其中
解釋變數(青年比例(+))與投票率差(-)、期初值(-)皆達到顯著水準,其 MULTICOLLINEARITY CONDITION NUMBER = 14.573748,R-squared=
0.069961,共線性問題大幅改善,解釋力較 5 有所提升,卻低於 OLS-4,針對此問題,進一步進行 OLS-7,逐一搜尋 OLS-4 中之自變數,在不 產生共線性問題的前提下增加變數以提高解釋力。
(七) OLS-7 迴歸模型為 OLS-6 加入在 OLS-4 搜尋之自變數以提高解釋力之迴 歸模型。在自變數達顯著性且不產生共線性問題的前提下,加入「福佬人 比例」時解釋力為最高,R-squared= 0.120661,MULTICOLLINEARITY CONDITION NUMBER = 23.470602。相較其他模型而言此為最佳模型。
OLS-1 OLS-2 OLS-3 OLS-4 OLS-5 OLS-6 OLS-7
常數項 -0.030367
(0.032423)
-16.2272*
(8.9484)
-0.0841**
(0.0405)
0.7743 (7.772664)
1.262033*
(0.72754)
0.014023 (0.04120)
0.008002 (0.04040)
青年人口比例 0.5704***
(0.18924)
16.56581*
(8.9592)
0.61886**
(0.1885)
0.1737 (0.3018)
0.520757**
(0.253525)
0.54266***
(0.194273)
0.52704***
(0.190432)
性別比 -0.00093
(0.00075)
壯年人口比 16.39706*
(8.94938)
老年人口比 16.1385*
(8.95599)
綜合所得平均
(0.731675)
-1.013224 (0.642414)
中等教育比例 -2.4676***
(0.83783)
-1.219491 (0.749412)
初等教育比利 -2.9368***
(0.8358)
-1.398782*
(0.726028)
農業人口比例 1.5964
(7.70367)
工業人口比例 1.6521
(7.70466)
服務業人口比例 1.6977
(7.7056)
無工作者人口比例 1.8510
(7.69857)
客家人比例 0.08026
(0.28715)
福佬人比例 0.18695
(0.28644)
0.09544***
(0.024178)
外省人比例 -0.1688
(0.33330)
原住民比例 0.15066
(0.282552)
台灣認同 0.09558
(0.310333)
數位融入 -0.002525
(0.002805)
投票率差 -0.0025***
(0.000555)
-0.0023***
(0.0005)
期初值 -0.0733**
(0.034266)
-0.1855***
(0.02417) W_ 民 進 黨 獲 票 率
差 Lamda
R-square 0.024889 0.054547 0.049077 0.132881 0.053918 0.081843 0.120661 Multicollinearity
condition numbers
14.153988 5454.56363 20.235934 6669.53928 459.158203 20.531241 23.470602
Moran's I (error) 16.7384*** 16.0816*** 16.4812*** 14.9650*** 16.3927*** 15.7725*** 15.7396***
Lagrange Multiplier(lag)
234.25***
Robust LM (lag) 7.0429***
Lagrange Multiplier(error)
230.605***
Robust LM (error) 3.3970
Log likelihood 370.289 375.818 374.786 391.299 375.699 378.761 388.795 Akaike info
criterion(AIC)
-736.579 -741.637 -741.571 -754.599 -739.398 -751.522 -767.589
Schwarz criterion(SC)
-728.818 -722.234 -726.049 -700.272 -716.115 -739.881 -748.186
樣本數 358 358 358 358 358 358 358
如表中所呈現,加入無提名的虛擬變數後,所有變數皆達顯著,R-squared=
0.133235,解釋力有所提升,而 MULTICOLLINEARITY CONDITION NUMBER=26.092035 亦在標準範圍內,表示加入無提名虛擬變數能使迴 歸模型更佳,亦能夠改善民進黨獲票率「高估」的情形。
OLS-7 OLS-8
常數項 -0.08584**
(0.040937)
-0.03935823 (0.04530869)
青年人口比例 0.56326***
(0.189346)
0.6446047***
(0.1963509)
福佬人比例 0.09544***
(0.024178)
0.1036068***
(0.02430879)
投票率差 -0.0023***
(0.0005)
-0.00215504***
(0.0005469237)
期初值 -0.0733**
(0.034266)
-0.1480849***
(0.0467807)
虛擬變數_無提名 0.03781902**
(0.01673591) W_民進黨獲票率差
Lamda
R-square 0.120661 0.133235
Multicollinearity condition numbers 23.470602 26.092035
Moran's I (error) 15.7396*** 16.0840***
Lagrange Multiplier(lag) 234.25*** 234.3452***
Robust LM (lag) 7.0429*** 3.4066*
Lagrange Multiplier(error) 230.605*** 238.4795***
Robust LM (error) 3.3970* 7.5410***
Log likelihood 388.795 391.373
Akaike info criterion(AIC) -767.589 -770.745
Schwarz criterion(SC) -748.186 -747.462
樣本數 358 358
在空間落遲模型(SLM)以及空間誤差模型(SEM)選擇上,按照 Anselin 提供的 診斷流程,首先進行 Lagrange Multiplier Test,觀察 Lagrange Multiplier(lag)及 Lagrange Multiplier(error)是否達到顯著,若前者顯著則使用 SLM 模型,後者顯著 則使用 SEM 模型,兩者都顯著則在進一步進行 Robust LM Test。在 OLS-8 中,
Lagrange Multiplier(lag)及 Lagrange Multiplier(error)皆是 P=0<0.05,達顯著性且拒
絕虛無假設。如此情況下,便要進一步進行 Robust LM Test,觀察 Robust LM (lag) 及 Robust LM (error)是否達到顯著,前者顯著則確認 SLM 有效,後者顯著則確認 SEM 有效。在 OLS-8 報表中,Robust LM (lag)之 P=0.06494>0.05,未達顯著水準 無法拒絕虛無假設,而 Robust LM (error)之 P 值=0.00603<0.05,達顯著水準且接受 虛無假設,表示使用 SLM 空間落遲模型及 SEM 空間誤差模型皆具有解釋效力, 近效應是存在的。而 R-square 值大幅提升至 0.579602,Log likelihood 值為 492.654,
Akaike info criterion(AIC)值為-971.307,Schwarz criterion(SC)值為-944.144。同樣比 較 SEM 模型,R-square 值為 0.653312,Log likelihood 值為 517.520413,Akaike info criterion(AIC)值為-1023.04,Schwarz criterion(SC)值為-999.758。
OLS-8 SLM SEM
常數項 -0.03935823
(0.04530869)
-0.01692864 (0.0314249)
0.1618877***
(0.04301355)
青年人口比例 0.6446047***
(0.1963509)
0.3140896**
(0.1359672)
0.09395969 (0.1557942)
福佬人比例 0.1036068***
(0.02430879)
0.05784576***
(0.0171264)
0.06098571***
(0.02370597)
投票率差 -0.00215504***
(0.0005469237)
-0.000416409 (0.0003792879)
-0.0002528879 (0.0004460727)
期初值 -0.1480849***
(0.0467807)
-0.1257188***
(0.0337075)
-0.3289459***
(0.0419146)
虛擬變數_無提名 0.03781902**
(0.01673591)
0.02370744**
(0.01169493)
0.075183***
(0.01635475)
W_民進黨獲票率差 0.7624605***
(0.03601661)
Lamda 0.8438103***
(0.0290626)
R-square 0.133235 0.579602 0.653312
Multicollinearity condition numbers 26.092035
Moran's I (error) 16.0840***
Lagrange Multiplier(lag) 234.3452***
Robust LM (lag) 3.4066*
Lagrange Multiplier(error) 238.4795***
Robust LM (error) 7.5410***
Log likelihood 391.373 492.654 517.520413
Akaike info criterion(AIC) -770.745 -971.307 -1023.04
Schwarz criterion(SC) -747.462 -944.144 -999.758
Breusch-Pagan test 77.5041*** 125.3982*** 128.7776***
樣本數 358 358 358
表格 4 空間迴歸模型結果報表
在完成空間迴歸模型後,分別針對 SLM 及 SEM 模型的殘差進行空間自相關 檢定。在 SLM 模型方面,如圖 21 所呈現,其 Moran’s I 值為 0.0250331,蒙地卡 羅檢驗計算出之 P 值=0.166>0.05,未達顯著不能拒絕虛無假設,表示其誤差呈現 空間隨機,圖 22 即呈現誤差的空間分布及顯著性。而在 SEM 模型方面,針對殘 差進行空間自相關檢定,如圖 23 所示,其 Moran’s I 值為-0.01,蒙地卡羅檢驗及 計算出之 P 值=0.374>0.05,未達顯著不能拒絕虛無假設,表示其誤差呈現空間隨 機,圖 24 即呈現誤差的空間分布及顯著性。上述證實兩者模型都能有效處理殘差 空間自相關問題。
圖 21 SLM 之誤差 Moran’s I 圖與蒙地卡羅檢驗
圖 22 SLM 之誤差 LISA Cluster 與顯著性圖
圖 23 SEM 之誤差 Moran’s I 圖與蒙地卡羅檢驗
圖 24 SEM 之誤差 LISA Cluster 與顯著性圖
比較空間迴歸模型的優劣可以比較 Log likelihood 值(值愈大愈好)、Akaike info criterion(值愈小愈好)及 Schwarz criterion(值愈小愈好)。在比較上述三個指標後,
發現 SEM 模型的解釋力較佳,但在此模型中,可以發現青年人口比例的影響沒有 Breusch-Pagan test 之 P 值=0.000000<0.05,達顯著水準拒絕虛無假設,表示有空間 異質現象的發生。空間異質現象發生的原因可能有地區性的差異,為排除這個因素,
將台灣縣市分為北、中、南、東等四區設置虛擬變數,試圖控制空間異質的問題。
以下為加入地區虛擬變數後所進行的傳統迴歸模型、SLM、SEM 模型之報表結果。
經過逐一加入或組合加入後發現「中部」、「南部」、「東部」之虛擬變數加入後 整體迴歸模型解釋力及變數顯著性為較佳,R-squared 值為 0.429958,解釋力較 OLS-8 提升許多,MULTICOLLINEARITY CONDITION NUMBER 為 29.436098,
在標準範圍內,為 OLS-9。
而在 SLM 與 SEM 模型的選擇上,再次經過診斷,首先進行 Lagrange Multiplier Test,Lagrange Multiplier(lag)及 Lagrange Multiplier(erroe)皆是 P=0<0.05,皆達顯著 水準,於是再進一步進行 Robust LM Test,Robust LM (lag)之 P=0.06417>0.05,為 不顯著,而 Robust LM (error)之 P=0.00057<0.05,達顯著水準,表示使用 SEM 模 型較為適合。
因此以 OLS-9 模型進行 SLM 及 SEM 模型,結果如下。
OLS-8 OLS-9 SLM SEM
常數項 -0.03935823
(0.04530869)
0.03273782 (0.03847707)
0.01974373 (0.0307988)
0.2767928 ***
(0.04832908)
青年人口比例 0.6446047***
(0.1963509)
0.5850715***
(0.1613792)
0.344956***
(0.1278342)
0.05655975 (0.1397648)
福佬人比例 0.1036068***
(0.02430879)
0.1196818***
(0.1613792)
0.07645899***
(0.01622891)
0.06448493***
(0.02135553)
投票率差 -0.00215504***
(0.0005469237)
-0.0007464893 (0.0004677575)
8.55861e-005 (0.0003714303)
0.000114242 (0.0004002313)
期初值 -0.1480849***
(0.0467807)
-0.3228581***
(0.04028644)
-0.229938***
(0.03343087)
-0.320012***
(0.03781767)
虛擬變數_無提名 0.03781902** 0.05984586*** 0.03776593*** 0.05680263***
(0.01673591) (0.01462564) (0.01178803) (0.01544323)
虛擬變數_東 -0.1267234***
(0.0153182)
-0.07075412***
(0.01298333)
-0.2539136***
(0.041331)
虛擬變數_南 0.06609602***
(0.01007651)
0.03727606***
(0.008306378)
-0.0932854***
(0.03461411)
虛擬變數_中 -0.02818259***
(0.01070955)
-0.01829077**
(0.008634481)
-0.2029077***
(0.02946771)
W_民進黨獲票率差 0.6214478***
(0.04544266)
Lamda 0.8870326***
(0.02337085)
R-square 0.133235 0.429958 0.633916 0.725922
Multicollinearity condition numbers
26.092035 29.436098
Moran's I (error) 16.0840*** 14.0217***
Lagrange Multiplier(lag) 234.3452*** 145.0670***
Robust LM (lag) 3.4066* 1.3674
Lagrange Multiplier(error) 238.4795*** 169.7664***
Robust LM (error) 7.5410*** 26.0667***
Log likelihood 391.373 466.384 528.902 552.916465
Akaike info criterion(AIC) -770.745 -914.768 -1037.8 -1087.83
Schwarz criterion(SC) -747.462 -879.843 -998.998 -1052.91
Breusch-Pagan test 77.5041*** 80.4824*** 121.2980*** 80.2422***
樣本數 358 358 358 358
表格 5 傳統迴歸及空間迴歸分析結果報表(加入地區虛擬變數)
觀 察 報 表 計 算 出 Log likelihood 及 AIC 與 SC 值 , SLM 模 型 之 Log likelihood=528.902 , AIC=-1037.8 , SC=-998.998 ; SEM 模 型 之 Log likelihood=552.916465,AIC=-1087.83,SC=--1052.91。綜合比較診斷結果及上述數 值結果,SEM 模型明顯較為適合做為解釋之模型,也再次證實加入了地區虛擬變 數,青年人口分布對於民進黨獲票率差的影響仍不顯著,拒絕本文研究假設。
然而,在 SEM 模型當中,儘管加入了地區變數以控制空間異質問題,但報表 中診斷異質現象之指標 Breusch-Pagan test 其 P 值=0.000000<0.05,達顯著水準拒 絕虛無假設,仍有空間異質現象的發生,表示在各地區中仍有未考慮的因素導致空
其影響因素之關係皆有空間異質性問題的產生,儘管設定了虛擬變數發現東部地 區、中部地區與南部地區呈現顯著,模型中檢定異質性的指標 Breusch-Pagan test 仍 是達到顯著,表示有其他的地區性因素影響,例如候選人因素以及其他未知的因素。
對於空間異質性問題,本文接著使用地理加權迴歸模型(GWR)進一步處理及探索 造成空間異質現象的原因。
地理加權迴歸模型(GWR)的建立有許多方式,如 ArcGIS、Matlab 程式建立以 及 Geoda 系列程式 GWR4.0,本文即透過 GWR4.0 進行地理加權迴歸模型的建立。
一、 參數設定
(一) 在模型建立中將民進黨獲票率差作為依變數,將在傳統迴歸模型中達顯 著性之自變數(福佬人、期初值、投票率差、虛擬變數_無提名縣市)及解釋 變數(青年人口比例)放置在地區(Local)自變數當中。
(二) 輸入各鄉鎮市區之中心點座標(X、Y)值。GWR4.0 提供投影座標和球面座 標類型供迴歸計算使用,不同的座標類型影響距離計算的單位。投影座標
(二) 輸入各鄉鎮市區之中心點座標(X、Y)值。GWR4.0 提供投影座標和球面座 標類型供迴歸計算使用,不同的座標類型影響距離計算的單位。投影座標