第四章 空間迴歸分析
第一節 傳統迴歸
第三節分析架構 第四節資料料與變數數 第五節研究假設 第六六節章節安排 第二章空間分析方法
第一節空間分析之意義 第二節空間計量量分析 第三節空間迴歸模型 第三章空間資料料探索索
第一節依變數數探索索 第二節自變數數探索索 第四章迴歸分析
第一節傳統迴歸分析 第二節空間迴歸分析 第五章結論論與建議
30
第二章空間分析方法
本章節將針對空間分析做出介紹,說說說明何謂空間分析以及其利利用之資料料、工具 與方法,讓讀讀者對空間分析方法能夠有初步且全面的認識識,方便便讀讀者能更更快掌握 之後章節的內容。
第一節空間分析的意義與目的
在電腦科技發展之前,人們只能用紙筆去繪製地圖,面臨臨數數字運算問題也只能 靠人腦進行行計算,但是在電腦發明之後,無論論是繪圖還是計算都都能交給電腦一次 解決並且同時進行行,因此空間分析也因應而生。
隨著科技的進步,電腦所能處理理的問題也越來來越多,從一開始簡單處理理標的物 之間的地理理關係,例例如計算點與點之間的距離離或簡單的地圖繪製,到後來來結合傳 統計量量方法,將計算結果表現在地圖上,並利利用數數據去證明空間與現象的確有所 關連連。有學者認為空間分析方法將技術運用在地理理學及區域科學,是良良好的假說說說 探索索的工具;一旦當分析資料料的位置產生變化,則結果也會隨之改變,所以在分 析過程就要將空間要素納入考量量,並提供空間分析所需的資料料屬性與空間資訊(胡 立立諄、賴進貴,2006)。
空間分析方法經常被社會科學學者拿來來運用,並且習慣上會分成兩兩個部分進行行 討論論,分別是「空間計量量分析」以及「空間迴歸分析」,前者就是所謂的空間探索索,
透過觀察標的物的主題圖對於現象加以解釋,主要目的是空間性質的確立立,後者 則著重於建立立迴歸模型。
在進行行空間分析方法之前,還要將借重地理理資訊系統的內容才能進行行研究,所 謂地理理資訊系統的本質就是資料料庫,蒐集並放入大量量包含地理理位置的地理理屬性資 訊,最後讓研究者可以利利用資料料庫裡裡的資料料來來進行行研究。市面上也有販售建置詳 細且內容完善的資料料庫,不不過本研究基於經費限制,加上研究目的且範圍相當明
31
確等因素,是由研究者歸納整理理相關資料料後,再自行行建立立專屬的空間資料料庫,有 了了符合本研究要求的空間資料料庫之後,才能利利用裡裡面的素材並採用 GeoDa13軟體進 行行空間分析。
13 GeoDa 軟體是由學者 Luc Anselin 所組成的團隊(Spatial Analysis Laboratory)研發而成,
該軟體之基本介紹與下載等請參參考其官方網站。http://geodacenter.asu.edu/
32
第二節空間資料料探索索方法
最直接的空間探索索是繪製各種地圖,我們可以繪製主題圖、直方圖、盒狀狀圖、
PCP 圖和卡通圖等,並透過觀察這些地圖找出空間性質分布的趨勢,例例如圖 二-1 是藍藍營各項選舉平均得票率率率的卡通圖,圓圈越大代表得票率率率越高,紅色是最大值,
藍藍色則是最小值,分別出現在暖暖區碇和里里及中正區八斗里里,另外圓圈大小差距 不不明顯,表示藍藍營各地得票率率率差異異不不大,具有一定的穩定度度。但是如果要更更深入 的分析這些空間性質,就必須加入空間自相關與空間異異質性,兩兩者之分別與特性 將詳述如下。
圖 二-1 基隆隆市 1995 至 2009 年年各項選舉藍藍營平均得票率率率卡通圖 (資料料來來源:整理理自中選會)
一、空間自相關
空間自相關(spatial autocorrelation)是一種統計並分析變數數結果聚集與傾 向的方法,其針對地理理現象潛在的空間相依性予以定量量,描述現象所在和其他相 鄰地區現象的類類似程度度以鑑別空間聚集的情形(Goodchild, 1986;Kitron, and Kazmierczak, 1997)。既然是處理理現象與鄰居的關係,所以我們必須先界定清楚 所謂鄰居的定義,而空間鄰近關係度度量量的標準通常有三種,分別是以地理理位置定
33
義鄰居的 Rook 法和 Queen 法以及以距離離為量量度度標準這三種方法。
Rook 是規則地區的鄰近關係,如圖 二-2 所示,中心點紫色格子的上下左右,
即藍藍色格子是其鄰居。Queen 則和 Rook 一樣,是一種規則地區的鄰近關係,不不同 於 Rook 的鄰居僅止於上下左右,Queen 的鄰居是與紫色中心點相接觸的位置,如 圖 二-3 所示之藍藍色格子皆為其鄰居,至於本文所採用的鄰居即是用 Queen 作定義,
就是 Queen 定義下的基隆隆市鄰居個數數直方圖。至於以距離離為量量度度的方法,則是先 規定若若干數數字例例如十公里里,那麼在十公里里內的就是鄰居,超過十公里里的地區則被 排除。
圖 二-2Rook 鄰居定義 圖 二-3 Queen 鄰居定義
圖 二-4 基隆隆市各里里鄰居個數數直方圖 (資料料來來源:整理理自中選會)
在了了解鄰居的定義後,我們可以說說說空間自相關是來來衡量量「自己」與「鄰居」之 相關程度度,也就是當與鄰居的關係愈相似,那麼空間自相關程度度愈高;反之,則
34
空間自相關程度度低。至於相關程度度的衡量量,則有公式可遵循。
為了了呈現鄰居的表現,我們先建立立一個鄰近矩陣(W)並將其標準化後,乘以變 數數值(Y),得到 WY,即為「鄰居表現」,簡言之就是把鄰居的變數數值予以加權平均。
而空間自相關就是在討論論 Y 與 WY 間的程度度,也就是討論論一個地區之變數數,是否會 受其鄰居變數數的影響?這就是所謂的「全域空間自相關」(global spatial
autocorrelation),而 Moran’'s I 就是用來來衡量量此現象程度度的指標,其定義如下:
(Global Moran’'s I)
上列列公式中,n是觀察的地區數數目,y 是變數數在所有地區中的平均值,而 yi 和 yj為地區 i 和 j 的個別變數數值。而地區 i 和地區 j 的空間鄰近(Spatial Contiguity)關係,則視 yi與 yj是否相鄰,若若相鄰則 Wij 值為 1,不不相鄰就是 0,所 以自己與鄰居的相關程度度可分為以下三種:
1. 正相關(positive autocorrelation):當計算出來來的 I 值時為正,表示自己高,鄰 近地區亦高,或者是自己低鄰居也低,這種現象稱之為「空間聚集」。
2. 負相關(negative autocorrelation):當 I 值為負,表示自己高,鄰近地區低,為
「空間分散」。
3. 不不相關(none autocorrelation):自己之表現高低,與鄰近地區的高低無關,為「空 間隨機」。
35
圖 二-5 藍藍營歷歷屆選舉得票率率率總平均 Moran’'s I 圖(資料料來來源:整理理自中選會)
Moran's I 關心的是整體、全域(Global)的空間自相關趨勢,倘若若我們想要觀 察某地區與其鄰近地區之相關關係,則是將重點放到了了「區域空間自相關」(local spatial autorrelation),這時候就要選擇 Local Moran's I 指數數,其公式如下:
公式 2
Local Moran's I 指數數是由 Anselin(1995)所提出,而 GeoDa 軟體則可以繪製 出 LISA(Local Indicators of Spatial Association)圖來來幫助我們圖像化這種鄰 近關係。若若計算出來來的 Local Moran's I 之值為正,代表該地區與其鄰近地區表 現呈現正相關,若若值為負則是負相關。當地區與鄰區的觀察值都都很高(高於平均值),
為熱區(hot spot),以 High-High(HH)表示;當地區與鄰區的觀察值都都很低則為冷冷 區(cold spot),則以 Low-Low(LL)表示;至於本身觀察值高周圍低(High-Low)以 及本觀察值低周圍高(Low-High)的負向區域空間自相關,被視為空間例例外。如圖 二-6 所示,暖暖區、中正區內好幾個里里是 High-High,表示自己的高得票率率率連連帶
36
讓鄰居也有高得票率率率,有明顯空間聚集的現象,另外圖中有顏色的部分代表 Local Moran's I 達顯著水準(0.05),白色部分即未達顯著水準。
圖 二-6 藍藍營歷歷屆選舉得票率率率總平均 LISA 區塊 (資料料來來源:整理理自中選會)
二、空間異異質性
所謂空間異異質性與傳統計量量經濟學處理理之異異質性一樣,都都是指誤差的變異異不不恆 定,但空間異異質性是指因為空間位置造成的異異質現象,可能因為量量度度問題、變數數 關係的空間不不穩定性或地區本身獨特性所造成,處理理空間異異質的方法有許多,大 部分使用地區虛擬變數數或用空間加權迴歸(鄧志松,2009)。若若發現了了空間異異質的 現象,我們則要注意是否遺漏漏了了重要的自變數數,若若能找出該自變數數並且進行行控制,
那麼空間異異質的誤差就能夠被排除;但若若找不不到造成空間異異質的自變數數,就只能 歸咎於各地區的特色,無法給予一個更更明確的答案。
37
第三節空間迴歸建模
本文將使用傳統迴歸模型(Ordinary Least Squares Regression,簡稱 OLS)、
空間落落遲模型(Spatial Lag Model,簡稱 SLM)及空間誤差模型(Spatial Error Model,簡稱 SEM)進行行迴歸分析,以下就此三個模型分別說說說明。
38
同樣的,Y 是依變數數,X 是自變數數,β是係數數,ε則是誤差為 iid14,而 WY 就 是鄰居表現,ρ則是 WY 的係數數,代表鄰近效應影響依變數數之正負及強弱。
三、空間誤差模型
假如經過空間落落遲模型的檢驗,WY 變數數仍然不不顯著,代表空間自相關並非鄰 居表現所引起,或者是 WY 變數數顯著,但誤差仍有明顯空間自相關,代表 WY 僅有 部分解釋力力,代表有遺漏漏重要自變數數的可能,這時候我們就要利利用空間誤差模型 來來直接對誤差進行行校正,SLM 公式如下:
Y=βX +ε ε=λWε+μ
公式 5
其中的μ為校正之後的誤差,不不過上式之誤差 不不是 iid,加入空間變數數 之 後,誤差 才是 iid,至於其餘變數數定義則如前所述。值得注意的是,為了了保有普 遍性與有效性,空間落落遲和空間誤差模型則是用最大概似法估算,並不不像傳統迴 歸模型是用最小平方法檢驗。
總而言之,本文所採用的研究方法首先是使用地圖以及表格呈現基隆隆市藍藍綠綠陣 營的政治版圖,透過圖文資料料的輔助讓數數據更更明確地表現,讀讀者才能在第一時間 就瞭解本研究所要關切切的議題;然後進行行空間資料料探索索,並比較全國性及地區性
總而言之,本文所採用的研究方法首先是使用地圖以及表格呈現基隆隆市藍藍綠綠陣 營的政治版圖,透過圖文資料料的輔助讓數數據更更明確地表現,讀讀者才能在第一時間 就瞭解本研究所要關切切的議題;然後進行行空間資料料探索索,並比較全國性及地區性