空間統計理論與方法

第二章文獻回顧

第三節空間統計理論與方法

空間統計是一種基於地理關係 (geo-referenced) 的統計方法，將空間關聯加入統計中對變項進行分析，以獲取事物於空間中的分布規律及結構，並處理空間相依性 (spatial dependence) 與空間異質性 (spatial heterogeneity) 二類空間效應 (Anselin, 1998)。地理學探討「人─地互動」關係勢必對於空間的互動特別關注，

因此利用空間統計得以更有效地挖掘地理現象背後隱含的意義，其分析方法可分為探索式空間資料分析 (exploratory spatial data analysis, ESDA) 及空間迴歸模型二類。

一、空間效應

空間相依性係指空間中存在的現象並非獨立或隨機發生，相鄰的空間單元會產生相同現象群聚的空間關聯情形，是地理分布現象和空間過程的本質特徵，依形成原因可分為空間延遲相依 (spatial lag dependence) 與空間誤差相依 (spatial error dependence)。空間延遲相依指涉地理現象本身會與鄰近區域跨邊界地互動，

產生擴散或外溢作用，使鄰近區域有相似特性。空間誤差相依成因有二：一為因空間單元劃設不當，無法正確體現地理現象潛在的分布本質，形成的冗餘空間相依；二為未納入模式的關鍵性因子具結構相似，使空間結構反映到殘差項。實際應用上，空間延遲相依與空間誤差相依兩者的效果往往同時存在且相互影響。

(Anselin and Rey, 1991; 陳菁瑤、洪志明，2009)

空間效應的另一種型態為空間異質性，表示在空間分析中函數型態或係數受到個人愛好與態度、管理制度、政府政策、環境等條件差異的影響，會隨著地理位置不同而產生變數間關係的改變或飄移 (drift) ，形成空間不穩定 (non-stationarity)。由於傳統線性迴歸視影響因素為靜態，對依變項的作用為全區均值，

並假定誤差項為變異相等，這些假設前提使固定的迴歸係數無法表現空間局部差 異，並使迴歸模型產生偏誤。(Fortheringham et al., 1997; 2002)

二、探索式空間資料分析

探索式空間資料分析是一種由資料驅動的探索過程，通過資料分析來發現問題、辨識異常區位、偵測空間聚集型態或其他形式的空間異質性 (Anselin, 1998)。

依研究尺度可分為全域型空間自相關 (global spatial autocorrelation) 與區域型空間自相關 (local spatial autocorrelation) 方法。

全域型空間自相關可測量全區整體的空間自相關性，常被使用的有 Moran’s I, Geary’s C, Join count 等指標，其中最具代表性的度量指標為 Moran’s I (Cliff and Ord, 1973)。由於全域空間自相關無法度量數值在空間中的聚集特性，對此需以區域型空間自相關指標來衡量區域內的局部性空間關聯特性，找出空間聚集的型態。常用者有 Anselin (1995) 發表的區域型空間關聯指標 (local indicators of spatial association, LISA) 和 Getis and Ord (1992) 提出的 Getis-Ord G_i (G_i^∗) 統計指標等方法。

探索式空間資料分析於土地利用變遷研究上可具體描述土地利用的空間分布、辨識特異區、呈現土地利用的空間聚集性與暗示空間體制 (spatial regimes)，

此外亦可用於檢驗土地利用變遷模式中殘差值的空間分布特性。相關研究如朱建銘 (2000) 以全域型 Moran’s I 及 Getis 指標度量雲林沿海地區水產養殖業於 1982 年、1988 年、1994 年的空間聚集強度，再透過 Getis-Ord Gi^*法找出水產養殖業的聚集區，並分析各時期空間聚集區的變遷情形。賴進貴等人 (2004) 運用全域型 Moran’s I 指標與區域型 Getis-Ord Gi^*(d)方法分析百年來空間相依性對台北盆地聚落變遷趨勢之影響。結果顯示非聚落發展成聚落的傾向往往伴隨著高度的空間自相關性，此外於鄰近區範圍的界定上，發現以半徑 500 公尺所界定的鄰近區對聚落變遷趨勢的影響最顯著。

三、空間迴歸模型

(一) 對空間相依性的修正

Anselin (1988a) 提出了空間線性模型的通用形式，用來處理橫斷面空間資料因空間相依性所造成的線性迴歸模型偏誤，可表示為：

y = ρ𝑊₁𝑦 + 𝑋𝛽 + ε ε = λ𝑊₂𝜀 + 𝜇

𝜇 ~ 𝑁(0, 𝜎²𝐼) (1)

當中 y 為依變項向量，ρ為空間延遲係數，λ為空間誤差係數，𝑊₁, 𝑊₂分別為依變項及誤差項的空間加權平均向量，X 為自變項矩陣，β為自變項的迴歸係數向量。從通用形式可依使用需求衍伸出特定模型，如ρ = 0, λ = 0即為一般線性迴歸；λ = 0為空間延遲模型 (spatial lag model, SLM)；ρ = 0為空間誤差模型 (spatial error model, SEM)。當中空間延遲模型用於處理因空間延遲相依所造成的線性迴歸模型偏誤，利用ρWy項將依變項的部分變化解釋為每個觀察值與其鄰近觀察值的相關性 (沈體雁等，2010)，亦可被視為空間過濾依變項(I − ρWy)y對原有自變項的迴歸 (Anselin, 1988a)，此模型在理論上適合用於已知依變項 (如建成地變遷) 有空間結構上的互動依據時，用以看出空間延遲係數的強度，並在顧及依變項空間相關下，看出其他變項的真實影響效果；空間誤差模型則是用來處理具空間自相關型態的遺漏變項，或空間單元劃分不當造成的干擾，意義上較接近強化統計技巧 (洪志明，2011)。

空間延遲/誤差模型今已廣泛應用於各研究領域，如胡立諄、賴進貴 (2006) 透過空間延遲模型，在考慮到空間誤差相依所造成的干擾下，探討台灣本島人口組成、社經地位、教育程度等因素與乳癌發生率的關係。紀玉臨等 (2009) 採用時間延遲之空間模型 (spatial-temporal lag model) 分析影響台灣本島外籍新娘空間分布的因素，並探討模式的鄰近效應。陳菁瑤、洪志明 (2009) 利用空間延遲模型與空間誤差模型從事台灣鄉鎮市層級的租稅競爭估計。

犯罪學領域者 Baller et al. (2001) 利用空間延遲模型與空間誤差模型探討美 國郡級行政區於 1960 年至 1990 年間殺人犯罪的結構因素與空間效應。發現鄰郡間的結構相似無法全然解釋殺人犯罪的空間聚集，且結構因素的影響力具區域差

內則有李瑞陽、陳勝義 (2010) 透過社會解組論與日常生活理論選取相關變項，

以多元線性迴歸建構台中市 2004 年至 2005 年的搶奪犯罪區位模型，並尋求最適之空間模式。驗證了搶奪犯罪率與相關變項間確有空間變異性存在，而此個案研究中空間延遲模型較空間誤差模型更為適用。

應用於土地利用變遷的相關研究如黃國慶、詹士樑 (2009) 以台北都會區為例，利用空間自相關分析檢視土地使用/覆蓋變遷的分布及聚集型態，並透過空間誤差模型建構土地使用/覆蓋變遷的驅動力校估模型，從而探討台北都會區於 1991 年至 2001 年間土地使用/覆蓋變遷的驅動力因子及鄰近效應。結果顯示相較於土地覆蓋變遷的驅動力涵蓋最廣，住宅土地使用變遷偏重於社會經濟面向，工業土地使用變遷主要受到土地政策影響，商業土地使用變遷則同時受到社會經濟與土地政策所決定。空間分布型態上，土地覆蓋變遷與住宅土地使用變遷具空間聚集性，同時鄰近效應亦為此二變遷模式的顯著驅動力之一。陳惠玲 (2010) 亦發現相較於全域方法，空間迴歸能更有效地分析桃園縣農地的分布與變遷情形。

(二) 對空間異質性的修正

空間異質性在迴歸模型中以變異數異質的形式表現結構的不穩定性 (陳斐，

2008)，多可藉傳統迴歸解決，但當結構不穩定具特定空間型態時，空間異質性會與空間自相關共同出現，此時傳統迴歸將產生偏誤而不再適用 (Anselin and Griffith, 1988)，這時可以用非線性模式或局部迴歸來改進。非線性模式者如分類與迴歸樹 (classification and regression tree, CART) 及類神經網路 (neural nets)，

得以對函數進行較具彈性的估計。如 McDonald and Urban (2006) 即以 CART 及 logistic 迴歸分別對美國北卡羅萊納州萊利─都林 (Raleigh-Durham) 建構的森林砍伐機率模式，並證實 CART 確實較 logistic 迴歸有更佳的準確度及相對均勻的殘差分布。

另一種處理空間異質性的方法為局部迴歸模型，如 Casetti (1972) 提出的空間擴張方法 (spatial expansion method)，此模型將係數視為自身地理座標位置的特定函數，讓每個觀察點皆具有獨自的迴歸係數，使係數分布的空間變化可被度量。鄒克萬、張曜麟 (2004) 即利用空間擴張方法，建立台南市⁵在 1984 年至 1904 年間的土地使用變遷 logit 模式，讓重要變數擁有較全域方法更佳的解釋力。但

5 為 2005 年 12 月 25 日改制前省轄市時期的台南市

由於空間擴張模型的係數變化取決於 X,Y 座標位置，因此只能呈現單一的變化趨勢，對於分析較複雜的空間現象有其侷限性。

此外，隨機係數模型 (random coefficient model) 將迴歸係數的異質性視為隨機變量，但未能考慮到係數分布的空間結構 (Swamy, 1971)。空間調適濾波 (spatial adaptive filtering) 則是透過對臨近觀察點間係數「估計─修正」的迭代運算來適應迴歸係數的空間漂移，然而缺點為係數無法進行統計檢定 (Foster and Gorr, 1986)。多層次模型 (multilevel model) 中迴歸係數為已知區域變數的函數，

使同一迴歸式的係數在不同地理位置有不同的值，然而區域之劃分需為先驗存在，

且係數分布在區域邊界將具不連續性 (Goldstein, 1987)。

在上述眾多局部迴歸方法研究的基礎上，Fortheringham et al. (1996) 發展出 的地理加權迴歸 (geographically weighted regression, GWR)，是近年來探討空間異質性問題常用的模式，通過讓係數估計值隨空間位置變化，捕捉因結構不穩定 所導致的殘差空間聚集現象。Fotheringham et al. (1998) 應用空間擴張模型與地 理加權迴歸二種方法探討英格蘭東北部四郡 605 個人口普查區內人口分布與諸種重大疾病間關係的空間不穩定性，即證實了相對於空間擴張模型中單一的係數變異趨勢，地理加權迴歸的局部係數估計能呈現較高的變異自由度與較複雜的空間型態，獲得較佳的模型解釋能力。

應用地理加權迴歸於土地利用變遷研究者如 Luo and Wei (2009) 利用 1988 年及 2000 年 SPOT 衛星影像以監督式分類取得南京地區土地覆蓋資料，再分別用全域 Logistic 迴歸及 Logistic GWR 模型來分析南京地區都市用地的空間型態與變遷因素。結果顯示相較於中國沿海大城市，南京的都市擴張型態較為緊湊 (compact) 且擴張速度較慢，影響因素以「與地區幹道距離」最重要。此外 Logistic GWR 能有效地提升全域 Logistic 迴歸的配適度，降低迴歸殘差的空間自相關性，

在文檔中桃園地區土地利用變遷與影響因素之空間分析 (頁 27-33)

第二章 文獻回顧

第三節 空間統計理論與方法

第二章文獻回顧

第三節空間統計理論與方法