線性迴歸分析結果的殘差,必須滿足在空間呈隨機分布的條件。但當探討地理議題 時,由於樣本常常來自於空間的抽樣,故可能會因地表現象具有空間異質性,導致殘差 具有空間自相關現象,違反線性迴歸「殘差必須呈現常態分佈」的假設。故另有空間統 計方法針對空間抽樣來建立迴歸模式。
空間統計建立迴歸與傳統線性迴歸的差異,在於空間統計是採用移動窗(moving window)的概念,只將一定距離內的樣本(觀察點)視為有影響,納進迴歸點的迴歸式 中,被納進來計算的範圍即是頻寬(bandwidth),如圖三-3 所示。當迴歸式由某個迴 歸點移動到旁邊的迴歸點時,移動窗會跟著往旁邊移動,因此新的樣本(觀察點)就會 被包含進來,一些原本的觀察點則跑到窗戶之外,如圖三-2 所示,由此可見位置越靠 近的兩條迴歸式迴歸係數也會越相似。(葉高華,2011)
圖 三-2 移動窗迴歸採樣圖(Fotheringham et al,2002)
在傳統移動窗迴歸中,在移動窗內所有樣本無論距迴歸點 i 多遠,該樣本對迴歸係 數估計都具有相同的影響力,也就是將樣本權重 Wij視為 1。而在移動窗之外的樣本,
因為沒有任何影響力權重直接設為 0。「窗內權重為 1、窗外權重為 0」的設置導致樣本 對係數估計的影響呈現空間不連續,故仍無法解釋空間不穩定現象。
圖 三-3 空間核圖(Fotheringham et al.,2002)
X 為迴歸點 i 的位置, 為樣本點。
Wij為資料點 j 迴歸點 i 的權重 dij為迴歸點 i 和資料點 j 的距離
地理加權迴歸承接移動窗迴歸的方式,與傳統移動窗迴歸的差別在於,地理加權 迴歸讓任一樣本點的權重不僅是 1,而是給予權重:距離迴歸點愈近的樣本點獲得越高 權重,而在移動窗邊緣的樣本點權重將視為零(圖三-3)。這方法讓任何位置都具有獨 自的迴歸係數,且迴歸係數在空間上皆呈現連續的變異。地理加權迴歸方程式如下 :
i i
ik
k k i
i
u u v x
Y
0 ,vi
, εi公式中,i 點代表的是空間的迴歸點(Regression point),被用來作參數估計,
u ,v
i i
表示研究空間中用來校估迴歸點 i 的空間座標,而
k u,
iv
i
則為 i 點的迴歸係數,εi為 點 u ,v
i i
迴歸式的誤差項。從公式結構中可發現 GWR 的樣本點是透過頻寬內距迴歸點 位置 i 的鄰近來加權,樣本點的權重隨著距離 dij的增加而減少,這讓樣本點隨著迴歸點 i 位置不同而產生變化,任何位置具有獨自的迴歸係數得以呈現空間連續性,也能表現 空間連續的變異。
圖 三-4 地理加權迴歸固定空間核概念示意圖
由上述可知,由於迴歸預測值是由附近的樣本點距離遠近來推估,故頻寬大小的決 定便是重點。若給定頻寬越大,會造成推估值結果接近一般迴歸;若給定頻寬越小,則 會造成迴歸係數快速衰退(林尚德,2003)。目前空間頻寬的設定,最普遍的方法為赤 池資訊準則 AIC(Akaike information criterion)。AIC 指數較小者,代表有較小的變異可 以得到較為準確的推估結果。由於本研究所採納因子其中之一為公車班次,公車站牌於 市區分布較為平均,沒有特別聚集或是特別疏遠的情形,故較不需使用調適型(Adaptive)
頻寬,故本研究將採固定頻寬方式(圖三-4)
地理加權迴歸是探討空間異質問題常用的空間模型,其能提升具有空間關係的多元 線性迴歸合適度,並降低迴歸殘差的空間自相關性,也得使各因子的影響力能呈現空間 上的解釋差異性,故本研究採此法進行 2001 年都市發展進程指標的因子探究。