• 沒有找到結果。

第三章 研究方法

第一節 研究設計與流程

一、土地利用變遷分析

將 1995 年及 2006 年「國土利用現況調查」成果依研究需求重新分類,取得 各類土地利用空間分布,並將二年度交差比對,以面積轉移矩陣掌握土地利用類 別間的變遷情形,再於鄉鎮市與村里層級呈現建成地變遷,初步掌握建成地分布 與變遷趨勢。

村里單元的建成地變遷趨勢參考 Tian (2005) 的方法,使用建成地變遷指數 (built-up area change index, BCI) 呈現時間內建成地比例的變化,表達形式為:

BCI =𝐵𝐴2006− B𝐴1995

𝑇𝐴 × 100% (2)

其中 BCI 表示村里單元在 1995 年至 2006 年間建成地面積百分比的變動量,

BA2006為 2006 年村里建成地面積,BA1995為 1995 年村里建成地面積,TA 是村 里總面積,單位皆為平方公里。

進一步以探索式空間資料分析偵測建成地的空間聚集型態。為簡化空間關係 及增加實用性,本研究所有空間權重矩陣 (spatial weighted matrix) 皆以最廣泛被 使用的一階相鄰后矩陣𝑊𝑖𝑗(1st contiguity order queen matrix) 定義之,即當村里單 元共線或共邊即為相鄰𝑊𝑖𝑗 = 1,反之無相鄰𝑊𝑖𝑗 = 0。

先使用 Moran’s I 統計量確定建成地分布與變遷的空間自相關性,Moran’s I 可視為觀測值與其空間延遲間的相關係數,反映空間接鄰村里屬性值的相似程度,

形式為:

I = 𝑛

𝑛𝑖=1𝑛𝑗=1𝑊𝑖𝑗×∑𝑛𝑖=1𝑛𝑗=1𝑊𝑖𝑗(𝑥𝑖 − 𝑥̅)(𝑥𝑗− 𝑥̅)

𝑛𝑖=1(𝑥𝑖 − 𝑥̅)2 (3) 式中表區域內有 n 個村里單元,每個單元內皆有觀測值𝑥,𝑥̅為觀測值平均,

村里單元 i,j 的接鄰與否構成𝑊𝑖𝑗矩陣。檢驗形式可由 I 值的期望值𝐸(𝐼)與變異數 𝑉𝑎𝑟(𝐼)推導:

Z(𝐼) = [𝐼 − 𝐸(𝐼)]

√𝑉𝑎𝑟(𝐼) (4)

Moran’s I 值收斂於 1 與-1 之間,愈趨近於 1 代表空間聚集程度愈高,愈趨 近於-1 表示空間離散程度愈強,趨近於 0 則表示空間過程隨機。對 Moran’s I 值 進行顯著性檢定時,在顯著水準 p=0.05 下當Z(I) ≥ 1.96代表區域內空間單元具 有空間自相關性,Z(I)值介於 1.96 至-1.96 間代表空間單元相關不顯著,Z(I) ≤

−1.96代表空間單元數值呈現負相關。

接著透過 Getis-Ord Gi*方法尋找建成地分布及變遷的空間冷、熱點,以了解 建成地分布與變遷的空間型態。其對每一個空間單元賦予一個指標值,代表該空 間單元與鄰近空間單元間屬性特徵的空間聚集程度,形式如下:

𝐺𝑖 =∑𝑛𝑗=1𝑤𝑖𝑗𝑥𝑗

𝑛𝑗=1𝑥𝑗 , ∀𝑗 (5) 式中𝑤𝑖𝑗所建構的接鄰關係亦包含了位置 i 與其本身的接連 (𝑖 = 𝑗),𝐺𝑖的標 準化統計量為:

Z(𝐺𝑖) =[𝐺𝑖− 𝐸(𝐺𝑖)]

√𝑉𝑎𝑟(𝐺𝑖) (6)

若空間單元內𝐺𝑖為正值,表示該空間單元與鄰近單元的觀察值皆為高值,是 空間熱點 (hot spots) 所在,反之負值則為空間冷點 (cold spots)。在顯著水準 p=0.05 之下,當Z(𝐺𝑖) ≥ 1.96代表區域內空間單元為顯著的空間熱點;Z(𝐺𝑖) ≤

−1.96代表為顯著的空間冷點。

二、建成地變遷因素描述分析

透過桃園地區地方發展相關研究及土地利用變遷文獻的回顧,配合考量研究 區特性,歸納出建成地變遷的潛在影響因素,使用 ESRI 推出的地理資訊軟體 ArcGIS Desktop 9.3.1 將蒐集到的各類圖資與社經資料建置到村里空間單元內,

並進行初步的描述分析,做為後續建立模式之用。

三、多元線性迴歸 (Multiple Linear Regression, MLR)

空間迴歸是自傳統線性迴歸為基礎進行擴展,以處理空間效應問題,因此需 由基本的多元線性迴歸出發,推估村里建成地變遷的影響因素。設一組隨機抽樣 依變項 y 與固定自變項𝑥𝑘的 MLR 模型為:

𝑦𝑖 = 𝛽0+ ∑ 𝛽𝑘 𝑘𝑥𝑖𝑘+ 𝜀𝑖 ε ~ 𝑁(0, 𝜎2𝐼) (7) 當中𝛽0為常數,𝛽𝑘為係數向量,𝜀𝑖為殘差,一般以普通最小平方法 (ordinary least square) 估計係數,故亦稱「OLS 迴歸」。為使模式為最佳線性不偏估計 (best linear unbiased estimator, BLUE) , 誤 差 項 須 符 合 獨 立 同 分 配 (independently identical distribution, iid),即殘差需具有下列性質:

1. 殘差期望值為零:E(𝜇) = 0

2. 殘差具變異數同質性:var(𝜇) = 𝜎2

3. 殘差獨立性:cov(𝜇𝑖, 𝜇𝑗) = 𝜎2 且 cov(𝑥, 𝜇) = 𝜎2 4. 殘差為常態分佈。

對多元線性迴歸係數進行統計推論前,首先須確定模式的設定是否恰當。第 一步先檢視各變項是否符合 OLS 迴歸基本假設,包括:依變項與自變項間呈現 線性關係、自變項間不存在嚴重多元共線性 (multicollinearity),以此原則對投入 的變項進行篩選或數值轉換。確認無誤後方進行係數估計。

使用 F 檢定、adjusted R2檢視整體模式之配適度 (goodness of fit),並以 t 檢 定辨識個別迴歸係數的顯著性。最後是對殘差進行診斷,確認殘差是否符合上述 線性迴歸假設。最小平方法為求取殘差的平方和最小化,期望盡可能符合多數樣 本資訊,然而實際上土地利用單元間並非獨立,且背後的自然環境、社經因素亦 非 均 質 , 使 得 OLS 迴 歸 的 估 測 常 發 生 平 均 化 效 應 與 誤 差 項 自 相 關 問 題 (McDonald and Urban, 2006; 楊書婷,2008), 誤差項自相關將導致標準誤產生偏 誤而使 F 檢定與 t 檢定失效,R2也會不精確。

在給定的空間加權矩陣下,OLS 迴歸的殘差可應用拉格朗日乘數 (Lagrange Multiplier, LM) 原則進行檢定。Burridge (1980) 首先提出空間誤差相依的 error 檢定,而後 Anselin (1988b) 提出空間延遲相依的 lag 檢定。然而 LM-lag 與 LM-error 檢定無法明確區分殘差空間自相關之源 (Anselin and Florax, 1995),

是故 Anselin et al. (1996) 進一步提出了二種修正後的穩健檢定:robust LM-lag 與

robust LM-error 檢定量,可區別空間相依性的來源,自空間延遲與空間誤差的混 合中評估何者更為重要,以此確認空間相依是在空間過程中具實質作用,或僅是 對遺漏變項空間結構的反應。因此殘差診斷的意義不單僅是偵測線性迴歸的偏誤,

更能進一步指出合宜的修正方法。

本研究先以 Moran’s I 統計量檢定殘差是否具有空間自相關,若有則以 robust LM-lag 及 robust LM-error 檢定區別空間自相關的來源,評估空間延遲相依及空 間誤差相依何者更為重要。如 robust LM-lag 顯著但 robust LM-error 不顯著,即 適合使用空間延遲模型進行修正;反之若 robust LM-error 顯著但 robust LM-lag 不顯著,代表模式極可能遺漏了關鍵自變項,或村里為不合宜的基本空間單元,

須對模式進行重新設定。

OLS 迴歸殘差違反變異數同質性假設的結果將使統計檢定失效,無法建構 信賴區間。本文藉由 Breusch-Pagan 法檢定殘差變異數是否同質,如檢定結果顯 著表示殘差具有變異數不穩定性,違反線性迴歸假設。當殘差變異數不穩定與空 間自相關同時出現時,即適合使用地理加權迴歸修正。最後殘差須服從常態分配,

本研究以單樣本 Kolmogorov-Smirnov 進行檢定。

四、空間延遲模型

空間延遲模型將空間延遲效應納入多元線性迴歸,反映出「村里單元內建成 地變遷影響鄰近村里單元建成地變遷,並同時受到鄰近村里單元建成地變遷的影 響」,函數形式為:

𝑦𝑖 = 𝜌 ∑𝑖≠𝑗𝑤𝑖𝑗𝑦𝑖 + ∑ 𝛽𝑘 𝑘𝑥𝑖𝑘 + 𝜀𝑖 𝜀 ~ 𝑁(0, 𝜎2𝐼) (8) 式中表示村里 i 的建成地變遷比例𝑦𝑖同時決定於相鄰村里的建成地變遷指數 及一組影響因素,當中𝜌為空間自迴歸係數,𝑤𝑖𝑗為村里的一階相鄰后矩陣。由於 空間自迴歸項是依變項空間自相關形成的內生聯立解,因此無法使用普通最小平 方法做係數估計,須改採其他可以解釋此種內生性的估計方法。本研究使用由 Luc Anselin 領導開發的空間資料分析軟體 GeodaTM 1.4.0 進行空間權重矩陣的定 義及運算空間延遲模型,GeodaTM 1.4.0 以最大概似法估計 (maximum likelihood, ML) 進行係數估計,此時模型的整體配適度不能以 R2衡量,需以 Log Likelihood、

赤池信息量準則 (Akaike’s information criterion, AIC)、施瓦茲準則 (Schwarz criterion, SC) 等非線性原則的適配性檢定來衡量。

本文以 AIC 法比較多元線性迴歸與空間延遲模型的配適性差異,AIC 為一 種從模式配適度與自由度間衡量最適模型的方法,AIC 值愈小表示該模式愈接近 真實分布。設𝐴𝐼𝐶𝑀𝐿𝑅為多元線性迴歸的 AIC 值、𝐴𝐼𝐶𝑆𝐿𝑀為空間延遲模型的 AIC 值,若 (𝐴𝐼𝐶𝑀𝐿𝑅− 𝐴𝐼𝐶𝑆𝐿𝑀) > 3,即可判斷空間延遲模型較多元線性迴歸更接近 真實模型。

五、地理加權迴歸

本研究使用由 Tomoki Nakaya 人組成的開發團隊所製作之 GWR4 軟體來進 行 地 理 加 權 迴 歸 的 校 估 。 此 軟 體 特 色 在 於 能 利 用 地 理 加 權 廣 義 線 性 模 式 (geographically weighted generalised linear modelling, GWGLM) 的 架 構 進 行 Poisson GWR 及 logistic GWR 建模,以處理二元或計數資料。此外尚能建立 GWR 與 GWGLM 的半參數型式模型,減少模式的複雜度並提升預測能力。

地理加權迴歸延伸自傳統迴歸理論的分析方法,加入空間座標作為加權變項,

允許自變項係數隨空間呈現連續變化,能體現空間不穩定性。其將多元線性迴歸 方程式修改如下:

𝑦𝑖 = 𝛽0(𝑢𝑖, 𝑣𝑖) + ∑ 𝛽𝑘 𝑘(𝑢𝑖, 𝑣𝑖)𝑥𝑖𝑘+ 𝜀𝑖 𝜀 ~ 𝑁(0, 𝜎2𝐼) (9) 當中(𝑢𝑖, 𝑣𝑖)為空間點 i 的座標,𝛽𝑘(𝑢𝑖, 𝑣𝑖)為點 i 的迴歸係數,𝜀𝑖為各空間點 誤差項,模式中每個觀察值皆賦予一個權重𝛽𝑘,𝛽𝑘為𝑑𝑖𝑗的單調遞減函數,以加權 最小平方法 (weighted least square, WLS) 進行參數估計,點 i 的係數𝛽𝑖為:

𝛽̂𝑖 = (𝑋𝑇𝑊𝑖𝑋)−1𝑋𝑇𝑊𝑖𝑦 (10) 其中𝑊𝑖為n × n的空間權重矩陣,且只有對角線為非 0 數字,透過不同的空 間核函數定義之。一般常用的空間核函數有高斯 (Gaussian) 函數與雙平方 (bi-square) 函數二種。高斯函數為一連續單調遞減函數,在迴歸點 x 上權重值為 1,

隨著距離迴歸點愈遠權重愈小,當 i , j 二點漸遠時 Wij 將漸趨近於 0,使遠方的 樣本點對迴歸點幾無影響力 (圖 3-1),其形式如下:

𝑊𝑖𝑗 = exp (−𝑑𝑖𝑗2

𝜃2 ) (11)

式中𝜃為描述權重與距離間關係的非負參數,此處稱之為帶寬 (bandwidth)。

與高斯函數不同,雙平方函數在帶寬內以高斯函數計算權重,帶寬外權重則全數 為 0,將上式修正如下:

𝑊𝑖𝑗 = {(1 − 𝑑𝑖𝑗2⁄ )𝜃2 2 𝑑𝑖𝑗 ≤ 𝜃

0 𝑑𝑖𝑗 > 𝜃 (12)

圖 3-1 空間核函數示意圖

資料來源:Fotheringham et al. (2002)

空間核函數的帶寬分別可以固定核心 (fixed kernal) 及調適核心 (adaptive kernal) 二種方式採樣。固定核心對於局部迴歸的帶寬設定以距離遠近為標準 (圖 3-2),適用於樣本點分布均勻的條件下;調適核心則以距離內樣本點數量為 考量,其帶寬會隨著樣本點疏密程度而改變,在樣本密集區帶寬較小、樣本稀疏 區帶寬較大 (圖 3-3)。空間核函數類型與帶寬採樣方式的選用上視研究區樣本多 寡及分布型態而定,不同權重函數的選擇對係數估計影響並不大,然而特定函數 的帶寬則對係數估計十分敏感 (Fortheringham et al., 2002)。

圖 3-2 固定核心示意圖

資料來源:Fotheringham et al. (2002)

圖 3-3 調適核心示意圖

資料來源:Fotheringham et al. (2002)

最適帶寬的選取常採用交叉驗證法 (cross validation, CV)、赤池信息量準則 (AIC) 及貝氏信息量準則 (Bayesian information criterion, BIC) 等方法,當中以又 以小樣本修正赤池信息量準則 (AICc) 法的應用最為廣泛 (Hurvich et al., 1998),

AICc 表達形式如下:

𝐴𝐼𝐶𝑐 = 2𝑛 log𝑒(𝜎̂) + 𝑛 log𝑒(2𝜋) + 𝑛 { 𝑛 + 𝑡𝑟(𝑆)

𝑛 − 2 − 𝑡𝑟(𝑆)} (13) 其中𝜎̂為誤差項標準差、𝑡𝑟(𝑆)是帽子矩陣 (hat matrix) 的痕跡 (trace),特定 帶寬下模式有最小 AICc 值時,此即為最佳帶寬。

然而實際上模式中往往並非所有迴歸係數都具空間變異性,可能有部份係數

然而實際上模式中往往並非所有迴歸係數都具空間變異性,可能有部份係數