• 沒有找到結果。

第五章 公民參與知識之空間資料探勘

第三節 GIS資料探勘流程

在向量式的空間資料探索研究之中,有許多的地理資訊系統軟體經常扮演了 十分重要的空間分析工具(Eck, et al., 1999;林祥偉,2011),例如:GeoDa與 ArcView GeoDa(Anselin, 2004)可以運用空間自相關(spatial autocorrelation),呈現 面資料的群聚是否顯著,以及不同群聚型態在空間中的分佈狀態。Environmental Sciences Research Institute(ESRI) 的 ArcView 中 的 空 間 統 計 工 具 (Spatial Statistics),亦可進行類似的空間分析研究。在向量式GIS資料模式的空間資料探 勘研究中,以「點」資料為探勘研究的樣本最為常見,透過地理資訊系統將這個 資料以空間分布的方式展現,便能夠解讀出研究標的在時空中的趨勢(林祥偉,

2011)。

一、空間資料定位

本研究以臺北市1999市民熱線受理之違規停車處理與鄰里無主垃圾清運等 案件之點資料為基礎繪製GIS地圖,並進行資料空間分佈型態分析。藉由空間資 料的分析,挖掘出未來相關議題的管理知識。臺北市1999違規停車處理與鄰里無 主垃圾清運資料,是由臺北市政府研考會提供2010年4月至6月的記錄。

對於1999市民熱線的資訊而言,資料屬性錯誤便是最大的雜訊來源,不論從 民眾陳情資料的文字檔案自動轉換為地址、從來電顯示顯示電信公司登錄的地址 擷取資訊、或是直接由1999客服人員鍵入地址資料,都有可能產生許多種錯誤,

包括語音轉換時的口語化地名、來電顯示記錄資料不符與地址記錄不完整。此 外,可能出現同樣的陳情案件,於相近的時間內由不同的民眾call in,而造成同 一案件多次記錄的情況。因此,研究團隊一方面自臺北市研考會取得內含地址與 座標資訊的之違停與無主垃圾紀錄之外;另一方面則利用人工過濾的方式,將地 址資訊標準化,透過地址定位的方式找出對應的座標。本研究將確切違停與無主 垃圾資料之區位,利用TGOS的地址定位服務(內政部資訊中心,2010)轉換成 X、Y軸座標格式。資料處理的方式是將每一筆原始記錄做定位,逐筆找出各記 錄所在位置之經緯度座標,再透過座標轉換系統轉換成TWD97二度分帶X、Y軸 座標格式,以利於GIS系統進行分析,呈顯臺北市違停與無主垃圾之點空間分佈。

地址資料不全或相關訊息不足者,則排除在本分析的範圍之外。

二、檢視臺北市違停與無主垃圾空間分佈型態為聚集或離散

根據繪製2010年違停與無主垃圾陳情地圖,可以透過視覺分析初步瞭解各類 陳情案件的空間分布型態。利用ArcView 10.0軟體工具平均最近鄰分析 (Average Nearest Neighbor analysis),可進一步獲得較確切的評估結果。平均最近鄰分析指 數是由植物生態學者Clark及Evans(1945)所建立的指標,用來檢測空間點分布的 型態。平均最鄰近分析主要用於計算空間中點資料之分佈狀態,檢測資料分佈的 型態屬於隨機、聚集或分散。公式如下:

第五章 公民參與知識之空間資料探勘

107

: 最鄰近指數

: 觀察點間的最鄰近平均距離

: 觀察點間假設隨機分布的平均距離

平均最近鄰分析是用來計算點資料分佈狀況的指數,假若Z值大於1,則表示 臺北市違停或無主垃圾的資料是屬於分散的分佈;假若Z值小於1,則表示違停或 無主垃圾的資料屬於具有群集的分佈的現象;若計算分析結果數值接近於1,則 此資料屬於隨機的分佈狀態。

三、界定出臺北市違停與無主垃圾嚴重之區域

本研究以違規停車與無主垃圾地點作為定點核心,搜尋的半徑為1000公尺,

網格尺寸為100平方公尺,並計算半徑範圍內的陳情案件數,產生臺北市違停與 無主垃圾密度趨勢圖。利用核密度分析(Kernel Density Analysis)的功能,本研究 分級界定出2010年4月到6月臺北市違停與無主垃圾集中的區及里。同時進一步分 析這三個月臺北市這兩類陳情案件點密度深色區塊(點密度值高)的位置,找出 三個月中累計出現點密度值高的里別。該方法主要是在研究範圍中建立均勻的網 格(cell),以每個網格中心點透過搜尋半徑建立其搜尋的範圍,並藉此推估違停或 無主垃圾地點在空間上出現的密度,可用來表示這些事件發生群聚的強度。通常 採用建立核密度分配的方式推估,其數學關係式如下(Burt & Barber, 1996):

λ ∑

λ : 估算出之核密度值

K: 雙變量的概率密度函數,稱為核心Kernel b: 搜尋半徑

di: 網格中心點至點i的距離

四、界定出臺北市各區違停與無主垃圾中心位置

將違規停車與無主垃圾個案資料點輸入,利用ArcView軟體工具找出各月違 停與無主垃圾之平均中心點(mean center)與中位數中心點(median center)點,判斷 臺北市每月違規停車及無主垃圾的中心位置點位於每個行政區的哪個村里。再逐 月進行疊圖分析,加入時間的面向,分析2010年4月到6月臺北市違規停車與無主 垃圾中心位置的轉移動態過程,藉以分析這兩類陳情案件中心位置的走向。而平 均中心點與中位數中心點(意指各點到某一點的距離和最小)的數學公式如下:

1. 平均中心點:(x , y )=(

x 平均中心點之x座標

y 平均中心點之y座標

x 某點i之x座標 y 某點i之y座標 n 資料點總數

2. 中位數中心點:min∑ (x u) (y v)

x 某點i之x座標 y 某點i之y座標 u 地理中心點之x座標 v 地理中心點之y座標