第四章 實驗結果與分析
4.4 實驗結果分析
國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
4.4 實驗結果分析
首先,我們採用貝氏機率分類建立預測模型。實驗結果發現貝氏機率分類區辨力不 足,故不採用。
再採用類神經網路,分別針對「所有郵件收寄量」與「包裹快捷收寄量」建立預測 模型,發現以「包裹快捷收寄量」建立之預測模型區辨力較佳,針對村里建物重心的環 域資料亦可提出具鑑別度的預測結果。最後採用邏輯迴歸,不但建立之預測模型具有區 辨力,且可以得到與類神經網路相同的結論,即「採用包裹快捷收寄量建立預測模型之 區辨力較佳」,並將實驗中建立的兩種資料探勘模型區辨力分數整理如表 19。
表19:收寄量預測模型區辨力分數(實驗一) 類神經網路 邏輯迴歸 所有郵件 0.368 0.392 包裹快捷 0.792 0.812 資料來源:本研究整理。
然而在實驗過程中,會發現有少部份村里設點之預測收寄量為負值,經查閱 Microsoft MSDN 網站與相關社群,在 Microsoft SQL Server 2008 Analysis Services 中僅 有「Microsoft 時間序列」資料探勘技術可配合 MINIMUM_SERIES_VALUE 參數使用,
將預測限制為某個預期的範圍。例如可以指定任何一天的預期銷售數量絕對不能超過存 貨中的產品數[31]。而本研究採用之類神經網路、邏輯迴歸技術皆不適用。
然而本研究之目的是在於找出具有高效益的評估設點,而非評估現有設點裁撤的可 能性。故將預測值視為「相對分數」,容許出現負值。預測值高者視為具有高經濟效益 的設點,可考慮增設郵局,預測值低者則不在本論文討論範圍內。
因此,我們針對包裹快捷收寄量,以類神經網路與邏輯迴歸分別建立預測模型所獲 得的預測結果,將兩者之平均預測值分別排序,找出在兩種資料探勘技術中平均排名較 高的村里並再排序,茲列出總排名前 20 名村里如表 20。
‧
‧
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
以台北縣林口鄉湖南村為例,該村里 98 年 12 月人口數為 8,706 人,但因為村里面 積較廣而建物面積較為分散,故當以建物面積重心環域 300 公尺計算時,反而因周圍建 物較少造成建物人口數偏低,如圖 23 所示。
圖23:台北縣林口鄉湖南村圖層套疊
(★為村里評估設點,▲為競爭者設點,●為重要交通路口)
以台北縣蘆洲市正義里為例,該村里 98 年 12 月人口數為 10,246 人,但因為本研究 假設以單一建物重心判斷人口數歸屬,故當以村里建物重心環域 300 公尺計算時,雖然 村里建物重心周圍的建物相當多但面積較廣,計算單一建物重心後發現鄰近該村里建物 重心 300 公尺的建物僅有一處,故造成建物人口數偏低,如圖 24 所示。
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
圖24:台北縣蘆洲市正義里圖層套疊
(★為村里評估設點,▲為競爭者設點,●為重要交通路口)
上述舉例之建物面積過於分散及單一建物重心偏移情形,為本研究假設造成之誤 差,故不作額外處理,但日後可調整實驗假設或實驗方式,避免類似情形再發生,如此 亦可提高預測模型的可信度。
針對村里評估設點結果利用 ArcGIS 9.2 軟體將預估設點評選結果以圖層套疊的方 式表示,如圖 25。建議設點分佈於台北縣市,主要位於台北市中山區、台北市大安區、
台北縣林口鄉等地,且多位於高人口數或高人口成長率的鄉鎮之內。
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University
圖25:村里評估設點分析結果(實驗一)
(★為村里評估設點)
‧ 國
立 政 治 大 學
‧
Na tiona
l Ch engchi University