研究內容與方法 - 應用模糊分群法推估路段速率之研究

3.1 問題特性分析

本研究利用具有 GPS 設備的公車所回傳的資料進行研究，然而公車並非專用的探針車輛，利用其回傳的資料提供路況時，將會產生一些問題，例如公車本身具有載客的任務，所以當公車在執行任務時，常會有不同於正常車輛的行為表現（如停車載客等），若是直接將回傳的速率資料加以平均作為路段的平均速率，可能會造成推估結果與實際路段速率不相符的誤差產生，進而影響推估速率的結果表現。

圖 2 為離峰時段探針車所回傳的資料表現，其中縱軸為速率，橫軸為時間，

該圖顯示公車每秒回傳一次的速率資料結果，從圖中可以觀察出回傳的速率資料不僅有明顯的高低起伏且探針車的最高速率在 40km/hr 以上，符合一般公車在離峰時的速度表現，而圖中低速或是速度 0 的點則是因為探針車因為載客或是遇號誌所產生的停等紀錄。

圖 2 探針車資料回傳示意圖（離峰）

圖 3 探針車資料回傳示意圖（尖峰）

此外，尖峰時間資料的回傳表現亦有所不同，如圖 3 所示，同樣地，橫軸代表時間，縱軸代表速率，該圖顯示同樣為公車每秒回傳一次的速率資料結果，右邊圖例則代表探針車的編號，共有 4 台探針車。從圖 3 可以發現，除了編號 1529 的探針車所回傳資料因低速或速率 0 的資料比例較少，且最高速率皆在 40km/hr 以上，較貼近離峰時間的表現之外，其他三輛探針車回傳的資料值，速度為 0 的資料佔整體回傳量的比例相當高且最高速率皆小於 25km/hr，即為道路情況壅塞時所產生的回傳現象。

因此，藉由上述兩項觀察結果可以推論，在離峰時，若直接平均所有的資料回傳值，將會明顯低估整個路段的平均速率，造成嚴重的誤差，將無法確實反應實際的道路路況；而在尖峰時間，車輛容易因為塞車而產生走走停停的現象，

由於無法明確判斷回傳的資料值，是否為正在加速中的速度，便無法切確表示其路況。所以，若能夠透過一套方法處理因載客或是遇路口號誌所產生停等的低速資料，亦或是能有效的保留符合實際路況的資料，對於路況推估的結果都將會有所幫助。

3.2 系統架構

針對路況推估計算之方法，本研究的系統架構如圖 4 所示。說明如下。

(1) 公車之 GPS 定位資料

針對每一公車在路段速率更新時間內，所回傳的所有紀錄時間、經緯度、

速度等定位資料。

(2) 擷取路段資料

針對特定路段擷取所有經過的公車資料。由於本研究主要在提供路段速率，所以必須先選取好特定的路段，就本研究而言，路段的可視為一固定長度的市區幹道，其中可包含多個路口，並在路段速率更新時間內，將所有經過該路段的公車資料擷取出來。

(3) 資料分群模式

擷取路段資料

資料分群模式公車之 GPS 定位資料

（時間、經緯度、速度）

路段速率計算與提供路況

收集完所有路段中的公車資料之後，進行資料群集分析，透過選擇不同群組內的資料，找出最符合該路況的速度群。

(4) 路段速率計算與提供路況

最後將所選擇的群組資料進行平均，作為提供的路況速率。

圖 4 系統架構圖

3.3 群集分析

群集分析（Cluster Analysis）是資料探勘（Data Mining）中常用的方式之一。

其目的是透過資料彼此間的”距離(Distance)”或是”相似程度（Similarity）”進行

模糊分群法（Fuzzy C-Means）簡稱 FCM，是根據 C-Means（或 K-Means）衍生而來的分群法，由 Dunn 在 1973 年提出[8]，並由 Bezdek[9]在 1981 改良成目 Fuzzy C-means 的應用步驟如下[4]：

(1) 決定群組數︰事先決定速度資料分群的群組數量，即要分成多少群。

(3) 計算中心點︰依照每筆速度資料與權重值的乘積以及所有權重值間的關係，

3.5 評估指標

在資料分析後的推估結果上，本研究採用文獻上常見的三種預測評估指標作為評估方式，分別是︰平均絕對值誤差率（Mean Absolute Percentage Error , MAPE）、均方根誤差（Root Mean Square Error, RMSE）與平均絕對誤差（Mean Absolute Error, MAE）作為依據，由於前兩者屬於相對誤差值，不受單位與數值大小之影響，判斷依據較為客觀；而後者為絕對指標值，可用以判定估計值與實際值之間的差距程度，屬於較主觀之評估指標。以下將個別介紹這些方法︰

3.5.1 平均絕對值誤差百分比（Mean Absolute Percentage Error, MAPE）

又稱為平均絕對誤差率，用以作為預測模式優劣之評估指標。主要因為

3.5.2 均方根誤差（Root Mean Square Error, RMSE）

均方根誤差為各次估計誤差平方和的平均值方根，可以了解模式估計的可靠性，若均方根誤差越小，表示估計可靠程度越高；相反地，若均方根誤差越大，

則表示模式估計可靠程度越低，可藉由此方法，了解本研究推估結果的可靠程度，

其計算方式如式 6 所示：

   

3.5.3 平均絕對誤差(Mean Absolute Error, MAE)

即平均每筆估計值與實際值的絕對殘差值，可以用來檢視本研究推估結果的

在文檔中應用模糊分群法推估路段速率之研究 (頁 16-23)