3.1 問題特性分析
本研究利用具有 GPS 設備的公車所回傳的資料進行研究,然而公車並非專 用的探針車輛,利用其回傳的資料提供路況時,將會產生一些問題,例如公車 本身具有載客的任務,所以當公車在執行任務時,常會有不同於正常車輛的行 為表現(如停車載客等),若是直接將回傳的速率資料加以平均作為路段的平均 速率,可能會造成推估結果與實際路段速率不相符的誤差產生,進而影響推估 速率的結果表現。
圖 2 為離峰時段探針車所回傳的資料表現,其中縱軸為速率,橫軸為時間,
該圖顯示公車每秒回傳一次的速率資料結果,從圖中可以觀察出回傳的速率資 料不僅有明顯的高低起伏且探針車的最高速率在 40km/hr 以上,符合一般公車在 離峰時的速度表現,而圖中低速或是速度 0 的點則是因為探針車因為載客或是 遇號誌所產生的停等紀錄。
圖 2 探針車資料回傳示意圖(離峰)
圖 3 探針車資料回傳示意圖(尖峰)
此外,尖峰時間資料的回傳表現亦有所不同,如圖 3 所示,同樣地,橫軸代 表時間,縱軸代表速率,該圖顯示同樣為公車每秒回傳一次的速率資料結果,右 邊圖例則代表探針車的編號,共有 4 台探針車。從圖 3 可以發現,除了編號 1529 的探針車所回傳資料因低速或速率 0 的資料比例較少,且最高速率皆在 40km/hr 以上,較貼近離峰時間的表現之外,其他三輛探針車回傳的資料值,速度為 0 的 資料佔整體回傳量的比例相當高且最高速率皆小於 25km/hr,即為道路情況壅塞 時所產生的回傳現象。
因此,藉由上述兩項觀察結果可以推論,在離峰時,若直接平均所有的資料 回傳值,將會明顯低估整個路段的平均速率,造成嚴重的誤差,將無法確實反 應實際的道路路況;而在尖峰時間,車輛容易因為塞車而產生走走停停的現象,
由於無法明確判斷回傳的資料值,是否為正在加速中的速度,便無法切確表示 其路況。所以,若能夠透過一套方法處理因載客或是遇路口號誌所產生停等的 低速資料,亦或是能有效的保留符合實際路況的資料,對於路況推估的結果都 將會有所幫助。
3.2 系統架構
針對路況推估計算之方法,本研究的系統架構如圖 4 所示。說明如下。
(1) 公車之 GPS 定位資料
針對每一公車在路段速率更新時間內,所回傳的所有紀錄時間、經緯度、
速度等定位資料。
(2) 擷取路段資料
針對特定路段擷取所有經過的公車資料。由於本研究主要在提供路段速 率,所以必須先選取好特定的路段,就本研究而言,路段的可視為一固定長 度的市區幹道,其中可包含多個路口,並在路段速率更新時間內,將所有經 過該路段的公車資料擷取出來。
(3) 資料分群模式
擷取路段資料
資料分群模式 公車之 GPS 定位資料
(時間、經緯度、速度)
路段速率計算 與 提供路況
收集完所有路段中的公車資料之後,進行資料群集分析,透過選擇不同 群組內的資料,找出最符合該路況的速度群。
(4) 路段速率計算與提供路況
最後將所選擇的群組資料進行平均,作為提供的路況速率。
圖 4 系統架構圖
3.3 群集分析
群集分析(Cluster Analysis)是資料探勘(Data Mining)中常用的方式之一。
其目的是透過資料彼此間的”距離(Distance)”或是”相似程度(Similarity)”進行
模糊分群法(Fuzzy C-Means)簡稱 FCM,是根據 C-Means(或 K-Means) 衍 生而來的分群法, 由 Dunn 在 1973 年提出[8],並由 Bezdek[9]在 1981 改良成目 Fuzzy C-means 的應用步驟如下[4]:
(1) 決定群組數︰事先決定速度資料分群的群組數量,即要分成多少群。
(3) 計算中心點︰依照每筆速度資料與權重值的乘積以及所有權重值間的關係,
3.5 評估指標
在資料分析後的推估結果上,本研究採用文獻上常見的三種預測評估指標作 為評估方式,分別是︰平均絕對值誤差率(Mean Absolute Percentage Error , MAPE)、均方根誤差(Root Mean Square Error, RMSE)與平均絕對誤差(Mean Absolute Error, MAE)作為依據,由於前兩者屬於相對誤差值,不受單位與數值 大小之影響,判斷依據較為客觀;而後者為絕對指標值,可用以判定估計值與實 際值之間的差距程度,屬於較主觀之評估指標。以下將個別介紹這些方法︰
3.5.1 平均絕對值誤差百分比(Mean Absolute Percentage Error, MAPE)
又稱為平均絕對誤差率,用以作為預測模式優劣之評估指標。主要因為
3.5.2 均方根誤差(Root Mean Square Error, RMSE)
均方根誤差為各次估計誤差平方和的平均值方根,可以了解模式估計的可靠 性,若均方根誤差越小,表示估計可靠程度越高;相反地,若均方根誤差越大,
則表示模式估計可靠程度越低,可藉由此方法,了解本研究推估結果的可靠程度,
其計算方式如式 6 所示:
3.5.3 平均絕對誤差(Mean Absolute Error, MAE)
即平均每筆估計值與實際值的絕對殘差值,可以用來檢視本研究推估結果的