第四章 旅行時間推估模式
5.1 預測模型
5.1.1 VD k-NN 模型
k-NN 屬於模式辨認的方法之一,主要概念是在特徵向量的空間中,將 k 個 幾何距離最接近的資訊分類出來,透過分類出來最相似的 k 筆已知資訊,來評估 未知資訊的一種方法。k-NN 中的 k 越大越能避免極端值的影響,但也容易將結 果平滑,導致準確性下降,因此 k 的筆數常列為一個需要校估的參數,尋找最適 合的 k 來提高評估的準確性。
將 k-NN 的概念應用在本研究的旅行時間預測模型上,要考慮的特徵向量空 間即為旅行時間,不同的路段、時階都是特徵向量空間中的一個樣本,而本研究 的樣本空間為第四章所建立的旅行時間歷史資料庫。要考慮什麼參數並找出最合 適的樣本來評估、預測未來的旅行時間,即是本研究的重點。
本研究是利用 VD 蒐集的即時資料透過 k-NN 法比對出最合適的旅行時間歷 史資料,因此將本研究的 k-NN 法稱為 VD k-NN 模型。本研究的 VD k-NN 模型 所考慮的參數有以下 6 個。
1. 選定預測起點至迄點位置,以 AVI 偵測器所在位置為基準,進行起迄點的 選擇。若 AVI 偵測器不在預測起點與迄點附近,則起迄點與 AVI 位置上的 差異,則使用 VD 資料進行旅行時間插補。
2. 設定歷史資料庫的搜尋範圍。例:1 個月、3 個月、6 個月。
3. 設定搜尋時間範圍T1,搜尋歷史資料庫中相似交通狀況的日期與時間點。例 如預測上午 8:00,T1為 15 分鐘,預測模型將搜尋旅行時間歷史資料庫中 7:45~8:15 中最相似交通狀況的日期與時間點。
4. 設定比對時間長度T2,決定使用多長的即時 VD 資料與旅行時間歷史資料庫 進行比對。例:預測上午 8:00,T1為 15 分鐘,T2為 10 分鐘,則使用 7:50~8:00 的即時 VD 資料,與旅行時間歷史資料庫中的 7:35~7:45、7:40~7:50、7:45~7:55、
7:50~8:00、8:05~8:15、8:10~8:20、8:15~8:25 等 7 筆資料。如上例,T1及T2
的關係可以如下圖 5-2 所示
8:00 7:55 7:50 7:45 7:40
7:35 8:05 8:10 8:15
T
1T
2圖 5-2 T1、T2差異示意圖
5. 設定 k 值。例 k=10、k=20、k=30。經本研究分析後,加入同一天的 k 限制 小於等於 3,原因將在 6.2 節參數校估結果中解釋。
6. 設定門檻值ɛ,傳統 k-NN 法僅比對出歷史資料庫中最相似的 k 筆資料,無 法判別比對的 k 筆是否適用於預測。因此本研究在預測模型中加入門檻值,
作為警示作用,當 k 筆最相似的旅行時間歷史資料誤差值高於門檻值,則代 表預測值可能不準確。藉由門檻值的概念,提出警示時則代表有其他參數需 要調整。例:旅行時間歷史資料庫不夠完整,無法比對出更有效的資料,需 要增加旅行時間歷史資料庫的範圍。
依照上述所介紹之參數,本研究將針參數 4、5 進行敏感度分析,找出國道 一號南下及北上預測範圍內,最合適的預測參數,來提升旅行時間預測的準確 性。
本研旅行時間的預測流程由下圖 5-3 所示。將蒐集之 VD 即時資料透過 k-NN 法與 VD 旅行時間歷史資料庫進行比對,從歷史資料庫中找出 k 筆最相似日期、
時階,接著分別將 k 筆對應的歷史日期與時階,由旅行時間歷史資料庫中計算出 k 個旅行時間,最後將 k 筆旅行時間平均,作為旅行時間預測結果。
VD即時資料
透過k-NN法比對VD旅行時間 歷史資料庫
k筆最相似的日期、時階
VD旅行時間歷史資料庫,延 遲加總
對應路段有無 AVI旅行時間歷
史資料
AVI旅行時間歷史資料庫,延 遲加總
是否為最後一個路 段(D)
是否完成k筆旅行時 間計算
將k筆旅行時間平均,作為旅 行時間預測結果
是 否
j=j+1
否 k=k+1
否
是
是
歷史旅行時間延遲加總 k=1
k筆旅行時間計算
j=O
圖 5-3 旅行時間預測流程圖
目前本研究的時間窗的設定為即時資料時間點正負 6 個時階,即 T1=30 分
)
AVI