預測模型

第四章旅行時間推估模式

5.1 預測模型

5.1.1 VD k-NN 模型

k-NN 屬於模式辨認的方法之一，主要概念是在特徵向量的空間中，將 k 個幾何距離最接近的資訊分類出來，透過分類出來最相似的 k 筆已知資訊，來評估未知資訊的一種方法。k-NN 中的 k 越大越能避免極端值的影響，但也容易將結果平滑，導致準確性下降，因此 k 的筆數常列為一個需要校估的參數，尋找最適合的 k 來提高評估的準確性。

將 k-NN 的概念應用在本研究的旅行時間預測模型上，要考慮的特徵向量空間即為旅行時間，不同的路段、時階都是特徵向量空間中的一個樣本，而本研究的樣本空間為第四章所建立的旅行時間歷史資料庫。要考慮什麼參數並找出最合適的樣本來評估、預測未來的旅行時間，即是本研究的重點。

本研究是利用 VD 蒐集的即時資料透過 k-NN 法比對出最合適的旅行時間歷史資料，因此將本研究的 k-NN 法稱為 VD k-NN 模型。本研究的 VD k-NN 模型所考慮的參數有以下 6 個。

1. 選定預測起點至迄點位置，以 AVI 偵測器所在位置為基準，進行起迄點的選擇。若 AVI 偵測器不在預測起點與迄點附近，則起迄點與 AVI 位置上的差異，則使用 VD 資料進行旅行時間插補。

2. 設定歷史資料庫的搜尋範圍。例：1 個月、3 個月、6 個月。

3. 設定搜尋時間範圍T₁，搜尋歷史資料庫中相似交通狀況的日期與時間點。例如預測上午 8:00，^T₁為 15 分鐘，預測模型將搜尋旅行時間歷史資料庫中 7:45~8:15 中最相似交通狀況的日期與時間點。

4. 設定比對時間長度T₂，決定使用多長的即時 VD 資料與旅行時間歷史資料庫進行比對。例：預測上午 8:00，T₁為 15 分鐘，T₂為 10 分鐘，則使用 7:50~8:00 的即時 VD 資料，與旅行時間歷史資料庫中的 7:35~7:45、7:40~7:50、7:45~7:55、

7:50~8:00、8:05~8:15、8:10~8:20、8:15~8:25 等 7 筆資料。如上例，^T₁及T₂

的關係可以如下圖 5-2 所示

8:00 7:55 7:50 7:45 7:40

7:35 8:05 8:10 8:15

T

圖 5-2 ^T₁、^T₂差異示意圖

5. 設定 k 值。例 k=10、k=20、k=30。經本研究分析後，加入同一天的 k 限制小於等於 3，原因將在 6.2 節參數校估結果中解釋。

6. 設定門檻值ɛ，傳統 k-NN 法僅比對出歷史資料庫中最相似的 k 筆資料，無法判別比對的 k 筆是否適用於預測。因此本研究在預測模型中加入門檻值，

作為警示作用，當 k 筆最相似的旅行時間歷史資料誤差值高於門檻值，則代表預測值可能不準確。藉由門檻值的概念，提出警示時則代表有其他參數需要調整。例：旅行時間歷史資料庫不夠完整，無法比對出更有效的資料，需要增加旅行時間歷史資料庫的範圍。

依照上述所介紹之參數，本研究將針參數 4、5 進行敏感度分析，找出國道一號南下及北上預測範圍內，最合適的預測參數，來提升旅行時間預測的準確性。

本研旅行時間的預測流程由下圖 5-3 所示。將蒐集之 VD 即時資料透過 k-NN 法與 VD 旅行時間歷史資料庫進行比對，從歷史資料庫中找出 k 筆最相似日期、

時階，接著分別將 k 筆對應的歷史日期與時階，由旅行時間歷史資料庫中計算出 k 個旅行時間，最後將 k 筆旅行時間平均，作為旅行時間預測結果。

VD即時資料

透過k-NN法比對VD旅行時間歷史資料庫

k筆最相似的日期、時階

VD旅行時間歷史資料庫，延遲加總

對應路段有無 AVI旅行時間歷

史資料

AVI旅行時間歷史資料庫，延遲加總

是否為最後一個路段(D)

是否完成k筆旅行時間計算

將k筆旅行時間平均，作為旅行時間預測結果

是否

j=j+1

否 k=k+1

否

是

歷史旅行時間延遲加總 k=1

k筆旅行時間計算

j=O

圖 5-3 旅行時間預測流程圖

目前本研究的時間窗的設定為即時資料時間點正負 6 個時階，即 T1=30 分

)

AVI

在文檔中使用車輛偵測器和自動車輛辨識之資料預測高速公路旅行時間 (頁 55-60)

第四章 旅行時間推估模式

5.1 預測模型

5.1.1 VD k-NN 模型

T

T

第四章旅行時間推估模式