• 沒有找到結果。

第四章 時變係數模式構建

4.2 TVC 模式構建

構建TVC 旅行時間預測模式前,須先將歷史資料作分群,本研究的 TVC 模式將依照不同的星期別及尖峰、離峰時段將資料作分群,並建立各個分 群的迴歸模式,當收到一筆即時旅行時間資料時,判斷該筆資料屬於哪一 分群,將資料代入符合該分群的TVC 模式,即可輸出旅行時間預測值。以 下將相關預測步驟進行詳細說明,其構建模式之相關流程可表示如圖 4.2 TVC 模式構建流程圖所示。

圖 4.2 TVC 模式構建流程圖

資料庫進行分群處理

分群後的歷史 旅行時間資料

校估每個分群的迴歸 參數值

產生各個分群的迴歸模式

輸出旅行時間預測值 (時間 t) t=t+1 

即時旅行時間

(時間 t) 歷史旅行時間

資料庫

是否有發生 交通事故

將受影響的資料刪除

4.3 TVC 模式資料整理

(一) 確認路段上固定點的數量

在TVC 模式中,本研究利用 ETC 旅行時間當作應變數Y,兩固定點之 間的旅行時間當作自變數Xi,由於本研究利用偵測器的位置作為固定點,

因此要先確認所要預測的路段上共有多少偵測器來決定固定點的數量,才 可得知需要設多少自變數,由於我們要預測的路段是泰山到楊梅南下路段 的旅行時間,假設這路段上共有五個固定點 d1、d2、d3、d4、d5 如圖 4.3 所示,每五分鐘可蒐集到一組資料,共有四筆同時段、兩兩固定點之間的 旅行時間資料(d1~d2、d2~d3、d3~d4、d4~d5),因此可將這四筆旅行時間資 料設為自變數X1、X2、X3、X4,同時段從泰山收費站出發到楊梅收費站的 ETC 旅行時間資料設為應變數 Y。

(二) 將資料作整理

假設歷史資料庫中有 2008 年 1、2 月份各禮拜四的資料,我們要預測 3 月份各禮拜四早上 8:00 的旅行時間,首先依照分群方式先整理 1、2 月份 個禮拜四尖峰時段 7:00~9:00 的資料,共有 1/3、1/10、1/17、1/24、1/31、

2/7、2/14、2/21、2/28 這九天,將ETC 旅行時間資料設為應變數Y,兩 點間的旅行時間資料為自變數Xi,可將資料整理成如表 4.2 所示。當資料 整理完成後,即可匯入本研究所使用的統計軟體SPSS 進行線性迴歸模式分 析,以建立完整線性迴歸預測模式。

圖 4.3 TVC 範例路段示意圖

d2 d3 d4

d1 d5

表 4.2 TVC 資料整理表

本模式利用統計軟體 SPSS 進行迴歸模式分析,採用最小平方法校估 各分群的迴歸模式係數,並依照係數的顯著程度作調整,若有係數呈現不 顯著性,則予以刪除,再重新作回歸模式分析,直到所有係數都為顯著為 止。

Step4. 產生各個分群的時變係數模式

校估後的迴歸模式係數,代入迴歸式中建立完整迴歸式,並建立各個 分群的迴歸模式,提供旅行時間預測使用。

Step5. 輸出旅行時間預測值

將收到的同時段、兩兩偵測器間的旅行時間資料帶入該分群的迴歸模 式,可得到一旅行時間預測值,將此預測的旅行時間輸出,並將此旅行時 間存入資料庫中,提供給下一個時段的旅行時間預測模組使用。

4.4 預測精確度之衡量

本研究採用之預測精確度衡量準則,是以平均絕對誤差百分比(Mean Absolute Percentage Error, MAPE)為評估指標,來衡量預測值與實際值之差 異,其計算公式如式 4-13 所示:

 

       100%

 其中

為實際值  ,  為預測值, M:樣本數

MAPE 之值愈小,表示模式正確預測能力愈強,精確度愈高,根據 Lewis (1982) MAPE 值之大小,將模式預測能力分為四種等級,如表 4.3 所示,

當MAPE 小於 10% 時,表示模式之預測能力高度精確,MAPE 介於 10%~ 20%,

預測能力為良好。

表 4.3 MAPE 預測能力之等級

MAPE 值 預測能力

< 10% 高度精確 10%~20% 良好 20%~50% 合理

> 50% 不正確

MAPE  

  M 1    

      4‐13  

第五章 數值測試

根據前面三、四章所構建之k-NN 與 TVC 高速公路旅行時間預測模式,

本章將以國道一號高速公路作為測試對象,測試在實際高速公路上,兩種 模式的預測績效,並對兩種模式的預測績效進行評估。

5.1 模式構建與測試 5.1.1 測試路段

本章將以國道一號高速公路南下泰山收費站(35.3 km)到楊梅收費站 (71.4 km)作為測試路段,此路段總長為 36.1 公里,泰山收費站設為起點 位置,楊梅收費站為迄點,此路段上共有 15 個固定點,因此每五分鐘可收 到一組 14 筆兩兩固定點之間的旅行時間資料,表 5.1 為各固定點編號名稱 及位置。

表 5.1 各固定點編號名稱及位置

固定點編號 1 2 3 4 5

固定點名稱 1S32.7 1S37 1S39 1S42 1S47 固定點位置(公里) 32.764 37.76 39.256 42.75 47.507

固定點編號 6 7 8 9 10

固定點名稱 1S50 1S51 1S52 1S54 1S55 固定點位置(公里) 50.01 51.09 52.84 54.014 55.77

固定點編號 11 12 13 14 15

固定點名稱 1S57 1S60 1S63 1S65 1S68.1 固定點位置(公里) 57.13 60.873 63.26 65.598 68.05

5.1.2 預測時段

本研究將利用 2008 年 1、2 的歷史資料庫來預測以下兩個時段的旅行 時間,每五分鐘預測一次,以比較k-NN 與 TVC 的預測結果。

(一) 2008 年 3 月份每周四早上 8:00~9:00。

(二) 2008 年 3 月份每周六早上 10:00~11:00。

5.1.3 蒐集資料

本研究的k-NN 旅行時間預測模式,利用兩兩固定點之間的旅行時間資 料作比對,上述提到泰山到楊梅收費站路段總共有 15 個固定點,因此每五 分鐘可收到 1 組 14 筆同時段、兩兩固定點之間的旅行時間,由於要利用 1、

2 月份的歷史資料來作預測,本研究假設所蒐集這兩個月份的資料時皆無缺 漏及異常的情況發生,其旅行時間資料庫格式如表 5.2 所示,圖 5.1 為旅 行時間資料庫實際圖。

表 5.2 旅行時間資料庫格式

欄位名稱 資料內容 資料格式

VD_UP 上游固定點 S:南下,N:北上

VD_Down 下游固定點 S:南下,N:北上 Travel_Time 偵測器間旅行時間 單位:秒

TT_DateTime 日期、時間 年/月/日 時:分:秒

Weekday 星期別 1:星期日,2:星期一

依此類推

Section_NO 路段編號 ex:29,編號第 29 路段

Direction 方向 S:南下,N:北上

VD_Up_AveSpeed 上游固定點的平均速度 hr/km VD_Down_AveSpeed 下游固定點的平均速度 hr/km Probe_ AveSpeed 探針車平均速度 hr/km Probe_Speed_1 大客車探針車平均速度 hr/km Probe_Speed_2 小客車探針車平均速度 hr/km

圖 5.1 旅行時間資料庫

本研究利用ETC 資料作為實際值,與預測結果作比對,ETC 旅行時間 資料庫格式如表 5.3 所示:

表 5.3 ETC 旅行時間資料庫格式

欄位名稱 資料內容 資料格式

DetectionDatetime 日期、時間 年/月/日 時:分:秒 Start_TollNo 收費站起點代碼 14003: 泰山收費站

22002: 楊梅收費站 End_TollNo 收費站迄點代碼 同上

Dir 方向 S:南下,N:北上

Cartype 車種 31:小客車,41:大客車

Travel_Time 旅行時間 分鐘

Weekday 星期別 1:星期日,2:星期一 依此類推

圖 5.2 ETC 旅行時間資料庫

5.2 建立 k-NN 預測模式

依照本研究的k-NN 模式構建流程,建立完整預測模式。

(1) k-NN 資料分群

將資料依照星期別作分群,因此每周的資料可分成七群,當收到即時 資料,能立即判定屬於哪一分群,在分群的資料庫中比對資料。

(2) 比對時間範圍

由於考量預測路段為泰山收費站到楊梅收費站,此路段總長為 36.1 公 里,以時速 80 公里作計算,其旅行時間大約 30 分鐘,因此設置比對時間 範圍為前後半小時歷史資料。

(3) k 值設定

k 值設定方式為先設定各門檻值,以 50 為一間距單位,當距離量度小 於此門檻值,則判定與即時資料相近,可進行選取。檢視各門檻值內各預 測時段(每五分鐘為一預測時段)的 k 值及對應的誤差值,選取當時段誤差 最小的 k 值解,以此方式設定 k 值。

(4) 驗證預測結果

以泰山收費站到楊梅收費站的ETC 旅行時間資料作為實際值,與預測 結果作比對,以MAPE 結果判定預測績效,檢視預測能力。

5.3 k-NN 預測結果

(一) 2008 年 3 月份每周四早上 8:00~9:00。

在設定 k 值部分,門檻值最小設置為 100,因為門檻值小於 100 時會有 某些時段選取不到歷史資料,門檻值最大為 1200,當門檻值為 1200 時,每 個時段的歷史資料都已全部選取完畢,因此沒有必要再增加門檻值作選取,

各門檻值對應 k 值表如表 5.4 所示,因礙於篇幅故僅列出部分時段。

表 5.4 門檻值對應 k 值(1)

從表 5.5 得知各門檻值所對應的 k 值結果,接著必須要知道當各時段選取

已從表 5.5 得知各時段選取 k 值時所得到誤差結果,因此從各時段的

圖 5.3 k-NN 預測結果(1)

圖 5.4 3/6 k-NN 預測結果  

0 10 20 30 40

1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 分

時段

k-NN 預測(1)

k‐NN ETC

0 10 20 30

1 2 3 4 5 6 7 8 9 10 11 12 13

分 鐘

時段

3/6 k-NN預測

k‐NN

ETC

圖 5.5 3/13 k-NN 預測結果

圖 5.6 3/20 k-NN 預測結果

0 10 20 30

1 2 3 4 5 6 7 8 9 10 11 12 13

分 鐘

時段

3/13 k-NN預測

k‐NN ETC

0 10 20 30 40

1 2 3 4 5 6 7 8 9 10 11 12 13

分 鐘

時段

3/20 k-NN 預測

k‐NN

ETC

圖 5.7 3/28 k-NN 預測結果 (二) 2008 年 3 月份每周六早上 10:00~11:00。

門檻值最小設置為 600,最大為 1100,各門檻值對應 k 值表如表 5.7 所示,因礙於篇幅故也僅列出部分時段。

表 5.7 門檻值對應 k 值(2)  

時間

 

門檻值 600 門檻值 650 門檻值 700 門檻值 1100 2008/3/1 AM 10:00:00 91 99 103 104 2008/3/1 AM 10:05:00 57 87 101 104 2008/3/1 AM 10:10:00 63 88 101 104 2008/3/1 AM 10:15:00 67 90 101 104 2008/3/1 AM 10:20:00 95 99 101 104 2008/3/1 AM 10:25:00 96 99 101 104 2008/3/1 AM 10:30:00 82 91 96 104 2008/3/1 AM 10:35:00 97 101 103 104 2008/3/1 AM 10:40:00 82 90 95 104 2008/3/1 AM 10:45:00 83 88 96 104 2008/3/1 AM 10:50:00 85 93 95 104 2008/3/1 AM 10:55:00 89 93 96 104 2008/3/1 AM 11:00:00 2 15 41 104

0 10 20 30 40

1 2 3 4 5 6 7 8 9 10 11 12 13

分 鐘

時段

3/27 k-NN預測

k‐NN

ETC

2008/3/8 AM 10:00:00 102 104 104 104

2008/3/1 AM 10:45:00 2.7371 3.9676 5.5980 8.2275 2008/3/1 AM 10:50:00 3.7809 4.8422 5.7386 8.6763 2008/3/1 AM 10:55:00 1.2276 2.4551 3.6280 5.9343 2008/3/1 AM 11:00:00 22.3189 22.3275 9.9374 2.1385 2008/3/8 AM 10:00:00 0.3467 0.0582 0.0582 0.0582 2008/3/8 AM 10:05:00 1.1726 1.2106 1.2106 0.4232 2008/3/8 AM 10:10:00 9.9921 10.0377 10.0377 9.6480 2008/3/8 AM 10:15:00 2.6440 2.0773 2.0773 1.6801 2008/3/8 AM 10:20:00 4.3731 3.4780 3.5611 3.1947 2008/3/8 AM 10:25:00 4.1653 2.5161 2.5896 2.2382 2008/3/8 AM 10:30:00 5.3962 5.2370 5.2370 4.9087 2008/3/8 AM 10:35:00 5.2985 4.5809 4.6698 4.3511 2008/3/8 AM 10:40:00 4.2803 4.2613 4.2613 3.9512 2008/3/8 AM 10:45:00 2.4614 2.4614 2.4614 2.1531 2008/3/8 AM 10:50:00 3.0776 3.1941 3.1941 2.8927 2008/3/8 AM 10:55:00 2.8235 2.8451 2.8451 2.5505 2008/3/8 AM 11:00:00 1.8946 1.6909 1.3991 1.3991 2008/3/15 AM 10:00:00 4.1252 3.9953 3.9953 4.4718 2008/3/15 AM 10:05:00 3.3526 3.3168 3.3168 4.5994 2008/3/15 AM 10:10:00 2.8956 3.2064 3.6867 4.5713

2008/3/29 AM 10:50:00 2.3652 4.3598 5.1761 5.5036 2008/3/29 AM 10:55:00 0.8883 0.9284 0.9284 1.7319 2008/3/29 AM 11:00:00 0.3324 0.3324 0.5826 1.3751

從表 5.8 得知各時段選取 k 值時所得到誤差結果,從各時段的誤差值 當中,挑選最小的誤差結果,各時段選取 k 值所得到預測結果如表 5.9 所 示,最大一筆誤差在 3/1 上午 11:00,其誤差值約為 11%,整體預測MAPE 值約為 3.7 %。圖 5.8 為k-NN 預測結果,圖 5.9 至圖 5.13 為預測 3 月份 各禮拜六上午 10:00~11:00 k-NN 預測結果。

 

 

 

 

 

 

表 5.9 k-NN 預測結果(2)

圖 5.8 k-NN 預測結果(2)

圖 5.9 3/1 k-NN 預測結果

0 10 20 30 40 50 60

1 3 5 7 9 11131517192123252729313335373941434547495153555759616365 分

時段

k-NN 預測(2)

k‐NN ETC

0 10 20 30 40 50 60

1 2 3 4 5 6 7 8 9 10 11 12 13

分 鐘

時段

3/1 k-NN預測

k‐NN

ETC

圖 5.10 3/8 k-NN 預測結果

圖 5.11 3/15 k-NN 預測結果

0 10 20 30 40 50 60

1 2 3 4 5 6 7 8 9 10 11 12 13

分 鐘

時段

3/8 k-NN預測

k‐NN ETC

0 10 20 30 40 50 60

1 2 3 4 5 6 7 8 9 10 11 12 13

分 鐘

時段

3/15 k-NN預測

k‐NN

ETC

圖 5.12 3/22 k-NN 預測結果

圖 5.13 3/29 k-NN 預測結果

0 10 20 30 40 50 60

1 2 3 4 5 6 7 8 9 10 11 12 13

分 鐘

時段

3/22 k-NN預測

k‐NN ETC

0 10 20 30 40 50 60

1 2 3 4 5 6 7 8 9 10 11 12 13

分 鐘

時段

3/29 k-NN預測

k‐NN

ETC

5.4 建立 TVC 預測模式

一般在迴歸研究中,迴歸式所選用之解釋變數必須是有意義的,而且 變數之間必須互相獨立,與應變數間的相關程度應該要高。而迴歸式的各 項參數項需通過 F 檢定及 t 檢定,才能確保所建立之模式是有意義的,而 且較估出來解數變數之參數值不能為 0,最後再由判定係數R2來判斷所建 立之迴歸試中對應變數解釋能力的高低與否,經過以上個步驟,才能建立 一個完整的迴歸式,因此,本研究在線性迴歸的檢定上,使用 SPSS 統計軟 體,進行各種模式的檢定,其作法將說明如下。

(1) TVC 資料分群

將資料依照星期別作分群,再將每周資料區分成尖、離峰交通趨勢,

當收到即時資料,能立即判定屬於哪一分群,由於假日的交通狀況與平日 狀況不同,因此將獨立出來考慮。

(2) 資料整理

將蒐集到的資料依照 4.7 所介紹資料整理方式進行整理。

(一) 首先要預測 2008 年三月份各禮拜四早上 8:00~9:00,因為該時段屬於 尖峰時段,因此必須整理資料庫中 1、2 月份的禮拜四早上 7:00~9:00 尖峰時段的歷史資料,以此作迴歸模式。

(二) 預測 2008 年三月份各禮拜六早上 10:00~11:00,將整理資料庫中 1、

2 月份 9:30~11:30 的歷史資料,以此作迴歸模式。

(3) 驗證預測結果

以泰山收費站到楊梅收費站的ETC 旅行時間資料作為實際值,與預測 結果作比對,以MAPE 結果判定預測績效,檢視預測能力。

以泰山收費站到楊梅收費站的ETC 旅行時間資料作為實際值,與預測 結果作比對,以MAPE 結果判定預測績效,檢視預測能力。

相關文件