• 沒有找到結果。

與現有預測系統比較分析

第五章 實證分析

5.5 與現有預測系統比較分析

在本小節中,將分別針對各個調查屬性進行分析,以絕對誤差比較本研究演 算法與現有預測系統的預測績效。

(1)整體分析

就整體資料而言,如表 35,本研究之平均絕對誤差比現有系統的平均絕對 誤差少了 36.47 秒鐘,以 ANOVA 針對兩個系統作分析,如表 36 所示,結果為 F(1, 21175)= 254.984,p<0.05,顯示本研究顯著優於現有系統的整體預測誤差。接著 將針對各種情境進行比較,分析本研究與現有系統在各種情境下表現之優劣。

表 35 整體誤差與現有系統比較結果

個數 最小值 最大值 平均數 標準差 現有系統 18610 0 1099 118.09 111.03

本研究 2567 0 630 81.62 87.64 表 36 整體資料與現有系統之差異分析

平方和 自由度 平均平方和 F 檢定 顯著性 組間 2999647.681 1 2999647.681 254.984 0.000 組內 249104392.1 21175 11764.08

總和 252104039.8 21176 (2) 早到與晚到分別分析

如將資料分為早到與晚到(正負值)分別加以探討,其結果如表 37 所示,

並以 ANOVA 針對兩個系統作分析,如表 38 所示。由表可知本研究在早到與晚到 資料中皆有比較好的表現。

表 37 早到與晚到資料與現有系統比較結果

個數 最小值 最大值 平均數 標準差 正值/早到 現有系統 11273 0 919 111.99 96.41

本研究 1172 0 630 73.01 87.16 負值/晚到 現有系統 7337 1 1099 127.46 129.79

本研究 1172 1 428 88.87 87.41

表 38 早到與晚到資料與現有系統之差異分析

情境 自由度

F 檢定 顯著性 組間 組內

正值/早到 1 12443 176.652 0.000 負值/晚到 1 8730 113.556 0.000

(3) 距離站位數分析

本部分主要探討車輛與目標站牌的距離對誤差所可能造成的影響。為求精簡 起見,本項分析以多、中及少站位數分類,多站位數為公車位置距離目標站牌 10 站以上,中站位數為距離 5~10 站,少站位數為距離 5 站以內。相關的分析結果 如表 39 所示,並以 ANOVA 針對兩個系統作分析,如表 40 所示。由表可知本研 究在三種情境中皆有比較好的表現。

表 39 站位數資料分析與現有系統比較結果

個數 最小值 最大值 平均數 標準差 少站位數 現有系統 6244 0 1026 83.47 81.81

本研究 925 0 587 48.46 58.43 中站位數 現有系統 8161 0 999 120.54 105.66

本研究 1001 0 630 72.07 73.07 多站位數 現有系統 4205 0 1099 164.74 137.8 本研究 641 0 554 144.41 108.82 表 40 站位數資料各與現有系統之差異分析

情境 自由度

F 檢定 顯著性 組間 組內

少站位數 1 7167 157.555 0.000 中站位數 1 9160 198.912 0.000 多站位數 1 4844 12.751 0.000

(5) 尖離峰分析

本部分主要探討尖離峰對誤差所可能造成的影響,因此資料分析以尖離峰加 以分類。尖峰分為上午尖峰(晨峰)7~10 點、下午尖峰(昏峰)16~20 點,離峰 為 10~16 點。相關的分析結果如表 41 所示,並以 ANOVA 針對兩個系統作分析,

如表 42 所示。由表可知本研究在三種情境中皆有比較好的表現。

表 41 尖離峰資料與現有系統比較結果

個數 最小值 最大值 平均數 標準差 上午尖峰 現有系統 5429 0 1026 106.32 96.8

本研究 1176 0 513 79.32 88.86 下午尖峰 現有系統 6911 0 898 131.34 114.17

本研究 101 0 479 55.49 71.96

離峰 現有系統 6270 0 1099 113.67 117.37 本研究 1290 0 630 85.77 87.27 表 42 尖離峰資料各與現有系統之差異分析

情境 自由度

F 檢定 顯著性 組間 組內

上午尖峰 1 6603 77.355 0.000 下午尖峰 1 7010 44.325 0.000 離峰 1 7558 65.449 0.000

(6) 平假日分析

本部分主要探討平假日對誤差所可能造成的影響,因此資料分析以平假日分 類,平日為星期一至星期五,假日為星期六與星期日。相關的分析結果如表 43 所示,並以 ANOVA 針對兩個系統作分析,如表 44 所示。由表可知本研究在兩種 情境中皆有比較好的表現。

表 43 平假日資料與現有系統比較結果

個數 最小值 最大值 平均數 標準差 平日 現有系統 11847 0 1099 122.6 107.88

本研究 1799 0 630 83.69 91.8 假日 現有系統 6763 0 1079 110.19 115.92

本研究 768 0 513 76.79 76.87 表 44 平假日資料與現有系統之差異分析

情境 自由度

F 檢定 顯著性 組間 組內

平日 1 13644 210.857 0.000 假日 1 7529 60.719 0.000

(7) 公車專用道資料

本部分主要探討公車專用道對誤差所可能造成的影響,因此以是否有公車專用道 進行資料分析,可得到有無公車專用道對於預估時間準確度之影響。相關的分析

結果如表 45 所示,並以 ANOVA 針對兩個系統作分析,如

表 46 所示。由表可知本研究在兩種情境中皆有比較好的表現。

表 45 有無公車專用道資料與現有系統比較結果

個數 最小值 最大值 平均數 標準差 有公車專用道 現有系統 11634 0 1099 126.21 119.55

本研究 212 0 435 87.72 87.1 無公車專用道 現有系統 6976 0 932 104.55 93.58

本研究 2355 0 630 81.08 87.69

表 46 公車專用道資料與現有系統之差異分析

情境 自由度

F 檢定 顯著性 組間 組內

有公車專用道 1 11844 21.765 0.000 無公車專用道 1 9329 114.309 0.000 (8) 列隊資料分析

本部分主要探討有無列隊(前方是否有其他公車列隊)對誤差所可能造成的 影響,因此以是否有公車列隊之情形進行資料分析,可得公車列隊對於預估時間 準確度之影響。相關的分析結果如表 47 所示,並以 ANOVA 針對兩個系統作分析,

如表 48 所示。由表可知本研究在兩種情境中皆有比較好的表現。

表 47 公車列隊資料與現有系統比較結果

個數 最小值 最大值 平均數 標準差 有列隊 現有系統 1438 0 786 134.52 126.72 本研究 231 1 479 72.43 74.6 無列隊 現有系統 17172 0 1099 116.71 109.5

本研究 2336 0 630 82.53 88.79 表 48 公車列隊資料與現有系統之差異分析

情境 自由度

F 檢定 顯著性 組間 組內

有列隊 1 1667 52.512 0.000 無列隊 1 19506 208.913 0.000

5.6 小結

由前面 5.4、5.5 節可知,本研究所設計的公車到站 k-NN 預測演算法與現有 系統比較有比較好的預測表現。就整體而言,本研究之平均絕對誤差為 81.62 秒,

相對於現有系統之平均絕對誤差 118.09 秒改善了 30.8%的誤差;在其他屬性分析 中,本研究的表現亦明顯優於現有預測系統,其中,以下午尖峰的誤差改善幅度 最大,與現有系統相比改善了 57.7%,其次為少站位數,與現有系統相比改善了 41.9%表示 k-NN 演算法用於下午尖峰、短距的到站時間預測有不錯的效果。

相關文件