應用k-NN模式於市區公車到站時間預測之研究

(1)

國

立

交

通

大

學

運輸科技與管理學系

碩

士

論

文

應用 k-NN 模式於市區公車到站時間預測之研究

The Study of Urban Bus Arrival Time Prediction

Using the k-NN Model

研究生：何佳儒

指導教授：王晉元教授

中

中華

華

華民

民

民國

國

國九

九

九十

十九

十

九

九年

年

年六

六

六月

月

(2)

應用k-NN模式於市區公車到站時間預測之研究

The Study of Urban Bus Arrival Time Prediction

Using the k-NN Model

研究生：何佳儒 Student：Chia-Ju Ho

指導教授：王晉元 Advisor：Jin-Yuan Wang

國立交通大學

運輸科技與管理學系

碩士論文

A Thesis

Submitted to Department of Transportation Technology and Management College of Management

National Chiao Tung University in partial Fulfillment of the Requirements

for the Degree of Master

in

Transportation Technology and Management June 2010

Hsinchu, Taiwan, Republic of China

(3)

應用k-NN模式於市區公車到站時間預測之研究

學生：何佳儒指導教授：王晉元博士

國立交通大學運輸科技與管理學系碩士班

摘要

先進大眾運輸系統（Advanced Public Transportation System, APTS）的公車到站時間預測能提供大眾運輸系統使用者有用的乘車資訊，降低民眾搭公車的等待時間，藉其提昇民眾搭乘公車意願，減少使用私人運具。在車隊管理方面，亦可提供業者公車到站時間，協助業者有效管理車隊。

市區公車的到站時間預測，需考量路口號誌及站牌上下客的停等時間，因此本研究以公車裝配之全球定位系統(Global Positioning System, GPS)回傳的即時資料為主要資料來源。本研究先利用 GPS 資料建立歷史資料庫，在資料比對上採用 k-NN 法預測公車到站時間。其中，因為實際的路段資料可能會有遺漏的情形，將歐基里德距離除上可取得的路段資訊數量作調整，以避免因較多的路段資訊造成較大的誤差。在計算路段平均速度時，採用延遲加總的方法，以反映車輛在行進中所遭遇的交通狀況。最後以台北市區公車為實測對象，以隨車調查的實際到站時間作驗證，探討在不同情況本研究方法的表現績效。就整體結果而言，本研究與顯著優於現有系統之預測表現，表示本研究之預測模式可用，且在少站位數及下午尖峰情境下，本演算法有比較好的表現。

關鍵詞：k-NN 法，市區公車，到站時間預測

(4)

The Study of Urban Bus Arrival Time Prediction Using the k-NN Model

Department of Transportation Technology Management

National Chiao Tung University

ABSTRACT

The estimation of urban bus arrival time using the GPS data is a

fundamental function of Advanced Public Transit Systems (APTS). This is a

difficult task due to the complications of traffic, signals, and bus stops.

We first propose a database schema to store the collected historical

data. Then, a k-NN based method is developed to derive the real time

estimation of bus arrival time. The real world data collected from various

routes in Taipei City is used for testing purpose.

The testing results show that the proposed method performs better than the

existing methods. The average error is within 1.5 minutes.

Keywords: k-NN method, urban bus, arrival time prediction.

(5)

誌謝

首先感謝這兩年給予我指導的王晉元老師，在完成論文的過程中，不厭其煩地幫我釐清問題點，協助我找出解決方法；並給我許多參與計畫的實作經驗，讓我可以從不同的角度觀察問題，亦可學習表達的能力；另外，在待人處世上也給與了我相當大的影響及鼓勵，期望在未來的日子裡依然能夠與老師維持良好的互動。接下來要感謝中華大學的蘇昭銘老師及系上的黃家耀老師，幫我找出了論文上的瑕疵以及一些說明不清之處，讓我有能力將這篇論文順利完成。也要謝謝系上的老師在這兩年給我的指導與體諒，讓我增進不少見聞。在研究的過程中，感謝學長姐彥佑、思文、小松、葉珮、健綸、黃恆昱光、老總等，在參與計畫的合作、研究或程式等各方面的幫助；謝謝一起努力的夥伴 Daisy、小惠、ANIGI、許大爺、思琪、志霖、怡婷，在為了論文而不眠的夜晚，帶給我許多的支持與幹勁。另外在 11 樓的生活中，雖然有做研究的苦悶，但因為許多人的陪伴與邀請，讓我能夠參許多的娛樂活動，將不好的情緒不定期的一掃而盡，豐富我原本可能超乾渴的研究生生活，謝謝 hoho、貽婷學姊、GoGoBoys、小朱、依潔、阿聰師、阿芬、大哥、劉婉、家誼、小薇和其他族繁不及備載的學長姐、同學、學弟妹們，儘管是小小的聊天或興趣上的交流，都是我這兩年不可或缺的調劑品。最後，也是最重要的，要感謝我的家人，願意在我的求學生涯中，給我無邊無際的支援與支持，讓我能夠勇敢面對所有的問題，所有的難關，所有的所有，讓我知道我有後盾可以讓我依靠，謝謝你們，在此僅以此篇論文獻給在我身邊的你們。

何佳儒謹誌于

國立交通大學運管所

中華民國九十九年六月

(6)

中文摘要... i 英文摘要... ii 誌謝 ... iii 目錄 ... iv 圖目錄 ... vi 表目錄 ... vii 第一章緒論 ... 1 1.1 研究動機 ... 1 1.2 研究目的 ... 1 1.3 研究範圍 ... 1 1.4 研究流程 ... 2 第二章文獻回顧 ... 4 2.1 無號誌化路口道路的旅行時間預測研究... 4 2.2 市區旅行時間預測研究 ... 6 2.3 小結 ... 8 第三章公車到站時間預測模式 ... 9 3.1 k-NN 模式介紹 ... 9 3.2 k-NN 之公車到站時間預測模式構建 ... 11 3.3 範例說明 ... 15 3.4 研究課題 ... 22 第四章資料處理 ... 24 4.1 資料過濾 ... 24 4.2 建立資料庫 ... 24 4.2.1 路線分段 ... 25 4.2.2 計算路段旅行時間 ... 25 4.2.3 劃分時段 ... 25 4.3 設定參數 ... 25

(7)

4.3.1 距離量度 ... 25 4.3.2 不完全路段的旅行時間計算 ... 26 4.3.3 k 值設定 ... 27 4.3.4 時間窗 ... 27 第五章實證分析 ... 28 5.1 現況說明 ... 28 5.2 資料蒐集 ... 30 5.2.1 交通資料 ... 30 5.2.2 實際到站資料 ... 31 5.2.3 現有系統預測資料 ... 31 5.3 參數設定 ... 32 5.3.1 k 值設定 ... 32 5.3.2 時間窗設定 ... 32 5.4 結果分析 ... 32 5.5 與現有預測系統比較分析 ... 38 5.6 小結 ... 41 第六章結論與建議 ... 42 6.1 結論 ... 42 6.2 建議 ... 42 參考文獻... 44 簡歷 ... 46

(8)

圖目錄

圖 1 研究流程圖 ... 3 圖 2 第一階建立資料庫流程圖 ... 11 圖 3 第二階段 k-NN 預測流程圖 ... 13 圖 4 範例現況說明示意圖 ... 15 圖 5 路線分段示意圖 ... 25 圖 6 計算路段旅行時間示意圖 ... 25 圖 7 範例不完全路段示意圖 ... 27 圖 8 現有系統一、四期廠商之到站時間演算流程 ... 29 圖 9 現有系統二、三期廠商之到站時間演算流程 ... 30 圖 10 k值與絕對誤差趨勢圖 ... 32 圖 11 預測誤差分配圖 ... 33

(9)

表目錄

表 1 範例路段長度 ... 15 表 2 範例歷史資料-路段旅行時間 ... 15 表 3 範例歷史資料-路段平均速度 ... 16 表 4 範例現狀旅行時間 ... 18 表 5 範例距離計算 ... 18 表 6 範例五筆歷史路段旅行時間計算(1) ... 19 表 7 範例五筆歷史路段旅行時間計算(2) ... 20 表 8 範例五筆歷史路段旅行時間計算(3) ... 20 表 9 範例五筆歷史路段旅行時間計算(4) ... 20 表 10 範例五筆歷史路段旅行時間計算(5) ... 21 表 11 範例五筆歷史路段旅行時間計算(6) ... 21 表 12 範例五筆歷史路段旅行時間計算(7) ... 21 表 13 路段資料欄位說明 ... 24 表 14 路段旅行時間資料 ... 26 表 15 歷史與現狀之路段旅行時間比較 ... 26 表 16 定時回報資料 ... 30 表 17 定點回報資料 ... 31 表 18 測試路線 ... 31 表 19 整體誤差結果 ... 33 表 20 早到/晚到誤差結果 ... 33 表 21 站位數資料分析 ... 34 表 22 距離站位數 ANOVA 分析 ... 34 表 23 站位數屬性差異分析 ... 34 表 24 尖離峰資料分析 ... 35 表 25 尖離峰情境 ANOVA 分析 ... 35 表 26 尖離峰屬性差異分析 ... 35 表 27 平假日資料分析 ... 36 表 28 平假日情境 ANOVA 分析 ... 36 表 29 公車專用道資料分析 ... 36 表 30 有無公車專用道情境 ANOVA 分析 ... 36 表 31 列隊資料分析 ... 37 表 32 有無列隊情境 ANOVA 分析 ... 37 表 33 演算法運算時間 ... 37 表 34 各路線運算時間 ... 38 表 35 整體誤差與現有系統比較結果 ... 38 表 36 整體資料與現有系統之差異分析 ... 38

(10)

表 37 早到與晚到資料與現有系統比較結果 ... 38 表 38 早到與晚到資料與現有系統之差異分析 ... 39 表 39 站位數資料分析與現有系統比較結果 ... 39 表 40 站位數資料各與現有系統之差異分析 ... 39 表 41 尖離峰資料與現有系統比較結果 ... 39 表 42 尖離峰資料各與現有系統之差異分析 ... 40 表 43 平假日資料與現有系統比較結果 ... 40 表 44 平假日資料與現有系統之差異分析 ... 40 表 45 有無公車專用道資料與現有系統比較結果 ... 40 表 46 公車專用道資料與現有系統之差異分析 ... 41 表 47 公車列隊資料與現有系統比較結果 ... 41 表 48 公車列隊資料與現有系統之差異分析 ... 41

(11)

第一章緒論

1.1 研究動機

先進大眾運輸系統（Advanced Public Transportation System, APTS）是以先進電子、通訊、電腦等相關科技協助大眾運輸提昇效率與服務水準，使民眾能夠多利用大眾運輸工具，減少使用私人運具，進而降低空氣污染及噪音等對環境所造成的負面衝擊，節省能源消耗。公車到站時間預測能提供大眾運輸系統使用者有用的資訊，降低民眾搭公車的等待時間與等待期間的不確定感，藉其提昇民眾搭乘公車意願與方便性。除此之外，在車隊管理方面，可提供業者公車到站時間，協助業者有效管理車隊。公車的到站時間預測屬於旅行時間預估預測的一種，旅行時間的預估預測根據道路屬性大致上能夠分為無號誌化路口及有號誌路口；根據預測的空間距離則可分為長距離及短距離。而公車的到站時間預測屬於有號誌化路口的旅行時間預測預測，其中若是班次較為密集的路線，預測的下一班公車為三、五站的短距離預測；若為班次較為稀疏的路線，則目標會延伸為整條路線的長距離預測。無號誌化路口的旅行時間預測，如近年來蓬勃發展的高速公路旅行時間預測演算法，至今，已有許多學者針對各種預估預測方法作研究探討；有別於高速公路車流同質性高、有明確起迄點的特性，市區的旅行時間預估預測需要加入更多的考量因素，如路口的停等，而預估預測公車的到站時間尚要考慮站牌的停等時間及是否設有公車專用道等差異，因此，市區公車的到站時間預估預測比無號誌預測更困難。有鑑於過去旅行時間預測文獻大部分以高速公路為研究對象，較少針對市區公車的到站時間預測加以探討，因此本研究以市區公車作為研究對象，並利用公車定位訊息當作資料來源，發展一套市區公車的到站時間預測演算法。

1.2 研究目的

本論文之研究目的為利用 GPS 資料為主要資料來源，發展一套市區公車的到站時間預測演算法，並且能夠廣泛應用到各種型態的公車路線。期望提供精確之公車到站時間，提供民眾及公車業者參考之用。

1.3 研究範圍

研究以市區公車作為研究對象，藉由實際取得的公車到站資訊，當作實際公車到站時間資料進行模式驗證。並進一步分析各種型態的績效表現，探討演算法在不同情境下有無明顯差異。本研究對象包括有無行駛公車專用道的路線、離峰與尖峰時段、平假日及站位數等屬性。

(12)

1.4 研究流程

本研究流程如圖 1 所示，其詳細步驟說明如下： (1). 確定研究問題與範圍決定實際案例的研究對象以及預測範圍起迄點，並根據研究背景與目的將問題進行清楚地描述與界定。 (2). 文獻回顧蒐集國內外研究旅行時間推估的相關文獻，分析市區公車與高速公路旅行時間預測的特性，針對市區公車歸納出各種演算法的優缺點，進而整理出本研究的研究方向。 (3). 建立預測模式利用公車 GPS 資料建立可行之公車到站時間預測模式。 (4). 資料處理所得之資料必須先進行過濾，排除非交通狀況所造成的異常資料點，以提高推估模式的精確度。 (5). 結果分析與模式校估將發展之公車到站時間預測模式應用在實際公車行駛路段，以驗證此模式是否適用於現實狀況，並由運作結果對模式作調整與修正。 (6). 結論與建議對本研究過程與結果提出結論與建議，並提出後續可以進行研究的方向。

(13)

(14)

第二章文獻回顧

市區公車的預測到站時間屬於旅行預測時間的一環，就文獻而言，旅行時間預測可分為有號誌化路口及無號誌化部分，而公車到站時間的預測屬於有號誌化路口的預測，以下針對這兩大部分進行文獻回顧：

2.1 無號誌化路口道路的旅行時間預測研究

無號誌化路口部分在高速公路的領域中已有許多學者投入研究，多數之研究以道路偵測器作為主要的資料來源。 Huang[1]、Kwon[2]及 Zhang[3]等人利用上、下游偵測器的點速度與路段長路求得路段中的平均旅行時間，進而依即時偵測到的交通資訊預測目標路徑的未來旅行時間。Huang[1]假設現況的旅行時間及歷史的旅行時間與未來的旅行時間存在自然對數的線性關係，研究以 PeMS 資料庫與實際探針車 GPS 資料作模式驗證，利用均方根誤差(Root Mean Square Error,RMSE)來衡量此模式的預測結果。 Kwon[2]假設整段路徑的旅行時間與當下每個路段旅行時間總和存在線性關係，研究以美國 I880 高速公路為對象預測未來 15 分鐘的旅行時間，實驗以平均絕對誤差(Mean Absolute Error, MAE)當作評估指標。Zhang[3]假設目前的旅行時間與未來的旅行時間存在線性關係，利用時變係數模式(time-varying coefficient)來預測未來的旅行時間，研究以美國 I880 高速公路為對象，利用平均絕對誤差(Mean Absolute Percentage Prediction Error, MAPPE)當作評估指標，結果顯示 TVC 的表現比用歷史平均資料預測的表現來得好。

Sun[4]、Li[5]、Kwon[6]等人利用現況與歷史資料先預測出未來時間的交通資料後，再以其資料推估出路段或路徑的旅行時間。Sun[4]利用局部線性迴歸(local linear regression)預測出未來時間點的速度資料，由路段長與速度預測值推估出路段的旅行時間，研究以 US-290NW 高速公路為對象，並以自動車牌辨識(Automatic Vehicle Identification, AVI)監控系統資料庫作為驗證資料。Li[5]假設旅行時間與車流量有關，利用關係式(1)推得旅行時間： Tt=A+Bt(Ft)n, Bt>0 , n≧1 (1) 其中 Tt為 t 時間的旅行時間，A 為自由車流下旅行時間，Bt為 t 時間的參數值，Ft為 t 時間的車流量，n 為指數；研究以卡門濾波器(Kalman Filter)預測未來 時間的車流量 Ft+1與係數 Bt+1。Kwon[6]假設相同星期別、相同時間點具有相同的流量、佔有率，試著找出佔有率、流量與旅行時間之間的關係，對探針車得到的實際旅行時間做線性迴歸。利用美國 I880 資料庫來建立旅行時間預測模式，實驗以均方根預測誤差(Root Mean Squared Prediction Error,RMSPE)作為評估指標。

Sun 等人[7]利用相鄰三組偵測器的速度推估出合適的二次方速度曲線，再使用積分找出路段的旅行時間，並加入路段速度最大值與最小值的範圍限制。研究對象為美國 I66 高速公路，測試路段長度為 4.82 英哩，實驗結果的相對誤差約為 5%。

(15)

間推估模組中將偵測器所得的流量、佔有率代入群集線性迴歸式路段推估旅行時間，依照上下游針測器的交通擁擠狀況將路段的交通分為四類，再根據不同交通 情況建立其線性迴歸模式；而預測模組應用 k-NN(k-Nearest Neighbors Model)與增 強時變係數 (Enhanced Time-Varying Coefficient Model)作預測。測試路段為美國高速公路 MD70 至 I695 長 25 英哩，研究結果的預測準確度平均約為 95.8%。 Yeon 等人[9]將路段分為擁塞、非擁塞兩種情況，非擁塞情況下路段旅行時 間為自由車流速度下的旅行時間，在擁塞情況下則以 T(f)=a×ebf_{關係式推估路段} 旅行時間，其中 T 為旅行時間，f 為車流量，a、b 為校估參數，收集資料的時間 間隔為 1 分鐘。實驗對象為 US202 高速公路，測試路段長為 8 英哩，預測結果以統計檢定檢驗與實際旅行時間是否有差別，而在 99%信賴水準下的檢定結果為推估值與實際值無差別。 Cortes 等人[10]利用反覆推估的方式求得路段的旅行時間，假設路段速度為上下游偵測器速度的線性組合： (2) 為 t1時間的路段速度，為在 t1時間的上游偵測器速度，為行駛目標路段的旅行時間，為在時間的下游偵測器速度，α為權重參數。如果路段速度已知，則路段旅行時間為： (3) 其中 X12為路段長度，由式(2)與式(3)進行反覆地計算，直到所得的 tt12與上一回 合計算所得的 tt12的差在可接受的範圍內，則輸出為此路段的推估旅行時間。測試路段為美國 I405 高速公路。 Paterson 與 Rose[11]利用排隊理論來描述在路段中的車輛通過情形，將路段的旅行時間分為自由車流下的旅行時間與延滯時間的總和，假設車流中的車輛皆符合先進先出的行為方式，利用上下游偵測器即可計算路段中的車輛數，如果車輛數小於道路容量，則路段旅行時間為自由車流速度下的旅行時間；反之，車輛數大於道路容量，代表此路段發生擁塞情形，則需加入延滯時間。在 GPS 系統開始發展後，亦有學者開始使用 GPS 當作資料來源預測高速公路的旅行時間。Hellinga[12]使用探測車推估路段的旅行時間，測試抽樣偏差對調查估計的影響。該研究理論基礎為等候理論，可以得到在平均延滯的抽樣估計中，其到達時間的分配，偏差及調查比例這兩項因素將導致計算結果的誤差。此研究的推導與模擬分析顯示，若以調查為基礎的平均旅行時間為基準之模式下，其旅行時間會因為抽樣誤差而導致預測結果偏高。使用單一交通資料來預測旅行時間會因為資料的屬性及缺漏有所偏誤，因此在多種交通資訊可取得的情況下，發展出利用資料融合的技術來預測旅行時間。 Hellinga 及 Gudapati[13]提出多種交通資料來源融合為單一路段旅行時間的推估模式。研究使用 VD、GPS 及駕駛路況回報等資料庫來發展資料融合的模式，如果有多種資料來源則先各自推估旅行時間後，再進行資料融合步驟得出最後所要的路段旅行時間推估值。 Choi 及 Chung[14]使用 VD 與探針車 GPS 資料來推估旅行時間。利用上游偵

(16)

測器的速度與路段距離求出一分鐘的路段旅行時間，再用 voting 資料融合方式將一分鐘的資料合併為五分鐘的資料；由 GPS 所蒐集的資料利用地理資訊系統技術找出路段的旅行時間。由兩種交通資料所得的旅行時間運用 Bayesian pooling 方式融合，得出最後所要的路段旅行時間。

Soriguera[15]、Faouzi[16]等人使用 VD 與 ETC 資料來推估旅行時間。 Soriguera[15]將 VD 資料分別利用 spot speed 和 cumulative flow balance 方法推估 出路段旅行時間後，運用 fuzzy logic 融合兩個推估值為 ITT；將 ETC 所得的路段 旅行時間當作 RTT。利用貝氏定理融合 ITT 與 RTT 得出最後所要的路段旅行時間。 Faouzi[16]將路段上的速度以距離最近的 VD 速度為準，再以路段長除以速度求出路段旅行時間；推估出的路段旅行時間與 ETC 所得的路段旅行時間以 Dempster-Shafer 演算法融合，得出所要的路段旅行時間。 Nanthawichit 等人[17]利用路段長與路段速度求得旅行時間。路段區域的分配原則是將 VD 的位置盡量分配到區域中間，以其速度當作路段的平均速度；若區域中有回傳 GPS 資料，則依照資料的可靠度加權平均。所得的旅行時間推估值運用卡門濾波器(Kalman Filter)做短期間的測模式。 Smith 及 Demetsky[18]對 k-NN 法進行績效評估，分析比較以下四種交通流量 的預測方法：歷史平均法，時間序列法、類神經網路法與 k-NN 法。評估的方法 為利用歷史的流量資料預測未來的流量再和實際值做比對，判斷那一個方法的績 效較差，結果發現當歷史資料大時，k-NN 法所預測的誤差結果比其他三種方法 所得到的結果誤差來得小，有較佳的預測能力。Smith、Williams 以及 Oswald[19] 將權重(Weight)的想法加入 k-NN 的模型，考慮目前的流量可能會與先前的交通流 量有關係，但是隨著時間距離的增加，其影響的程度愈小，所以利用權重的方法進行修正，將不同時間所造成的影響納入考慮。 Clark[20]除了流量外，試著利用 k-NN 法試著針對其他可蒐集到的交通資訊 進行預測，如速度和佔有率。接著進行一一分析和交叉分析，結果發現當同時利用流量、佔有率和速率這三項變數進行分析時，所得到的預測值相對於個別比對而言，誤差有下降的現象，所以愈多變數進行討論可以得到更精確的結論。

2.2 市區旅行時間預測研究

市區旅行時間預測屬於有號誌化路口的部份，市區的平面道路屬於開放性的道路，行駛在路上的車種多樣，所包括行進速度範圍廣泛，且於非限制路段能夠自由駛離車道或在路口轉向，在路上亦會遭遇到號誌停等的狀況，其交通狀況的變化較大。Choi 等人[21]利用 GPS 以及電子地圖來計算路段之動態旅行時間，並針對測量路段旅行時間的技術作比較；另外在都市幹道的網路上，路段旅行時間是最易受到號誌系統與環境交通因素的影響。因此，為得到路段的旅行時間，最常用的方法是浮動車輛法(floating car method)，推估點至點間的旅行時間。實驗利用所蒐集到的實際路網資料與此研究所計算出的旅行時間值進行績效評估，可以驗證結果準確。Robinason 和 Polak[22]利用 VD 資料來預測市區的路段旅行時 間，以 k 最近鄰點法建立預測模式，研究與回歸方法做比較，在各種情境下皆顯 示有較好的預測能力。

(17)

在市區旅行時間預測的領域中又以公車的到站時間預測為大宗，公車行走的路線、班次固定，大部分的公車業者皆會在營運中的公車車輛上裝配 GPS 相關系統，記錄公車實際的行車、停等狀況，因此大部分的公車到站時間預測研究以公車的 GPS 訊息當作預測的資料來源。

Shalaby 及 Farhan[23]利用 GPS 及自動乘客計數器 (Automatic Passenger Counting, APC)資料預測市區公車的到站時間。研究模式將到站時間分為路段間的旅行時間與停靠站的乘客上下車時間，分別利用卡曼濾波器來預測停靠站間的車輛行駛時間與旅客到達率；測試資料為美國多倫多地區的 5 號公車路線，實驗結果的 MRE 約為 6%、平方根相對誤差(Root Squared Relative Error, RSRE)約為 7.3%。 Patnaik 等人[24]利用 APC 資料預測市區公車的到站時間。研究路段區域以高需求量的公車停靠站作分別，利用線性迴歸模式預測任兩站間的公車旅行時間，其變數包括兩站之間的距離、兩站之間的累積停等時間、兩站之間的累積停等站數及區別時段的伯努力變數；實驗結果的 RMSE 約為 3%，R2_{介於 0.96 至 0.99} 之間，顯示研究的迴歸模式具有良好的預測能力。 Chung 及 Shalaby[25]利用 GPS 資料預測校車的到站時間，利用前五天的歷史資料推估歷史一般狀況，再用現況的每站延誤時間與當天的天氣狀況調整校車的到站時間；研究並考慮到實際應用時，發佈的到站預測時間比實際到達時間晚的話，會造成學生無法搭上校車的情況，因此加入調整機制將發佈的到站預測時間輕微提早。研究方法與歷史移動平均法、迴歸法比較，在各種情境下皆顯示有比較低的預測誤差。吳佳峰[26]利用車輛歷史資料預測公車的到站時間，將旅行時間分為車輛運行時間與車輛停等時間兩部分，依 GPS 所回傳的實際車輛行駛速度及前車經過路段的旅行時間調整預測車輛運行時間，並隨車輛實際停等狀況調整未經過路段的預測車輛停等時間；最後將所有車輛未經過路段之預測車輛運行時間及預測車輛停等時間加總，即可得到預測車輛旅行時間。研究以國內客運業者資料做測試，結果發現模式在一般時段有不錯的預測能力，而當遭遇非重現性擁塞時，亦能夠過調整機制將預測的旅行時間控制在可接受之誤差範圍內。陳建名[27]利用 GPS 資料預測市區公車的到站時間，將公車旅行時間切割為車輛運行時間和車輛停等時間，其停等時間包括於交叉路口停等號誌之停等時間，及公車在停靠站牌載客上下車所發生之停等時間。預測車輛運行時間在公車正常情況下行駛時，使用歷史平均速度作預測，當交通狀況出現異常狀況時，則使用前車資訊作預測。在停等時間之預測，以改變點分析將歷史資料庫依車速高低之不同型態切割成數個不同時段，而在不同車速之時段，此研究將以不同預測模式來預測公車於交叉路口停等號誌之停等時間。

(18)

2.3 小結

在本章之文獻回顧可發現，國外實作之旅行時間預測系統主要多針對城際間之高速公路，而較少針對市區路網。在高速公路的環境下，旅行時間之變動因素主要來自車流速度（此速度與車流量以及道路容量有關），以及突發之事故狀況，為較單純之系統環境，大部分使用 VD 資料建立預測模式。反之，預測市區內旅次之旅行時間，則必須多加考慮路口號誌造成的停等情況，若是預測對象為市區公車的到站時間，則需考量到站牌上下客的停等時間，大部分研究以 GPS 訊息當作資料來源，以取得車輛實際的行走、停等的時間及位置。在有關旅行時間預測方法的部分，迴歸法是常用的預測方法，可運用在預測旅行時間週期性的變化上，但因為迴歸法缺少彈性變化，無法即時反應旅行時間 的變化情形。最近興起的 k-NN 方法就其精神亦是文獻常用的相似歷史資料比對 的方法，在非號誌化路口的路網上利用 k-NN 法預測旅行時間的文獻亦日益增多， 其研究結果也證實預測方法有不錯效果。對於國內實際的市區公車的預測到站時間由於大部分公車班距比較短，預測的空間距離比較短，短時間內交通狀況變化不會太大，因此大部分並沒有採用預測的方法，而是以現狀的推估為主；但將其運用在公車班距長、預測的空間距離長的路線上，則會因為交通狀況改變而容易產生比較大的預測誤差。因此本研究嘗試引進在無號誌化路口之旅行時間預測上 有良好表現的 k-NN 法，用於市區的公車到站時間預測上，檢視是否能夠把預測 的準確度更加以提升。

(19)

第三章公車到站時間預測模式

本研究的目的在於如何利用即時的交通資訊進行旅行時間之預測，由於旅行時間會隨著路上交通情況的不同而有不同的現象，若車輛遭遇相似的交通狀況， 則車輛行駛的時間亦相似；因此本研究將利用 k-NN 法找出相似交通資訊的歷史 資料預測旅行時間。以下將針對 k-NN 模式進行介紹，並且說明模式所需要的參 數。

3.1 k-NN 模式介紹

k 最近鄰法(k-Nearest Neighbor Method，k-NN Method)是一種利用比較歷史資

料與即時資料，找出擁有相同特性的資料的方法。最初是由 Benedetti[28]、Stone[29] 及 Tukey[30]這些學者提出了最近鄰法(nearest neighbor method)的概念發展而來。這些學者利用一元位置估計(Univariate Location Estimators)，建立了無母數迴歸式的模型，進而延伸出最近鄰法的概念，利用輸入的資訊找尋出與資料庫中最相似的資料。

Altman[31]將以上的研究進行整理，將一元位置估計延伸至多元位置估計 (Multivariate Location Estimators)並且提出了 k-NN 法，該方法將歷史資料區分群， 再將輸入資料與分群後的歷史資料作比對，比對出該資料與那 k 組歷史資料較為 類似，即可利用 k 組歷史資料預測未來資料。 Robinson 及 Polak[22]提出了建立 k-NN 模型時應該先設定的條件。 (1) 決定模式中的特徵向量。 k-NN 法中最重要的第一步即是要決定要比對的內容為何，如果選取 的特徵向量太少，則無法有足夠的特徵去分辨歷史資料，可能會有不同的輸出值卻有相似的特徵向量；反之，若是選擇太多的特徵向量，則可能產生維度的問題，讓不相關的特徵向量影響距離量度，而選到不好的歷史資料。 (2) 設定距離量度(distance metric)。距離量度為兩組資料相似程度之指標。常見得距離量度主要有下列三種：歐幾里得距離(Euclidean distance) 假設兩個事件 xi、xj，每個事件有 m 個屬性，xip為 xi事件的第 p 個屬性，xjp為 xj事件的第 p 個屬性，則 xi事件與 xj事件間的歐幾里 得距離 dij如(4)式所示： (4)

(20)

馬式距離(Mahalanois distance)

馬式距離 D2_{可用矩陣如(5)式所示：}

Dij2=(Xi-Xj)T Cw-1(Xi-Xj) (5)

其中 Xi為 xi事件的屬性矩陣，Cw為聯合組內共變異數矩陣

(pooled within-group covariance matrix)。馬式距離為歐幾里得距離平方的一種延伸： Dij2=(Xi－Xj)TCw-1(Xi－Xj) =[xi1-xj1 xi2-xj2 xi3-xj3 … xim-xjm] (6) 意即在求 dij2時，Cw-1=Cw=I(單位矩陣)，換言之，當各軸的單位長度相等，且各軸互為垂直時，歐幾里得距離平方與馬式距離相同。街道區距離(city block distance)

假設每個事件有 m 個屬性，則第 i 個事件與第 j 個事件間的街道 區距離如(7)式所示： (7) 然而距離量度的判斷目前並沒有一個很好的準則來對各種資料進行距離量度的判斷，在面對不一樣的環境條件，分析人員必須自行建立一套準則來做處理，因此隨著不同的特徵分群，將會採用不同的距離量度以判斷即時資料與那一個歷史資料類似。 (3) 決定判斷類似樣本的數量。 決定 k 值是決定預測誤差大小的關鍵步驟，若選取太大或太小的 k 值，容易產生較大的預測誤差。k 值的決定通常為測試選取不同 k 值所得 出的誤差結果，由此選出使誤差最小的 k 值，以此設定 k 值，以求出預 測誤差可盡量減少。 由以上 k-NN 法的介紹可知，k-NN 法是利用輸入資料比對歷史資料，找出擁 有相同特性的歷史資料，預測未來值；且若要使用 k-NN 演算法必須蒐集交通資 訊，建立比對的歷史資料庫，設定相關參數包括比對特徵向量、距離量度計算。 以下將先針對 k-NN 的演算機制建構適合本研究的公車到站預測演算法，接著根 據上述文獻及模式建立過程，提出本研究所需要探討的研究課題，並提出研究設計的解決方法。

(21)

3.2 k-NN 之公車到站時間預測

本研究利用 k-NN 方法建立 找與即時樣本相類似的歷史交通狀況到站時間，利用即時的交通資訊比對歷史交通資訊時間下擁有類似的交通資訊時間。進行 k-NN 預測前需先建立歷史資料庫為第一階段建立資料庫的流程圖詳細步驟說明如下：步驟 1：蒐集交通資料取得市區公車的步驟 2：資料過濾過濾不合理的資料圖

之公車到站時間預測模式構建

方法建立公車到站時間預測模式，希望可以利用該方法尋找與即時樣本相類似的歷史交通狀況。假設在相同的交通趨勢變化下會有相同的利用即時的交通資訊比對歷史交通資訊的方法，能夠辨識出哪時間下擁有類似的交通資訊，並由該歷史時間所對應的到站時間預測目前的預測前需先建立歷史資料庫，以提供演算法的資料比對過程為第一階段建立資料庫的流程圖：：蒐集交通資料市區公車的即時資料。過濾不合理的資料，以避免異常的歷史資料造成預測的誤差圖 2 第一階建立資料庫流程圖希望可以利用該方法尋假設在相同的交通趨勢變化下會有相同的能夠辨識出哪些歷史時間預測目前的到站以提供演算法的資料比對過程，圖 2 以避免異常的歷史資料造成預測的誤差。

(22)

步驟 3：將路線依站牌分段：以站牌為切割點，將路線分為數個路段。步驟 4：劃分資料庫時段時段內的資料要能代表當時的交通狀況，以交通狀況改變幅度不大的時段為資料畫分的範圍。步驟 5：計算路段平均速度步驟 5.1：搜尋時段內的速度資料依劃分的時段，依序搜尋非進離站範圍的路段速度資料。步驟 5.2：加總平均速度資料將搜尋出來的速度資料加總平均，得到路段平均速度。步驟 5.3：輸出路段平均速度資料輸出每時段每路段的路段平均速度資料。步驟 6：計算路段平均速度步驟 6.1：計算每車次的路段旅行時間將每車次依進離站資訊計算路段旅行時間，亦即相鄰兩站的進站時間差為路段的旅行時間。步驟 6.2：加總平均時段內的每車旅行時間依照劃分時段，將時段內的每車旅行時間加總平均，得到每時段的路段旅行時間。步驟 6.3：輸出路段旅行時間資料輸出每時段每路段的路段旅行時間。步驟 7：儲存至歷史資料庫計算出來的路段平均速度及路段旅行時間，依資料格式儲存至資料庫。 第二階段為依照上述 k-NN 的演算法構建市區公車的到站時間預測模式。當 有一筆即時資料輸入時，從歷史資料庫中先搜尋出符合時間窗限制的歷史資料，再比對即時與歷史資料，得出各筆歷史資料與即時資料的距離量度，從各距離量 度中尋找與即時資料最鄰近的 k 筆歷史資料，並將此 k 筆資料的路段旅行時間作 加總平均，再依延遲加總的機制算出目標的總旅行時間，即為所得之預測結果。 圖 3 為本研究構建的 k-NN 預測流程圖：

(23)

詳細步驟說明如下：步驟 1：蒐集交通資料取得市區公車的即時資料。假設某路線現況的路段旅行時間為_!"，t 為 預測時間，l 為路段。 步驟 2：搜尋符合時間窗限制的歷史資料圖 3 第二階段 k-NN 預測流程圖 1 11 1....蒐集交通資訊蒐集交通資訊蒐集交通資訊蒐集交通資訊 ( (( (時間時間時間時間tttt)))) 3 33 3....比對即時資料與歷史資料比對即時資料與歷史資料比對即時資料與歷史資料比對即時資料與歷史資料 4 44 4....選取選取選取k選取kkk筆歷史資料筆歷史資料筆歷史資料筆歷史資料平均平均平均 平均k筆歷史資料之路段筆歷史資料之路段筆歷史資料之路段l的筆歷史資料之路段的的的旅行時間旅行時間旅行時間旅行時間 6 66 6....輸出到站時間的預測值輸出到站時間的預測值輸出到站時間的預測值輸出到站時間的預測值 ( (( (時間時間時間時間tttt)))) t=t+1 2 22 2....搜尋符合時間窗限制搜尋符合時間窗限制搜尋符合時間窗限制搜尋符合時間窗限制的歷史資料的歷史資料的歷史資料的歷史資料由路段由路段由路段 由路段l的平均速度與路的平均速度與路的平均速度與路的平均速度與路段長算出路段旅行時間段長算出路段旅行時間段長算出路段旅行時間段長算出路段旅行時間是否到達預測是否到達預測是否到達預測是否到達預測目標站牌目標站牌目標站牌目標站牌路段路段路段 路段l是否有平均是否有平均是否有平均是否有平均旅行時間旅行時間旅行時間旅行時間總旅行時間總旅行時間總旅行時間總旅行時間+=+=+=+= 路段路段路段 路段l平平平平均旅行時間均旅行時間均旅行時間均旅行時間下一路段下一路段下一路段下一路段 l=l+1 是是是是否否否否否否否否總旅行時間是否總旅行時間是否總旅行時間是否總旅行時間是否超過記錄時段超過記錄時段超過記錄時段超過記錄時段總旅行時間總旅行時間總旅行時間總旅行時間====0000 車輛所在路段為路段車輛所在路段為路段車輛所在路段為路段 車輛所在路段為路段l 搜尋搜尋搜尋搜尋kkkk筆歷史資料筆歷史資料筆歷史資料筆歷史資料下一時段資料下一時段資料下一時段資料下一時段資料否否否否是是是是是是是是 5 55 5....延遲加總路段延遲加總路段延遲加總路段延遲加總路段旅行時間旅行時間旅行時間旅行時間

(24)

訂定時間窗範圍，搜尋預測時間前後時間段內的資料。利用 k-NN 法的歷史資料庫通常都很龐大，若是每次計算過程都要比對全部的歷史資料，則需要花費許多的運算時間；因為每日同時段的交通狀況相似，故本研究訂定搜尋時間窗範圍，只搜尋預測時間前後時間段內的資料。假設歷史旅行時間為_#"_$_%_&，dm為日期，tn為時間，l 為路段。搜尋|t-tn|<tw 的歷史資料，tw 為時間窗範圍。 步驟 3：比對即時資料與歷史資料利用距離量度比對即時與歷史資料，以得到各筆歷史資料與即時資料的差異程度。其距離公式為 '(#$%& )! #$%& " (8) 步驟 4：選取 k 筆歷史資料 依照距離量度的大小排序，選取 k 筆最小距離的歷史資料。假設 M={h1,h2,h3,…,hk}為 k 筆距離最小的歷史資料集合，h1為距離最小的歷史資料。步驟 5：延遲加總路段旅行時間因為到站時間預測為預測未來的到站時間，車輛在行進的時候時間隨之改變，所儲存的路段旅行時間亦因為時段不同，若是從頭到尾只用同一時段的資料，則無法準確反映車輛所遭遇的交通狀況。因此本研究採用延遲加總方法，從車輛所在位置，依序加總路段旅行時間，檢察是否有超過資料庫的記錄時段，調整所參考的歷史路段旅行時間。 步驟 5.1：在 t 時間預測車輛至目標站牌的總旅行時間,Tt為 0，路段 l 為 車輛目前的所在路段。 步驟 5.2：將 k 筆歷史資料中的路段 l 的旅行時間加總平均，得路段 l 之 歷史旅行時間預測值,ttl。 " _*+", -. (9) 步驟 5.3：若由於 k 筆歷史資料之路段 l 的旅行時間皆為空值，而無法得 到路段 l 的平旅行時間，則利用歷史資料的路段平均速度與路段長度算 出路段 l 的歷史旅行時間。 步驟 5.4：累加總旅行時間，則 Tt+="。步驟 5.5：若預測路段已到達目標站牌，則停止延遲加總計算；反之，則繼續下一路段的計算。步驟 5.6：檢查總旅行時間是否超過歷史資料庫的記錄時段，若是超過時

(25)

段長度，則搜尋旅行時間。步驟 6：輸出到站時間預測值到站時間的預測值預測時間點出，並將此旅行時間預測值存入歷史資料庫中間預測模式作使用。

3.3 範例說明

以下舉例說明模式演算流程假設下圖 4 為上午個站牌分為 13 個路段，公車，黑色虛線為各輛公車在去 5 分鐘完整經過路段下游站距離 210 公尺)、 12，最新位置在路段 13 範例假設： (1) 歷史資料格式如下旅行時間及平均速度表日期時間 Day1 08:00 Day1 08:05 Day1 08:10 Day1 08:15 1 2 3 4 345 360 410 350 則搜尋 k 筆歷史資料所對應的下一個時段資料作為下個路段的 時間預測值 到站時間的預測值預測時間點(t)加上總旅行時間，將預測的旅行時間輸 並將此旅行時間預測值存入歷史資料庫中，提供給下一個時段的旅行時。以下舉例說明模式演算流程：為上午 08:30 某路線上之公車行進狀況示意圖，各路段長度如表 1 所示，即時資料回傳了路線上黑色虛線為各輛公車在 5 分鐘內行駛的軌跡，分別為在路段經過路段 1，在路段 2 的最新位置上，與上游站距離、在路段 13 上的 2 車(過去 5 分鐘完整經過 13 上)。現在要輸出 1 車到預測目標站牌的表 1 範例路段長度歷史資料格式如下表 2 及表 3 所示，歷史資料庫中有及平均速度，5 分鐘記錄一筆，以下為 8:00 到 9:00 表 2 範例歷史資料-路段旅行時間路段旅行時間(秒) 1 2 3 4 5 6 7 8 9 10 56 44 23 29 23 58 59 56 41 51 48 40 53 53 28 20 51 59 46 53 60 33 44 60 38 49 18 48 54 20 30 26 24 36 25 17 31 41 19 路段路離長度(公尺) 4 5 6 7 8 9 10 11 350 280 410 340 390 320 540 300 圖 4 範例現況說明示意圖筆歷史資料所對應的下一個時段資料作為下個路段的將預測的旅行時間輸提供給下一個時段的旅行時公車行進狀況示意圖，假設路線上有 14 即時資料回傳了路線上有兩輛分別為在路段 2 上的 1 車(過與上游站距離 150 公尺，與經過路段 8 至路段站牌的到站時間。歷史資料庫中有 3 天各路段的平均 9:00 的歷史資料。 11 12 13 55 34 38 36 25 41 32 17 35 52 22 21 12 13 295 490

(26)

Day1 08:20 46 48 15 16 56 49 48 30 26 40 24 58 40 Day1 08:25 53 39 21 35 35 51 42 37 58 25 55 48 25 Day1 08:30 32 22 54 29 28 44 52 26 22 57 18 17 48 Day1 08:35 44 25 21 54 49 35 46 33 37 27 35 35 Day1 08:40 23 37 52 31 45 22 21 39 39 35 36 21 28 Day1 08:45 27 43 46 22 57 30 42 25 51 38 33 43 52 Day1 08:50 32 57 35 32 60 25 24 18 24 28 18 25 15 Day1 08:55 26 23 28 36 48 59 44 22 48 20 26 42 57 Day2 08:00 50 44 37 54 30 15 59 37 58 17 16 58 37 Day2 08:05 50 26 54 52 53 34 33 48 58 26 25 33 32 Day2 08:10 23 58 26 37 56 43 59 46 18 29 20 54 41 Day2 08:15 51 57 40 45 56 34 26 25 49 38 49 26 Day2 08:20 27 39 45 56 26 53 36 46 15 33 18 44 47 Day2 08:25 19 21 54 53 55 35 22 41 21 43 23 47 44 Day2 08:30 20 47 56 33 42 57 15 44 23 17 44 55 42 Day2 08:35 16 27 40 37 25 17 57 51 38 48 41 16 18 Day2 08:40 33 43 21 25 54 42 51 49 57 39 17 26 35 Day2 08:45 36 53 29 20 39 52 43 38 41 47 44 38 Day2 08:50 48 24 19 60 17 55 36 45 30 22 51 56 27 Day2 08:55 33 38 17 58 38 26 40 53 21 34 42 19 53 Day3 08:00 41 50 51 57 21 47 36 35 48 59 30 24 43 Day3 08:05 31 60 44 18 50 20 35 53 53 35 30 28 15 Day3 08:10 16 32 26 33 53 44 40 42 40 47 45 23 50 Day3 08:15 38 37 27 26 24 23 31 15 60 22 50 21 17 Day3 08:20 23 38 24 34 40 16 46 26 28 29 28 34 36 Day3 08:25 17 53 49 46 37 20 43 47 17 19 38 54 24 Day3 08:30 23 60 20 38 26 45 37 31 40 59 35 45 53 Day3 08:35 26 40 37 26 22 25 20 57 44 16 39 36 37 Day3 08:40 22 40 55 31 27 46 55 32 55 21 50 55 21 Day3 08:45 22 17 26 49 57 31 49 16 22 60 24 27 Day3 08:50 41 54 37 56 46 29 28 26 37 42 54 39 22 Day3 08:55 43 44 36 59 24 47 32 28 18 38 23 33 45 表 3 範例歷史資料-路段平均速度路段平均速度(公里/小時) 日期時間 1 2 3 4 5 6 7 8 9 10 11 12 13 Day1 08:00 28 22 29 6 18 17 8 47 6 18 20 16 49 Day1 08:05 20 21 28 24 33 47 25 46 39 15 41 43 11 Day1 08:10 13 16 19 47 27 28 50 38 27 7 20 47 6 Day1 08:15 49 10 9 27 6 31 11 37 38 42 34 23 27

(27)

Day1 08:20 38 34 8 24 43 35 38 20 30 14 11 19 34 Day1 08:25 28 11 45 36 9 44 16 28 30 20 40 19 13 Day1 08:30 46 20 5 44 26 27 38 43 22 34 49 35 26 Day1 08:35 47 49 22 50 49 19 15 14 8 18 45 9 35 Day1 08:40 45 19 19 29 18 43 35 10 14 9 14 13 32 Day1 08:45 45 26 14 15 42 14 22 43 5 37 41 40 20 Day1 08:50 50 38 26 34 23 50 49 27 23 6 49 18 21 Day1 08:55 48 43 35 10 37 21 10 22 7 29 36 45 17 Day2 08:00 22 14 35 42 43 21 33 23 8 10 48 42 12 Day2 08:05 8 40 27 36 34 8 7 36 26 33 21 47 23 Day2 08:10 14 17 49 5 12 5 39 41 14 32 31 38 13 Day2 08:15 48 22 14 50 18 29 46 24 15 31 33 6 41 Day2 08:20 8 35 40 21 30 36 50 34 29 41 9 45 13 Day2 08:25 23 47 50 36 38 9 35 38 11 35 22 13 47 Day2 08:30 50 23 34 31 35 25 47 14 49 48 32 8 40 Day2 08:35 8 14 20 44 25 15 30 9 42 25 32 14 41 Day2 08:40 11 19 16 34 13 24 30 27 25 26 17 11 22 Day2 08:45 33 21 46 6 8 50 13 44 22 50 19 16 27 Day2 08:50 44 46 14 46 40 10 14 18 38 49 45 7 24 Day2 08:55 5 45 24 28 37 21 40 36 17 16 12 16 33 Day3 08:00 50 21 19 11 30 7 8 5 30 15 42 8 18 Day3 08:05 30 43 27 19 48 20 8 47 48 18 18 43 12 Day3 08:10 49 16 44 38 12 34 42 16 31 18 5 12 12 Day3 08:15 19 5 31 19 49 9 31 9 15 25 23 32 33 Day3 08:20 28 41 28 41 48 5 29 12 44 46 42 29 11 Day3 08:25 38 38 11 28 28 32 24 11 49 48 39 38 23 Day3 08:30 18 33 15 50 8 30 40 6 43 43 37 17 49 Day3 08:35 45 28 41 34 8 14 7 24 23 43 50 9 10 Day3 08:40 45 42 31 50 33 20 13 26 11 38 36 50 36 Day3 08:45 35 18 11 46 35 35 36 15 25 5 46 39 11 Day3 08:50 22 15 21 14 11 40 15 27 40 23 8 19 44 Day3 08:55 35 7 8 49 19 49 9 40 13 19 25 44 28 (2) 搜尋資料庫的時間窗範圍設為前後 15 分鐘。 (3) 比對特徵向量為路段的旅行時間。 (4) 距離量度使用歐基里德距離。 (5) k 值設為 5。 (6) 不完整路段由車輛與上下游站牌的距離比內插出至下游站牌的旅行時間，

(28)

即(加權平均後的路段旅行時間)×(車輛與下游站的距離佔整個路段長的比例)。演算流程：步驟 1：將蒐集到的即時資料依照進離站時間，計算出 3 輛車在過去 5 分鐘內所經過路段的路段旅行時間，結果如下表 4 所示：表 4 範例現狀旅行時間路段旅行時間(秒) 日期時間 1 2 3 4 5 6 7 8 9 10 11 12 13 現況 08:30 54 33 20 35 50 25 步驟 2：搜尋歷史資料庫中 08:30 前後 15 分鐘資料，共 21 筆資料，如表 2 的灰底資料，找出路段 1、路段 8 至路段 12 的路段旅行時間。步驟 3：與現況的路段旅行時間資料作比對，計算其距離量度，如下表 5 所示：表 5 範例距離計算日期時間路段旅行時間(秒) 距離 1 2 3 4 5 6 7 8 9 10 11 12 13 Day1 08:15 30 26 24 36 25 17 31 41 19 52 22 21 35.9166 Day1 08:20 46 48 15 16 56 49 48 30 26 40 24 58 40 43.5775 Day1 08:25 53 39 21 35 35 51 42 37 58 25 55 48 25 45.9891 Day1 08:30 32 22 54 29 28 44 52 26 22 57 18 17 48 45.9239 Day1 08:35 44 25 21 54 49 35 46 33 37 27 35 35 32.7261 Day1 08:40 23 37 52 31 45 22 21 39 39 35 36 21 28 39.6232 Day1 08:45 27 43 46 22 57 30 42 25 51 38 33 43 52 48.7442 Day2 08:15 51 57 40 45 56 34 26 25 49 38 49 26 31.6070 Day2 08:20 27 39 45 56 26 53 36 46 15 33 18 44 47 48.0833 Day2 08:25 19 21 54 53 55 35 22 41 21 43 23 47 44 50.6656 Day2 08:30 20 47 56 33 42 57 15 44 23 17 44 55 42 50.4579 Day2 08:35 16 27 40 37 25 17 57 51 38 48 41 16 18 49.2240 Day2 08:40 33 43 21 25 54 42 51 49 57 39 17 26 35 56.3205 Day2 08:45 36 53 29 20 39 52 43 38 41 47 44 38 33.9706 Day3 08:15 38 37 27 26 24 23 31 15 60 22 50 21 17 48.6313 Day3 08:20 23 38 24 34 40 16 46 26 28 29 28 34 36 40.9268 Day3 08:25 17 53 49 46 37 20 43 47 17 19 38 54 24 53.0566 Day3 08:30 23 60 20 38 26 45 37 31 40 59 35 45 53 50.6557 Day3 08:35 26 40 37 26 22 25 20 57 44 16 39 36 37 50.3885 Day3 08:40 22 40 55 31 27 46 55 32 55 21 50 55 21 57.8446 Day3 08:45 22 17 26 49 57 31 49 16 22 60 24 27 39.5727

(29)

例：即時資料與 Day1 08:15 的距離量度=

/30 012 ₃ 2221 342 5 20303 04333 303

6666666 2075 886

步驟 4：選出距離量度中最小的前五筆資料的歷史資料，分別為 Day1 08:15、 Day1 08:35、Day2 08:15、Day2 08:45、Day3 08:45，如表 5 灰底資料。步驟 5：延遲加總路段旅行時間以 1 車到達目標站牌的到站時間為對象進行預測：步驟 5.1：設 1 車至目標站牌的總旅行時間為 0，路段 2 為車輛目前的所在路段。步驟 5.2：將五筆歷史資料中的路段 2 的旅行時間加總平均，得路段 2 之歷史旅行時間為 35.6 秒，如表 6 所示。對 1 車而言，路段 2 為不完全路段，因此利用 1 車與上下游站牌距離比內插出剩餘距離的旅行時間 =35.6×[210/(150+210)]= 20.8 秒。表 6 範例五筆歷史路段旅行時間計算(1) 路段旅行時間日期時間 1 2 3 4 5 6 7 8 9 10 11 12 13 Day1 08:15 30 26 24 36 25 17 31 41 19 52 22 21 Day1 08:35 44 25 21 54 49 35 46 33 37 27 35 35 Day2 08:15 51 57 40 45 56 34 26 25 49 38 49 26 Day2 08:45 36 53 29 20 39 52 43 38 41 47 44 38 Day3 08:45 22 17 26 49 57 31 49 16 22 60 24 27 平均旅行時間 35.6 總旅行時間 20.8 步驟 5.3：路段 2 可以五筆歷史資料求出路段旅行時間，不進行此步驟。步驟 5.4：累加總旅行時間，則總旅行時間=0+20.8=20.8 秒。步驟 5.5：尚未到達目標站牌，繼續下一路段的計算。步驟 5.6：20.8 秒小於資料庫的記錄時段 5 分鐘，因此使用相同的五資料計算下一路段的旅行時間。路段 3 重覆步驟 5.2 至 5.6 的計算結果如下表 7 所示：

(30)

表 7 範例五筆歷史路段旅行時間計算(2) 路段旅行時間(秒) 日期時間 1 2 3 4 5 6 7 8 9 10 11 12 13 Day1 08:15 30 26 24 36 25 17 31 41 19 52 22 21 Day1 08:35 44 25 21 54 49 35 46 33 37 27 35 35 Day2 08:15 51 57 40 45 56 34 26 25 49 38 49 26 Day2 08:45 36 53 29 20 39 52 43 38 41 47 44 38 Day3 08:45 22 17 26 49 57 31 49 16 22 60 24 27 平均旅行時間 35.6 28 總旅行時間 20.8 48.8 對路段 4 進行計算：步驟 5.2：路段 4 的歷史資料皆為空值，無法求出路段平均旅行時間。步驟 5.3：路段 4 無法由五筆歷史資料求出路段旅行時間，因此搜尋對應的路段速度資料，並計算路段 4 之平均速度為 35.8 公里/小時，如表 8 所示。表 8 範例五筆歷史路段旅行時間計算(3) 路段平均速度(公里/小時) 日期時間 1 2 3 4 5 6 7 8 9 10 11 12 13 Day1 08:15 49 10 9 27 6 31 11 37 38 42 34 23 27 Day1 08:35 47 49 22 50 49 19 15 14 8 18 45 9 35 Day2 08:15 48 22 14 50 18 29 46 24 15 31 33 6 41 Day2 08:45 33 21 46 6 8 50 13 44 22 50 19 16 27 Day3 08:45 35 18 11 46 35 35 36 15 25 5 46 39 11 路段平均速度 35.8 路段 4 的路段旅行時間=350(公尺)/ 35.8 (公里/小時)=35.2 秒表 9 範例五筆歷史路段旅行時間計算(4) 路段旅行時間(秒) 日期時間 1 2 3 4 5 6 7 8 9 10 11 12 13 Day1 08:15 30 26 24 36 25 17 31 41 19 52 22 21 Day1 08:35 44 25 21 54 49 35 46 33 37 27 35 35 Day2 08:15 51 57 40 45 56 34 26 25 49 38 49 26 Day2 08:45 36 53 29 20 39 52 43 38 41 47 44 38 Day3 08:45 22 17 26 49 57 31 49 16 22 60 24 27 平均旅行時間 35.6 28 35.2 總旅行時間 20.8 48.8 84 步驟 5.4：累加總旅行時間，則總旅行時間=48.8+35.2=84 秒。步驟 5.5：尚未到達目標站牌，繼續下一路段的計算。路段 5 到路段 10 重覆步驟 5.2 至 5.6 的計算結果如下表 10 所示：

(31)

表 10 範例五筆歷史路段旅行時間計算(5) 路段旅行時間(秒) 日期時間 1 2 3 4 5 6 7 8 9 10 11 12 13 Day1 08:15 30 26 24 36 25 17 31 41 19 52 22 21 Day1 08:35 44 25 21 54 49 35 46 33 37 27 35 35 Day2 08:15 51 57 40 45 56 34 26 25 49 38 49 26 Day2 08:45 36 53 29 20 39 52 43 38 41 47 44 38 Day3 08:45 22 17 26 49 57 31 49 16 22 60 24 27 平均旅行時間 35.6 28 35.2 40.8 45.2 33.8 39 30.6 總旅行時間 20.8 48.8 84 124.8 170 203.8 242.8 273.4 對路段 10 進行計算：步驟 5.2：將五筆歷史資料中的路段 10 的旅行時間加總平均，得路段 10 之歷史旅行時間為 33.6 秒，如表 11 所示表 11 範例五筆歷史路段旅行時間計算(6) 路段旅行時間(秒) 日期時間 1 2 3 4 5 6 7 8 9 10 11 12 13 Day1 08:15 30 26 24 36 25 17 31 41 19 52 22 21 Day1 08:35 44 25 21 54 49 35 46 33 37 27 35 35 Day2 08:15 51 57 40 45 56 34 26 25 49 38 49 26 Day2 08:45 36 53 29 20 39 52 43 38 41 47 44 38 Day3 08:45 22 17 26 49 57 31 49 16 22 60 24 27 平均旅行時間 35.6 28 35.2 40.8 45.2 33.8 39 30.6 33.6 總旅行時間 20.8 48.8 84 124.8 170 203.8 242.8 273.4 307 步驟 5.3：路段 10 可以五筆歷史資料求出路段旅行時間，不進行此步驟。步驟 5.4：累加總旅行時間，則總旅行時間=273.4+33.6=307 秒。步驟 5.5：尚未到達目標站牌，繼續下一路段的計算。步驟 5.6：307 秒超過資料庫的記錄時段 5 分鐘，因此搜尋五筆歷史資料的下一時段資料進行下一個路段的平均旅行時間計算，下表 12 為下一時段的歷史資料。表 12 範例五筆歷史路段旅行時間計算(7) 路段旅行時間(秒) 日期時間 1 2 3 4 5 6 7 8 9 10 11 12 13 Day1 08:20 46 48 15 16 56 49 48 30 26 40 24 58 40 Day1 08:40 23 37 52 31 45 22 21 39 39 35 36 21 28 Day2 08:20 27 39 45 56 26 53 36 46 15 33 18 44 47 Day2 08:50 48 24 19 60 17 55 36 45 30 22 51 56 27 Day3 08:50 41 54 37 56 46 29 28 26 37 42 54 39 22 平均旅行時間 35.6 28 35.2 40.8 45.2 33.8 39 30.6 33.6 36.6 總旅行時間 20.8 48.8 84 124.8 170 203.8 242.8 273.4 307 343.6

(32)

對路段 11 進行計算：步驟 5.2：將五筆歷史資料中的路段 11 的旅行時間加總平均，得路段 11 之歷史旅行時間為 36.6 秒步驟 5.3：路段 11 可以五筆歷史資料求出路段旅行時間，不進行此步驟。步驟 5.4：累加總旅行時間，則總旅行時間=307+36.6=343.6 秒。步驟 5.5：已預測到目標站牌，停止延遲加總計算。步驟 6：輸出預測的到站時間 1 車預測的到站時間=08:30:00+343.6 秒=08:35:43

3.4 研究課題

由前幾節的 k -NN 流程介紹能夠整理出以下幾項研究課題，將在之後的章節 逐一針對各項課題提出本研究設計的處理方法： (1) 資料過濾收集回來的公車 GPS 資料不完全都是合理的資料點，例如路段旅行時間過長、進站停等的速度點資料、號誌停等的速度點資料等，若是採用所有的資料點，則會影響計算的平均速度及平均旅行時間，故需要將原始資料作適當的過濾，其後建立之資料庫及計算所得的數值才能夠具有效性。 (2) 建立歷史資料庫 k-NN 法是利用比對歷史資料找出相似資料特性的方法，故建立合適的資料是很重要的前置作業。本研究的預測對象為公車的到站時間，因為公車的到站時間與道路的交通狀況與站牌停等情況有很大的關係，公車所遭遇的交通狀況會因為路段的不同而有所不同，亦會因為尖離峰的時間因素有不同的交通狀況，因此建立預測公車到站時間的歷史資料庫，需要探討路段與時段的分法，以適當表現當地當時的交通狀況。分路段 本研究將利用市區公車能夠得到的資訊當作 k -NN 比對的特徵向量， 分的好壞會影響到比對的品質。若是切割的路段數少，則無法精確描述整條路線的交通狀況；反之，若是將路線切割成太小的單位，則可能造成許多路段資料發生空值的情況，因此，需要針對取得交通資料的特性決定路段的分法。分時段若是粗略切割成很大的時段，則無法保證此時段內的交通狀況不變；若是分小時段，則比對的歷史資料量會很大。因此時段的分法亦是需要考慮的設計要件。

(33)

(3) 參數校估距離量度 k -NN 的目標是在找尋最接近即時資訊的歷史資訊，需要依照比對 資料的特性選取合適的距離量度，若是距離量度無法表現資料的相似程度，則可能會因為取得差異較大的歷史資料作預測，而造成較大的偏誤。時間窗進行資料比對的歷史資料筆數將影響演算法的運算時間。若是搜尋整個歷史資料庫會使得演算法在比對的過程中花費較多時間，因此必須定出搜尋的時間窗範圍，以減少搜尋時間。 k 值 k 值的設定將決定輸出的預測值，若是選取較大的 k 值，則會過度平 滑歷史資料；若是選取較小的 k 值，選取的值中有比較大的偏誤，則會 造成預測值有較大的誤差。 (4) 不完全路段的旅行時間計算在市區公車的行走時間包括停等時間，若是較長的路段，則估算路段剩餘距離的行駛時間的誤差可能會超出可忍受的誤差範圍。因此，需要依照資料特性設計適當的剩餘旅行時間估算方法。 以上為本研究建立 k -NN 公車到站時間預測模式時需要解決的課題，資料過 濾與資料庫建立的前置作業處理，及關於影響模式準確度的參數估計、不完全路段的旅行時間計算及加權平均方法將於第四章資料處理做詳細介紹；最後將應用實際資料作測試，並針對結果作改善與調整。

(34)

第四章資料處理

本研究以 k -NN 法作為資料分析的演算法，由上一章節對 k -NN 演算流程的 介紹能夠得知資料過濾、建立資料庫及設定參數皆為演算法中重要的設計要件，以下將針對各項設計要件加以說明。

4.1 資料過濾

在建立歷史資料庫或引用即時資料的時候，若是直接將資料依照設計的流程建立歷史資料庫或當作演算法的輸入資料，則可能會因為不適當的資料點造成演算法的誤差，此時必須先進行資料過濾的步驟，才能進行資料庫建立及演算法的運算流程，以下將列出需要過濾掉的資料情形： (1) 受站牌上下客影響：當車輛經過站牌時，會因為上下車的乘客而使速度為零，若是因為上一輛公車的停等行為讓車輛速度明顯降低，故在進離站範圍內的速度點資料將予剔除。 (2) 受紅燈停等影響：當車輛接近路口時，若是遇到紅燈使得速度為零，則會影響路段平均速度，因此在進離站範圍外且接近路口區域，連續數個速度點為零的資料，在計算路段平均速度將予剔除。 (3) 受急踩煞車影響：當車輛位置在進離站範圍外，且非接近路口區域時，若有急踩煞車的情形產生，則會使得車速突然降為零，故將在進離站範圍外且非路口附近，突然為零的速度點資料剔除。

4.2 建立資料庫

本研究以 k -NN 模式進行公車到站時間預測，以路線上的各路段旅行時間代 表路線的交通狀態，將現況的路段旅行時間與歷史的路段旅行時間進行比對，找出與現狀路段旅行時間分配最相似的歷史資料，亦即與現狀有相似的交通狀況。因此建立適當的資料庫為演算法重要的前置作業，研究設計的路段資料庫欄位內容如表 13 所示，主要儲存處理過的路段旅行時間、速度：表 13 路段資料欄位說明欄位內容欄位說明路線去回程上游站下游站路段旅行時間路段速度時段路段所屬的公車路線編號為去程或回程的資料(0為去程，1為回程) 路段的上游站牌編號路段的下游站牌編號路段的平均旅行時間(秒) 路段的平均速度(公里/小時) 資料所屬的時段(包括日期及時間)

(35)

4.2.1 路線分段

本研究將各個公車路線以站牌為切點分為數個路段圖，假設路線上有 4 個公車站牌分別為 及 C2，以站牌為切點則可分出路段

4.2.2 計算路段旅行時間

確定每個路段的起迄點後資訊計算路段旅行時間，段旅行時間，意謂路段兩端站牌公車依行進方向前進，於站牌 進站時間為 a2、離站時間為

4.2.3 劃分時段

在劃分歷史資料時段時市區交通狀況在 5 分鐘內擁有比較相似的情況加總平均 5 分鐘內的每車次路段

4.3 設定參數

4.3.1 距離量度

由 3.1 節 k -NN 模式介紹中 圖本研究將各個公車路線以站牌為切點分為數個路段，下圖為路線分段的示意 個公車站牌分別為 S1、S2、S3 及 S4，與 以站牌為切點則可分出路段 1、路段 2 及路段 3：

旅行時間

確定每個路段的起迄點後，接著計算每個路段的旅行時間，將站內的等待乘客上下車之停等時間併入下一路段的路路段兩端站牌的進站時間差即為路段旅行時間 於站牌 S1 的進站時間為 a1、離站時間為 離站時間為 d2，則路段 1 的路段旅行時間為 在劃分歷史資料時段時，因各個路段之車流尖峰與離峰時段不盡相同分鐘內擁有比較相似的情況，故本研究將劃分時段設為內的每車次路段旅行時間。模式介紹中，可知常用的距離量度是將現況資料與歷史資料圖 5 路線分段示意圖圖 6 計算路段旅行時間示意圖下圖為路線分段的示意 與 2 個路口分別為 C1 路段的旅行時間。以每車的進離站將站內的等待乘客上下車之停等時間併入下一路段的路差即為路段旅行時間。如圖 6 所示， 離站時間為 d1，站牌 S2 的 的路段旅行時間為 a2-a1。 因各個路段之車流尖峰與離峰時段不盡相同，因為故本研究將劃分時段設為 5 分鐘，可知常用的距離量度是將現況資料與歷史資料

(36)

中的每個路段旅行時間作比較，算出每路段的距離後，再把每一段的距離依定義的公式加總計算出每一筆歷史資料與現況資料的距離量度；其中隱含每個比對的路段都必須要有值，否則會因為資料缺漏而沒有加總到總距離中，使得總距離量度值變小，在演算的過程被視為與現狀有比較相似的交通狀況。由於使用公車的路段旅行時間作比對，而每個時段中並非每個路段都會有公車經過，因此所擷取出的即時與歷史資訊產生缺漏的比例高，以表 14 為例，歷史資料 1 中有值的為路段 1、路段 2 及路段 3，而歷史資料 2 中有值的為路段 1、路段 3、路段 4、路段 5 及路段 6。表 14 路段旅行時間資料路段 1 路段 2 路段 3 路段 4 路段 5 路段 6 旅行時間現況 150 171 170 22 72 29 歷史資料 1 101 115 117 歷史資料 2 119 118 69 100 71 距離量度以歐幾里得距離作計算，可得出歷史資料 1 與狀況的距離為 91.356，歷史資料 2 與現狀的距離為 91.77。由結果可知歷史資料 1 之距離小於歷史資料 2 之距離，代表歷史資料 1 的交通狀況與現狀比較相似。但觀察每路段的旅行時間差值如表 15 所示，歷史資料 2 的每路段差值都小於歷史資料 1 中路段 2 的差值 72，表示歷史資料 2 筆歷史資料 1 更接近現況；卻因為能夠計算的資訊較多而使得總距離變大，此與篩選歷史資料的機制相異。表 15 歷史與現狀之路段旅行時間比較路段 1 路段 2 路段 3 路段 4 路段 5 路段 6 與現況之絕對差歷史資料 1 49 56 53 歷史資料 2 31 52 47 28 42 因此本研究為了因應市區公車之路段資料缺漏的特性，將距離量度的計算公 式調整為「每路段的均方根距離」，如(10)式所示，m 為可比較的路段個數： 2 1 9 12 (10) 將上例依設計之距離公式重新計算，可得出歷史資料 1 與狀況的距離為 52.744，歷史資料 2 與現狀的距離為 41.041。由結果可知歷史資料 2 之距離小於歷史資料 1 之距離，表示歷史資料 2 比歷史資料 1 更為接近現況，此與 k -NN 的篩選機制相符。

4.3.2 不完全路段的旅行時間計算

因為市區公車的現況位置並不一定位於路段的端點上，可能會產生不完全路 段，如圖 7 所示，如果預預測公車到站牌 S4 的旅行時間，則對公車而言，路段 3 為完整路段，可由歷史資料直接獲得路段 3 的旅行時間；相對而言，路段 2 為 不完整路段，需估計公車現狀位置至下游站牌 S3 的旅行時間。

(37)

本研究利用公車的現況位置與前後站牌的相對位置估計剩餘路段的旅行時間。如所示，假設公車位現狀位置與上下游站牌距離 路段 2 的旅行時間為 t，

4.3.3 k 值設定

本研究將透過實驗資料 差，選取適當的 k 值當作之後預測演算法的固定參數值

4.3.4 時間窗

本研究將搜尋歷史資料的時間窗範圍間表行駛時，會保持在前後兩班公車的行駛範圍內即可包括公車行駛速度快慢所可能圖本研究利用公車的現況位置與前後站牌的相對位置估計剩餘路段的旅行時 假設公車位現狀位置與上下游站牌距離 d1 與 d2 ，則公車至下游站 S2 的旅行時間為6 : 將透過實驗資料比較在不同的 k 值下，所得的到站時間的平均絕對誤 值當作之後預測演算法的固定參數值。本研究將搜尋歷史資料的時間窗範圍設為公車最大的班距會保持在前後兩班公車的行駛範圍內，因此時間窗選擇最大的班距行駛速度快慢所可能出現的時段。圖 7 範例不完全路段示意圖本研究利用公車的現況位置與前後站牌的相對位置估計剩餘路段的旅行時 2，由歷史資料得出 21 2。所得的到站時間的平均絕對誤設為公車最大的班距。因為公車依照時因此時間窗選擇最大的班距，

(38)

第五章實證分析

根據前面第四章所建構 k-NN 市區公車到站時間預測模式，本章節將以台北 市區公車作為測試對象，與現狀預測系統的預測績效進行評估。

5.1 現況說明

台北之市公車動態資訊系統共分為四期，分別由不同廠商建置，採用不同的公車到站時間預測方法，以下將詳細敘述各期廠商的公車到站時間預測演算法。

方法一：一、四期建置廠商

當通訊伺服器接收到車機定位訊號後，則計算車輛於該營運路線之到離站資訊，再傳送至演算中心進行預估到站時間計算。經由營運路線狀況分析可知，台北市公車發車間距短則 5 分鐘內，長則 1 小時，亦有固定班次之路線，故研擬兩種預估到站時間演算邏輯。演算法以路線特性劃分，針對台北市班次密集及較長班距之路線分別設計演算邏輯，例如班次在 20 分鐘以內之路線採前 3 班之平均旅行時間做為預估到站時間之參考；20 分鐘以上及固定班次之路線採歷史資料（以路線、站牌、星期、時、行駛方向劃分）推估方式。預估到站時間演算邏輯分述如下: (1) 前車資料推估演算法當接收到即時定位資訊時（包含定時或是發送點所傳回的資訊），會主動通知預估到站模組，此時預估到站模組將即時計算每一傳回位置點所屬的路段，以提供預估到站用。前車旅行時間資料以所屬路段之到達及離開時間計算每個站牌間之旅行時間；因此，每一個路段都會有 0 至多筆的時間資訊。每當有模組需要該路段的前車資訊時，則模式會取預測時間前 3 筆資訊加總平均，得到該路段的前車旅行時間並回傳。 (2) 歷史資料推估演算法接收到的每一筆即時定位資訊，都會被儲存成歷史資料，以供計算歷史平均旅行時間用。當資料被存成歷史資料後，系統會根據每天累積的資訊，計算每個星期別中每個時段（以 1 小時為間距）的歷史平均速度表。並利用當天的資料來調整之前所計算出的歷史平均旅行時間表；調整的方式為將新的資料與已算出的平均旅行時間表做平均。其預估到站演算法流程如下圖：

應用k-NN模式於市區公車到站時間預測之研究

國

立

交

通

大

學

運輸科技與管理學系

碩

碩

碩

碩

士

士

士

士

論

論

論

論

文

文

文

文

應用 k-NN 模式於市區公車到站時間預測之研究

The Study of Urban Bus Arrival Time Prediction

Using the k-NN Model

研 究 生：何佳儒

指導教授：王晉元 教授

中

中

中

中 華

華

華

華 民

民

民

民 國

國

國

國 九

九

九

九 十

十 九

十

十

九

九

九 年

年

年

年 六

六

六

六 月

月

月

月

應用k-NN模式於市區公車到站時間預測之研究

The Study of Urban Bus Arrival Time Prediction

Using the k-NN Model

研 究 生：何佳儒 Student：Chia-Ju Ho

指導教授：王晉元 Advisor：Jin-Yuan Wang

國 立 交 通 大 學

運 輸 科 技 與 管 理 學 系

碩 士 論 文

應用k-NN模式於市區公車到站時間預測之研究

學生：何佳儒 指導教授：王晉元 博士

國立交通大學運輸科技與管理學系碩士班

摘 要

關鍵詞：k-NN 法，市區公車，到站時間預測

The Study of Urban Bus Arrival Time Prediction Using the k-NN Model

Department of Transportation Technology Management

National Chiao Tung University

ABSTRACT

The estimation of urban bus arrival time using the GPS data is a

fundamental function of Advanced Public Transit Systems (APTS). This is a

difficult task due to the complications of traffic, signals, and bus stops.

研究生：何佳儒

指導教授：王晉元教授

中華

華民

民國

國九

九十

十九

九年

年六

六月

研究生：何佳儒 Student：Chia-Ju Ho

國立交通大學

運輸科技與管理學系

碩士論文

學生：何佳儒指導教授：王晉元博士

摘要

誌謝

何佳儒謹誌于

目錄

第一章緒論

第二章文獻回顧

第三章公車到站時間預測模式

第四章資料處理

第五章實證分析