國 立 交 通 大 學
運
輸
科
技
與
管
理
學
系
碩 士 論 文
利用群集分析與線性迴歸推估高速公路旅行時間之
研究
The Study of Using Cluster Analysis and Linear
Regression to Estimate Travel Time on Freeway
研 究 生:何聰儒
指導教授:王晉元 教授
利用群集分析與線性迴歸推估高速公路旅行時間之研究
The Study of Using Cluster Analysis and Linear Regression to
Estimate Travel Time on Freeway
研 究 生:何聰儒 Student:Cong-Ru He
指導教授:王晉元 Advisor:Jin-Yuan Wang
國 立 交 通 大 學
運 輸 科 技 與 管 理 學 系
碩 士 論 文
A ThesisSubmitted to Transportation Technology and Management College of Management
National Chiao Tung University in partial Fulfillment of the Requirements
for the Degree of Master
in
Transportation Technology and Management
June 2009
Hsinchu, Taiwan, Republic of China
利用群集分析與線性迴歸推估高速公路旅行時間之研究
學生:何聰儒 指導教授:王晉元 國立交通大學運輸科技與管理學系碩士班
摘要
先進用路人資訊系統(Advanced Traveler Information System, ATIS)中,為了要給予用 路人準確的資訊,以做為路徑,運具選擇之依據,旅行時間推估是一項重要的課題。 由於過去研究對於國道旅行時間多以車輛偵測器收集相關資料來進行,然而目前國 道一號有車輛偵測器的佈設以及有探針車行走,因此本研究主要利用國道上所佈設之車 輛偵測器和探針車所裝設之全球定位系統(Global Postitioning System, GPS)之回傳資料 做為本研究資料來源。本研究主要透過群集分析法將偵測器所收集到的流量、速度等資 料依照相似度較高的合併成一群集,再利用線性迴歸探討此群集資料與探針車之間的關 係。 本研究以國道一號為測試對象,時間範圍為 2007 年 10 月至 2008 年 3 月來做測試, 其中 3 月份資料來做驗證。測試結果顯示出本研究模式的方法具體可行,所推估出來的 結果有一定的準確性。 關鍵字:旅行時間推估、群集分析法、線性迴歸、車輛偵測器、探針車。
ii
The Study of Using Cluster Analysis and Linear Regression to Estimate Travel Time on Freeway
Student:Cong-Ru He Advisor:Jin-Yuan Wang
Department of Transportation Technology and Management Nation Chiao Tung University
Abstract
Advanced Traveler Information System (ATIS) is a subsystem of the Intelligent Transportation System (ITS). In ATIS, “travel time estimation” is always a basic and important issue, needed by travelers to plan trips effectively.
Traffic flow data was mostly gathered through vehicle detectors (VD). In this study, VDs and probe vehicles are used for collecting data, and the method “cluster analysis” is used to cluster data combined with similarity through detectors, trying to find the relationship between the clustered data and probe vehicle via regression.
The data is collected from 2007/10 to 2008/03, and the method for travel time estimation is verified with the data in 2008/03 by different cluster analysis. The final result comes to be technically accurate.
Key words: Travel time estimation, cluster analysis, linear regression, vehicle detectors,
致 謝
本論文得以順利完成,首先要感謝王晉元老師的指導與鼓勵。不管是在學業或是生 活待人處事上,學生都受益良多。在論文撰寫方面,不是本科系的我,老師總是不辭辛 勞也不厭其煩的給予學生指導,讓學生在研究過程中遇到瓶頸時,得到老師寶貴的意見 和幫助,能夠一次一次的突破瓶頸。 在論文口試期間,感謝中華大學運輸科技與物流管理系張靖老師以及台北科技大學 工業工程與管理系盧宗成老師在論文進行過程中給予相當多寶貴的意見與指導,最後在 論文口試時惠賜卓見及不吝指正,使本論文更臻完備;在論文進度審查期間,也感謝系 上韓復華老師、黃寬承老師費心審閱並給予學生寶貴意見。 兩年研究生的生活,要感謝實驗室的各位成員,感謝小松學長的程式教學、思文學 長的一些課程和生活上的幫助、彥佑學長給予論文的幫助、hoho 學長在電腦上的幫助; 芬傑、建旻、珮婷一起共患難為 meeting 和論文努力;還有學弟妹的程式一姐佳儒、要 念博班的藍鳥、愛講冷笑話的宇凡、吃東西很慢的小惠、很會團購的怡如在實驗室一起 打嘴砲、吃美食。另外感謝建綸學長、憲梅學姐在學業上的一些幫助和歡樂,為乏味的 研究生活增添了不少的樂趣。 還要感謝大學同學以及高中同學一起互相打氣努力,不論是工作或是學業,有大家 一起照應和生活分享,紓解了苦悶煩躁的研究生活壓力。 最後要感謝的是在背後默默支持我的家人,不管是什麼方面遇到挫折,他們總是能 為我打氣,鼓勵我,讓我更有信心和勇氣去接受每一個挑戰。 誠心感謝在這段日子的所有人事物,每一位都是完成這篇論文的功臣,能夠順利完 成這篇論文,真的是托各位的福。在此與大家一同分享論文完成的喜悅,感謝大家。 何聰儒 謹誌 2009 年 7 月於新竹交大iv
目錄
中文摘要 ... I 英文摘要 ... II 致 謝 ... III 目錄 ... IV 表目錄 ... VI 圖目錄 ... VII 第一章 緒論 ... 1 1.1 研究背景與動機 ... 1 1.2 研究目的 ... 1 1.3 研究範圍 ... 2 1.4 研究流程 ... 2 第二章 文獻回顧 ... 4 2.1 利用車輛偵測器推估旅行時間 ... 4 2.2 利用探針車資料推估旅行時間 ... 8 2.3 小結 ... 9 第三章 研究方法 ... 10 3.1 旅行時間推估模式 ... 10 3.1.1 資料過濾模式 ... 12 3.1.2 群集分析 ... 12 3.1.2.1 相似度計算 ... 12 3.1.2.2 階層式聚合演算法 ... 13 3.1.3 線性迴歸 ... 18 3.1.4 兩偵測器間之旅行時間推估及旅行時間延滯加總 ... 18 3.2 衡量評估指標 ... 22 第四章 實例分析 ... 24 4.1 資料處理與分群 ... 24 4.2 線性迴歸方程式校估 ... 34 4.3 模式驗證與分析 ... 38 第五章 結論與建議 ... 41 5.1 結論 ... 415.2 建議 ... 41
參考文獻 ... 43
簡 歷 ... 45
附錄一 ... 46
vi
表目錄
表 2. 1 交通狀況型式表,Chang[5] ... 5 表 3. 1 旅行時間推估時間表 ... 21 表 4. 1 不同時間下各個偵測器之資料缺漏率 ... 25 表 4. 2 Chang之上下游偵測器所測得之平均速度、平均流量集資料筆數 .... 25 表 4. 3 階層式分群(3 群)之上下游偵測器所測得之平均速度、平均流量集資 料筆數 ... 27 表 4. 4 階層式分群(4 群)之上下游偵測器所測得之平均速度、平均流量集資料 筆數 ... 28 表 4. 5 階層式分群(5 群)之上下游偵測器所測得之平均速度、平均流量集資料 筆數 ... 29 表 4. 6 k-means(3 群)之上下游偵測器所測得之平均速度、平均流量集資料筆 數 ... 30 表 4. 7 k-means(4 群)之上下游偵測器所測得之平均速度、平均流量集資料筆 數 ... 31 表 4. 8 k-means(5 群)之上下游偵測器所測得之平均速度、平均流量集資料筆 數 ... 32 表 4. 9 k-means分群法 2008 年三月份星期六、日(3 群)早上七點至十點之旅 行時間資料庫 ... 37 表 4. 10 2008 年三月份禮拜六、日兩ETC收費站間之旅行時間與不同分群數 目下推估出來之旅行時間 ... 38 表 4. 11 星期二、三、四兩ETC收費站間之旅行時間與不同分群數目下推估 出來之旅行時間之絕對誤差及均方根誤差 ... 39 表 4. 12 星期六、日兩ETC收費站間之旅行時間與不同分群數目下推估出來 之旅行時間之絕對誤差及均方根誤差 ... 40圖目錄
圖 1. 1 研究流程圖 ... 3 圖 2. 1 旅行時間推估模組流程圖,Chang[5] ... 5 圖 3. 1 旅行時間推估流程圖 ... 11 圖 3. 2 二元樹 ... 14 圖 3. 3 k-means 範例原始資料分佈 ... 16 圖 3. 4 k-means 範例隨機選取資料點 ... 16 圖 3. 5 k-means 範例距離計算 ... 17 圖 3. 6 k-means 範例分群指派 ... 17 圖 3. 7 計算群集平均質量中心 ... 17 圖 3. 8 推估兩偵測器之旅行時間示意圖 ... 19 圖 3. 9 車輛與偵測器分佈圖 ... 19 圖 3. 10 車輛在 O 點根據 OA 兩偵測器傳回之旅行時間 ... 20 圖 3. 11 車輛在 A 點根據 AB 兩偵測器傳回之旅行時間 ... 20 圖 3. 12 車輛經過 OD 所需時間 ... 20 圖 3. 13 OD 之間車輛經過每兩個偵測器所需要之旅行時間 ... 21 圖 4. 1 楊梅收費站至泰山收費站間各個偵測器代號及分佈位置圖 ... 24 圖 4. 2 三月份禮拜二、三、四各個分群法在不同群集數目下推估出來的旅行 時間與兩 ETC 間之旅行時間之分佈圖。 ... 35 圖 4. 3 三月份禮拜二、三、四各個分群法在不同群集數目下推估出來的旅行時 間與兩 ETC 間之旅行時間之分佈圖。 ... 35 圖 4. 4 三月份禮拜二、三、四各個分群法在不同群集數目下推估出來的旅行時 間與兩 ETC 間之旅行時間之分佈圖。 ... 35 圖 4. 5 三月份禮拜六、日各個分群法在不同群集數目下推估出來的旅行時間與 兩 ETC 間之旅行時間之分佈圖。 ... 36 圖 4. 6 三月份禮拜六、日各個分群法在不同群集數目下推估出來的旅行時間與 兩 ETC 間之旅行時間之分佈圖。 ... 36 圖 4. 7 三月份禮拜六、日各個分群法在不同群集數目下推估出來的旅行時間與 兩 ETC 間之旅行時間之分佈圖。 ... 361
第一章 緒論
1.1 研究背景與動機
隨著科技的日新月異,人們對於各方面課題皆逐漸朝向智慧化的方向演進, 交通方面的課題也不例外。智慧型運輸系統(Intelligent Transportation Systems, ITS) 即為應用先進的電子,通信,資訊與感測等技術,以整合人,路,車的管理策略, 提供即時(real-time)的資訊而增進運輸系統的安全,效率,及舒適性,同時也減少 交通對環境的衝擊。
ITS 所包含之一子系統:先進旅行者資訊系統(Advanced Traveler Information System, ATIS),係藉由先進資訊、通訊及其他相關技術,提供旅行者必要之資訊, 使其能於車內、家裡、辦公室、車站等地點方便地取得所需之資訊,作為旅次產 生、運具與路線選擇之決策參考,以順利到達目的地。並可以避免因資訊不足產 生之煩躁與焦慮。
旅行時間的推估不僅在 ATIS 中是一項重要且基本的課題,在先進交通管理系 統(Advanced Traffic Management Systems, ATMS)以及先進公共運輸系統(Advanced Public Transportation Systems, APTS)中也屬實重要,主要能幫助旅行者對即時交通 狀況有相當程度的瞭解,提高運輸效率,使交通資訊加透明化,亦輔助提供決策 資訊,以減少無謂的社會成本耗損。 Chang et al [5]提到旅行時間主要分為推估和預測兩大部分,然而推估是預測的 基礎,有了良好準確的旅行時間推估資訊才有準確度高的旅行時間預測。因此本研 究考慮利用有佈設車輛偵測器(Vehicle detector, VD)的路段所偵測到的車流量、速度 外加 ETC 收費站間所測得之旅行時間和探針車訊號來推估兩 ETC 收費站之間之旅 行時間。有了這些基礎的旅行時間推估資訊後,便可以更進一步的利用以發展出的 模式來預測旅行時間。 1.2 研究目的 本論文研究目的為發展一個旅行時間推估模式,利用高速公路路段中有佈設
車輛偵測器所偵測到的速度和流量、ETC 所偵測到的旅行時間,以及探針車訊號, 透過旅行時間推估模式,推估出兩 ETC 收費站之間之旅行時間,提供可靠且準確 的交通資訊,以助於使用者進行更佳的路線選擇。 輸入:五分鐘一筆歷史交通資訊(速度、流量)、五分鐘一筆歷史探針 車資訊、ETC 資訊。 輸出:旅行時間推估。 1.3 研究範圍 本研究透過佈設於高速公路路段之車輛偵測器,蒐集交通量基礎資料,並用以 建構旅行時間推估模式,其範圍為國道有佈設 ETC 收費站及車輛偵測器之路段。 1.4 研究流程 本研究之研究流程如圖 1.1 所示,各階段說明如下: 確認研究問題 本階段主要工作為分析研究目的,並了解外在限制與可用資源,以清楚描述研究 問題。 相關文獻回顧 本階段主要工作為回顧相關之文獻,以分析過去研究之優缺點,作為本研究模式 建構之基礎。 模式方法建構 本階段主要工作為建立可行之車輛旅行時間推估模式。 實作應用與結果分析 本階段主要工作為將車輛旅行時間預估模式應用於高速公路路段,以驗證此模式 是否適用於現實狀況,並分析結果以作為修正模式之依據。 結論與建議 對本研究之過程與結果做一結論與建議。
確認研究問
題
相關文獻回
顧
模式方法建
構
實作應用與
結果分析
結論與建議
圖 1. 1 研究流程圖 3第二章 文獻回顧
旅行時間推估與預測是許多 ITS 子系統的中心,如:ATIS、APTS 等,預測旅行時 間有許多種方式。大部分文獻都事先將交通量資料整理彙整,再進行旅行時間推估。因 此本章節探討其旅行時間推估方法,包含如何利用車輛偵測器推估旅行時間之方法,及 資料如何分類的相關文獻來作探討。 2.1 利用車輛偵測器推估旅行時間 Chang et al[5]於美國馬里蘭(Maryland)在 25 英哩的快速道路間,使用 10 個偵測 器與 5 個 LED 看版,將偵測所得資訊以旅行時間推估模組(Travel Time Estimation Module)來建立現有的歷史旅行時間資料庫,再透過此資料庫使用旅行預測模組 (Travel Time Prediction Module)來預測旅行時間,事故偵測模組(Incident Detection Module)可將路段事故預先知會駕駛人,並將事故路段視為不可行,避免因為事故 造成的擁塞使得預測結果偏差,遺失資料模型(Missing Data Module)來防止因為偵 測器失靈所造成的資訊延滯與漏失,結合以上四種模型,可在各 LED 提供用路人 通往下個交流道出口的估計旅行時間。 該研究為解決一些不能避免的資訊不足問題,旅行時間推估模組目的為利用少 量分佈(sparsely distributed)的偵測器(>0.5miles)來推估旅行時間,並將將偵測器偵測 到之流量、佔有率,以及車輛實地調查旅行時間,代入群集線性迴歸模式推估旅行 時間;而副模式則是處理在交通資訊不足以讓系統作測定的情況。在實際操作時, 旅行時間推估模組會推估所有旅程的旅行時間,並同時將所得資訊儲存到資料庫作 旅行時間預測之用。此模組運作流程圖如下:圖 2. 1 旅行時間推估模組流程圖,Chang[5] 旅行時間推估模組主要以群集線性迴歸模式,根據偵測器所收集的資料推估行 駛該路段上的車輛的旅行時間。若是經常出現的交通狀態,則用群集線性迴歸模式 來進行旅行時間推估。當車輛在某路段行駛時,其可能的旅行時間範圍會受限於該 路段當時的交通情況,例如在交通擁擠的狀況下,車輛無法達到自由速率,群集線 性迴歸模式即是把偵測到的交通情況歸類,再根據不同的交通情況建立其線性迴歸 模式,之後再依據不同交通情況,代入相對應的線性迴歸模式推估其旅行時間。下 表 2.1 即為該研究所定義之交通情況。 表 2. 1 交通狀況型式表,Chang[5] 交通狀況 (pattern) 分類 上游偵測器交通狀況 擁擠 非擁擠 下游偵測器 交通狀況 擁擠 嚴重擁擠 中等擁擠或轉換時期 非擁擠 中等擁擠或轉換時期 自由狀況 該研究測試路段為 MD70 至 I-695 長 25 英里,此路段上共設置 10 個偵測器及 5
5 個可變訊息標誌(variable message signs,VMS),測試資料為早上和晚上尖峰時段。 測試結果第三個 VMS 到 I-695 預測準確度 97.9%、第四個 VMS 到 I-695 預測準確 度為 96.9%、第五個 VMS 到 I-695 預測準確度為 92.7%。整體上此模式可以適用於 輕微和適度的擁擠狀況。 Zhang[3]研究提出線性時變係數模式(Time-varying coefficient, TVC)預測短期 旅行時間。在即時旅行時間方法計算方面,此研究指出實際的旅行時間與推估的旅 行時間中存在一線性關係式。透過固定式車輛偵測器之速率和路段長度可求得推估 的旅行時間,線性模式的截距和係數皆依時間而變化,最後以遞迴最小平方法推估 截距和係數。因此他們利用此線性關係建立預測模式利用目前高速公路的旅行時間 來預測未來的旅行時間。並且使用平均絕對誤差百分比來衡量此模式的預測結果。 此模式是用於每個路段皆有佈設車輛偵測器的高速公路。 此研究的測試範例有二: 1. I-880 此測試資料來自一段在加州海沃長 6 英哩的高速公路,在這段高速公路上, 每隔三分之一英哩就有一個雙迴圈車輛偵測器,因此全路段總共有 35 個偵 測器。因此測試範例是蒐集北邊車道早上 5 點至早上 10 點的偵測器資料。 2. I-405 此測試資料來自在於加州的 I-405 公路,此研究採用早上 5 點至早上 10 點 的資料。資料規模較上一個測試範例大。 測試結果方面,在以 I-880 的資料測試下,依照時間的遠近誤差約在 5%至 10%。 而在以 I-405 的資料測試下,依照時間的遠近誤差約在 8%至 13%。由於此模式的 精確度會隨著時間預估的遠近以及輸入資料的多寡而有所不同,因此適用於公路 上。 Karl[4]認為高速公路上面的單迴圈偵測器並無法直接偵測車輛的速度,該研究 利用偵測器(約每 0.3miles 佈設一個)偵測到之流量、佔有率等資料。車長、佔有率 等資料,並以流量-密度-速度三者之間的關係做一個轉換,以得出目前高速公路上
7 的車輛速度。因此他提出了一個模式,可以直接由偵測器偵測到佔有率以及流量, 利用直觀的車流統計模式,直接推估出路段的旅行時間。首先他假設在一個給定的 時間間隔內,車輛的旅行時間在統計上會呈現一個分佈,接著再去預測此統計分布 的型態,因此可以推估出路段的旅行時間。 在測試方面,本研究採用 I-880 公路所蒐集到的資料作為測試範例。結果發現, 當給定的時間間隔小於 300 秒時,可以預測出旅行間的分佈型態,但是當時間間隔 漸漸變大時,便會漸漸失去追蹤旅行時間分佈型態的準確度。 Benjamin Coifman[7]於欲量測之路段上下游處設車輛重量辨識與旅行時間量 測站,而在各個量測點上裝置兩個連續之迴路線圈偵測器,利用上述資料擷取車輛 特徵並執行旅行時間之量測。該研究利用車輛長度、重量與車輛經過量測站之順序 來辨別是否為同一部車輛,再依辨識後之結果,推算其旅行時間。因其辨識技術無 法判斷所有經過偵測站之車輛,故所得到僅是部分車輛之樣本資料,此種方式利用 實際之車流樣本資料進行旅行時間之計算,能提供用路者之行車資訊亦僅能做過去 某段時間路況之參考,而不巨預測之效果。 Oh[9]利用流量守恆的觀念,發展推估路段旅行時間之模式,該文獻的資料來 源為車輛偵測器,透過車流之時空關係圖,將偵測器所回傳之資料利用流量-密度-速度之關係式加入系統流量均衡參數來轉換為路段旅行時間,其研究同時採用車流 模擬軟體之輸出資料與加州 I-880 高速公路之現場調查資料進行模式之驗證分析, 其研究結果顯示其誤差在 3%以內。Oh 模式應用國外車流相關資料,以車流模擬軟 體輸出資料或真實調查資料作為輸入項,均有明顯成效。 黃智建[12]利用有限的車輛偵測器所偵測到的平均車速等交通資料,透過上下 游路段之間的關係,推估路段中其他沒有布設車輛偵測器路段的平均車速,以期能 提供足夠的資訊做為推算旅行時間之用。此研究主要分成路段偵測器資料推估模式 以及旅行時間推估模式。路段偵測器資料推估模式是利用上下游之偵測器進行中間 偵測器因資料無法取得或缺漏之相關交通量推算,採用方法為多元線性迴歸。另外 旅行時間推估模式為利用多元線性迴歸所推算出來的交通量當作輸入資料,帶入
Oh[]模式進而推算出上下游偵測器間之路段旅行時間。最後將完整路段之車輛偵測 器速度資料和利用先行迴歸所推估出來之速度帶入 Oh 模式來做驗證和比較。此研 究所建構之模式推估中間路段偵測器資料損壞或缺漏之平均車速,進而推估該路段 之旅行時間。 2.2 利用探針車資料推估旅行時間 由 Sen[8]可了解,其所引用的資料為美國在芝加哥的 ADVANCE 計畫所收集到 的車輛經過各個路段之旅行時間資料,並檢定迴歸式中各參數是否具有顯著性,並 估算各參數值。在該計畫中,交通資訊中心(Traffic Information Center,TIC)將收集到 的之車輛在各路段之旅行時間,時間間隔以五分鐘為單位,加總各路段之車輛平均 行時間。並假設若該路段有不射偵測器,則 TIC 將同時採用偵測器級陣真車輛所得 之資料進行路段之旅行時間推估;而若該路段無佈射偵測器,則 TIC 僅採用探針車 輛之資料做為該路段之目前旅行時間。利用上述方式進行旅行時間之計算模式,並 預測路段未來 5、10 級 15 分鐘之旅行時間。在路段之旅行時間估算需注意車輛在 路段之旅行時間並非獨立,前後車之旅行時間具有共變性,其原因主要為若從上游 路段進入該路段之時間相近。例如前車之後車,其旅行時間可能將與前車相近;落 在同一車隊狀況之鄰近車輛亦可能具有同樣的旅行時間。該研究最後得到之結論為: (1)不論在路段使用多少探針車輛,其平均旅行時間之變異數仍遠大於零。(2)當每 單位時間路段之探針車輛數大於某特定數目時,之後額外加入探針車輛將無法有效 減少旅行時間變異數。因此文獻中建議探針車輛之佈設主要考慮能夠涵蓋並監控路 網之數量即可,而相當高密度的探針車輛佈設對於改善推估路段旅行時間上是不需 要的。 吳家峰[10]因受限國內固定式車輛偵測器不足,透過 GPS 訂位資訊之歷史資料 來推估車輛之旅行時間。推估車輛旅行時間魔式分為車輛運行時間和車輛停等時間。 從 GPS 定位訊號可以提供模式車輛目前所在位置、該時點瞬時速度、並可經過比 較兩筆定位訊號計算車輛之平均車速。從車輛平均車速模式可觀察車輛運行速度的 變化,前車經過前方路段所傳之該路段最近旅行時間資訊,可以提供推估車輛運行
9 時間調整機制所用。此外從車輛停等時間,判斷推估車輛停等時間是否有超估或低 估之現象,以提供推估車輛停等時間之調整機制所用。研究中,以實際國道客運和 市區公車之 GPS 訊號資料來做實例之測試。從測試結果中發現,模式在未遭遇非 重現性擁塞時,推估時間有不錯的準度,而當遭遇擁塞時,模式之推估旅行時間誤 差亦能透過模式推估旅行時間調整機制而控制在可接受範圍內。 2.3 小結 一般推估旅行時間之資料來源主要為車輛偵測器以及探針車,然而在實務上推 估旅行時間除了準確程度以外,最重要的是在實施上和計算上的效率,各種方法都 有其優缺點,但如何能夠在短時間處理大量的資料,並迅速的將預測結果呈現給用 路人,才是實務上最需要追求的目標。資料的分群對其旅行時間推估也有影響力, 因此大部分文獻都先將交通量資料蒐集彙整分群,因為隨意將資料分群會造成旅行 時間推估準確度降低。且從文獻中發現迴歸的方式是一種概念很簡單,但又不失預 測的準確度的方法,而其中的線性迴歸操作容易,只要資料處理的步驟,做好資料 分類,找到適合的資料分群,並隨時更新參數,則用作旅行時間推估上是可行的。 在台灣部分國道上,有車輛偵測器的佈設以及有探針車經過,因此本研究主要以 Chang et al [5]之旅行時間推估方法作為主軸進而修改其方法,資料來源可透過國道 上之車輛偵測器及探針車,建構一個旅行時間推估模式,可應用於國道上。
第三章 研究方法
本研究發展之旅行時間推估模式,主要是以 Chang et al[5]之方法為主軸,抽取此研 究內旅行時間推估模組作為主要研究方向,然後以不同於 Chang et al[5]方法來改善,發 展一個旅行時間推估模式。因此本研究想透過 Chang et al[5]在相同環境下(偵測器少量 分佈)、不同資料形態、不同資料分類來推估旅行時間。首先為交通狀況分類,Chang et al [5]之分類方法簡單將上下游偵測器分成擁擠和非擁擠狀況(pattern),然而本研究想使 用其他分群方法,將偵測器蒐集到的流量、速度之資料分群,為了符合資料庫龐大及資 料差異大的特性,本研究主要利用階層式分群法和分割式分群法以及 Chang et al [5]之分 群方法,將交通量資料分成不同的群集。接著在旅行時間推估方面,由於線性迴歸操作 容易,只要資料處理的步驟,做好資料分類,找到適合的資料分群,並隨時更新線性迴 歸式參數,則用作旅行時間推估上是可行的,因此本研究利用線性迴歸來推估。 由於兩 ETC 收費站之間有佈設車輛偵測器及探針車經過,本研究對兩 ETC 收費站之 旅行時間推估之方式為利用上游、下游車輛偵測器所測得之交通量資料,配合探針車通 過兩偵測器之旅行時間,找出兩者之間之的線性關係,即可推估偵測器間之旅行時間, 再利用延滯加總得到兩 ETC 收費站整段之旅行時間,由於分段旅行時間需要上下游偵測 器之資料量配合,因此偵測器至 ETC 收費站之間的旅行時間,需用探針車經過離 ETC 最 近之上下游之偵測器透過內插法進而得之偵測器至 ETC 收費站之旅行時間,即可得到延 滯加總之收費站間之旅行時間。最後再利用 ETC 收費站之平均每五分鐘測得之旅行時間, 來比較本研究旅行時間推估的顯著性。 以下 3.1 節介紹整個旅行時間推估模式的流程,包含資料分群和線性迴歸,接著介 紹本研究所利用之方式來推估兩 ETC 之間之旅行時間,然後介紹如何利用時間延滯方 法來加總偵測器之間之旅行時間進而得到 ETC 收費站之間之旅行時間,最後利用一些 評估指標來驗證模式之精準度。 3.1 旅行時間推估模式 本研究旅行時間推估之流程圖如下圖所示:圖 3. 1 旅行時間推估流程圖 由上圖可知,本研究旅行時推估方法可分為四個步驟:資料過濾模式、群集分 析法、線性迴歸、旅行時間延滯加總。 首先先長期蒐集車輛偵測器所偵測之流量、速度等資料、ETC 資訊以及探針車 之旅行時間,透過資料過濾魔是將所得資料過濾並構建歷史資料庫。接著利用群集 分析法將偵測器歷史資料庫分成 n 個群集,配合探偵車資訊,找出車輛偵測器和探 11
偵車之間的線性迴歸關係。因此每個群集裡都有一個已校估好參數的線性迴歸式, 放進群集迴歸式資料庫,接著將車輛偵測器之即時資料與所分群好之群集做比對, 決定即時資訊屬於哪一個群集,將資料代入此群集所屬之迴歸式,即可推估出上下 游偵測器間之旅行時間。 本研究旅行時間推估流程圖和 Chang et al[5]之旅行時間推估模組架構大致上 相同,主要的差別即在資料分群的方法以及群集線性迴歸之變數不同。且本研究利 用 ETC 收費站測得的旅行時間資料當作實際值,和本研究所推估的旅行時間比較 顯著性。接下來將方法逐一介紹。 3.1.1 資料過濾模式 由於從車輛偵測器、ETC 收費站的歷史資料可能有些異常值(故障、維修),導 致資料不能直接拿來利用,因此必須有特殊處理方式來過濾這些異常資料。本研究 透過高公局過濾資料判別方式,主要是將一筆資料之值未落在前後五分鐘資料值 ±15%內,則視為異常資料,將此資料刪除之。 3.1.2 群集分析 由於資料的整理分群會影響到旅行時間推估的準確性,因此為了要讓旅行時間 推估準確度提高,由 Anil K. Jain[]知依照相似度計算的不同可將分群法分成階層式 (Hierarchical)分群法和分割式(Partitional)分群法。本研究不同於 Chang et al [5]之交 通狀況分類,利用階層式聚合演算法及 k-means 作為分析的方法。由於階層式分群 法對群集大小差異大、任意形狀群集之資料會有不錯的分群效果,且可以彈性依據 使用者不同需求,對資料集合產生不同的群集數量;分割式分群法對於較大的資料 集合能夠有好的效率,因此本研究之所以選擇這兩個分群法,是因為兩個分群法有 不同的優點,由於資料庫有龐大且有大小差異大的特性,所以利用這兩種分群法來 做比較。除此之外,因為衡量資料記錄間的相似度將決定資料記錄所歸屬的群集並 影響整個分群的結果,因此相似度測量是群集分析中最根本的課題。以下也會對相 似度計算做詳細解說。 3.1.2.1 相似度計算
13 兩資料點之間的相似度是由其相對應資料維度中資料數值間的差異性來決 定。 假設有 Xi,Xj個群集,每個群集有 k 個資料點: xi=<xi1, xi2,…, xik> xj=<xj1, xj2,…, xjk>
1. 尤拉距離(Euclidean d tanc )is e
, ∑
(式 3.1)
2. 曼哈頓距離(Manh taat n dis at nce)
, ∑ (式 3.2) 3. 平方差(Square-error) 此方法用於分割式分群法。 ∑ ∑ x ; ∑| | (式 3.3) 其中 E:距離總偏移值 x:表一資料點 mi:表示群集 Si的質量中心 |Si|:群集 Si中所涵蓋之資料點數量 k:使用者事先所定義之群集數量 在 Jain[1]中提到,尤拉距離是最廣泛被用到計算相似度之公式,因此本研究中 在階層式分群法之相似度計算為利用尤拉距離,然而在分割式分群法則利用平方差 來計算。 3.1.2.2 階層式聚合演算法 透過彼此相似度高的較小群集合併成較大的群集,是由樹狀結構的底部開始向 上層層聚合。起初我們將每一筆資料都視為一個群集,而在每一階層運算過程中,
我們會將距離最相近的兩個群集聚合為一個新的群集,整個演算法步驟如下: Step 1. 將 n 筆資料視為 n 個群集,每一個群集當中最少包含了一筆資料。 Step 2. 在所有的群集當中找出距離最為相近的兩個群集 Ci、Cj。 Step 3. 合併 Ci、Cj成為一個新的群集。 Step 4. 若群集的數目未達到我們要求的終止狀態,則重複步驟 2。 整個聚合的過程會如同圖 3.2 所示,最後會形成一株二元樹,一開始各筆資料 皆是一個群集,所有共有 7 個群集,最初合併的是 B 和 C 的資料。隨後是 D 和 E 的資料,以此類推,到最後整個過程收斂之後,所以資料就完全聚合為一個群集。 圖 3. 2 二元樹 而在演算法的步驟 2 當中,我們提到最為相近的兩個群集,在記算距離之前, 我們需要瞭解群集之距離的定義,對這些不同的定義我們說明如下:
1. 單一連結法(single-link clustering algorithm),根據其定義,群集 Ci與 Cj距離為兩
之 相近 的距離, 法如下:
者 中最 兩點間 其表式
15
2. 完整連結法(complete-link clustering algorithm),根據其定義,群集 Ci與 Cj的距
為兩 之 的兩點 ,其表式法如下: 離 者 中相距最遠 間距離 , , , (式 3.5) 在 Griffiths[2]提到,以單一連結法和完整連結法做比較,完整連結法的表現比 單一連結法還好,會使得在同一群集中的資料點通常會有較高的相關性,因此本研 究利用完整連結法之定義計算資料間的相似度。 3.1.2.3 K 平均法(k-means) 根據使用者所事先定義之群集數量 k,隨機從資料集合中選擇任 k 個資料點當 作起始 k 群集的群集中心;接著透過相似度計算公式,把資料集合中的每個資料點 歸屬到離它最近之群集中心所屬的群集,並形成一個新的群集;依照其群集內所有 資料點,記算每個新群集的群集中心。這樣的步驟一直重覆執行,直到群集中心不 再變動為止。整個演算法步驟如下: 輸入:一個包含 n 個資料點之資料集合,以及使用者定義之群及數量 k。 輸出:k 個互不交集的群集。 Step 1. 隨機從資料集合中選擇任 k 個資料點當作起始 k 群的群集中心。 Step 2. 利用相似度計算公式,將資料點分別歸屬到距其最近之群集中心所屬的群 集。 Step 3. 利用各群集中所包含的資料點,重新計算各群集之群集中心點。 Step 4. 假如由 3 所得到各群之群集中心與之前所計算之群集中心相同,亦即距離 總偏移值不再變動,則表示分群結果已穩定並結束此處理程序並輸出各群結果,否則回 到步驟 2 繼續執行。 範例分析: 資料物件數 n=7,設 k=3。
Step 0. 資料物件分布情況。 圖 3. 3 k-means 範例原始資料分佈 Step 1. 隨機選取 k 個資料點做為出使群集中心。 圖 3. 4 k-means 範例隨機選取資料點 Step 2. 計算所有資料點到 k 個初始群集中心的距離,將資料點歸屬到距其最近之 群集中心所屬之群集。
圖 3. 5 k-means 範例距離計算 圖 3. 6 k-means 範例分群指派 Step 3. 重新計算分配群集中心。 17 群集中心 群集中心 群集中心 圖 3. 7 計算群集平均質量中心 Step 4. 若判斷總偏移值收斂則停止,否則回到步驟 2。
3.1.3 線性迴歸 Chang et al [5]所使用之群集線性迴歸,是以流量和佔有率為基礎,作為自變數, 實際旅行時間為應變數,校估出線性迴歸式。由於高公局所取得之資料沒有佔有率。 因此本研究將線性迴歸式稍做修改,利用流量、速度當作自變數,兩 ETC 之旅行 時間為應變數。以下簡單介紹線性迴歸基本架構: TV(t) = (式 3.6) i:第 i 個群集; TV(t):實際旅行時間,探偵車通過偵測器之旅行時間; t:為某 第 i 個群集中 t 時間點下之上游偵測器所測得之平均速度; 一時間點 : :第 i 個群集中 t 時間點下之下游偵測器所測得之平均速度; :第 i 個群集中 t 時間點下之上游偵測器所測得之平均流量; :第i 個群集中 t 時間點下之下游偵測器所測得之平均流量; 、 、 、 、 :參數。 3.1.4 兩偵測器間之旅行時間推估及旅行時間延滯加總 由於兩 ETC 收費站之間有佈設車輛偵測器,因此此小節介紹如何利用上下游 偵測器推估兩偵測器之間的旅行時間。 首先取得偵測器測得之流量、速度資料以及探針車之位置、速度、旅行時間資 料。將偵測器之資料依照本研究使用的分群法分群,以及取出探針車經過兩偵測器 之旅行時間之資料,再利用本研究提出的線性迴歸方法,校估出偵測器和探針車之 間的迴歸式。接著將即時資料代入迴歸式後即可推估出兩偵測器間之旅行時間。
圖 3. 8 推估兩偵測器之旅行時間示意圖 圖 3.8 為推估兩偵測器之旅行時間示意圖,因此可推導出兩偵測器和探針車之 迴歸式,進而推估出偵測器間之旅行時間。 因為本研究推估出上下游偵測器間之旅行時間,若要推估整段之旅行時間,要 利用時間延滯加總,即可得到整段之旅行時間。以下介紹如何利用時間延滯推估整 段旅行時間。 假設一輛車從起點偵測器 O 出發,迄點為偵測器 D,OD 之間有數個偵測器。 如圖 3.9 所示: 圖 3. 9 車輛與偵測器分佈圖 車輛在 O 點之時間為八點整,由 O 和 A 兩偵測器於 8 點時傳回之速度、流量 資料可推算出車輛於 OA 之間的旅行時間為 10 分鐘。如圖 3.10 所示: 19
圖 3. 10 車輛在 O 點根據 OA 兩偵測器傳回之旅行時間 接著再由 A 與 B 兩偵測器於 8 點 10 分時傳回之速度、流量資料可推算出車輛 於 AB 之間的旅行時間為 20 分鐘。如圖 3.11 所示: 圖 3. 11 車輛在 A 點根據 AB 兩偵測器傳回之旅行時間 一直到 D 點,此時時間為 9 點整,因此我們可以推估 OD 整條路段需要一小時。 如圖 3.12 所示: 圖 3. 12 車輛經過 OD 所需時間 而由旅行時間模式推估出來的時間可以做成一個表,如表 3.1 所示。假設車輛
於 8 點從 O 點出發。要推估早上 8 點從 O 到 D 的旅行時間。如圖 3.13 所示:
圖 3. 13 OD 之間車輛經過每兩個偵測器所需要之旅行時間
表 3. 1 旅行時間推估時間表
時段/路段 S1(OA) S2(AB) S3(BC) S4(CE) S5(ED)
8:00 10(分) 15 13 17 15 8:10 15 20 10 14 10 8:20 20 20 12 15 14 8:30 25 18 10 12 14 8:40 21 23 14 10 13 8:50 23 21 15 13 10 9:00 10 15 10 15 10 假設偵測器每 10 分鐘回傳一筆資料,在 8:00 時由偵測器 O 和偵測器 A 所推算 OA 之間旅行時間需要 10 分鐘,因此到達 A 點時間為 8:10,在這個時點由偵測器 A 和偵測器 B 所推算 AB 之間旅行時間需要 20 分鐘,因此到達 B 點時間為 8:30,在 這個時點由偵測器 B 和偵測器 C 所推算 BC 之間旅行時間需要 10 分鐘,因此到達 C 點時間為 8:40,在這個時點由偵測器 C 和偵測器 E 所推算 CE 之間旅行時間需要 10 分鐘,因此到達 E 點時間為 8:50,在這個時點由偵測器 E 和偵測器 D 所推算 ED 之間旅行時間需要 10 分鐘,因此到達 D 點時間為 9:00。所以 OD 整段推估之旅行 時間為 10+20+10+10+10=60 分鐘。 由以上步驟得知,首先取得歷史資料,利用群集分析將歷史資料分群,配合探 針車經過上下游偵測器間之旅行時間,以偵測器之流量和速度做為自變數,探針車 之旅行時間為應變數,即可找出屬於各個群集之線性迴歸式。接著比對偵測器之即 21
時資料型態是歸屬於哪一個群集,代入此群集所屬之迴歸式,即可推算出上下游偵 測器之間之旅行時間。
3.2 衡量評估指標
模式是否準確,需要靠指標來衡量。本研究利用平均絕對誤差百分比(Mean Absolute Percentage Error, MAPE)及均方根誤差(Root Mean Square Error, RMSE)作為模式精準度 之判斷依據。
1. 平均絕對誤差百分比(Mean Absolute Percentage Error, MAPE)
因該值是屬於相對數值,且不受實際值與預測值單位之影響,故能客觀獲 得實際值與預測值間相對差異,且 MPAE 值若小於 10 以下,則表示該模式有 高精準度之預測,MAPE 值若介於 10 至 20 之間,則表示模式有優良精準之預 測,若 MAPE 值介於 20 至 50 之間,則表示模式有合理之預測,若 MAPE 值 大於 50,則表示模式屬於不準確之預測。 1 100% (式 3.7) 其中,M 為評估項數 X(i)為第 i 項之實際值 Y(i)為第 i 項之估計值
2. 均方根誤差(Root Mean Square Error, RMSE)
均方根誤差為各次估計誤差平方合的平均值方根,可以顯示模式估計之可 靠性,均方根誤差愈小,表示估計的可靠性越高;反之,均方根誤差越大,表 示模式估計之可靠性越低。 RMSE ∑ x i y i M M (式 3.8)
23
其中,M 為評估項數 X(i)為第 i 項之實際值
第四章 實例分析
本研究主要利用階層式分群法及分割式分群法,將佈設於高速公路之偵測器所蒐集 到的流量、速度等交通量資料加以分群,再利用線性迴歸來加以推估,然後以 ETC 收 費站測得之旅行時間當作實際值,來衡量評估模式之精準度。 4.1 資料處理與分群 本研究蒐集高速公路北上楊梅收費站至泰山收費站之間共十五個偵測器每五 分鐘所通過之車輛的流量、速度、每五分鐘探針車經過上下游偵測器的旅行時間等 資料,ETC 資料每一台安裝 ETC 車機通過收費站之旅行時間,配合偵測器計算每 五分鐘通過兩兩收費站所需要之平均旅行時間,時間範圍為 2007 年十月至 2008 年 三月禮拜二、三、四、六、日早上七點至早上十點,每五分鐘一筆。其中 2007 年 十月份至 2008 年二月份資料用來作線性迴歸推估,2008 年三月份資料用來作線性 迴歸驗證。 由於 Chang et al[5]所分類之交通狀況分成上下游偵測器是否為擁擠或不擁擠 狀況等四個群集,本研究將所蒐集的資料利用分群法同樣分為三、四、五群,藉此 比較本研究所定義的分群法是否和 Chang et al[5]對交通狀況之分群有所差異。圖 4.1 為楊梅收費站至泰山收費站間各個偵測器代號及分佈位置。 圖 4. 1 楊梅收費站至泰山收費站間各個偵測器代號及分佈位置圖 在處理資料部分,透過本研究之資料過濾模式將一筆資料之值未落在前後五分 鐘資料值±15%內,則視為異常資料,須刪除之。表 4.1 為 2007 年十月至 2008 年三 月各個偵測器的資料缺漏率。25 表 4. 1 不同時間下各個偵測器之資料缺漏率 偵測器名稱(二、三、四) 缺漏率 偵測器名稱(六、日) 缺漏率 1N36 31.41% 1N36 18.81% 1N37 54.42% 1N37 54.14% 1N42 24.65% 1N42 16.71% 1N43 59.05% 1N43 56.79% 1N48 89.06% 1N48 88.3% 1N49 21.18% 1N49 4.98% 1N51 100% 1N51 100% 1N53 98.46% 1N53 94.36% 1N53.9 100% 1N53.9 100% 1N56 68.72% 1N56 70.62% 1N57 4.91% 1N57 4.79% 1N61 63.11% 1N61 60.92% 1N64 57.64% 1N64 48.47% 1N66 91.3% 1N66 91.89% 1N68.1 59.33% 1N68.1 58.89% 其中 1N48、1N51、1N53、1N53.9、1N56、1N61、1N66 七個偵測器因缺漏率 過高,因此本研究將這七個偵測器忽略不計。 首先先將所蒐集之資料按照 Chang et al[5]之交通狀況分類分成四群(以下稱為 Chang),假設速度小於每小時 40 公里定義為塞車,下表 4.2 為 Chang 分群上下游 偵測器所測得之平均速度和平均流量及資料筆數。 表 4. 2 Chang 之上下游偵測器所測得之平均速度、平均流量集資料筆數 VD 1N36_ 1N37 1N37_ 1N42 1N42_ 1N43 1N43_ 1N49 1N49_ 1N57 1N57_ 1N64 1N64_ 1N68.1 上游擁 擠、 下游擁 擠 上游平 均速度 (km/hr) - - - 19.06 - - - 上游平 均流量 (pcu/hr) - - - 77.6 - - -
下游平 均速度 - - - 23.13 - - - 下游平 均流量 - - - 105.46 - - - 資料筆 數(筆) 0 0 0 15 0 0 0 上游擁 擠、 下游不 擁擠 上游平 均速度 - 25.56 30.44 24.77 23.40 21.17 29.58 上游平 均流量 - 152.40 135.04 75.67 105.5 90.70 127.40 下游平 均速度 - 74.57 91.28 76.05 77.785 79.52 86.48 下游平 均流量 - 142.90 104.72 162.73 150.71 141.05 135 資料筆 數 0 251 25 365 42 17 103 上游不 擁擠、 下游擁 擠 上游平 均速度 5.41 82.18 73.77 80.21 68.16 74.43 - 上游平 均流量 36.61 171.36 152.13 88.34 169.61 145.19 - 下游平 均速度 8.21 29.95 25.30 25.26 22.611 30.43 - 下游平 均流量 35.99 131.81 72.85 109.43 96.66 128.92 - 資料筆 數 233 22 319 23 18 128 0 上游不 擁擠、 下游不 擁擠 上游平 均速度 79.81 88.93 68.84 84.19 72.69 82.99 84.06 上游平 均流量 168.06 170.16 160.73 85.30 168.13 156.39 145.30 下游平 均速度 87.37 68.86 84.30 72.675 84.35 85.32 90.87 下游平 均流量 169.79 162.12 83.74 168.57 149.91 142.68 136.66 資料筆 數 1088 1164 1119 1323 1733 517 374 其中為-代表無資料,表示無此狀況發生。
27 下表 4.3-4.5 為階層式分群不同群集數目上下游偵測器所測得之平均速度和平均流 量及資料筆數。 表 4. 3 階層式分群(3 群)之上下游偵測器所測得之平均速度、平均流量集資料筆數 VD/群集數 1N36_ 1N37 1N37_ 1N42 1N42_ 1N43 1N43_ 1N49 1N49_ 1N57 1N57_ 1N64 1N64_ 1N68.1 1 上游平均速 度 92.63 84.50 95.89 49.43 98.35 82.02 85.05 上游平均流 量 59.67 62.27 53.63 23.58 69.45 174.28 150.38 下游平均速 度 83.38 95.32 48.21 98.91 96.3 84.26 90.77 下游平均流 量 59.30 63.06 22.43 58.56 62.37 163.57 142.57 資料筆數 52 59 55 58 105 76 241 2 上游平均速 度 78.7 92.06 59.35 91.39 66.47 83.14 93 上游平均流 量 195.36 141.69 176.04 113.93 188.1 160.83 105 下游平均速 度 95.85 79.37 92.66 64.62 83.14 86.71 91 下游平均流 量 203.76 141.12 104.01 182.89 167.49 142.59 80 資料筆數 160 105 307 208 691 226 1 3 上游平均速 度 78.73 92.69 76.53 90.7 73.51 82.32 87.21 上游平均流 量 171.15 187.13 157.7 80.48 162.63 142.42 134.55 下游平均速 度 89.84 63.88 86.49 72.06 83.83 79.66 91.53 下游平均流 量 167.81 174.16 67.83 171.41 145.24 133.92 123.64 資料筆數 422 371 162 383 732 111 93
表 4. 4 階層式分群(4 群)之上下游偵測器所測得之平均速度、平均流量集資料筆數 VD/群集數 1N36_ 1N37 1N37_ 1N42 1N42_ 1N43 1N43_ 1N49 1N49_ 1N57 1N57_ 1N64 1N64_ 1N68.1 1 上游平均速 度 91.92 36.46 95.89 49.43 98.5 73.82 93 上游平均流 量 67.86 35.86 53.63 23.58 67.92 145.82 105 下游平均速 度 102.07 97.2 48.21 98.91 96.41 35 97 下游平均流 量 67.47 41.46 22.43 58.56 61.11 135.88 80 資料筆數 38 15 55 58 102 17 1 2 上游平均速 度 78.72 100.88 53.97 91.39 74.95 82.02 87.2 上游平均流 量 195.36 71.27 177.95 113.93 190.71 174.28 134.55 下游平均速 度 95.85 94.68 97.55 64.62 86.5 84.26 91.53 下游平均流 量 203.76 70.43 118.08 182.89 154.02 163.57 123.64 資料筆數 160 44 97 208 184 76 101 3 上游平均速 度 78.73 92.06 61.54 92.05 72.54 83.14 84.56 上游平均流 量 171.15 141.69 175.15 79.09 159.44 160.83 158.95 下游平均速 度 89.84 79.37 90.41 72.91 89.15 86.71 91.14 下游平均流 量 167.81 141.12 97.52 183.42 144.41 142.59 139.04 資料筆數 422 105 210 234 580 226 128 4 上游平均速 度 94.57 92.69 76.53 88.59 64.51 83.86 85.61 上游平均流 量 37.42 187.13 157.7 82.65 186.22 141.8 140.67
29 下游平均速 度 32.64 63.88 86.49 70.74 82.13 87.74 90.36 下游平均流 量 37.14 174.16 67.83 152.54 170.57 133.57 146.56 資料筆數 14 371 162 149 390 94 113 表 4. 5 階層式分群(5 群)之上下游偵測器所測得之平均速度、平均流量集資料筆數 VD/群集數 1N36_ 1N37 1N37_ 1N42 1N42_ 1N43 1N43_ 1N49 1N49_ 1N57 1N57_ 1N64 1N64_ 1N68.1 1 上游平均速 度 80.61 93.06 59.45 46.26 74.95 73.82 93 上游平均流 量 158.74 195.53 173.92 21.56 190.71 145.82 105 下游平均速 度 93.21 63.85 91.35 99.48 86.5 35 97 下游平均流 量 148.04 174.63 112.89 54.48 154.02 135.88 80 資料筆數 229 438 188 50 64 17 1 2 上游平均速 度 91.69 95.4 95.89 87.4 72.54 82.21 87.2 上游平均流 量 72.17 39.6 53.63 34.2 159.44 168.75 134.55 下游平均速 度 99.89 66.2 48.21 96.9 89.15 86.11 91.53 下游平均流 量 68.04 164.6 22.43 92.6 144.41 150.73 123.64 資料筆數 46 5 55 20 195 184 102 3 上游平均速 度 78.01 32.64 63.3 88.74 66.42 84.14 83.91 上游平均流 量 188.26 37.14 176.02 71.19 188.97 137.38 166.47 下游平均速 度 91.01 97.42 94.19 70.44 82.91 88.22 90.76 下游平均流 量 193.59 36.35 83.11 190.57 169.54 132.54 150.21
資料筆數 427 14 305 171 619 62 34 4 上游平均速 度 94.57 98.16 83.39 83.81 98.35 84.1 84.79 上游平均流 量 37.42 73.86 130.39 60.97 69.45 151.847 156.23 下游平均速 度 32.64 93.94 87.45 87.34 96.3 86.84 91.27 下游平均流 量 37.14 79.88 53.59 150.54 62.37 140.51 135.01 資料筆數 14 60 80 90 42 180 94 5 上游平均速 度 79.58 94.55 78.81 92.81 73.51 80.67 85.61 上游平均流 量 178.5 145.5 149.83 102.64 162.63 187.29 140.67 下游平均速 度 103.5 74.47 61.19 66.32 83.83 81.67 90.36 下游平均流 量 29 154.71 83.93 175.15 145.24 162.77 146.56 資料筆數 2 210 31 472 608 27 113 下表 4.6-4.8 為 k-means 不同群集數目上下游偵測器所測得之平均速度和平均流量及 資料筆數。 表 4. 6k-means(3 群)之上下游偵測器所測得之平均速度、平均流量集資料筆數 VD/群集數 1N36_ 1N37 1N37_ 1N42 1N42_ 1N43 1N43_ 1N49 1N49_ 1N57 1N57_ 1N64 1N64_ 1N68.1 1 上游平均速 度 92.14 94.43 57.78 59.27 98.35 82.98 87.43 上游平均流 量 65.88 145.89 176.81 26.24 69.45 148.29 135.7 下游平均速 度 84.49 73.96 93.02 98.24 96.3 80.32 91.65 下游平均流 量 60.16 154.77 107.05 67.97 62.37 148.33 124.75
31 資料筆數 61 226 324 74 105 151 122 2 上游平均速 度 78.28 86.19 94.85 90.01 66.47 84.03 83.48 上游平均流 量 189.27 65.47 65.96 71.39 188.1 148.3 158.66 下游平均速 度 92.6 93.78 60.41 74.27 83.14 88.03 90.79 下游平均流 量 193.9 73.8 24.55 174.54 167.49 129.9 139.46 資料筆數 426 76 77 364 691 130 130 3 上游平均速 度 80.11 93.05 74.90 91.61 73.51 81.79 86.59 上游平均流 量 157.11 196324 163.1 109.44 162.63 173.38 140.15 下游平均速 度 90.31 63.74 87.75 65.25 83.83 85.57 90.48 下游平均流 量 147.19 175.33 69.39 177.59 145.24 151.63 149.21 資料筆數 231 425 257 365 732 189 91 表 4. 7k-means(4 群)之上下游偵測器所測得之平均速度、平均流量集資料筆數 VD/群集數 1N36_ 1N37 1N37_ 1N42 1N42_ 1N43 1N43_ 1N49 1N49_ 1N57 1N57_ 1N64 1N64_ 1N68.1 1 上游平均速 度 80.38 94.16 95.89 89.12 98.5 82.06 84.94 上游平均流 量 156.08 143.35 53.63 70.85 67.92 172.41 151.44 下游平均速 度 89.94 74.89 48.21 74.81 96.41 87.49 91.75 下游平均流 量 146.67 156.94 22.43 177.94 61.11 139.55 126.91 資料筆數 222 136 55 232 102 93 68 2 上游平均速 度 92.14 84.68 56.19 92.79 74.95 84.35 82.41
上游平均流 量 65.88 63.54 173.893 95.92 190.71 146.98 165.28 下游平均速 度 84.49 95.19 93.43 65.08 86.5 87.64 90.57 下游平均流 量 60.16 64.73 113.73 153.89 154.02 137.51 143.38 資料筆數 61 61 184 126 184 194 63 3 上游平均速 度 77.78 91.51 66.75 49.28 72.54 73.11 87.67 上游平均流 量 181.31 175.55 176.7 22.94 159.44 145.52 130.03 下游平均速 度 89.21 72.94 91.56 99.01 89.15 38.15 91.36 下游平均流 量 183.43 149 83.44 57.49 144.41 137.36 123.26 資料筆數 202 86 198 57 580 19 76 4 上游平均速 度 78.52 92.07 80.48 91.61 64.51 82.03 86.53 上游平均流 量 195.91 196.46 145.04 111.35 186.22 169.04 142.22 下游平均速 度 95.8 61.09 82.05 66.57 82.13 83.91 90.66 下游平均流 量 201.67 178.75 62.91 184.35 170.57 161.28 146.3 資料筆數 233 252 87 234 390 107 136 表 4. 8k-means(5 群)之上下游偵測器所測得之平均速度、平均流量集資料筆數 VD/群集數 1N36_ 1N37 1N37_ 1N42 1N42_ 1N43 1N43_ 1N49 1N49_ 1N57 1N57_ 1N64 1N64_ 1N68.1 1 上游平均速 度 78.04 91.64 79.09 91.35 99.87 81.49 84.57 上游平均流 量 200.11 116.6 149.06 90.52 51.53 177.31 155.75
33 下游平均速 度 96.37 82.38 84.5 67.61 97.64 85.27 91.69 下游平均流 量 205.01 124.49 62.31 188.94 46.31 152.42 125.46 資料筆數 145 237 141 231 64 120 49 2 上游平均速 度 92.14 92.62 62.07 59.27 84.93 83.28 85.78 上游平均流 量 65.88 219.41 165.76 26.24 145.98 156.51 146.39 下游平均速 度 84.49 68.12 86.33 98.24 86.69 84.31 91.2 下游平均流 量 60.16 181.79 104.79 67.97 140.2 158.51 139.22 資料筆數 61 24 124 74 195 97 84 3 上游平均速 度 80.32 83.5 66.66 95.17 68.98 73.38 86.88 上游平均流 量 156.27 247 180.41 120.8 170.5 145.44 139.69 下游平均速 度 89.92 49 93.86 65.19 83.06 36.61 90.23 下游平均流 量 146.8 187.5 80.64 182.38 147.86 136.33 151.18 資料筆數 224 2 185 147 619 18 72 4 上游平均速 度 76.87 89.53 53.85 85.77 95.95 85.11 87.48 上游平均流 量 189.29 193.81 181.13 62.68 98.04 136.97 131.16 下游平均速 度 92.53 64.78 96.68 79.16 94.23 87.26 91.52 下游平均流 量 184.16 175.06 117.04 170.85 87.92 139.12 123.71 資料筆數 175 315 138 197 42 80 85 5 上游平均速 度 80.46 101.53 95.15 92.26 66.42 83.41 82.22
上游平均流 量 174.99 180.56 61.95 96.84 188.97 157.45 166.05 下游平均速 度 88.47 62.21 57.3 65.29 82.91 88.35 90.33 下游平均流 量 192.63 172.59 25.57 157.38 169.54 133.54 144.98 資料筆數 113 149 70 154 608 155 53 4.2 線性迴歸方程式校估 本研究先將所分群好之偵測器資料與探針車經過兩 VD 間之旅行時間做比對, 在相同時間點下將資料合併拿來做線性迴歸推估之資料。其中自變數為上下游偵測 器測得之流量、速度,依變數為探針車經過兩 VD 間之旅行時間。泰山收費站與楊 梅收費站北上之間有十五個偵測器,因此迴歸式有十四個,但因 1N48、1N51、1N53、 1N53.9、1N56、1N61、1N66 七個偵測器缺漏率太高,故忽略不利用。因此只剩下 1N36_1N37、1N37_1N42、1N42_1N43、1N43_1N49、1N49_1N57、1N57_1N64、 1N64_1N68.1 七段之偵測器為正常,所以每個分群法各有七個迴歸式。由於各個分 群法之線性迴歸的統計分析過多,因此各個迴歸式的統計分析參考附錄一。 各個分群的迴歸式校估出來後,利用三月份之所有偵測器資料帶入屬於各個分 群法之迴歸式,可得到三月份星期六早上七點至十點所推估出來的旅行時間,因此 我們可以將所推估出來的旅行時間和兩 ETC 間的旅行時間做出旅行時間分佈圖。 下圖 4.2-4.7 為三月份禮拜二、三、四、六、日各個分群法推估出來的旅行時間與 兩 ETC 間之旅行時間之分佈圖。
0 10 20 30 40 07:00:00 07:10:00 07:20:00 07:30:00 07:40:00 07:50:00 08:00:00 08:10:00 08:20:00 08:30:00 08:40:00 08:50:00 09:00:00 09:10:00 09:20:00 09:30:00 09:40:00
旅行時間
禮拜二、三、四(3群)
ETC k‐means(3) 階層式(3) Chang 圖 4. 2 三月份禮拜二、三、四各個分群法在不同群集數目下推估出來的旅行時間與兩 ETC 間之旅行時間之分佈圖。 0 10 20 30 40 07:00:00 07:10:00 07:20:00 07:30:00 07:40:00 07:50:00 08:00:00 08:10:00 08:20:00 08:30:00 08:40:00 08:50:00 09:00:00 09:10:00 09:20:00 09:30:00 09:40:00旅行時間
禮拜二、三、四(4群)
ETC k‐means(4) 階層式(4) Chang 圖 4. 3 三月份禮拜二、三、四各個分群法在不同群集數目下推估出來的旅行時間與兩 ETC 間之旅行時間之分佈圖。 0 10 20 30 40 07:00:00 07:10:00 07:20:00 07:30:00 07:40:00 07:50:00 08:00:00 08:10:00 08:20:00 08:30:00 08:40:00 08:50:00 09:00:00 09:10:00 09:20:00 09:30:00 09:40:00旅行時間
禮拜二、三、四(5群)
ETC k‐means(5) 階層式(5) Chang 圖 4. 4 三月份禮拜二、三、四各個分群法在不同群集數目下推估出來的旅行時間與兩 ETC 間之旅行時間之分佈圖。 350 10 20 30 40 07:00:00 07:10:00 07:20:00 07:30:00 07:40:00 07:50:00 08:00:00 08:10:00 08:20:00 08:30:00 08:40:00 08:50:00 09:00:00 09:10:00 09:20:00 09:30:00 09:40:00
旅行時間
禮拜六、日(3群)
ETC k‐means(3) 階層式(3) Chang 圖 4. 5 三月份禮拜六、日各個分群法在不同群集數目下推估出來的旅行時間與兩 ETC 間之旅行時間之分佈圖。 0 10 20 30 40 07:00:00 07:10:00 07:20:00 07:30:00 07:40:00 07:50:00 08:00:00 08:10:00 08:20:00 08:30:00 08:40:00 08:50:00 09:00:00 09:10:00 09:20:00 09:30:00 09:40:00旅行時間
禮拜六、日(4群)
ETC k‐means(4) 階層式(4) Chang 圖 4. 6 三月份禮拜六、日各個分群法在不同群集數目下推估出來的旅行時間與兩 ETC 間之旅行時間之分佈圖。 0 10 20 30 40 07:00:00 07:10:00 07:20:00 07:30:00 07:40:00 07:50:00 08:00:00 08:10:00 08:20:00 08:30:00 08:40:00 08:50:00 09:00:00 09:10:00 09:20:00 09:30:00 09:40:00旅行時間
禮拜六、日(5群)
ETC k‐means(5) 階層式(5) Chang 圖 4. 7 三月份禮拜六、日各個分群法在不同群集數目下推估出來的旅行時間與兩 ETC 間之旅行時間之分佈圖。 將三月份之驗證資料帶入各個迴歸式所推估出來的旅行時間,可以做成一個資 料庫。下表 4.9 為 k-means 分群法在三月份星期六早上七點至十點經過各個偵測器37 所需要之時間。 表 4. 9 k-means 分群法 2008 年三月份星期六、日(3 群)早上七點至十點之旅行時間資 料庫 時段\ 路段 泰山_ 1N36 1N36_ 1N37 1N37_ 1N42 1N42_ 1N43 1N43_ 1N49 1N49_ 1N57 1N57_ 1N64 1N64_ 1N68.1 楊梅_ 1N68.1 7:00 0.97(分) 0.60 3.67 0.45 4.27 5.09 3.87 2.78 2.27 7:05 0.98 0.59 3.77 0.45 4.27 5.19 3.84 2.84 2.27 7:10 0.98 0.59 3.94 0.46 4.25 5.27 3.86 2.83 2.31 7:15 0.99 0.60 3.73 0.46 3.83 5.3 3.89 2.91 2.31 7:20 1.01 0.59 3.98 0.45 4.12 5.32 3.91 2.95 2.31 7:25 0.98 0.99 3.96 0.44 4.00 5.56 3.84 2.90 2.31 7:30 0.96 0.59 3.84 0.44 3.99 5.28 3.85 2.81 2.31 7:35 0.95 0.59 3.83 0.44 3.99 5.38 3.86 2.74 2.31 7:40 0.94 0.60 3.99 0.43 4.52 5.39 4.01 2.76 2.35 7:45 0.99 0.58 3.82 0.46 4.34 5.23 3.83 2.87 2.35 7:50 1.01 0.60 3.92 0.47 4.52 5.26 3.88 2.79 2.35 7:55 1.01 0.60 4.01 0.46 4.34 5.26 3.93 2.76 2.35 8:00 1.03 0.60 4.12 0.46 4.29 5.19 3.8 2.75 2.35 8:05 1.03 0.59 3.87 0.45 4.18 5.08 3.82 2.80 2.35 8:10 1.03 0.60 3.84 0.44 4.28 5.11 3.97 2.88 2.35 8:15 1.03 0.50 3.79 0.43 4.10 5.38 3.91 2.84 2.97 8:20 1.03 0.59 4.02 0.44 4.30 5.31 3.90 2.89 2.97 8:25 1.03 0.59 3.75 0.46 4.48 5.35 3.97 2.80 2.97 8:30 1.03 0.60 3.84 0.45 4.05 5.27 3.92 2.82 2.97 8:35 1.03 0.60 3.58 0.48 4.32 5.3 3.94 2.86 2.97 8:40 1.03 0.59 3.92 0.45 4.15 5.39 3.96 2.87 2.26 8:45 1.03 0.58 3.70 0.47 4.15 5.26 3.94 2.82 2.26 8:50 1.03 0.60 3.72 0.48 4.37 5.24 3.94 2.77 2.26 8:55 1.27 0.59 3.66 0.47 3.95 5.29 3.92 2.8 2.26 9:00 1.16 0.59 4.10 0.46 4.16 5.43 3.89 2.8 2.26 9:05 1.16 0.62 3.77 0.46 4.32 5.32 3.89 2.79 2.26 9:10 1.16 0.59 3.97 0.47 4.31 5.3 3.96 2.92 2.26 9:15 1.16 0.60 4.04 0.45 4.09 5.44 3.41 2.89 2.38 9:20 1.25 0.62 4.23 0.45 4.20 5.27 3.95 2.89 2.38 9:25 1.25 0.59 3.83 0.47 4.33 5.28 3.97 2.90 2.38 9:30 1.25 0.59 3.72 0.46 4.25 5.20 3.95 2.89 2.36 9:35 1.25 0.58 3.76 0.54 4.34 5.29 3.93 2.98 2.36
9:40 1.25 0.56 3.47 0.46 4.60 5.33 3.93 2.87 2.36 9:45 1.25 0.57 3.39 0.45 4.32 5.42 3.88 2.89 2.41 9:50 1.14 0.56 3.47 0.44 4.09 5.30 3.93 2.93 2.37 9:55 1.14 0.57 3.39 0.44 4.09 5.30 3.89 2.82 2.37 10:00 1.14 0.56 3.38 0.44 4.12 5.32 3.92 2.91 2.37 4.3 模式驗證與分析 經由各個分群法所推估出來的旅行時間後,必須要有些模式精準度判斷的依據, 本研究利用平均絕對誤差百分比以及均方根誤差做為模式精準度之準則。 將三種分群法推估之旅行時間,與泰山和楊梅兩 ETC 收費站之旅行時間來作 模式驗證,下表 4.10 為三月份禮拜六不同分群法各個迴歸式推估延滯加總出來的旅 行時間與表 4.11 與婊 4.12 為兩 ETC 間收費站之旅行時間與不同時間之不同分群法 數目的平均絕對誤差及均方根誤差。 表 4. 10 2008 年三月份禮拜六、日兩 ETC 收費站間之旅行時間與不同分群數目下推估 出來之旅行時間 時段 ETC k-means (3 群) k-means (4 群) k-means (5 群) 階層式 (3 群) 階層式 (4 群) 階層式 (5 群) Chang 7:00 22.2(分) 24.12 23.74 24.15 24.12 24.38 23.93 24.14 7:05 22.29 24.11 25.20 24.51 24.16 24.65 24.27 24.13 7:10 22.67 24.46 25.10 24.36 24.49 24.50 24.72 24.21 7:15 22.32 24.34 24.96 25.22 24.50 24.26 24.64 24.29 7:20 22.40 24.54 24.95 25.40 24.68 24.26 24.99 24.43 7:25 23.03 24.35 25.15 24.29 24.40 24.32 24.85 24.55 7:30 22.40 24.81 23.94 23.89 25.61 25.63 25.68 24.58 7:35 22.42 24.82 24.25 25.49 24.44 24.50 24.55 24.22 7:40 22.49 24.83 24.15 24.64 24.69 24.44 24.90 24.22 7:45 22.39 24.95 24.32 24.65 24.68 24.33 24.67 24.21 7:50 22.44 24.62 24.26 24.63 24.80 24.74 24.94 24.21 7:55 22.85 24.21 24.25 24.21 24.61 24.39 24.48 24.33 8:00 22.78 24.17 24.06 24.35 23.80 24.27 24.55 24.17 8:05 22.42 24.45 24.43 24.62 24.60 24.35 24.82 24.24 8:10 22.75 24.71 24.02 24.63 24.42 24.34 24.96 24.36 8:15 23.85 25.03 24.67 24.95 25.07 24.93 25.68 25.33
39 8:20 22.50 25.56 25.16 25.43 25.24 25.07 24.28 25.14 8:25 22.81 25.30 25.24 25.27 25.2 25.07 24.36 25.2 8:30 22.80 25.03 25.14 25.05 25.25 25.42 25.11 25.26 8:35 22.88 25.59 25.21 26.25 25.57 25.68 24.60 25.5 8:40 22.95 24.62 24.63 25.46 24.80 24.89 23.93 24.86 8:45 22.74 24.59 24.71 24.40 24.62 24.65 24.07 24.62 8:50 23.01 24.43 24.71 24.52 24.64 25.38 24.68 24.50 8:55 22.89 24.95 24.79 24.93 25.01 24.92 24.72 24.68 9:00 23.14 25.05 24.37 25.02 24.90 24.73 24.65 24.86 9:05 23.06 24.95 24.84 25.75 25.13 25.39 25.04 24.98 9:10 23.19 24.39 24.01 24.77 25.75 24.96 24.84 24.96 9:15 23.53 24.87 24.58 25.01 25.42 24.88 24.72 25.31 9:20 23.48 24.92 24.60 25.04 25.05 25.12 24.50 24.86 9:25 23.35 24.56 24.56 24.56 25.14 25.26 24.29 24.93 9:30 23.29 24.65 24.52 24.38 25.22 24.81 24.14 25.47 9:35 23.33 24.59 24.20 24.72 25.03 24.31 24.32 25.75 9:40 23.91 24.18 24.38 24.21 24.27 24.66 24.04 25.19 表 4. 11 星期二、三、四兩 ETC 收費站間之旅行時間與不同分群數目下推估出來之旅 行時間之絕對誤差及均方根誤差 星期二、三、四 最大誤差 最小誤差 平均絕對誤差 均方根誤差 K-means(3 群) 23.92% 5.12% 16.43% 5.72 K-means(4 群) 20.67% 2.75% 13.96% 4.93 K-means(5 群) 20.3% 5.14% 14.3% 4.95 階層式(3 群) 22.67% 6.5% 14.67% 5.28 階層式(4 群) 24.36% 5.14% 14.92% 5.27 階層式(5 群) 23.04% 4.23% 13.9% 5.05 Chang 22.18% 0.2% 8.6% 3.36
表 4. 12 星期六、日兩 ETC 收費站間之旅行時間與不同分群數目下推估出來之旅行時 間之絕對誤差及均方根誤差 星期六、日 最大誤差 最小誤差 平均絕對誤差 均方根誤差 K-means(3 群) 13.61% 1.15% 8.01% 1.91 K-means(4 群) 11.83% 1.97% 7.52% 1.81 K-means(5 群) 14.74% 1.24% 8.54% 2.05 階層式(3 群) 12.2% 1.49% 8.61% 2.03 階層式(4 群) 14.44% 3.13% 8.36% 1.97 階層式(5 群) 14.63% 0.56% 7.77% 1.86 Chang 11.84% 5.34% 8.12% 1.88
41
第五章 結論與建議
5.1 結論 本研究結論如下: 1. 在泰山收費站至楊梅收費站之間偵測器偵測之速度、流量和探針車經過偵測器 之旅行時間具有線性關係,各個分群之上下游速度和流量資料與探針車經過偵 測器之旅行時間部分有顯著性相關。 2. 本研究利用兩 ETC 收費站之間的旅行時間做為模式驗證資料,結果顯示在不同 時段不同分群數目下結果下,以 MAPE 值為例: (1). 星期二、三、四: 不管 k-means 和階層式分群法分幾群,表現都比 Chang 差。 (2). 星期六、日 以 k-means(4 群)表現最好。 3. 誤差較大的原因可能是偵測器和偵測器之間距離過長,較無法反映出此路段實 際狀況,因此推估出來之旅行時間誤差會較大。 4. 透過變異數分析表可知,大部分的迴歸式之自變數(速度、流量,P-value<0.05) 對應變數(旅行時間)有顯著影響。 5. 以尖峰時段(星期二、三、四)來看,Chang 的分群法比本研究分群法效果還要好; 非尖峰時段(星期六、日)來看 k-means 分群法表現的比其他分群法還好,表示 k-means 分群法在不擁擠的狀況下推估的效果最好。 5.2 建議 1. 在泰山收費站至楊梅收費站之間之偵測器,偵測器有時資料為損壞或是故障, 導致模式因偵測器故障之資料而使估計精準度下降。或許未來偵測器提升資料 之準確性,對模式的準確度應該能增加。 2. 本研究只利用上下游偵測器與探針車經過上下游偵測器之旅行時間分段並利用 延滯加總推估旅行時間,或許未來可以考慮直接利用整段所有偵測器和探針車經過偵測器之旅行時間來做迴歸分析。
43
參考文獻
1. A.K. Jain, M.N. Murty and P.J. Flynn, “Data clustering: a review”, ACM Computing Surveys Vol.31, No.4, pp. 264–323, 1999.
2. A. Griffith, H. C. Luckhurst, and P. Willet, “Using Inter-document Similarity Information in Document Retrieval Systems”, journal of the American society for information science, Vol.37, pp. 3-11, 1986.
3. Zhang, X., and Rice, J., “Short-Term Travel Time Prediction Using a Time-Varying Coefficient Linear Model”, Transportation Research Part C, Vol. 11, pp. 187-210, 2003 4. Karl F. Petty, “Accurate Estimation of Travel Times from Single-Loop Detectors,”
Transportation Research Part A, Vol.32, pp. 7-17, 1998
5. Gang-Len Chang, Nan Zou, Jianwei Wang, “Development and Field Evaluation of a Real-Time Travel Time Prediction System,” Maryland Department of Transportation State Highway Administration, Draft Final Report, 2006.
6. Kwon, J., Coifman, B., Bickel, P., “Day-to-Day Travel-Time Trends and Travel-Time Prediction from Loop-Detector Data”, Transportation Research Record: Journal of the Transportation Research Board, Vol.1717,pp.120-129,2000.
7. Benjamin Coifman, “Vehicle Re-Indetification (VRI) and Travel Time Measurement (TTM) in Real-Time on Freeways Using Existing Loop Detector Infrastructure”, Transportation Research Record 1643, pp181-191,1998.
8. Sen, Ashish, Thakuriah, Piyushimita, Zhu, Xia-Quon, and Karr, Alan, “Frequency of Probe Reports and Variance of Travel Time Estimates”, Journal, of Transportation Engineering, Vol.123, NO.4,pp290-297,1997.
9. Oh, J. S., Jayakrishnan, R., and Recker, W. “Section Travel Time Estimation from Point Detection Data”, presentation at the 82th Annual Meeting of Transportation Research Board, Washington, D.C.,U.S.A., 2002.
10. 吳佳峰,「有 GPS 資訊提供下之車輛旅行時間預估模式之研究」,國立交通大學運輸 工程與管理學系碩士論文,民國 89 年 11. 張惠汶,「利用公車 GPS 定位資料推估路段行車速率之研究」,國立交通大學運輸工 程與管理學系碩士論文,民國 90 年 12. 黃智建,「車輛偵測器不完整資訊推估旅行時間之研究」,逢甲大學交通工程與管理 所碩士論文,民國 96 年 13. 曾憲雄等,資料探勘,旗標出版社,台北,民國九十七年九月
簡 歷
姓 名: 何聰儒 出 生 地: 彰化縣 出 生 日 期: 民國 73 年 11 月 10 日 連 絡 地 址: 台中縣大肚鄉自強村 23 鄰中沙路 164 巷 5 弄 85 號 學 歷: 民國 98 年 6 月 國立交通大學運輸科技與管理學系碩士 民國 96 年 6 月 國立高雄大學應用經濟學系學士 電 子 郵 遞: [email protected] 45附錄一
其中 up_spd 為上游偵測器速度、up_flow 為下游偵測器流量、down_spd 為下 游偵測器速度、down_flow 為下游偵測器流量、TT 為探針車經過兩兩偵測器之旅行時 間。 以下為各個分群法所屬之迴歸式的統計分析。 k-mean 分群法各個群集數目之迴歸式之統計分析 禮拜二、三、四(3 群-第一群) 表 1N36_1N37 模式摘要 摘要輸出 迴歸統計 R 的倍數 0.857805 R 平方 0.735829 調整的 R 平方 0.710045 標準誤 2.333251 觀察值個數 199 ANOVA 自由度 SS MS F 顯著值 迴歸 4 155.0643 38.76607 7.120801 2.27E-05 殘差 194 1056.148 5.44406 總和 198 1211.212 係數 標準誤 t 統計 P-值 截距 52.73229 9.464236 5.571743 8.35E-08 up_fsspd -0.10977 0.094575 -1.36067 0.047204 up_fsflow -0.02037 0.016108 -1.36473 0.007486 down_Fsspd -0.08766 0.01783 -4.91677 1.87E-06 down_fsflow 0.008885 0.015343 1.57908 0.043207 表 1N37_1N42 模式摘要 摘要輸出 迴歸統計 R 的倍數 0.807891
47 R 平方 0.652687 調整的 R 平方 0.651287 標準誤 39.93505 觀察值個數 226 ANOVA 自由度 SS MS F 顯著值 迴歸 4 70342.69 17585.67 11.02683 3.59E-08 殘差 221 352452.6 1594.808 總和 225 422795.3 係數 標準誤 t 統計 P-值 截距 459.789 48.88797 9.404953 6.94E-18 up_fsspd -1.1251 0.301462 -3.73216 0.000241 up_fsflow 0.010135 0.159577 1.63513 0.049415 down_Fsspd -1.19283 0.249677 -4.77749 3.23E-06 down_fsflow -0.11059 0.16124 -1.68588 0.04351 表 1N42_1N43 模式摘要 摘要輸出 迴歸統計 R 的倍數 0.80702 R 平方 0.651281 調整的 R 平方 0.660554 標準誤 4.848008 觀察值個數 324 ANOVA 自由度 SS MS F 顯著值 迴歸 4 4374.527 1093.632 46.53122 8.69E-31 殘差 319 7497.515 23.50318 總和 323 11872.04 係數 標準誤 t 統計 P-值 截距 67.2363 5.669198 11.85993 3.98E-27 up_fsspd -0.34586 0.027277 -12.6792 4.12E-30 up_fsflow 0.01572 0.021197 1.741612 0.048868 down_Fsspd -0.17721 0.026181 -6.76882 6.24E-11 down_fsflow 0.014343 0.020328 1.705585 0.048096
表 1N43_1N49 模式摘要 摘要輸出 迴歸統計 R 的倍數 0.829854 R 平方 0.688657 調整的 R 平方 0.661743 標準誤 36.54811 觀察值個數 74 ANOVA 自由度 SS MS F 顯著值 迴歸 4 60609.06 15152.27 11.34352 3.93E-07 殘差 69 92167.73 1335.764 總和 73 152776.8 係數 標準誤 t 統計 P-值 截距 359.9836 160.9689 2.236356 0.028564 up_fsspd -1.16444 0.200828 -5.7982 1.84E-07 up_fsflow 0.661021 0.710281 0.930648 0.035528 down_Fsspd 0.069115 1.54113 1.444847 0.044359 down_fsflow -0.2945 0.308994 -1.9531 0.043867 表 1N49_1N57 模式摘要 摘要輸出 迴歸統計 R 的倍數 0.856581 R 平方 0.733731 調整的 R 平方 0.723081 標準誤 3.357743 觀察值個數 105 ANOVA 自由度 SS MS F 顯著值 迴歸 4 3106.79 776.6975 68.89011 6.95E-28 殘差 100 1127.444 11.27444