中華大學

(1)

中華大學碩士論文

題目：運用悠遊卡及資料探勘求解公車營運改善方案 Exploring Smartcard and Data Mining to Improve Bus Operation Strategies

系所別：運輸科技與物流管理學系碩士班學號姓名：邱詩淳 M09314004 指導教授：林祥生博士

中華民國九十五年七月

(2)

(3)

(4)

(5)

運用悠遊卡及資料探勘求解公車營運改善方案

學生：邱詩淳指導教授：林祥生博士

摘要

過去國內有關公車營運的研究已不在少數，可是最大的研究障礙往往來自欠缺完整且具代表性的載客紀錄。在台北都會區啟用悠遊卡後，不僅改變了民眾搭乘大眾運具的付費方式，更重要的是乘客的所有交易資料都可同時被記錄下來。經年累月下來，大眾運輸成為一個資料密集之產業，所以龐大的資料庫中埋藏了許多有用的隱含資訊，而資料探勘技術（Data Mining）本身也善於從大量資料庫探勘出有參考意義價值之商業智慧。

本研究以悠遊卡系統內之乘客實際交易資料和公車衛星定位系統內之公車到站時間資料，比對出乘客刷卡位置後，經由乘客搭乘紀錄的推估可建立出真實乘客OD 矩陣。接著運用真實之乘客 OD 矩陣進行公車營運改善求解。藉由瞭解公車實務營運課題後，發現公車業者現行路線經營策略除每站皆停外，另外尚有直達車及區間車兩種靠站型態，為使研究成果能與實務符合且將來能應用，本研究採用直達車、區間車等營運路線組合作為研究範疇。並運用資料探勘技術之群集化分析及關聯法則之功能，分別求解區間車及直達車之最佳營運路線。最後建立產出方案之評比計算式，包含業者的車小時成本及車公里成本、

乘客的車上時間成本及等車時間成本，模式目標為系統總節省成本最大。本研究以802 公車路線進行實例應用與分析。

以本研究所探討的公車802 而言，區間車改善效果以下午尖峰時段最佳，

直達車改善效果則以上午尖峰時段最佳，這也反映業者可依照路線乘客的需求特性，可因時制宜的調整其經營方式，提供客製化的服務。而無論在哪一時段，

行駛區間車之總體績效均優於直達車，且本研究各時段所求解之區間車最佳行駛路線均優於業者現況行駛路線。

在敏感度分析部份，營運時間成本、營運里程成本及乘客車上時間成本皆與成本計算式呈正向關係。有鑒於油價上漲及乘客時間愈趨寶貴，若能根據路線乘客需求特性提供客製化服務型態，不僅乘客可獲得更符合需求的公車服務，節省交通時間，公車業者也可節省成本。

關鍵字：悠遊卡、公車動態資訊系統、資料探勘技術

(6)

Exploring Smartcard and Data Mining to Improve Bus Operation Strategies

Student : Shih-Chun Chiu Advisor : Dr. Hsiang-Sheng Lin

Abstract

In the past, the researches about bus operation have had the same shortage, which was always without complete and reliable OD Table. Fortunately, after the popularity of Taipei Smartcard, the data of rider pay can be recorded by Smartcard at the same time. Gradually, the public transportation has become a large database industry, which has many useful concealed information. In addition, data mining is also a good technique to analyze the stored data in large databases to discover potential information and knowledge.

This research constructs real passenger OD Table by Taipei Smartcard System’s data and Taipei County e-bus System’s data. As well as explore real OD Table to generate bus operation strategies. This research discusses the short-turn service route and express service route. It applied Data Mining technology about clustering and association rules to figure out optimal short-turn service route and optimal express service route, with the objective to save maximum the sum of operator’s cost

（including traveling time cost and distance cost）and passengers’ travel time cost

（including in-vehicle time cost and waiting time cost）. A case study by 802 route shows an optimal condition.

By this research, the result shows that the best improving effect of short-turn service is the afternoon peak time period, and the best improving effect of express service is the morning peak time period. It also reflects that operators should base on passengers’ demand to adjust their operational strategies. Overall, the effect of short-turn service is better than express service. However, the performance of optimal short-turn service route solution surpasses the present short-turn service. By the sensitive analysis, excluding from the cost of passenger’s waiting time, we could save more total cost if other factors’ costs arise. It implies that providing customized service not only the passengers may get more suitable bus service but also the operator may save more cost.

Keywords：Taipei Smartcard, e-bus System, Data mining

(7)

誌謝

窗外下著2006 年的第一場梅雨，象徵著兩年的研究所生活即將畫下句點，

宣告結束。本論文的完成，首先要感謝指導教授林祥生博士，在詩淳求學的兩年間，不論是課業或待人處事上，給予詩淳殷切的指導與啟發，和適時的協助與提攜，使我受惠良多，倘若沒有老師這般不厭其煩的叮嚀及指導，這篇論文可能就無法順利完成，在此獻上最誠摯的謝意。

此外，還要感謝東南客運在詩淳國科會小產學研究期間提供資料，給予詩淳研究本論文的啟蒙，在研究期間，感謝首都客運李總經理的大力贊助資料與協助，以及張庭榮課長毫無保留的提供經驗，使得詩淳得以順利進行研究，而在口試期間，承蒙魏健宏教授、陶治中教授在百忙之中仍撥空指導與悉心審閱，

並提供諸多寶貴的意見與指正，方能匡正研究上的疏失，使本文得以更加完備，

謹此表達深忱的感激。

在研究求學期間，感謝所有研究所成員們的幫忙與協助。感謝暢湘學長總是願意當我們的開心果及打雜小弟，感謝雅雯、耘翠、眉君、惠筑這些好姐妹的一路扶持，感謝益豪這位好夥伴的相互幫助，感謝小基、人敬、智浩、勝弦、

佳鴻、任由、佑旌、宗樺、文菊、浩宗、振越還有高桂學姊、思葦學姊等人在研究期間所給予的支持與鼓勵。忘不了我們班的敬浩呆三人組、豪朱二人組的搞笑，忘不了大家在校內口試前的一起挑燈夜戰，忘不了大夥一起出遊歡笑的日子，還有許多其他的學長、學姊、學弟、學妹族繁不及備載，因為有你們，

讓詩淳的研究所生活多采多姿！

再來還要感謝我的家人，在我的求學路上一路支持我，謝謝爸爸、媽媽的養育之恩及金錢上的支援，謝謝妹妹、弟弟的貼心懂事，因為有你們的陪伴與支持，讓詩淳得以心無旁鶩專心於論文的研究與撰寫，於此表達無限的感謝！

最後，謹以此篇論文，獻給曾經幫助過詩淳的師長及朋友，感謝你們帶給我的一切，謝謝大家！

邱詩淳謹識於中華運管所中華民國95 年 7 月

(8)

目錄

摘要...i

Abstract ...ii

誌謝... iii

目錄...iv

圖目錄...vi

表目錄... viii

第一章緒論...1

1.1 研究背景與動機... 1

1.2 研究目的... 1

1.3 研究方法... 1

1.4 研究對象與範圍... 2

1.5 研究內容及流程... 2

第二章文獻回顧...5

2.1 公車營運相關課題... 5

2.1.1 公車排班及人車調度... 5

2.1.2 路線設計及績效... 7

2.2 公車靠站型態... 8

2.2.1 公車靠站型態之類型及優缺點... 8

2.2.2 公車靠站型態之相關研究... 12

2.3 智慧卡產出資料之相關研究... 14

2.4 資料探勘... 14

2.4.1 資料探勘的定義... 14

2.4.2 資料探勘的功能... 15

2.4.3 資料探勘的應用... 17

2.5 小結... 20

第三章公車乘客起迄需求之推估...21

3.1 起迄需求推估邏輯概念... 21

3.2 研究路線特性... 24

3.3 悠遊卡資料特性... 26

3.4 衛星定位資料特性... 29

3.5 資料轉換及前處理過程... 32

3.6 起迄需求推估方式... 39

3.7 推估結果分析... 43

第四章模式構建與設計...48

4.1 現況分析及模式設計... 48

4.2 區間車方案產出... 50

4.2.1 群集分析技術... 50

(9)

4.2.2 K-meams 演算法 ... 52

4.2.3 區間車探勘內容及流程... 53

4.3 直達車方案產出... 54

4.3.1 關聯式法則... 54

4.3.2 Apriori 演算法 ... 56

4.3.3 直達車探勘內容及流程... 58

4.4 產出方案之評比方法... 62

4.4.1 各項成本分析... 62

4.4.2 評比計算式建構... 64

第五章模式應用與分析...66

5.1 區間車... 66

5.1.1 平日上午尖峰時段... 66

5.1.2 平日下午尖峰時段... 71

5.1.3 平日離峰時段... 74

5.1.4 假日時段... 77

5.1.5 現況比較... 80

5.2 直達車... 81

5.2.1 平日上午尖峰時段... 81

5.2.2 平日下午尖峰時段... 84

5.2.3 平日離峰時段... 87

5.2.4 假日時段... 89

5.3 敏感度分析... 91

5.3.1 車小時成本之變動... 91

5.3.2 車公里成本之變動... 92

5.3.3 等車時間成本之變動... 92

5.3.4 車上時間成本之變動... 93

5.4 交叉敏感度分析... 94

5.4.1 車小時成本與乘客等車時間成本之變動... 94

5.4.2 車公里成本與乘客等車時間成本之變動... 95

5.4.3 車上時間成本與乘客等車時間成本之變動... 96

第六章結論與建議...98

6.1 結論... 98

6.2 建議... 99

參考文獻...100

附錄一符號表...103

附錄二上午尖峰時段 OD 表...104

附錄三平日離峰時段 OD 表...108

附錄四假日時段 OD 表...110

(10)

圖目錄

圖1.1 研究流程... 4

圖2.1 每站皆停方式示意圖... 9

圖2.2 直達車方式示意圖... 9

圖2.3 區間車方式示意圖... 10

圖2.4 越站停車方式示意圖... 10

圖2.5 分區直達方式示意圖... 11

圖2.6 限制分區方式示意圖... 11

圖3.1 起迄需求推估邏輯概念圖（兩段票現象）... 22

圖3.2 起迄需求推估邏輯概念圖（一段票現象）... 23

圖3.3 802 營運路線圖... 25

圖3.5 衛星定位資料庫處理原則... 31

圖3.6 公車到站時間遺漏值... 32

圖3.7 資料前處理及轉換流程... 33

圖3.8 乘客刷卡站位推導圖... 38

圖3.9 乘客刷卡站位示意圖... 38

圖3.10 推導二段票乘客起迄點示意圖... 41

圖3.11 推導一段票乘客起迄點示意圖一... 41

圖3.12 推導一段票乘客起迄點示意圖二... 42

圖3.13 推導一段票乘客起迄點示意圖三... 42

圖4.1 靠站型態分析流程圖... 50

圖4.2 K-means 概念圖 ... 53

圖4.3 區間車探勘邏輯概念圖... 53

圖4.4 關聯式法則概念圖... 58

圖4.5 直達車探勘邏輯概念圖... 59

圖4.6 模擬 OD 表... 60

圖4.7 直達車探勘流程說明... 62

圖5.1 探勘主軸示意圖... 66

圖5.2 區間車分群結果... 67

圖5.3 上午尖峰時段各方案成本... 69

圖5.4 下午尖峰時段各方案成本... 72

圖5.5 平日離峰時段各方案成本... 75

圖5.6 假日時段各方案成本... 78

圖5.7 平日上午尖峰直達車各方案成本... 82

圖5.8 平日下午尖峰直達車各方案成本... 85

圖5.9 平日離峰直達車各方案成本... 87

圖5.10 假日時段直達車各方案成本... 89

圖5.11 車小時成本變動下對於總成本之影響... 91

(11)

圖5.12 車公里成本變動下對於總成本之影響... 92

圖5.13 等車時間成本變動下對於總成本之影響... 93

圖5.14 車上時間成本變動下對於總成本之影響... 94

圖5.15 車小時與等車時間成本反向變動下對於總成本之影響... 95

圖5.16 車公里成本與等車時間成本反向變動下對於總成本之影響... 96

圖5.17 車上時間成本變動與等車時間成本反向變動下對於總成本之影響... 97

(12)

表目錄

表2.1 公車排班相關彙整... 7

表2.2 公車運作組合策略文獻彙整... 13

表2.3 資料探勘的定義... 15

表2.4 資料探勘應用領域相關文獻彙整... 19

表3.1 資料欄位一... 26

表3.2 資料欄位二... 26

表3.3 資料欄位三... 26

表3.4 悠遊卡資料紀錄欄位... 27

表3.5 悠遊卡原始資料各欄位所代表的意義... 27

表3.6 悠遊卡刷卡行為方式... 28

表3.7 不同刷卡行為方式所得資訊... 29

表3.8 刷卡時段分割方式... 35

表3.9 802 站牌代碼... 37

表3.10 推估需求起迄點概念... 40

表3.11 下午尖峰時段乘客 OD 起迄表一 ... 44

表3.12 下午尖峰時段乘客 OD 起迄表二... 45

表3.13 下午尖峰時段乘客 OD 起迄表三... 46

表3.14 下午尖峰時段乘客 OD 起迄表四... 47

表4.1 實務上已行駛之靠站型態... 49

表5.1 資料探勘分群結果... 67

表5.2 區間車方案組合及改善績效比較... 67

表5.3 平日上午尖峰二分群... 68

表5.4 平日上午尖峰三分群... 68

表5.5 平日上午尖峰四分群... 68

表5.6 上午尖峰時段最佳行駛路線... 70

表5.7 平日下午尖峰二分群... 71

表5.8 平日下午尖峰三分群... 71

表5.9 平日下午尖峰四分群... 71

表5.10 下午尖峰時段最佳營運行駛路線... 73

表5.11 平日離峰二分群... 74

表5.12 平日離峰三分群... 74

表5.13 平日離峰四分群... 74

表5.14 平日離峰最佳營運行駛路線... 76

表5.15 假日時段二分群... 77

表5.16 假日時段三分群... 77

表5.17 假日時段四分群... 77

(13)

表5.18 假日時段最佳營運行駛路線... 79

表5.19 平日上午尖峰時段之現況與探勘結果績效比較... 80

表5.20 平日下午尖峰時段之現況與探勘結果績效比較... 80

表5.21 平日離峰時段之現況與探勘結果績效比較... 80

表5.22 假日時段之現況與探勘結果績效比較... 80

表5.23 平日上午尖峰直達車探勘結果... 81

表5.24 平日上午尖峰直達車各方案成本... 81

表5.25 平日上午尖峰直達車最佳營運行駛路線... 83

表5.26 平日下午尖峰直達車探勘結果... 84

表5.27 平日下午尖峰直達車各方案成本... 84

表5.28 平日下午尖峰直達車最佳營運行駛路線... 86

表5.29 平日離峰直達車探勘結果... 87

表5.30 平日離峰時段直達車各方案成本... 87

表5.31 平日離峰直達車最佳營運行駛路線... 88

表5.32 假日時段直達車探勘結果... 89

表5.33 假日時段直達車... 89

表5.34 假日時段直達車最佳營運行駛路線... 90

表5.35 車小時單位成本變動下之總成本變動資料... 91

表5.36 車公里單位成本變動下之總成本變動資料... 92

表5.37 等車時間成本變動下之總成本變動資料... 92

表5.38 車上時間成本變動下之總成本變動資料... 93

表5.39 交叉敏感度分析因素... 94

表5.40 車小時單位成本與等車時間成本反向變動下之總成本變動資料... 95

表5.41 車公里單位成本與等車時間成本反向變動下之總成本變動資料... 95

表5.42 車上時間成本與等車時間成本反向變動下之總成本變動資料... 96

(14)

第一章緒論

1.1 研究背景與動機

近年來，隨著都市的快速發展，私人運具大幅成長，捷運路網一條條的開通，使得公車業者的經營空間逐漸被壓縮，從以往扮演主要運送的主角，逐漸轉變為捷運站間的接駁配角。儘管如此，公車系統仍佔著舉足輕重的重要角色。

只是，面對能源物料的成本逐年上漲，如何兼顧服務品質及節省成本，是營運業者最關心的課題。

過去業者因為缺乏資料，所以很難檢視乘客行為，公車經營者對於乘客需求的了解，多半依賴司機們的個別觀察及站長的經驗累積，而類似這種拼湊式的市場資訊蒐集，不但容易造成個人主觀且不具代表性的扭曲情報，也難以輔助業者進行有效的營運決策。所幸，隨著悠遊卡付費系統的普及化，乘客在搭乘的同時可以記錄大量的資料，如搭乘日期、刷卡時間、票種及轉乘紀錄等，

此舉可代替現存的運輸資料來源（抽樣調查）和節省成本，若能善用悠遊卡裡的交易記錄，運用適當的資料處理技術，將可完整呈現乘客需求在不同時間及空間上的分布，大幅改善以往人工蒐集資料的缺陷，甚至能改善乘客關係管理並提升營運績效。

而過去有關改善公車服務績效的研究，多偏重於公車排班、人車調度及路線績效與設計的課題(將詳述於第二章)，對於如何因應乘客在不同時間及空間上的需求分布，提出因地制宜的多元靠站型態(如直達車、區間車、越站停車等) 較少著墨，且受限於實際資料取得的困難，前人的研究亦多以虛擬的簡例或少數調查資料進行測試。

1.2 研究目的

在前述問題背景及研究動機之下，本論文擬應用現有的悠遊卡刷卡資料，

推導公車乘客的需求分布型態，進而構建不同類型的公車靠站組合，以尋求乘客旅行時間節省及業者營運成本降低的改善效益，故界定本研究之目的如下：

一、運用悠遊卡刷卡資料及公車衛星定位到站時間，比對乘客刷卡地點，以推估乘客起迄運量表（OD Table）。

二、運用資料探勘技術之群集分析功能，求解區間車營運改善方案。

三、運用資料探勘技術之關聯法則功能，求解直達車營運改善方案。

四、提出不同需求型態下，可獲致較高績效的營運改善方案。

1.3 研究方法

以往對於公車靠站型態組合研究多以虛擬的簡例或少數調查資料作為求解範圍。目前悠遊卡系統裡，已可清楚紀錄乘客之交易資料，但由於悠遊卡系統尚未與衛星定位系統整合，所以悠遊卡資料裡無紀錄乘客之刷卡地點及起迄點。

因此，本研究將以乘客實際交易資料作為研究基底，經乘客刷卡時間與衛

(15)

星定位系統裡，紀錄每輛公車的進站、離站時間之比對結果，推估出乘客刷卡地點，進而建構出乘客起迄運量表（OD Table）。本研究利用SAS Enterprise Miner 9.1 版之資料探勘技術，建立區間車、直達車等靠站型態組合，以降低公車業者營業成本與旅客旅行時間成本之總和成本最大為模式目標，接著以Visual C 程式語言撰寫方案評比計算式程式，利用電腦程式執行上述運算，尋求各靠站型態之最佳靠站組合。

1.4 研究對象與範圍

本研究範圍為台北地區聯營公車系統，而原本預定選線原則有以下三點特性：1.壟斷性高之路線，較能呈現完整需求型態。2.乘客使用悠遊卡比例高之路線，具有陳述該路線乘客特質之代表性。3.優先考慮二段票之路線，較易推估乘客OD 分布。

經由與業者尋求提供實務資料協助後，本研究之研究對象為首都客運之 802 路線，資料範圍為 2005 年 10 月份乘客交易紀錄，從中挑選具代表性之上午尖峰、下午尖峰、平日離峰及假日連續三班車之乘客交易資料，建立該時段之完整乘客起迄需求矩陣。802 路線有以下二點特性：1.壟斷性高之路線：從三峽往返板橋僅此一條公車業者經營，因此較能呈現完整需求。2.為二段票之路線：802 路線為二段票路線，較易推估乘客 OD 分布。

1.5 研究內容及流程

本研究之研究流程如圖1.1 所示，具體說明如下：

一、確認問題

首先了解能改善公車服務績效的策略之相關課題，以及各課題間之可能關聯性，然後決定研究之課題。

二、界定研究範圍與目的

應用現有的悠遊卡刷卡資料，推導公車乘客的需求分布型態，進而構建不同類型的公車靠站型態組合，以尋求乘客旅行時間節省及業者營運成本降低的改善效益。

三、文獻回顧

針對國內外有關公車靠站型態、公車排班設計及路線設計及績效之文獻進行回顧。在國內現有文獻中，對於靠站方式的研究較為缺乏，僅針對區間車、直達車及每站皆停進行研究，大都未同時求出實際停靠站、班距、

車輛數、營運成本及時間成本，即使求出結果，也並未提出停靠站選擇之依據。而公車排班設計大致分為數學規劃法、最大承載區間概念法、系統模擬法及啟發式求解法四種。

四、公車營運課題瞭解

公車路線選擇靠站方式主要是針對乘客需求與道路環境等因素，以適當的停靠站方式進行運作，期望能提升服務水準且降低業者營運成本。本

(16)

研究將藉由資料蒐集及業者訪談，以瞭解研究路線之特性及需求。爾後針對缺點進行改善，已達到提升服務水準且降低業者營運成本之目標。

五、蒐集及處理資料

蒐集研究路線基本資料、目前公車業者之路線經營方式及業者實際營運成本資料，並向業者取得該路線悠遊卡交易資料。而路線基本資料包括路線長度、停靠站數、場站調度時間、車輛容量、承載率。另外，在取得該路線之悠遊卡交易資料後，需要先經過資料前處理及轉換步驟，處理過後的資料庫才能做為資料探勘使用的資料庫。

六、推導公車乘客OD 分布並進行需求特性分析

資料經過處理後，除了可推估公車乘客之OD 分布矩陣，也可藉由資料探勘技術得出乘客需求特性。而所要了解的乘客需求特性如：乘客在平日與假日之載客量比較，一日中各時段的尖離峰現象，上下午尖峰乘客需求差異等課題。

七、建構各種公車靠站型態

本研究將以資料探勘技術輔佐停靠站的選擇，作為選站的依據，靠站型態將考慮每站皆停、直達車、區間車及區間直達車等運作策略。而靠站組合方式的選擇，將運用資料探勘技術之群集及關聯式法則之概念，如：

K-means 平均法、關聯式法則，一同尋求最佳解，並比較各方法所改善之績效結果。

八、建立方案評比計算式

在衡量公車業者之經營環境以及滿足乘客合理服務水準的前提下，本研究將以降低系統總成本(乘客等候時間、乘客車上時間及公車業者營運成本)最大為方案評比計算式。

九、驗證改善績效

求解出不同公車停靠方式，運用方案評比計算式求算出不同服務型態所能提高之效益。

十、提出可改善公車服務績效的營運策略

根據方案評比計算式之績效比較，提出不同需求型態下，可獲致較高績效的營運策略。

(17)

確認問題

界定研究範圍與目的

文獻回顧公車營運課題了解

處理悠遊卡資料

建構各種公車靠站組合方案

提出多元化之最適靠站型態

公車靠站組合服務績效推估公車乘客OD分布矩陣

挖掘乘客需求特性

建立方案評比計算式

驗證不同情境下各方案之績效

圖1.1 研究流程

(18)

第二章文獻回顧

在本章文獻回顧中分成四小節，首先 2.1 節先回顧公車排班及路線績效等相關文獻，2.2 節回顧公車營運在靠站型態之相關文獻，2.3 節針對前人已運用智慧卡產出資料之相關研究做一回顧，2.4 節則針對資料探勘方法做介紹及相關文獻之應用。最後，2.5 節則根據上述各課題之文獻回顧後，所得到之啟發和想法作總結。

2.1 公車營運相關課題 2.1.1 公車排班及人車調度

一、數學規劃法

劉方琪(1998)【24】主要針對市區公車固定班距的隨機排班問題，在假設車輛容量固定、旅客在等候線等候時間超出某上限值就離開，旅客到達過程服從非均勻波以松過程（Possion Process）、旅客到站下車人數服從二項式分配（Binomial）、公車站間旅行時間服從韋伯分配、旅客之上下車時間為一常數等情況下，提出一「最佳化客運公司利潤」為目標的最佳班距模式，並將模式區分為單一班距與多班距兩種模式。單一班距模式以界線回朔分析法（Bounding Retrospective Algorithm）求解。多班距則由該研究發展出之隨機最佳化方法求解，其中隨機最佳化方法為將ㄧ日營運區分為多各時段，再將各時段透過單一班距進行求解。最後以新竹客運之某特定路線的試調資料作測試驗證，結果顯示在非尖峰時段能增加80%的營運效率，在尖峰時段中則改善了17%。

二、最大承載區間概念法

Ceder(1984)【30】提出兩種資料蒐集的方法，共四種決定班次的方法，

而蒐集的方法分別是單點調查法(Max Load Methods)和隨車調查法(Load Profile Methods)兩種，單點調查法是蒐集每站最大上車乘載量人數，而隨車調查法則是蒐集整條路線乘客上車人數，將所蒐集之資料數據描繪出該條路線各時段的需求分佈。依照蒐集數據，導出決定班次方法及時刻，而單點調查法有兩種導出班距的方法，隨車調查法也有兩種導出班距的方法，最後，並提出選擇適用方法的準則。

Ceder(2001)【31】有感於初始班表可能會因環境或其他外在因素的改變，使得原始班表不再符合乘客需求，希望能在條件不變下(如：車隊規模)，進行班表重建及調整。主要也是依照所蒐集之資料數據，來改善發車時間，而調整準則是以同時考慮每站最大承載人數，是否已達到期望人數為分割點，只要某站人數一達到臨界值，則該時間為發車時間。

三、系統模擬法

謝金玫(1993)【26】以經營者的立場，建構一目標函數為維持可接受服務水準下使「營運者淨收益最大」的模式。其排班模式所得的資料與訪談專家所得之經驗建構公車排班作業之系統，為一人員及車輛的排班系

(19)

統。該研究將排班作業中之特殊情況考慮進去，如車輛臨時故障送修或行車人員因故缺席等不確定狀況，而其探討影響排班作業的因素包括：旅次需求量、班距彈性、公車運行作業方式、服務水準、重複路線競爭、車輛容量、行駛時間、週期時間、車隊規模、營運成本及可使用的人員等十項。

最後，以大有巴士的信義幹線作為研究測試對象。

吳宗憲(1994)【6】對於謝金玫在不確定狀況僅考慮人員請假與車輛故障兩種情況感到不足，因此繼續深入了解車況（車輛可用狀況）、人況（駕駛員勤缺狀況）、路況（道路交通狀況）、客況（旅客需求變化狀況）等不確定因素的產生，對於調度站排班作業的影響。該研究利用系統模擬法建構排班模式以得到正常排班的知識，並利用訪談專家與駐站實習，以得到不確定狀況的知識，結合兩者發展出一排班專家系統，而其目標式為系統總成本（乘客等車時間成本、車內時間成本及業者營運成本之合）最小。

而其探討影響排班作業的主要因素有：乘客需求量、需求彈性、服務水準、

重複路線的競爭、車輛容量、運作時間、公車運行作業方式、車隊數目、

營運成本及駕駛人數等十項。最後以信義幹線作為研究測試對象。

陳政信(2002)【18】延續劉方琪(1998)【24】的研究，把其研究範圍由單一路線之發車班距的設定延伸至單一路線多班距之班距設定問題。在考慮較複雜且符合現實狀況（如：旅運需求、行車時間、乘客因不耐煩而離開等候線等）之行車隨機的系統，也同時考慮公車營運業者本身的利潤及乘客的利益，建立ㄧ目標函數，利用依隨機最佳化的方法找出最佳發車班距使目標函數最高。本研究運用系統模擬法還解決多班距排班問題，

Nelder-Mead 的方法論來解決最佳隨機化問題。結果顯示若行車系統只有兩個時段以及只有總站和終站兩站，且乘客在總站上車必須在中站下車，

則近似解釋一個不做的簡單最佳解，若行車系統為多站式時，則效果就較差，此時可依照常理來推一起始解，以求取較好的最佳發車頻率。

四、啟發式解法

吳孟璵(2003)【5】研究範圍是以市區公車即時班表排班為主，其建立排班模式主要考量「營運者利潤最大化」原則及「旅客擁擠程度」為限制，

來決定各時段發車次數及提供時刻表資訊。並利用GPS 即時資料輔助調度監控車輛行駛中誤點、脫班、漏班、連班及無法回站發車等情況，和遇到人員事先請假、中途退出以及車輛保養、故障等狀況，建構一以專家知識作為班表調整依據的專家系統。最後以台北市公車285 路線為測試對象，

結果顯示非假日單日可提升4.36%獲利，假日單日可提升 63%獲利，整體而言單月效益應可提升 9%獲利；在專家系統的使用者滿意度調查方面，

90%的使用者對於調度模組感到「滿意」，系統效率較原人工作業減少 50%

的時間。

游文松(2004)【14】考量經營業者與司機員兩層面，建立ㄧ多目標人員與車輛排班模式，並依據模式特性，發展以勤務為染色體之基因演算法

(20)

進行模式求解作業，其中，在適合度目標函式採用權重赫爾德範數(weighted Holder norms)，以處理多目標單位與值域不同之問題。其研究範圍以單場站單路線與單場站多路線為主。最後以桃園客運桃園站實際營運勤務及新竹客運排班教育訓練範例內容為測試對象。結果顯示該研究求解結果確實能提升現行汽車客運人員與車輛排班作業效率。

表2.1 公車排班相關彙整

研究者論文名稱研究對象排班方法研究主題

謝金玫 (1993)

專家系統應用於公車排班作業之研究

大有巴士

信義幹線系統模擬法

¾ 人員排班

¾ 車輛排班

¾ 隨機班表吳宗憲

(1994)

結合模擬技術與專家系統應用於公車排班作業之研究

大有巴士

信義幹線系統模擬法

¾ 人員排班

¾ 車輛排班

¾ 隨機班表劉方琪

(1998)

市區公車排班與即

時機動調度之研究新竹客運數學規劃法

¾ 車輛排班

¾ 隨機情況

¾ 固定班表陳政信

(2002)

公車多班距時刻表設計的隨機最佳化問題

模擬實驗系統模擬法 ¾ 隨機情況

¾ 即時班表

吳孟璵 (2003)

GPS 環境下公車車輛排班調度專家系統之研究

台北市公

車285 路線啟發式解法

¾ 人員排班

¾ 車輛排班

¾ 即時班表游文松

(2004)

公路客運人員與車

輛排班之研究新竹客運啟發式解法 ¾ 人員排班

¾ 車輛排班資料來源：本研究整理

2.1.2 路線設計及績效

邱奕明【11】為提昇大眾運輸系統之績效、增進公車專用道設施效益，研擬市區公車路線之調整程序，其內容包含分析準則、調整方式、及評估方法三部份。該研究以各運輸走廊公車路線作為分析之基礎，選取路線重複率、路網涵蓋率、路線彎繞度、行駛公車專用道長度比例作為調整準則，並以公車專用道路段容量作為調整限制；路線調整方法以路線拉直、路線平移為策略；調整績效評估則以公車系統成本為評估指標，以大眾運輸旅次指派輸出資料進行分析。該研究結合地理資訊系統之資料庫管理、空間分析、及成果展示等功能，

藉以提昇調整流程之效率，同時加強調整成果之溝通能力。最後依據研擬之準則及評估方法對台北市聯營公車系統進行實例分析，除確認本程序操作之實用性外，並證實配合公車專用道之路網結構，依據此調整程序改變公車路線，可有效提昇公車系統之績效，對大眾運輸系統效益之提昇具有正面意義。

王湮筑【4】於公車路網現況評估模式構建中，考量經營者、使用者及管制

(21)

者等三個層面，並以選取可以量化之指標和避免各指標間具相依性之原則，選取路網密度、涵蓋路線、路線彎繞度、路線直接性、載客量、路網可及性及服務範圍指標為評估路網現況之指標，配合 TransCAD 及 EXCEL 之應用，以評估路線調整或規劃增設前後之績效。在既有公車路線調整方面，分析既有路線調整之影響因素、目標及原則，選取「路線彎繞度指標」及「路線重複性」作為既有路線調整準則。並參考過去相關研究，訂定超過門檻值（1.3＜路線彎繞度＜1.6）或路線重複性高的路線，列為優先考量調整的路線。考量新闢路線規劃方面，提出新闢路線規劃目標，並進一步分析新闢路線選取原則，且以「交通分區可及性」及「供需比」作為選取亟需規劃新路線之交通分區的準則。結合「TransCAD」之應用，作為公車路網規劃與設計之主要工具。以台中市市區公車系統為實例分析對象，經既有路線調整準則及新闢路線選取準則之分析，

規劃四條調整及合併路線和十三條新闢路線。

2.2 公車靠站型態

2.2.1 公車靠站型態之類型及優缺點

一般公車路線可選擇之靠站策略，包括每站皆停方式、直達車方式、區間車方式、越站停車方式及分區停車等服務方式，以下為各種靠站型態之實施方式與特性【45】。

一、每站皆停方式（All Stop Service）

此種營運方式係指每一班車往返行駛於路線的全程，並在每一車站停靠，以供乘客上下車，如圖 2.1 所示。都市中的公車系統大多採用此種營運方式，此即為一般所稱的普通車。此種營運方式的特性為站距較短、乘客搭乘較為方便及等車時間較短，但也因停靠車站過多而造成乘客的平均旅行時間較長。每站皆停之優缺點如下：

(一) 優點

1. 各站乘客皆可搭乘，為最簡單的運作方式。

2. 班車每站皆停，乘客到站步行距離較短。

3. 班距較短，乘客等車時間也較短。

4. 服務範圍較大。

(二) 缺點

1. 乘客平均旅行時間較長。

2. 停靠與啟動頻繁，乘客舒適性低。

3. 班車行駛時間長，車輛迴轉率較低。

4. 班車營運中干擾較大，易發生連班或脫班現象。

(22)

圖2.1 每站皆停方式示意圖二、直達車方式（Express Service）

此種營運方式為每一班車街行駛路線全程，但僅停靠少處幾各站，如圖 2.2 所示。直達車所停靠之車站多為乘客的主要旅次產生點或吸引點，

如學校、百貨公司、辦公大樓、主要轉車中心等。此種停站特性為站距較長、班車行駛速率較快、減少乘客旅行時間，但因停靠站數較少，服務範圍減小、乘客步行時間較長。直達車之優缺點如下：

(一) 優點：

1. 停靠站數減少、提高班車行駛速率、增加車輛迴轉率。

2. 減少乘客旅行時間。

3. 班車在路線中所受干擾較小，較能維持正常班距行駛。

(二) 缺點：

1. 停站數減少、乘客步行距離較長，乘客搭乘較不方便。

2. 服務範圍較小，部分乘客需轉車。

圖2.2 直達車方式示意圖三、區間車方式（Short-Turn Service）

此種運作方式為在路線上乘客較多的區段另派班車服務，每一班車僅停靠其行駛區段中之每個車站，如圖 2.3 所示。其特性與每站皆停方式相類似，但因其行駛里程較短，班車在路線中所受延滯較小。區間車之優缺點如下：

(一) 優點：

1. 行駛距離較短，班車準點性較高。

2. 車輛迴轉率高。

3. 班車行駛於乘客量大之區段，較易維持均勻之載客量。

(二) 缺點：

1. 班車僅行駛部份區段，長程乘客需轉車。

2. 乘客搭乘時易發生錯誤。

：車輛停靠供乘客上下車

：車輛不停靠

(23)

圖2.3 區間車方式示意圖四、越站停車方式（Skip-Stop Service）

此種運作方式一般將車站分為A、B、AB 三類，並將班車分為 A、B 兩類。各類班車接往返行駛路線全程，但A 車僅停靠 A、AB 兩類車站，B 車進停靠B、AB 兩類車站，如圖 2.4 所示。如此，所有班車皆停靠 AB 類車站，A、B 兩類車站則分別僅有 A、B 兩類班車停靠。此種運作方式由於停靠站數較每站皆停方式為少，可使行駛速率提高，減少乘客旅行時間，

但對於起、迄點分別為 A、B 兩類車站之乘客造成困擾。越站停車之優缺點如下：

(一) 優點：

1. 班車停靠站數較每站皆停少，可減少乘客旅行時間。

2. 班車停靠站較直達車多，服務範圍較大。

3. 班車行駛時間縮短，降低路線營運成本。

(二) 缺點：

1. 起、迄點分別在 A、B 兩類車站時，易造成乘客轉車困難。

2. 對於 A、B 兩類車站之班車班距增大，增加成客等車時間。

3. 服務方式較每站皆停複雜，易造成乘客搭乘之困擾。

圖2.4 越站停車方式示意圖五、分區停車方式（Zonal Service）

此種運作方式是將乘客較多、里程較長之路線劃分成若干區間，不同

郊區市中心

A B C D E F G H I J K

F G H I J K

區間車路線

：A 車站，車輛停靠供乘客上下車

郊區市中心

A B C D E F G H I J K

：B 車站，車輛停靠供乘客上下車

：AB 車站，車輛停靠供乘客上下車

(24)

區間將指派不同班車行駛，各班車之行駛路線僅包括其服務區間至中心商業區之路段，班車停靠其服務區間內之每一車站。其特性為班車行駛距離較短、停靠站數較少，可增加車輛使用率，並減少乘客旅行時間。此種運作方式有可分為下列四種：

(一) 分區直達方式（Zonal Express Service）

此種運作方式將服務路線分成兩區或數區，而以不同之路線分別提供服務，各班車在其服務分區內每站皆停，在分區外則不停靠任何站，而直達市中心區。其營運方式如圖2.5 所示。

圖2.5 分區直達方式示意圖 (二) 限制分區方式（Restricted Zonal Service）

此種運作方式與分區直達方式類似，為進城方向之班車在其服務的分區之外，僅允許乘客下車，而出城方向的班車允許乘客上車。

(三) 限站分區方式（Limited-Stop Zonal Service）

此種運作方式在路線所服務之區間內可供乘客自由搭乘，但在服務區間外，則僅於指定之車站停靠。其營運方式如圖2.6 所示。

圖2.6 限制分區方式示意圖

郊區市中心

路線一

分區一路線二

分區二路線三

分區三

郊區市中心

路線一分區一

A B D E G

路線二

分區二

B C D E G

路線三分區三

E G F

(25)

(四) 半限制分區方式（Semi-Restricted Zonal Service）

此種運作方式與限制分區方式相似，但是當進城方向之班車在其服務的分區之外有乘客下車時，才允許乘客下車；若無人下車則不停車載客。

2.2.2 公車靠站型態之相關研究

葉祥海(1983)【22】針對都市公車，利用電腦模擬方法，分別建立普通車、

區間車與直達車三種派車策略之電腦模擬模式，進行各種組合派車策略之模擬實驗。主要目的是在分析同一公車路線上行駛直達車、區間車與普通車在各種組合比例下之系統績效。作者把實地調查5 路及 10 路公車之數據資料及路線基本資料，當作模擬程式之起始輸入值，再進行各種組合派車之模擬實驗。研究中對於直達車運作方式之停靠站並未說明其選擇方法，僅以每分鐘上下人數總和大於 1.5 人之站位，作為直達車之停靠站位。而有關於區間車服務之區段選擇方法也未加說明。模擬結果顯示，直達車或區間車愈多時，車輛迴轉率愈高，

但將造成乘客等車時間顯著增加及載客數愈不均勻之不良現象。

Santhakumar 和 Hariharan（1991）【44】運用電腦模擬模式，探討在各種運輸系統管理（TSM）策略對於公車路線服務績效之影響，包括：改變行車速度、改變加速度或減速度、減少站牌數、改變公車靠站型態（探討直達車）、公車車型的配置、重新安排公車站牌位置等六種。研究中利用四條公車路線之實際資料，透過電腦模擬結果顯示，當施實直達車之停靠站方式，總行車時間約減少30%，可有效提升服務績效，不過研究中並未說明。

趙瑞芳(1996)【23】針對公車運輸系統運作策略之特性、優缺點與適用條件，求解單一公車路線之最佳運作策略組合。該研究建立ㄧ公車排班及載客模擬模式，以系統總成本（包括業者營運成本、乘客車上時間成本與等車時間成本）最小為目標式，限制條件有車輛容量限制、班車最大班距、原路線乘客總等車時間等，並以道路交通環境、公車路線基本資料、尖離峰乘客需求資料為資料起始輸入值，並用卡方檢定確認模擬產生之觀測值與輸入的資料屬於相同之分配型態，再進行排班及載客模擬分析。策略組合包括每站皆停與直達車、

每站皆停與區間車、每站皆停與分區停車（skip stop）之運作組合。最後以 36 路公車資料進行實例應用與分析，結果顯示若乘客起迄分佈型態集中於路線部分區段，則實施區間車與每站皆停運做組合策略有較佳的成果。

郭月萍(2000)【13】依據公車路線乘客起迄資料及公車排班的計算原理，

利用啟發式方法建構公車路線最適營運策略組合模式，並以系統總成本最小為總評估指標，尋求營運者成本及旅客旅行時間成本同時下降最多之營運策略組合。研究中假設了六種公車問題，分別為：數量大且乘客OD 量均勻分布、數量小且乘客OD 量均勻分布、數量大且乘客 OD 量集中於部分停靠站、數量大且乘客OD 量集中於後段停靠站、數量小且乘客 OD 量集中於部分停靠站、數量小且乘客OD 量集中於後段停靠站。估計出各營運策略組合下各類班車之運量，並實際求出各營運策略組合下各類班車之停靠站、班距、總車輛數、業者

(26)

營運成本及乘客旅行時間成本等資料。

表2.2 公車運作組合策略文獻彙整

研究者論文名稱研究方法及內容缺點

葉祥海 (1983)

單一路線上各種組合比例下之系統績效

¾ 系統模擬法

¾ 同一公車路線上行駛直達車、區間車與普通車在各種組合比例下之系統績效。

1.人力蒐集數據。

2.未設定目標式。

3.未說明如何選取停靠站位。

Santhakumar 和 Hariharan

（1991）

transportation systems management options to improve urban bus performance using computer simulation

¾ 系統模擬法

¾ 探討六種 TSM 策略對於公車服務績效之影響，其中包含改變公車靠站型態，透過電腦模擬證明採用直達車策略能有效提升服務績效。

2.未說明直達車選取停靠站位之方法及目標式。

趙瑞芳 (1996)

單一公車路線求解最佳運作策略組合

¾ 系統模擬法

¾ 同一公車路線上行駛直達車、區間車與普通車在各種組合比例下之系統績效。

¾ 以系統總成本(公車營運成本、乘客等車時間總成本、乘客車上時間總成本)最小化。

2.未敘述各種營運策略的如何選取停靠站位

郭月萍 (2000)

單一公車路線求解最適營運組合策略

¾ 啟發式解法

¾ 同一公車路線在六種情況下之最佳策略，並求出各類班車之停靠站、

班距、總車輛數、業者營運成本及乘客旅行時間成本等資料。

¾ 以系統總成本(公車營運成本、乘客等車時間總成本、乘客車上時間總成本)最小化。

1.模擬數據

資料來源：本研究整理

(27)

2.3 智慧卡產出資料之相關研究

林祥生【8】依據台北市聯營公車之營運特色，研擬公車票證電腦化作業之規劃目標、設計要求及系統架構，並依據此一規範篩選出適用於台北市的自動化收費設備，最後提出一套計便利乘客用票又可提升業者管理績效之票證制度及票務作業流程。其研究發現，公車票證電腦化的實施，除了直接增進業者營運管理效益，同時亦提供具記錄具公信力的營收資料，可作為政府今後補貼政策之依據。更重要的是，研究單位可依據票卡紀錄內容，推估乘客起迄運量表，

以取代目前高成本、低效率的運量調查方式。

林祥生等人【7】根據公車紅 29 的刷卡資料，自行構建一分析軟體，分別從總體面及個體面挖掘公車乘客的需求特性及搭乘行為。在總體面，本研究分析平日與假日的載客量比較、一日中各時段的尖離峰現象、不同平常日及不同身份別的尖峰時段差異、捷運轉乘行為等，而在個體面更進一步比較全票及學生乘客的搭乘習性，讓經營者能清楚看見個別顧客的消費者行為，一方面可針對目標乘客實施精準行銷策略，另方面亦能有效安排車輛定檢及人員輪休。凡此過去業者無從得知的需求特性，皆可由本研究所構建的資料探勘模式逐一呈現，使業者今後能以科學數據進行更有效的營運策略。

Bagchi 和 White【39】發現智慧卡（smart card）將成為可用來分析旅行者行為的新運輸資料來源。智慧卡裡所紀錄之資料，可以幫忙克服現存運輸資料來源的不足及讓業者從統計數字中了解乘客的需求。透過智慧卡系統，業者將可取得：1.大量的個人旅行資料；2.可以連接這些資料到個人卡或是使用者；3.

比現存運輸資料來源可以獲得更長期的連續旅次資料；4.知道他們的忠誠顧客是誰。可是若要從現存運輸資料，作為分析乘客行為來源的資料是有困難，因為智慧卡所記錄的內容不夠完整，如不知乘客確切起迄點、旅次目的等，而這些缺漏資料可能還需要藉由調查或其他方法來克服彌補。不過業者仍可再在了解資料上的限制後，尋找一種實用的方法來分析和應用。此外，公車業者也可因應現在潮流，根據資料分析結果發展出適合路線特性之行銷策略。

2.4 資料探勘 2.4.1 資料探勘的定義

資料探勘(Data Mining)是從龐大的資料量中，透過理解、萃取、整合、查核、除誤、轉化、測試、解釋等階段，逐步挖掘出有價值的隱藏資訊，以作為企業決策的重要參考，因此麻省理工學院的 Technology Review 雜誌將其選為改變未來世界的十大創新科技之一【48】。資料探勘在過去經常被用來分析信用卡客戶或手機用戶的消費行為，以輔助經營者從龐雜的客戶帳單資料中，挖掘出有助於未來精準行銷的決策資訊。

而在資訊科技的推波助瀾下，不僅企業競爭的強度與速度倍數於以往，激增的市場交易也使得各企業所需儲存與處理的資料量愈來愈龐大。所以，企業

(28)

如何因應外界的競爭，快速且有效地從資料庫中取得有用資訊，並反映市場或消費者的需求，已成為各企業重視的焦點；而資料探勘技術不但能輔助企業建立自動預測顧客行為的模型，還可與商業資料倉儲(Commercial Data Warehouse) 結合，發展出更有價值的商業用途。

關於資料探勘的定義有許多不同版本，其中較具有代表性者包括，Fayyad 等人(1996)【32】指出「資料探勘能將資料簡化成正確的、未曾被知道的、有用的以及最容易了解之規則的一連串重要處理動作」，Berry 等人(1997)【27,28】

認為「資料探勘是針對大量的資料，利用自動化或半自動的方式進行分析，以尋找出有意義的關係或法則」，Han(2000)【35】則定義「資料探勘是從大量資料中萃取出來的知識」，而尹相志(2003)【2】認為「資料探勘是利用統計以及機械學習的演算法，啟發性地從大量資料中找尋隱藏具有商業價值的知識與規則，作為自動化商業策略之應用」。關於資料探勘的定義，其他許多學者也有提出相關的解釋，並整理如表2.3 所示。

表2.3 資料探勘的定義

作者定義

Frawley (1991) 資料探勘是從資料中萃取出隱藏的、先前未知的有用資訊。

Grupe and Owrang (1995)

資料探勘乃是從現存資料中剖析出新事實及發現專家們尚未知曉的新關係。

Fayyad et al.

(1996)

資料探勘是知識發現(Knowledge Discovery in Database；

KDD)其中的一個步驟。資料探勘透過演算法，將資料作一分析與應用，以找出其特性(pattern)與模式(model)的過程。

Cabena et al.

(1997)

資料探勘是將未知且有效的資訊從大型資料庫抽出的過程，並且將萃取出的有用資訊提供給主管做決定性的決策。

Kim (2000) 資料探勘是提煉未知且可能有用的知識來幫助決策的一系列流程。

Shaw et al.

(2001)

資料探勘是尋找和分析資料的一個過程，主要的目的是找出隱含在裡面有用的資訊。

Roger et al.

(2002)

資料探勘是一種從整個資料庫裡的資料，利用一種或多種電腦技術來自動分析與去擷取知識的過程。

資料來源：本研究整理

2.4.2 資料探勘的功能

一般而言，資料探勘依其模型主要可分為六大主要功能

【15,16,17,18,19,20,21】，這些功能的內容及可使用的技巧概述如下：

(29)

一、分類 (Classification)

分類是指檢視新物件的特性，然後將其指定到預先定義好的類別中，

即利用一連串的輸入變數來預測「類別變數」。所要檢視的物件，通常是指資料庫中的紀錄，包含更新資料紀錄及標上類別編號等。例如在信用卡的分析上，發卡銀行會利用顧客的資產狀況及繳費記錄，將信用卡申請人分類為低、中、高風險群，藉此分類方式對不同族群給予不同的額度及服務。常用的方法有決策樹(Decision Tree)或類神經網路(Neural Network)等。

二、推估 (Estimation)

推估善於處理連續性的數值，憑著一些輸入資料，可用來推估一些未知的連續性變數，例如按照信用申請者之教育程度及行為別，來推估其信用卡消費量。相關的使用技術包括統計方法上之相關分析、迴歸分析及類神經網路方法等。

三、預測 (Prediction)

預測是推估未來的數值及趨勢，歷史資料可用來建立模型以檢視近來觀察值的資料，例如由過去行銷活動所產生的反應，來預測未來新活動的回應率，或是由顧客的職業、年齡、收入等人口屬性特質及其消費行為來預測可能的流失率等。使用的相關技術包括迴歸分析、時間序列分析(Time Series Analysis)、類神經網路及案例庫推理(Case-Based Reasoning)等。

四、關聯法則 (Association rule)

關聯法則主要描述在龐大資料庫中某些資料項目間彼此之關連性，其形式為X→Y，其中 X 及 Y 分別表示資料庫中不同之項目組。關聯法則最早應用於超市購物籃分析(Market Basket Analysis)，藉由顧客的交易記錄，

找出商品間彼此的關聯性，以做為超市商品擺設及進貨庫存之參考。

五、群集化 (Clustering)

群集化就是將許多不同的群組，分成一些更相似的子群組或群集，目的是要將組與組之間的差異找出來，將相似特性的項目組成一群。它與分類不同的是，群集化沒有依靠事先明確定義的類別來進行分類，資料是根據自身的相近性群聚在一起。因此，群集化可說是分類的前置作業，它也是進行市場區隔的第一步。

六、序列規則 (Sequential Pattern)

序列規則技術的重點是考慮時間的因素，利用此方法分析不同時間點上各事件的關聯性，也就是在一長期時間區段內，事件發生的順序。其最大功能是協助我們找出顧客的消費生命週期序列規則主要分為順序性規則與週期性規則兩種，順序性規則乃考慮事件發生之時間先後關係，而週期性規則考慮時間區段的變化，分析時間區段內所發生的事情，是否其他相同時間區段內也會發生。這兩種方法雖不同，但對使用者而言，隨著時間的多樣變化，找出有用的規則已日形重要。

(30)

2.4.3 資料探勘的應用

陳佳楨(2003)【16】為了減少病患往來醫院的次數，及增加病患可選擇到院看診的時段，以提升醫院經營效率及服務品質，於是將資料探勘技術的關聯式法則應用在就診行為與醫師排班的研究。研究對象為埔里基督教醫院民國89 年全年之門診紀錄，篩選相關資料，如病歷碼、看診科別、看診時段、看診日期，並新增星期別及週別兩欄資料。最後探勘的資料項目有五：流水編號、病歷號、週別、「醫生代碼」集合（看診診別）、「星期別＋時段＋醫生代碼」

集合。醫生代碼為病患看診診別集合，而「星期別＋時段＋醫生代碼」集合是為了要陳述時間順序的特性。其研究直接選取前200 組最具影響性的關聯法則來做排班，評估準則為便利度。結果顯示將求診頻率高的醫師組合排在同ㄧ時段，確實提升病患便利度及醫院服務品質。

陳文杰(2004)【15】為了找出交通意外發生原因以避免事故發生，將資料探勘應用於交通事故分析，探討高速公路事故發生的主要因素，也將資料探勘結果與統計結果作ㄧ比較。研究對象為90.01~92.12 共 24 個月內在高速公路發生事故為對象，透過資料探勘(分類與迴歸樹)與統計方法(負二項迴歸)來進行分析。結果發現，透過資料探勘可得出當交通流量分別到達4,677 及 2,096 時，有較高機率會發生事故，而此現象是透過統計方法(負二項迴歸模式)所分析不出來的。不過，在預測率方面，資料探勘與統計方法的預測率分別為58%及 53%，

差異不大。因此，此研究應證資料探勘技術中的分類樹，不但可以應用在交通事故分析上，且還能得出統計模式所找不出的特性。

王秀雯(2004)【1】此研究目的是應用資料探勘技術，分析影響事故嚴重程度的主要原應及影響程度，藉由資料探勘結果與統計模式結果的分析比較，評估資料探勘在運輸安全應用的可行性，提供改善照是防制工作的參考。研究對象為90.01~90.12 共 12 個月在台北市發生交通事故的受傷者，透過資料探勘(分類與迴歸樹)與統計方法(多元羅吉特模式)兩種方法，來比較兩種模式對於影響事故嚴重程度之變數及預測分類的正確率。結果顯示，在整體預測率而言，資料探勘技術(分類樹)優於統計方法(多元羅吉特模式)。而在影響事故嚴重程度之變數，兩者差異不大所找出變數大致相同。因此，資料探勘技術中的分類數是可以應用在運輸安全領域。

謝文雄(2002)【25】此研究目的是應用資料探勘技術，從龐大的乘客交易歷史資料庫中，了解客戶的消費行為並根據其行為的不同將其分群，藉此來協助企業做市場區隔化來辨認目標市場，然後針對這些客戶進行直接行銷，以提高其忠誠度，並在客戶尚未提出服務之前，就能適時提供適當的資訊給客戶，

進而保留住客戶。研究對象為某五金製造業客戶銷售資料庫，透過資料探勘技術之群集分析、決策樹分析及關聯式分析等三種方法來探勘。經由群集分析可將客戶分群，結果顯示僅有14.59%的客戶是屬於忠誠度高且利益高，所以這一群為目標客戶。而經由決策樹分析可了解大部分顧客交易的頻率及金額多為大於0.5 次且消費金額小於 2475 元。最後在關聯式分析可發現，忠誠度高的顧客

(31)

所購買的產品為四輪車，且若產品有購買風輪架和水泥車，通常也都會在購買四輪車。

陳麗君(2003)【17】運用資料探勘技術的自我映射組織和模糊決策樹，建立了信用卡黃金級客戶族群的特徵模式，以瞭解黃金及客戶的特徵組合。接者利用黃金客戶過去消費的歷史資料，透過資料探勘的方法挖掘黃金及客戶在不同時間區段其行為改變的趨勢。研究對象為某銀行發卡中心 90.01~91.12 共兩年的歷史資料，期望發卡銀行可以從模式中，預測出目標客戶，將有限的資源投注在重要的目標客戶群上，讓行銷效益更為豐碩。且也從顧客行為改變的特徵模式，幫助企業挽留流失的黃金級客戶。結果分出等級最低、等級下降、有潛力型及等級最高等四群。並依照四群給予不同的行銷建議。

許哲瑋(2003)【12】透過資料挖掘技術與多變量統計方法，以美妝保養品為例，進行資料庫行銷的實證工作。研究範圍包括了產品關聯性分析、顧客屬性特徵挖掘等二大主題。針對產品關聯性分析之研究，作者利用SAS Enterprise Miner 4.1 版軟體挖掘關聯法則規則，過程是在擷取交易明細資料後，分別利用因素分析和關聯分析，重新規劃產品組合類別，並作為建立產品推薦系統，和設計聯合銷售方案的參考，最後比較資料挖掘與多變量統計方法，再分析產品關聯性時的差異，。針對顧客屬性特徵挖掘之研究，使用SQL 語法結合會員資料與交易明細後，先以使用率做事前區隔把會員分成二群，再嘗試利用決策樹學習法，描述各個顧客群的特徵屬性，並衡量潛在顧客成為高價值客戶的可能性。

邱創政(2003)【9】提出一以顧客消費表現為基礎之群集分析演算法，根據顧客的消費表現，包括曾經購買哪些商品，以及花費在毎各購買商品的消費金額，作為顧客市場區隔之區隔變數，進行市場區隔。而該研究之顧客群集分析演算法，是以K-means 演算法之演算流程架構為基礎，融入關聯法則支持度的概念，以 RFM 指標做為比較顧客間消費表現的基礎，而其運用基因演算法選取出使顧客群質心之顧客，以得到較佳且穩定的分群結果。研究對象為某一零售商所提供的顧客交易資料，以實驗的方式證明其所建構之顧客分群法，確實能有效地讓每位顧客群內之顧客都有較為相似的行為及模式。

張忠琦(2000)【19】為了能讓企業網頁內容客製化，提昇企業電子商務的經營績效及網站的效能，運用資料探勘的技術針對伺服器網站日誌(Web Server logs)與企業網站內容(Web content)進行分析，以能得到每位使用者網站內容瀏覽模式(Web Content Access Patterns) 。目的在於藉由網站使用度與網頁內容的結合，能更有效的讓網站管理者了解使用者瀏覽企業網頁的行為規則，並且依據網站內容瀏覽規則作為改善企業網站的內容配置與網站架構的參考。作者以撰寫WAP-mine 演算法來找出瀏覽模式，WAP-Tree 會紀錄 Event Label、Count、

Label link 三件事，而 WAP-mine 演算法概念類似關聯式法則支持度的觀念，最後再用K-means 的分群技術依照每位使用者的瀏覽特徵分群，做出客製化的網頁內容。

(32)

邱義堂(2000)【10】運用資料探勘技術，針對電信業者發展一客戶流失預測模式，以協助企業解決客戶流失問題。作者摒棄以往用用客戶基本資料、人口統計及消費歷史資料等資料來分析，改用電信業者現有的營運資料來研究預測流失客戶模式（如租用期間、繳費方式、申裝類別），經由對客戶大量通聯記錄的分析（平均每日使用時間、平均每日使用次數），探索客戶退租前通話行為變化，從中尋找流失徵兆，進而發展有效的預測模型。作者以C4.5 決策樹歸納技術，再運用多專家決策(Multi-expert Strategy)分類方法做預測分類。研究對象為某電信業者2000 年 10 月到 2001 年 1 月的客戶資料，經實驗驗證；該研究模型選取 10.03%之全體客戶，平均可預測出有 50.64%的客戶會流失；若選取29.00%全體客戶中，平均可預測出有 68.62%的客戶會流失。

表2.4 資料探勘應用領域相關文獻彙整

研究者研究主題應用對象應用方法

張忠琦(2000) 資料探勘於網站使用度與網

頁內容探索之研究網頁瀏覽 WAP-Tree 邱義堂(2000 通信資料庫之資料探勘：客戶

流失預測之研究電信業者

C4.5 決策樹

（分類分析的一種）

謝文雄(2002) 以資料探勘探討顧客消費之行為

零售製造

業群集分析

陳佳楨(2003)

資料探勘應用於就診行為與醫師排班之研究─ 以埔里基督教醫院

醫院排班關聯式法則

邱創政(2003) 以消費表現為基礎之顧客群

集分析金融業群集分析

陳麗君(2003) 應用資料探勘技術於信用卡

黃金級客戶之顧客關係管理金融業

類神經網路

（群集分析的一種）

許哲瑋(2003)

資料挖掘與統計方法應用於資料庫行銷之實證研究─以美妝保養品業為例

化妝品關聯法則

陳文杰(2004) 應用資料挖掘技術於高速公

路交通肇事次數之研究交通預測分類+迴歸樹

王秀雯(2004) 應用資料挖掘技術於交通事

故傷亡嚴重程度之研究交通預測分類+迴歸樹資料來源：本研究整理

(33)

2.5 小結

根據上述各小節之彙整資料，首先於 2.1 節針對市區公車排班做一彙整，

發現過去有關改善公車服務績效的研究，多偏重於公車排班、人車調度及路線設計及績效的課題。在 2.2 節可發現，國內對於如何因應乘客在不同時間及空間上的需求分布，提出因地制宜的多元靠站方式(如直達車、區間車、越站停車等)較少著墨，且受限於實際資料取得的困難，且前人的研究亦多以虛擬的簡例或少數調查資料進行測試，也無法提出停靠站選取的準則，但由前人研究之電腦模擬結果證明，依據乘客搭乘特性而設計出量身訂做之靠站型態，的確可提升服務績效，降低業者及乘客成本。而 2.3 節可得知，電腦票證的實施除可乘客使用便利、提供正確營運數據及提升營運效率外，最重要的是業者可由悠遊卡資料裡得到乘客搭乘特性，如了解乘客流失率，了解搭乘該條公車路線的旅次率（多久搭乘一次），轉乘旅次以及流失率（判別忠誠顧客），更重要的是若能推論出乘客搭乘的時間與空間分佈（起迄運量表），可依照所有乘客的需求特性，提供更客製化之服務型態。最後在 2.4 節中，介紹資料探勘的定義、

功能。經由彙整可發現資料探勘應用的範圍廣泛，過去國內極少應用在交通領域，僅只應用在運輸安全課題，對於改善服務績效範疇，還未有人深入研究，

而許哲瑋【12】、邱創政【9】、謝文雄【25】等人皆運用資料探勘方法，以顧客消費特性為基礎，探勘出消費者之潛在需求及特性，提出符合不同需求特徵顧客之行銷策略。因此，應該可嘗試將此觀念運用在交通領域裡。

經由上述前人於各領域之研究，可發現自悠遊卡問世後，其產出資料已可廣泛被應用在許多課題上，如：乘客總體需求分析【7,38】。而本研究認為可更深入探討運用悠遊卡資料來改善公車靠站型態，以提供更符合乘客需求之服務型態，此課題具有深入探討及加以應用的價值，因為悠遊卡所記錄的交易資料是正確且真實的需求及數據，可進一步改善前人用虛擬的簡例或少數調查資料的缺點，且若使用確實的數據及資料去改善，加上運用資料探勘此技術，更能增加本研究結果的可靠性及實用性。

(34)

第三章公車乘客起迄需求之推估

由於悠遊卡系統尚未與衛星定位系統整合，所以悠遊卡資料裡並無紀錄乘客之刷卡地點及起迄點。為得到乘客運量起迄表，目前僅能經由比對悠遊卡系統及衛星定位系統之時間，以推估乘客刷卡地點。因此，本章主要敘述如何從悠遊卡原始資料經由資料轉換及處理，建立出乘客起迄需求矩陣，將分七節詳述。3.1 節敘述乘客起迄需求推估的邏輯概念，主要描述現行衛星定位系統和悠遊卡系統，如何紀錄乘客搭乘資料和公車定位資料及資料內容；3.2 節介紹本研究之研究對象及其路線特性；3.3 節及 3.4 節分別敘述悠遊卡資料和衛星定位系統之原始資料記錄格式；接著 3.5 節將敘述悠遊卡原始資料透過何種資料轉換程序可獲得有益資訊，衛星定位系統經過何種資料處理可成為與乘客刷卡時間資料比對之資料庫；並於3.6 節示範如何推估乘客起迄需求之過程，最後在 3.7 節呈現推導出之乘客起迄需求運量表。

3.1 起迄需求推估邏輯概念

欲建立乘客之起迄運量分布，要先能得知乘客之起迄點位置。不過，目前衛星定位系統尚未與悠遊卡系統整合，所以我們無法直接從乘客的交易資料中得知乘客的刷卡位置，因此將先了解現存資料紀錄那些內容，設法將原始資料透過處理及轉換過程，進而推導出乘客刷卡站位，最後再由乘客刷卡站位試圖推估出乘客起迄需求位置，建立一乘客起迄需求運量表。

圖 3.1 所示，此行駛路段範圍為兩段票，乘客刷卡方式為上車刷一段，下車再刷一段。目前台北縣政府 e-bus 之衛星定位系統，以站牌為單位，會紀錄該站位即將要進站、離站之公車車牌號碼，該公車之行駛路線和其進站時間（站牌前50 公尺）及離站時間（站牌後 80 公尺）。如圖 3.1 所示，在捷運新埔站該站站牌，它記錄了238-AC 公車，將於 08:00:00 進站，且於 08:02:30 離站，

該輛公車行駛路線為 802。同理，當公車行駛至樹林市衛生所站時，在樹林市衛生所站該站站牌，它記錄了238-AC 公車，將於 09:00:00 進站，且於 09:01:30 離站，該輛公車行駛路線為 802。而在悠遊卡系統裡，當乘客上車刷卡時，會紀錄該位乘客所使用悠遊卡之卡號ID 及上車刷卡時間，而在下車刷卡付費時，

亦同樣紀錄該位乘客所使用悠遊卡之卡號 ID 及下車刷卡時間。我們可經由比對乘客上車刷卡時間及衛星定位系統裡公車當時位置，對應出乘客上車位置（乘客起點），同理，可經由比對乘客下車刷卡時間及公車當時位置，對應出乘客下車位置（乘客迄點），即可推估出乘客於該趟旅次之起迄點位置，並進而建構出乘客OD 矩陣。

一段票刷卡行為則因單筆交易記僅能紀錄某一位置之資料（如搭乘起點或迄點位置），如圖3.2 所示，其推估邏輯為經由多天持續觀察乘客的搭乘行為，

比對出乘客較固定之刷卡地點，以上車刷卡為例，乘客往程會記錄上車位置（起點），返程也會紀錄上車位置（起點），經由多筆相同記錄，可推估乘客的往程下車位置為返程的上車位置，進而推估乘客該趟旅次之起迄點位置。

(35)

圖3.1 起迄需求推估邏輯概念圖（兩段票現象）

12

6 9 3

1 2

5 4 8 7

1011 12

6 9 3

1 2

5 4 8 7

10 11 衛星定位系統紀錄資料

公車路線：802 公車車牌：238-AC 公車位置：捷運新埔站 公車進站時間：08:00:00 公車離站時間：08:02:30

衛星定位系統紀錄資料 公車路線：802

公車車牌：238-AC

公車位置：樹林市衛生所站 公車進站時間：09:00:00 公車離站時間：09:01:30

衛星

收發訊號

悠遊卡系統紀錄資料 卡片 ID：123456789 刷卡時間：09:00:50 刷卡方式：下車刷卡 行駛方向

乘客上車刷卡乘客下車刷卡

悠遊卡系統紀錄資料 卡片 ID：123456789 刷卡時間：08:01:30 刷卡方式：上車刷卡

乘客上車刷卡時間 v.s.

公車停靠位置

乘客下車刷卡時間 v.s.

公車停靠位置 比對出乘客上車位置

（起點）

推估出乘客起迄點

比對出乘客下車位置

（迄點）

中 華 大 學

中 華 大 學 碩 士 論 文

題目：運用悠遊卡及資料探勘求解公車營運改善方案 Exploring Smartcard and Data Mining to Improve Bus Operation Strategies

系 所 別：運輸科技與物流管理學系碩士班 學號姓名：邱 詩 淳 M09314004 指導教授：林 祥 生 博 士

中 華 民 國 九十五 年 七 月

運用悠遊卡及資料探勘求解公車營運改善方案

Exploring Smartcard and Data Mining to Improve Bus Operation Strategies

Abstract

Keywords：Taipei Smartcard, e-bus System, Data mining

誌 謝

目 錄

圖目錄

表目錄

第一章 緒論

1.1 研究背景與動機

1.2 研究目的

1.3 研究方法

1.4 研究對象與範圍

1.5 研究內容及流程

第二章 文獻回顧

2.1 公車營運相關課題 2.1.1 公車排班及人車調度

2.1.2 路線設計及績效

2.2 公車靠站型態

2.2.1 公車靠站型態之類型及優缺點

2.2.2 公車靠站型態之相關研究

2.3 智慧卡產出資料之相關研究

2.4 資料探勘 2.4.1 資料探勘的定義

2.4.2 資料探勘的功能

2.4.3 資料探勘的應用

2.5 小結

第三章 公車乘客起迄需求之推估

3.1 起迄需求推估邏輯概念

推估出乘客起迄點

中華大學

中華大學碩士論文

系所別：運輸科技與物流管理學系碩士班學號姓名：邱詩淳 M09314004 指導教授：林祥生博士

中華民國九十五年七月

誌謝

目錄

第一章緒論

第二章文獻回顧

第三章公車乘客起迄需求之推估