• 沒有找到結果。

中 華 大 學

N/A
N/A
Protected

Academic year: 2022

Share "中 華 大 學"

Copied!
124
0
0

加載中.... (立即查看全文)

全文

(1)

中 華 大 學 碩 士 論 文

題目:運用悠遊卡及資料探勘求解公車營運改善方案 Exploring Smartcard and Data Mining to Improve Bus Operation Strategies

系 所 別:運輸科技與物流管理學系碩士班 學號姓名:邱 詩 淳 M09314004 指導教授:林 祥 生 博 士

中 華 民 國 九十五 年 七 月

(2)
(3)
(4)
(5)

運用悠遊卡及資料探勘求解公車營運改善方案

學生:邱詩淳 指導教授:林祥生 博士

摘 要

過去國內有關公車營運的研究已不在少數,可是最大的研究障礙往往來自 欠缺完整且具代表性的載客紀錄。在台北都會區啟用悠遊卡後,不僅改變了民 眾搭乘大眾運具的付費方式,更重要的是乘客的所有交易資料都可同時被記錄 下來。經年累月下來,大眾運輸成為一個資料密集之產業,所以龐大的資料庫 中埋藏了許多有用的隱含資訊,而資料探勘技術(Data Mining)本身也善於從 大量資料庫探勘出有參考意義價值之商業智慧。

本研究以悠遊卡系統內之乘客實際交易資料和公車衛星定位系統內之公車 到站時間資料,比對出乘客刷卡位置後,經由乘客搭乘紀錄的推估可建立出真 實乘客OD 矩陣。接著運用真實之乘客 OD 矩陣進行公車營運改善求解。藉由 瞭解公車實務營運課題後,發現公車業者現行路線經營策略除每站皆停外,另 外尚有直達車及區間車兩種靠站型態,為使研究成果能與實務符合且將來能應 用,本研究採用直達車、區間車等營運路線組合作為研究範疇。並運用資料探 勘技術之群集化分析及關聯法則之功能,分別求解區間車及直達車之最佳營運 路線。最後建立產出方案之評比計算式,包含業者的車小時成本及車公里成本、

乘客的車上時間成本及等車時間成本,模式目標為系統總節省成本最大。本研 究以802 公車路線進行實例應用與分析。

以本研究所探討的公車802 而言,區間車改善效果以下午尖峰時段最佳,

直達車改善效果則以上午尖峰時段最佳,這也反映業者可依照路線乘客的需求 特性,可因時制宜的調整其經營方式,提供客製化的服務。而無論在哪一時段,

行駛區間車之總體績效均優於直達車,且本研究各時段所求解之區間車最佳行 駛路線均優於業者現況行駛路線。

在敏感度分析部份,營運時間成本、營運里程成本及乘客車上時間成本皆 與成本計算式呈正向關係。有鑒於油價上漲及乘客時間愈趨寶貴,若能根據路 線乘客需求特性提供客製化服務型態,不僅乘客可獲得更符合需求的公車服 務,節省交通時間,公車業者也可節省成本。

關鍵字:悠遊卡、公車動態資訊系統、資料探勘技術

(6)

Exploring Smartcard and Data Mining to Improve Bus Operation Strategies

Student : Shih-Chun Chiu Advisor : Dr. Hsiang-Sheng Lin

Abstract

In the past, the researches about bus operation have had the same shortage, which was always without complete and reliable OD Table. Fortunately, after the popularity of Taipei Smartcard, the data of rider pay can be recorded by Smartcard at the same time. Gradually, the public transportation has become a large database industry, which has many useful concealed information. In addition, data mining is also a good technique to analyze the stored data in large databases to discover potential information and knowledge.

This research constructs real passenger OD Table by Taipei Smartcard System’s data and Taipei County e-bus System’s data. As well as explore real OD Table to generate bus operation strategies. This research discusses the short-turn service route and express service route. It applied Data Mining technology about clustering and association rules to figure out optimal short-turn service route and optimal express service route, with the objective to save maximum the sum of operator’s cost

(including traveling time cost and distance cost)and passengers’ travel time cost

(including in-vehicle time cost and waiting time cost). A case study by 802 route shows an optimal condition.

By this research, the result shows that the best improving effect of short-turn service is the afternoon peak time period, and the best improving effect of express service is the morning peak time period. It also reflects that operators should base on passengers’ demand to adjust their operational strategies. Overall, the effect of short-turn service is better than express service. However, the performance of optimal short-turn service route solution surpasses the present short-turn service. By the sensitive analysis, excluding from the cost of passenger’s waiting time, we could save more total cost if other factors’ costs arise. It implies that providing customized service not only the passengers may get more suitable bus service but also the operator may save more cost.

Keywords:Taipei Smartcard, e-bus System, Data mining

(7)

誌 謝

窗外下著2006 年的第一場梅雨,象徵著兩年的研究所生活即將畫下句點,

宣告結束。本論文的完成,首先要感謝指導教授林祥生博士,在詩淳求學的兩 年間,不論是課業或待人處事上,給予詩淳殷切的指導與啟發,和適時的協助 與提攜,使我受惠良多,倘若沒有老師這般不厭其煩的叮嚀及指導,這篇論文 可能就無法順利完成,在此獻上最誠摯的謝意。

此外,還要感謝東南客運在詩淳國科會小產學研究期間提供資料,給予詩 淳研究本論文的啟蒙,在研究期間,感謝首都客運李總經理的大力贊助資料與 協助,以及張庭榮課長毫無保留的提供經驗,使得詩淳得以順利進行研究,而 在口試期間,承蒙魏健宏教授、陶治中教授在百忙之中仍撥空指導與悉心審閱,

並提供諸多寶貴的意見與指正,方能匡正研究上的疏失,使本文得以更加完備,

謹此表達深忱的感激。

在研究求學期間,感謝所有研究所成員們的幫忙與協助。感謝暢湘學長總 是願意當我們的開心果及打雜小弟,感謝雅雯、耘翠、眉君、惠筑這些好姐妹 的一路扶持,感謝益豪這位好夥伴的相互幫助,感謝小基、人敬、智浩、勝弦、

佳鴻、任由、佑旌、宗樺、文菊、浩宗、振越還有高桂學姊、思葦學姊等人在 研究期間所給予的支持與鼓勵。忘不了我們班的敬浩呆三人組、豪朱二人組的 搞笑,忘不了大家在校內口試前的一起挑燈夜戰,忘不了大夥一起出遊歡笑的 日子,還有許多其他的學長、學姊、學弟、學妹族繁不及備載,因為有你們,

讓詩淳的研究所生活多采多姿!

再來還要感謝我的家人,在我的求學路上一路支持我,謝謝爸爸、媽媽的 養育之恩及金錢上的支援,謝謝妹妹、弟弟的貼心懂事,因為有你們的陪伴與 支持,讓詩淳得以心無旁鶩專心於論文的研究與撰寫,於此表達無限的感謝!

最後,謹以此篇論文,獻給曾經幫助過詩淳的師長及朋友,感謝你們帶給 我的一切,謝謝大家!

邱詩淳 謹識於中華運管所 中華民國95 年 7 月

(8)

目 錄

摘 要...i

Abstract ...ii

誌 謝... iii

目 錄...iv

圖目錄...vi

表目錄... viii

第一章 緒論...1

1.1 研究背景與動機... 1

1.2 研究目的... 1

1.3 研究方法... 1

1.4 研究對象與範圍... 2

1.5 研究內容及流程... 2

第二章 文獻回顧...5

2.1 公車營運相關課題... 5

2.1.1 公車排班及人車調度... 5

2.1.2 路線設計及績效... 7

2.2 公車靠站型態... 8

2.2.1 公車靠站型態之類型及優缺點... 8

2.2.2 公車靠站型態之相關研究... 12

2.3 智慧卡產出資料之相關研究... 14

2.4 資料探勘... 14

2.4.1 資料探勘的定義... 14

2.4.2 資料探勘的功能... 15

2.4.3 資料探勘的應用... 17

2.5 小結... 20

第三章 公車乘客起迄需求之推估...21

3.1 起迄需求推估邏輯概念... 21

3.2 研究路線特性... 24

3.3 悠遊卡資料特性... 26

3.4 衛星定位資料特性... 29

3.5 資料轉換及前處理過程... 32

3.6 起迄需求推估方式... 39

3.7 推估結果分析... 43

第四章 模式構建與設計...48

4.1 現況分析及模式設計... 48

4.2 區間車方案產出... 50

4.2.1 群集分析技術... 50

(9)

4.2.2 K-meams 演算法 ... 52

4.2.3 區間車探勘內容及流程... 53

4.3 直達車方案產出... 54

4.3.1 關聯式法則... 54

4.3.2 Apriori 演算法 ... 56

4.3.3 直達車探勘內容及流程... 58

4.4 產出方案之評比方法... 62

4.4.1 各項成本分析... 62

4.4.2 評比計算式建構... 64

第五章 模式應用與分析...66

5.1 區間車... 66

5.1.1 平日上午尖峰時段... 66

5.1.2 平日下午尖峰時段... 71

5.1.3 平日離峰時段... 74

5.1.4 假日時段... 77

5.1.5 現況比較... 80

5.2 直達車... 81

5.2.1 平日上午尖峰時段... 81

5.2.2 平日下午尖峰時段... 84

5.2.3 平日離峰時段... 87

5.2.4 假日時段... 89

5.3 敏感度分析... 91

5.3.1 車小時成本之變動... 91

5.3.2 車公里成本之變動... 92

5.3.3 等車時間成本之變動... 92

5.3.4 車上時間成本之變動... 93

5.4 交叉敏感度分析... 94

5.4.1 車小時成本與乘客等車時間成本之變動... 94

5.4.2 車公里成本與乘客等車時間成本之變動... 95

5.4.3 車上時間成本與乘客等車時間成本之變動... 96

第六章 結論與建議...98

6.1 結論... 98

6.2 建議... 99

參考文獻...100

附錄一 符號表...103

附錄二 上午尖峰時段 OD 表...104

附錄三 平日離峰時段 OD 表...108

附錄四 假日時段 OD 表...110

(10)

圖目錄

圖1.1 研究流程... 4

圖2.1 每站皆停方式示意圖... 9

圖2.2 直達車方式示意圖... 9

圖2.3 區間車方式示意圖... 10

圖2.4 越站停車方式示意圖... 10

圖2.5 分區直達方式示意圖... 11

圖2.6 限制分區方式示意圖... 11

圖3.1 起迄需求推估邏輯概念圖(兩段票現象)... 22

圖3.2 起迄需求推估邏輯概念圖(一段票現象)... 23

圖3.3 802 營運路線圖... 25

圖3.5 衛星定位資料庫處理原則... 31

圖3.6 公車到站時間遺漏值... 32

圖3.7 資料前處理及轉換流程... 33

圖3.8 乘客刷卡站位推導圖... 38

圖3.9 乘客刷卡站位示意圖... 38

圖3.10 推導二段票乘客起迄點示意圖... 41

圖3.11 推導一段票乘客起迄點示意圖一... 41

圖3.12 推導一段票乘客起迄點示意圖二... 42

圖3.13 推導一段票乘客起迄點示意圖三... 42

圖4.1 靠站型態分析流程圖... 50

圖4.2 K-means 概念圖 ... 53

圖4.3 區間車探勘邏輯概念圖... 53

圖4.4 關聯式法則概念圖... 58

圖4.5 直達車探勘邏輯概念圖... 59

圖4.6 模擬 OD 表... 60

圖4.7 直達車探勘流程說明... 62

圖5.1 探勘主軸示意圖... 66

圖5.2 區間車分群結果... 67

圖5.3 上午尖峰時段各方案成本... 69

圖5.4 下午尖峰時段各方案成本... 72

圖5.5 平日離峰時段各方案成本... 75

圖5.6 假日時段各方案成本... 78

圖5.7 平日上午尖峰直達車各方案成本... 82

圖5.8 平日下午尖峰直達車各方案成本... 85

圖5.9 平日離峰直達車各方案成本... 87

圖5.10 假日時段直達車各方案成本... 89

圖5.11 車小時成本變動下對於總成本之影響... 91

(11)

圖5.12 車公里成本變動下對於總成本之影響... 92

圖5.13 等車時間成本變動下對於總成本之影響... 93

圖5.14 車上時間成本變動下對於總成本之影響... 94

圖5.15 車小時與等車時間成本反向變動下對於總成本之影響... 95

圖5.16 車公里成本與等車時間成本反向變動下對於總成本之影響... 96

圖5.17 車上時間成本變動與等車時間成本反向變動下對於總成本之影響... 97

(12)

表目錄

表2.1 公車排班相關彙整... 7

表2.2 公車運作組合策略文獻彙整... 13

表2.3 資料探勘的定義... 15

表2.4 資料探勘應用領域相關文獻彙整... 19

表3.1 資料欄位一... 26

表3.2 資料欄位二... 26

表3.3 資料欄位三... 26

表3.4 悠遊卡資料紀錄欄位... 27

表3.5 悠遊卡原始資料各欄位所代表的意義... 27

表3.6 悠遊卡刷卡行為方式... 28

表3.7 不同刷卡行為方式所得資訊... 29

表3.8 刷卡時段分割方式... 35

表3.9 802 站牌代碼... 37

表3.10 推估需求起迄點概念... 40

表3.11 下午尖峰時段乘客 OD 起迄表一 ... 44

表3.12 下午尖峰時段乘客 OD 起迄表二... 45

表3.13 下午尖峰時段乘客 OD 起迄表三... 46

表3.14 下午尖峰時段乘客 OD 起迄表四... 47

表4.1 實務上已行駛之靠站型態... 49

表5.1 資料探勘分群結果... 67

表5.2 區間車方案組合及改善績效比較... 67

表5.3 平日上午尖峰二分群... 68

表5.4 平日上午尖峰三分群... 68

表5.5 平日上午尖峰四分群... 68

表5.6 上午尖峰時段最佳行駛路線... 70

表5.7 平日下午尖峰二分群... 71

表5.8 平日下午尖峰三分群... 71

表5.9 平日下午尖峰四分群... 71

表5.10 下午尖峰時段最佳營運行駛路線... 73

表5.11 平日離峰二分群... 74

表5.12 平日離峰三分群... 74

表5.13 平日離峰四分群... 74

表5.14 平日離峰最佳營運行駛路線... 76

表5.15 假日時段二分群... 77

表5.16 假日時段三分群... 77

表5.17 假日時段四分群... 77

(13)

表5.18 假日時段最佳營運行駛路線... 79

表5.19 平日上午尖峰時段之現況與探勘結果績效比較... 80

表5.20 平日下午尖峰時段之現況與探勘結果績效比較... 80

表5.21 平日離峰時段之現況與探勘結果績效比較... 80

表5.22 假日時段之現況與探勘結果績效比較... 80

表5.23 平日上午尖峰直達車探勘結果... 81

表5.24 平日上午尖峰直達車各方案成本... 81

表5.25 平日上午尖峰直達車最佳營運行駛路線... 83

表5.26 平日下午尖峰直達車探勘結果... 84

表5.27 平日下午尖峰直達車各方案成本... 84

表5.28 平日下午尖峰直達車最佳營運行駛路線... 86

表5.29 平日離峰直達車探勘結果... 87

表5.30 平日離峰時段直達車各方案成本... 87

表5.31 平日離峰直達車最佳營運行駛路線... 88

表5.32 假日時段直達車探勘結果... 89

表5.33 假日時段直達車... 89

表5.34 假日時段直達車最佳營運行駛路線... 90

表5.35 車小時單位成本變動下之總成本變動資料... 91

表5.36 車公里單位成本變動下之總成本變動資料... 92

表5.37 等車時間成本變動下之總成本變動資料... 92

表5.38 車上時間成本變動下之總成本變動資料... 93

表5.39 交叉敏感度分析因素... 94

表5.40 車小時單位成本與等車時間成本反向變動下之總成本變動資料... 95

表5.41 車公里單位成本與等車時間成本反向變動下之總成本變動資料... 95

表5.42 車上時間成本與等車時間成本反向變動下之總成本變動資料... 96

(14)

第一章 緒論

1.1 研究背景與動機

近年來,隨著都市的快速發展,私人運具大幅成長,捷運路網一條條的開 通,使得公車業者的經營空間逐漸被壓縮,從以往扮演主要運送的主角,逐漸 轉變為捷運站間的接駁配角。儘管如此,公車系統仍佔著舉足輕重的重要角色。

只是,面對能源物料的成本逐年上漲,如何兼顧服務品質及節省成本,是營運 業者最關心的課題。

過去業者因為缺乏資料,所以很難檢視乘客行為,公車經營者對於乘客需 求的了解,多半依賴司機們的個別觀察及站長的經驗累積,而類似這種拼湊式 的市場資訊蒐集,不但容易造成個人主觀且不具代表性的扭曲情報,也難以輔 助業者進行有效的營運決策。所幸,隨著悠遊卡付費系統的普及化,乘客在搭 乘的同時可以記錄大量的資料,如搭乘日期、刷卡時間、票種及轉乘紀錄等,

此舉可代替現存的運輸資料來源(抽樣調查)和節省成本,若能善用悠遊卡裡 的交易記錄,運用適當的資料處理技術,將可完整呈現乘客需求在不同時間及 空間上的分布,大幅改善以往人工蒐集資料的缺陷,甚至能改善乘客關係管理 並提升營運績效。

而過去有關改善公車服務績效的研究,多偏重於公車排班、人車調度及路 線績效與設計的課題(將詳述於第二章),對於如何因應乘客在不同時間及空間 上的需求分布,提出因地制宜的多元靠站型態(如直達車、區間車、越站停車等) 較少著墨,且受限於實際資料取得的困難,前人的研究亦多以虛擬的簡例或少 數調查資料進行測試。

1.2 研究目的

在前述問題背景及研究動機之下,本論文擬應用現有的悠遊卡刷卡資料,

推導公車乘客的需求分布型態,進而構建不同類型的公車靠站組合,以尋求乘 客旅行時間節省及業者營運成本降低的改善效益,故界定本研究之目的如下:

一、運用悠遊卡刷卡資料及公車衛星定位到站時間,比對乘客刷卡地點,以推 估乘客起迄運量表(OD Table)。

二、運用資料探勘技術之群集分析功能,求解區間車營運改善方案。

三、運用資料探勘技術之關聯法則功能,求解直達車營運改善方案。

四、提出不同需求型態下,可獲致較高績效的營運改善方案。

1.3 研究方法

以往對於公車靠站型態組合研究多以虛擬的簡例或少數調查資料作為求解 範圍。目前悠遊卡系統裡,已可清楚紀錄乘客之交易資料,但由於悠遊卡系統 尚未與衛星定位系統整合,所以悠遊卡資料裡無紀錄乘客之刷卡地點及起迄點。

因此,本研究將以乘客實際交易資料作為研究基底,經乘客刷卡時間與衛

(15)

星定位系統裡,紀錄每輛公車的進站、離站時間之比對結果,推估出乘客刷卡 地點,進而建構出乘客起迄運量表(OD Table)。本研究利用SAS Enterprise Miner 9.1 版之資料探勘技術,建立區間車、直達車等靠站型態組合,以降低公車業者 營業成本與旅客旅行時間成本之總和成本最大為模式目標,接著以Visual C 程 式語言撰寫方案評比計算式程式,利用電腦程式執行上述運算,尋求各靠站型 態之最佳靠站組合。

1.4 研究對象與範圍

本研究範圍為台北地區聯營公車系統,而原本預定選線原則有以下三點特 性:1.壟斷性高之路線,較能呈現完整需求型態。2.乘客使用悠遊卡比例高之路 線,具有陳述該路線乘客特質之代表性。3.優先考慮二段票之路線,較易推估 乘客OD 分布。

經由與業者尋求提供實務資料協助後,本研究之研究對象為首都客運之 802 路線,資料範圍為 2005 年 10 月份乘客交易紀錄,從中挑選具代表性之上 午尖峰、下午尖峰、平日離峰及假日連續三班車之乘客交易資料,建立該時段 之完整乘客起迄需求矩陣。802 路線有以下二點特性:1.壟斷性高之路線:從三 峽往返板橋僅此一條公車業者經營,因此較能呈現完整需求。2.為二段票之路 線:802 路線為二段票路線,較易推估乘客 OD 分布。

1.5 研究內容及流程

本研究之研究流程如圖1.1 所示,具體說明如下:

一、確認問題

首先了解能改善公車服務績效的策略之相關課題,以及各課題間之可 能關聯性,然後決定研究之課題。

二、界定研究範圍與目的

應用現有的悠遊卡刷卡資料,推導公車乘客的需求分布型態,進而構 建不同類型的公車靠站型態組合,以尋求乘客旅行時間節省及業者營運成 本降低的改善效益。

三、文獻回顧

針對國內外有關公車靠站型態、公車排班設計及路線設計及績效之文 獻進行回顧。在國內現有文獻中,對於靠站方式的研究較為缺乏,僅針對 區間車、直達車及每站皆停進行研究,大都未同時求出實際停靠站、班距、

車輛數、營運成本及時間成本,即使求出結果,也並未提出停靠站選擇之 依據。而公車排班設計大致分為數學規劃法、最大承載區間概念法、系統 模擬法及啟發式求解法四種。

四、公車營運課題瞭解

公車路線選擇靠站方式主要是針對乘客需求與道路環境等因素,以適 當的停靠站方式進行運作,期望能提升服務水準且降低業者營運成本。本

(16)

研究將藉由資料蒐集及業者訪談,以瞭解研究路線之特性及需求。爾後針 對缺點進行改善,已達到提升服務水準且降低業者營運成本之目標。

五、蒐集及處理資料

蒐集研究路線基本資料、目前公車業者之路線經營方式及業者實際營 運成本資料,並向業者取得該路線悠遊卡交易資料。而路線基本資料包括 路線長度、停靠站數、場站調度時間、車輛容量、承載率。另外,在取得 該路線之悠遊卡交易資料後,需要先經過資料前處理及轉換步驟,處理過 後的資料庫才能做為資料探勘使用的資料庫。

六、推導公車乘客OD 分布並進行需求特性分析

資料經過處理後,除了可推估公車乘客之OD 分布矩陣,也可藉由資 料探勘技術得出乘客需求特性。而所要了解的乘客需求特性如:乘客在平 日與假日之載客量比較,一日中各時段的尖離峰現象,上下午尖峰乘客需 求差異等課題。

七、建構各種公車靠站型態

本研究將以資料探勘技術輔佐停靠站的選擇,作為選站的依據,靠站 型態將考慮每站皆停、直達車、區間車及區間直達車等運作策略。而靠站 組合方式的選擇,將運用資料探勘技術之群集及關聯式法則之概念,如:

K-means 平均法、關聯式法則,一同尋求最佳解,並比較各方法所改善之 績效結果。

八、建立方案評比計算式

在衡量公車業者之經營環境以及滿足乘客合理服務水準的前提下,本 研究將以降低系統總成本(乘客等候時間、乘客車上時間及公車業者營運成 本)最大為方案評比計算式。

九、驗證改善績效

求解出不同公車停靠方式,運用方案評比計算式求算出不同服務型態 所能提高之效益。

十、提出可改善公車服務績效的營運策略

根據方案評比計算式之績效比較,提出不同需求型態下,可獲致較高 績效的營運策略。

(17)

確認問題

界定研究範圍與目的

文獻回顧 公車營運課題了解

處理悠遊卡資料

建構各種公車靠站組合方案

提出多元化之最適靠站型態

公車靠站組合 服務績效 推估公車乘客OD分布矩陣

挖掘乘客需求特性

建立方案評比計算式

驗證不同情境下各方案之績效

圖1.1 研究流程

(18)

第二章 文獻回顧

在本章文獻回顧中分成四小節,首先 2.1 節先回顧公車排班及路線績效等 相關文獻,2.2 節回顧公車營運在靠站型態之相關文獻,2.3 節針對前人已運用 智慧卡產出資料之相關研究做一回顧,2.4 節則針對資料探勘方法做介紹及相關 文獻之應用。最後,2.5 節則根據上述各課題之文獻回顧後,所得到之啟發和想 法作總結。

2.1 公車營運相關課題 2.1.1 公車排班及人車調度

一、數學規劃法

劉方琪(1998)【24】主要針對市區公車固定班距的隨機排班問題,在 假設車輛容量固定、旅客在等候線等候時間超出某上限值就離開,旅客到 達過程服從非均勻波以松過程(Possion Process)、旅客到站下車人數服從 二項式分配(Binomial)、公車站間旅行時間服從韋伯分配、旅客之上下車 時間為一常數等情況下,提出一「最佳化客運公司利潤」為目標的最佳班 距模式,並將模式區分為單一班距與多班距兩種模式。單一班距模式以界 線回朔分析法(Bounding Retrospective Algorithm)求解。多班距則由該研 究發展出之隨機最佳化方法求解,其中隨機最佳化方法為將ㄧ日營運區分 為多各時段,再將各時段透過單一班距進行求解。最後以新竹客運之某特 定路線的試調資料作測試驗證,結果顯示在非尖峰時段能增加80%的營運 效率,在尖峰時段中則改善了17%。

二、最大承載區間概念法

Ceder(1984)【30】提出兩種資料蒐集的方法,共四種決定班次的方法,

而蒐集的方法分別是單點調查法(Max Load Methods)和隨車調查法(Load Profile Methods)兩種,單點調查法是蒐集每站最大上車乘載量人數,而隨 車調查法則是蒐集整條路線乘客上車人數,將所蒐集之資料數據描繪出該 條路線各時段的需求分佈。依照蒐集數據,導出決定班次方法及時刻,而 單點調查法有兩種導出班距的方法,隨車調查法也有兩種導出班距的方 法,最後,並提出選擇適用方法的準則。

Ceder(2001)【31】有感於初始班表可能會因環境或其他外在因素的改 變,使得原始班表不再符合乘客需求,希望能在條件不變下(如:車隊規 模),進行班表重建及調整。主要也是依照所蒐集之資料數據,來改善發車 時間,而調整準則是以同時考慮每站最大承載人數,是否已達到期望人數 為分割點,只要某站人數一達到臨界值,則該時間為發車時間。

三、系統模擬法

謝金玫(1993)【26】以經營者的立場,建構一目標函數為維持可接受 服務水準下使「營運者淨收益最大」的模式。其排班模式所得的資料與訪 談專家所得之經驗建構公車排班作業之系統,為一人員及車輛的排班系

(19)

統。該研究將排班作業中之特殊情況考慮進去,如車輛臨時故障送修或行 車人員因故缺席等不確定狀況,而其探討影響排班作業的因素包括:旅次 需求量、班距彈性、公車運行作業方式、服務水準、重複路線競爭、車輛 容量、行駛時間、週期時間、車隊規模、營運成本及可使用的人員等十項。

最後,以大有巴士的信義幹線作為研究測試對象。

吳宗憲(1994)【6】對於謝金玫在不確定狀況僅考慮人員請假與車輛故 障兩種情況感到不足,因此繼續深入了解車況(車輛可用狀況)、人況(駕 駛員勤缺狀況)、路況(道路交通狀況)、客況(旅客需求變化狀況)等不 確定因素的產生,對於調度站排班作業的影響。該研究利用系統模擬法建 構排班模式以得到正常排班的知識,並利用訪談專家與駐站實習,以得到 不確定狀況的知識,結合兩者發展出一排班專家系統,而其目標式為系統 總成本(乘客等車時間成本、車內時間成本及業者營運成本之合)最小。

而其探討影響排班作業的主要因素有:乘客需求量、需求彈性、服務水準、

重複路線的競爭、車輛容量、運作時間、公車運行作業方式、車隊數目、

營運成本及駕駛人數等十項。最後以信義幹線作為研究測試對象。

陳政信(2002)【18】延續劉方琪(1998)【24】的研究,把其研究範圍 由單一路線之發車班距的設定延伸至單一路線多班距之班距設定問題。在 考慮較複雜且符合現實狀況(如:旅運需求、行車時間、乘客因不耐煩而 離開等候線等)之行車隨機的系統,也同時考慮公車營運業者本身的利潤 及乘客的利益,建立ㄧ目標函數,利用依隨機最佳化的方法找出最佳發車 班距使目標函數最高。本研究運用系統模擬法還解決多班距排班問題,

Nelder-Mead 的方法論來解決最佳隨機化問題。結果顯示若行車系統只有 兩個時段以及只有總站和終站兩站,且乘客在總站上車必須在中站下車,

則近似解釋一個不做的簡單最佳解,若行車系統為多站式時,則效果就較 差,此時可依照常理來推一起始解,以求取較好的最佳發車頻率。

四、啟發式解法

吳孟璵(2003)【5】研究範圍是以市區公車即時班表排班為主,其建立 排班模式主要考量「營運者利潤最大化」原則及「旅客擁擠程度」為限制,

來決定各時段發車次數及提供時刻表資訊。並利用GPS 即時資料輔助調度 監控車輛行駛中誤點、脫班、漏班、連班及無法回站發車等情況,和遇到 人員事先請假、中途退出以及車輛保養、故障等狀況,建構一以專家知識 作為班表調整依據的專家系統。最後以台北市公車285 路線為測試對象,

結果顯示非假日單日可提升4.36%獲利,假日單日可提升 63%獲利,整體 而言單月效益應可提升 9%獲利;在專家系統的使用者滿意度調查方面,

90%的使用者對於調度模組感到「滿意」,系統效率較原人工作業減少 50%

的時間。

游文松(2004)【14】考量經營業者與司機員兩層面,建立ㄧ多目標人 員與車輛排班模式,並依據模式特性,發展以勤務為染色體之基因演算法

(20)

進行模式求解作業,其中,在適合度目標函式採用權重赫爾德範數(weighted Holder norms),以處理多目標單位與值域不同之問題。其研究範圍以單場 站單路線與單場站多路線為主。最後以桃園客運桃園站實際營運勤務及新 竹客運排班教育訓練範例內容為測試對象。結果顯示該研究求解結果確實 能提升現行汽車客運人員與車輛排班作業效率。

表2.1 公車排班相關彙整

研究者 論文名稱 研究對象 排班方法 研究主題

謝金玫 (1993)

專家系統應用於公 車排班作業之研究

大有巴士

信義幹線 系統模擬法

¾ 人員排班

¾ 車輛排班

¾ 隨機班表 吳宗憲

(1994)

結合模擬技術與專 家系統應用於公車 排班作業之研究

大有巴士

信義幹線 系統模擬法

¾ 人員排班

¾ 車輛排班

¾ 隨機班表 劉方琪

(1998)

市區公車排班與即

時機動調度之研究 新竹客運 數學規劃法

¾ 車輛排班

¾ 隨機情況

¾ 固定班表 陳政信

(2002)

公車多班距時刻表 設計的隨機最佳化 問題

模擬實驗 系統模擬法 ¾ 隨機情況

¾ 即時班表

吳孟璵 (2003)

GPS 環境下公車車 輛排班調度專家系 統之研究

台北市公

車285 路線 啟發式解法

¾ 人員排班

¾ 車輛排班

¾ 即時班表 游文松

(2004)

公路客運人員與車

輛排班之研究 新竹客運 啟發式解法 ¾ 人員排班

¾ 車輛排班 資料來源:本研究整理

2.1.2 路線設計及績效

邱奕明【11】為提昇大眾運輸系統之績效、增進公車專用道設施效益,研 擬市區公車路線之調整程序,其內容包含分析準則、調整方式、及評估方法三 部份。該研究以各運輸走廊公車路線作為分析之基礎,選取路線重複率、路網 涵蓋率、路線彎繞度、行駛公車專用道長度比例作為調整準則,並以公車專用 道路段容量作為調整限制;路線調整方法以路線拉直、路線平移為策略;調整 績效評估則以公車系統成本為評估指標,以大眾運輸旅次指派輸出資料進行分 析。該研究結合地理資訊系統之資料庫管理、空間分析、及成果展示等功能,

藉以提昇調整流程之效率,同時加強調整成果之溝通能力。最後依據研擬之準 則及評估方法對台北市聯營公車系統進行實例分析,除確認本程序操作之實用 性外,並證實配合公車專用道之路網結構,依據此調整程序改變公車路線,可 有效提昇公車系統之績效,對大眾運輸系統效益之提昇具有正面意義。

王湮筑【4】於公車路網現況評估模式構建中,考量經營者、使用者及管制

(21)

者等三個層面,並以選取可以量化之指標和避免各指標間具相依性之原則,選 取路網密度、涵蓋路線、路線彎繞度、路線直接性、載客量、路網可及性及服 務範圍指標為評估路網現況之指標,配合 TransCAD 及 EXCEL 之應用,以評 估路線調整或規劃增設前後之績效。在既有公車路線調整方面,分析既有路線 調整之影響因素、目標及原則,選取「路線彎繞度指標」及「路線重複性」作 為既有路線調整準則。並參考過去相關研究,訂定超過門檻值(1.3<路線彎繞 度<1.6)或路線重複性高的路線,列為優先考量調整的路線。考量新闢路線規 劃方面,提出新闢路線規劃目標,並進一步分析新闢路線選取原則,且以「交 通分區可及性」及「供需比」作為選取亟需規劃新路線之交通分區的準則。結 合「TransCAD」之應用,作為公車路網規劃與設計之主要工具。以台中市市區 公車系統為實例分析對象,經既有路線調整準則及新闢路線選取準則之分析,

規劃四條調整及合併路線和十三條新闢路線。

2.2 公車靠站型態

2.2.1 公車靠站型態之類型及優缺點

一般公車路線可選擇之靠站策略,包括每站皆停方式、直達車方式、區間 車方式、越站停車方式及分區停車等服務方式,以下為各種靠站型態之實施方 式與特性【45】。

一、每站皆停方式(All Stop Service)

此種營運方式係指每一班車往返行駛於路線的全程,並在每一車站停 靠,以供乘客上下車,如圖 2.1 所示。都市中的公車系統大多採用此種營 運方式,此即為一般所稱的普通車。此種營運方式的特性為站距較短、乘 客搭乘較為方便及等車時間較短,但也因停靠車站過多而造成乘客的平均 旅行時間較長。每站皆停之優缺點如下:

(一) 優點

1. 各站乘客皆可搭乘,為最簡單的運作方式。

2. 班車每站皆停,乘客到站步行距離較短。

3. 班距較短,乘客等車時間也較短。

4. 服務範圍較大。

(二) 缺點

1. 乘客平均旅行時間較長。

2. 停靠與啟動頻繁,乘客舒適性低。

3. 班車行駛時間長,車輛迴轉率較低。

4. 班車營運中干擾較大,易發生連班或脫班現象。

(22)

圖2.1 每站皆停方式示意圖 二、直達車方式(Express Service)

此種營運方式為每一班車街行駛路線全程,但僅停靠少處幾各站,如 圖 2.2 所示。直達車所停靠之車站多為乘客的主要旅次產生點或吸引點,

如學校、百貨公司、辦公大樓、主要轉車中心等。此種停站特性為站距較 長、班車行駛速率較快、減少乘客旅行時間,但因停靠站數較少,服務範 圍減小、乘客步行時間較長。直達車之優缺點如下:

(一) 優點:

1. 停靠站數減少、提高班車行駛速率、增加車輛迴轉率。

2. 減少乘客旅行時間。

3. 班車在路線中所受干擾較小,較能維持正常班距行駛。

(二) 缺點:

1. 停站數減少、乘客步行距離較長,乘客搭乘較不方便。

2. 服務範圍較小,部分乘客需轉車。

圖2.2 直達車方式示意圖 三、區間車方式(Short-Turn Service)

此種運作方式為在路線上乘客較多的區段另派班車服務,每一班車僅 停靠其行駛區段中之每個車站,如圖 2.3 所示。其特性與每站皆停方式相 類似,但因其行駛里程較短,班車在路線中所受延滯較小。區間車之優缺 點如下:

(一) 優點:

1. 行駛距離較短,班車準點性較高。

2. 車輛迴轉率高。

3. 班車行駛於乘客量大之區段,較易維持均勻之載客量。

(二) 缺點:

1. 班車僅行駛部份區段,長程乘客需轉車。

2. 乘客搭乘時易發生錯誤。

:車輛停靠供乘客上下車

:車輛不停靠

:車輛停靠供乘客上下車

(23)

圖2.3 區間車方式示意圖 四、越站停車方式(Skip-Stop Service)

此種運作方式一般將車站分為A、B、AB 三類,並將班車分為 A、B 兩類。各類班車接往返行駛路線全程,但A 車僅停靠 A、AB 兩類車站,B 車進停靠B、AB 兩類車站,如圖 2.4 所示。如此,所有班車皆停靠 AB 類 車站,A、B 兩類車站則分別僅有 A、B 兩類班車停靠。此種運作方式由 於停靠站數較每站皆停方式為少,可使行駛速率提高,減少乘客旅行時間,

但對於起、迄點分別為 A、B 兩類車站之乘客造成困擾。越站停車之優缺 點如下:

(一) 優點:

1. 班車停靠站數較每站皆停少,可減少乘客旅行時間。

2. 班車停靠站較直達車多,服務範圍較大。

3. 班車行駛時間縮短,降低路線營運成本。

(二) 缺點:

1. 起、迄點分別在 A、B 兩類車站時,易造成乘客轉車困難。

2. 對於 A、B 兩類車站之班車班距增大,增加成客等車時間。

3. 服務方式較每站皆停複雜,易造成乘客搭乘之困擾。

圖2.4 越站停車方式示意圖 五、分區停車方式(Zonal Service)

此種運作方式是將乘客較多、里程較長之路線劃分成若干區間,不同

:車輛停靠供乘客上下車

郊區 市中心

A B C D E F G H I J K

F G H I J K

區間車路線

:A 車站,車輛停靠供乘客上下車

郊區 市中心

A B C D E F G H I J K

:B 車站,車輛停靠供乘客上下車

:AB 車站,車輛停靠供乘客上下車

(24)

區間將指派不同班車行駛,各班車之行駛路線僅包括其服務區間至中心商 業區之路段,班車停靠其服務區間內之每一車站。其特性為班車行駛距離 較短、停靠站數較少,可增加車輛使用率,並減少乘客旅行時間。此種運 作方式有可分為下列四種:

(一) 分區直達方式(Zonal Express Service)

此種運作方式將服務路線分成兩區或數區,而以不同之路線分別 提供服務,各班車在其服務分區內每站皆停,在分區外則不停靠任何 站,而直達市中心區。其營運方式如圖2.5 所示。

圖2.5 分區直達方式示意圖 (二) 限制分區方式(Restricted Zonal Service)

此種運作方式與分區直達方式類似,為進城方向之班車在其服務 的分區之外,僅允許乘客下車,而出城方向的班車允許乘客上車。

(三) 限站分區方式(Limited-Stop Zonal Service)

此種運作方式在路線所服務之區間內可供乘客自由搭乘,但在服 務區間外,則僅於指定之車站停靠。其營運方式如圖2.6 所示。

圖2.6 限制分區方式示意圖

:車輛停靠供乘客上下車

郊區 市中心

路線一

分區一 路線二

分區二 路線三

分區三

:車輛停靠供乘客上下車

郊區 市中心

路線一 分區一

A B D E G

路線二

分區二

B C D E G

路線三 分區三

E G F

(25)

(四) 半限制分區方式(Semi-Restricted Zonal Service)

此種運作方式與限制分區方式相似,但是當進城方向之班車在其 服務的分區之外有乘客下車時,才允許乘客下車;若無人下車則不停 車載客。

2.2.2 公車靠站型態之相關研究

葉祥海(1983)【22】針對都市公車,利用電腦模擬方法,分別建立普通車、

區間車與直達車三種派車策略之電腦模擬模式,進行各種組合派車策略之模擬 實驗。主要目的是在分析同一公車路線上行駛直達車、區間車與普通車在各種 組合比例下之系統績效。作者把實地調查5 路及 10 路公車之數據資料及路線基 本資料,當作模擬程式之起始輸入值,再進行各種組合派車之模擬實驗。研究 中對於直達車運作方式之停靠站並未說明其選擇方法,僅以每分鐘上下人數總 和大於 1.5 人之站位,作為直達車之停靠站位。而有關於區間車服務之區段選 擇方法也未加說明。模擬結果顯示,直達車或區間車愈多時,車輛迴轉率愈高,

但將造成乘客等車時間顯著增加及載客數愈不均勻之不良現象。

Santhakumar 和 Hariharan(1991)【44】運用電腦模擬模式,探討在各種 運輸系統管理(TSM)策略對於公車路線服務績效之影響,包括:改變行車速 度、改變加速度或減速度、減少站牌數、改變公車靠站型態(探討直達車)、公 車車型的配置、重新安排公車站牌位置等六種。研究中利用四條公車路線之實 際資料,透過電腦模擬結果顯示,當施實直達車之停靠站方式,總行車時間約 減少30%,可有效提升服務績效,不過研究中並未說明。

趙瑞芳(1996)【23】針對公車運輸系統運作策略之特性、優缺點與適用條 件,求解單一公車路線之最佳運作策略組合。該研究建立ㄧ公車排班及載客模 擬模式,以系統總成本(包括業者營運成本、乘客車上時間成本與等車時間成 本)最小為目標式,限制條件有車輛容量限制、班車最大班距、原路線乘客總 等車時間等,並以道路交通環境、公車路線基本資料、尖離峰乘客需求資料為 資料起始輸入值,並用卡方檢定確認模擬產生之觀測值與輸入的資料屬於相同 之分配型態,再進行排班及載客模擬分析。策略組合包括每站皆停與直達車、

每站皆停與區間車、每站皆停與分區停車(skip stop)之運作組合。最後以 36 路公車資料進行實例應用與分析,結果顯示若乘客起迄分佈型態集中於路線部 分區段,則實施區間車與每站皆停運做組合策略有較佳的成果。

郭月萍(2000)【13】依據公車路線乘客起迄資料及公車排班的計算原理,

利用啟發式方法建構公車路線最適營運策略組合模式,並以系統總成本最小為 總評估指標,尋求營運者成本及旅客旅行時間成本同時下降最多之營運策略組 合。研究中假設了六種公車問題,分別為:數量大且乘客OD 量均勻分布、數 量小且乘客OD 量均勻分布、數量大且乘客 OD 量集中於部分停靠站、數量大 且乘客OD 量集中於後段停靠站、數量小且乘客 OD 量集中於部分停靠站、數 量小且乘客OD 量集中於後段停靠站。估計出各營運策略組合下各類班車之運 量,並實際求出各營運策略組合下各類班車之停靠站、班距、總車輛數、業者

(26)

營運成本及乘客旅行時間成本等資料。

表2.2 公車運作組合策略文獻彙整

研究者 論文名稱 研究方法及內容 缺點

葉祥海 (1983)

單 一 路 線 上 各 種 組 合 比 例 下 之系統績效

¾ 系統模擬法

¾ 同一公車路線上行駛直 達車、區間車 與普通車 在各種組合比例下之系 統績效。

1.人力蒐集數據。

2.未設定目標式。

3.未說明如何選取 停靠站位。

Santhakumar 和 Hariharan

(1991)

transportation systems management options to improve urban bus performance using computer simulation

¾ 系統模擬法

¾ 探討六種 TSM 策略對 於公車服務績效之影 響,其中包含改變公車 靠站型態,透過電腦模 擬證明採用直達車策略 能有效提升服務績效。

1.人力蒐集數據。

2.未說明直達車選 取停靠站位之方 法及目標式。

趙瑞芳 (1996)

單 一 公 車 路 線 求 解 最 佳 運 作 策略組合

¾ 系統模擬法

¾ 同一公車路線上行駛直 達車、區間車與普通車 在各種組合比例下之系 統績效。

¾ 以系統總成本(公車營 運成本、乘客等車時間 總成本、乘客車上時間 總成本)最小化。

1.人力蒐集數據。

2.未敘述各種營運 策略的如何選取 停靠站位

郭月萍 (2000)

單 一 公 車 路 線 求 解 最 適 營 運 組合策略

¾ 啟發式解法

¾ 同一公車路線在六種情 況下之最佳策略,並求 出各類班車之停靠站、

班距、總車輛數、業者 營運成本及乘客旅行時 間成本等資料。

¾ 以系統總成本(公車營 運成本、乘客等車時間 總成本、乘客車上時間 總成本)最小化。

1.模擬數據

資料來源:本研究整理

(27)

2.3 智慧卡產出資料之相關研究

林祥生【8】依據台北市聯營公車之營運特色,研擬公車票證電腦化作業之 規劃目標、設計要求及系統架構,並依據此一規範篩選出適用於台北市的自動 化收費設備,最後提出一套計便利乘客用票又可提升業者管理績效之票證制度 及票務作業流程。其研究發現,公車票證電腦化的實施,除了直接增進業者營 運管理效益,同時亦提供具記錄具公信力的營收資料,可作為政府今後補貼政 策之依據。更重要的是,研究單位可依據票卡紀錄內容,推估乘客起迄運量表,

以取代目前高成本、低效率的運量調查方式。

林祥生等人【7】根據公車紅 29 的刷卡資料,自行構建一分析軟體,分別 從總體面及個體面挖掘公車乘客的需求特性及搭乘行為。在總體面,本研究分 析平日與假日的載客量比較、一日中各時段的尖離峰現象、不同平常日及不同 身份別的尖峰時段差異、捷運轉乘行為等,而在個體面更進一步比較全票及學 生乘客的搭乘習性,讓經營者能清楚看見個別顧客的消費者行為,一方面可針 對目標乘客實施精準行銷策略,另方面亦能有效安排車輛定檢及人員輪休。凡 此過去業者無從得知的需求特性,皆可由本研究所構建的資料探勘模式逐一呈 現,使業者今後能以科學數據進行更有效的營運策略。

Bagchi 和 White【39】發現智慧卡(smart card)將成為可用來分析旅行者 行為的新運輸資料來源。智慧卡裡所紀錄之資料,可以幫忙克服現存運輸資料 來源的不足及讓業者從統計數字中了解乘客的需求。透過智慧卡系統,業者將 可取得:1.大量的個人旅行資料;2.可以連接這些資料到個人卡或是使用者;3.

比現存運輸資料來源可以獲得更長期的連續旅次資料;4.知道他們的忠誠顧客 是誰。可是若要從現存運輸資料,作為分析乘客行為來源的資料是有困難,因 為智慧卡所記錄的內容不夠完整,如不知乘客確切起迄點、旅次目的等,而這 些缺漏資料可能還需要藉由調查或其他方法來克服彌補。不過業者仍可再在了 解資料上的限制後,尋找一種實用的方法來分析和應用。此外,公車業者也可 因應現在潮流,根據資料分析結果發展出適合路線特性之行銷策略。

2.4 資料探勘 2.4.1 資料探勘的定義

資料探勘(Data Mining)是從龐大的資料量中,透過理解、萃取、整合、查 核、除誤、轉化、測試、解釋等階段,逐步挖掘出有價值的隱藏資訊,以作為 企業決策的重要參考,因此麻省理工學院的 Technology Review 雜誌將其選為 改變未來世界的十大創新科技之一【48】。資料探勘在過去經常被用來分析信 用卡客戶或手機用戶的消費行為,以輔助經營者從龐雜的客戶帳單資料中,挖 掘出有助於未來精準行銷的決策資訊。

而在資訊科技的推波助瀾下,不僅企業競爭的強度與速度倍數於以往,激 增的市場交易也使得各企業所需儲存與處理的資料量愈來愈龐大。所以,企業

(28)

如何因應外界的競爭,快速且有效地從資料庫中取得有用資訊,並反映市場或 消費者的需求,已成為各企業重視的焦點;而資料探勘技術不但能輔助企業建 立自動預測顧客行為的模型,還可與商業資料倉儲(Commercial Data Warehouse) 結合,發展出更有價值的商業用途。

關於資料探勘的定義有許多不同版本,其中較具有代表性者包括,Fayyad 等人(1996)【32】指出「資料探勘能將資料簡化成正確的、未曾被知道的、有 用的以及最容易了解之規則的一連串重要處理動作」,Berry 等人(1997)【27,28】

認為「資料探勘是針對大量的資料,利用自動化或半自動的方式進行分析,以 尋找出有意義的關係或法則」,Han(2000)【35】則定義「資料探勘是從大量資 料中萃取出來的知識」,而尹相志(2003)【2】認為「資料探勘是利用統計以及 機械學習的演算法,啟發性地從大量資料中找尋隱藏具有商業價值的知識與規 則,作為自動化商業策略之應用」。關於資料探勘的定義,其他許多學者也有 提出相關的解釋,並整理如表2.3 所示。

表2.3 資料探勘的定義

作者 定義

Frawley (1991) 資料探勘是從資料中萃取出隱藏的、先前未知的有用資訊。

Grupe and Owrang (1995)

資料探勘乃是從現存資料中剖析出新事實及發現專家們尚 未知曉的新關係。

Fayyad et al.

(1996)

資料探勘是知識發現(Knowledge Discovery in Database;

KDD)其中的一個步驟。資料探勘透過演算法,將資料作一 分析與應用,以找出其特性(pattern)與模式(model)的過程。

Cabena et al.

(1997)

資料探勘是將未知且有效的資訊從大型資料庫抽出的過 程,並且將萃取出的有用資訊提供給主管做決定性的決策。

Kim (2000) 資料探勘是提煉未知且可能有用的知識來幫助決策的一系 列流程。

Shaw et al.

(2001)

資料探勘是尋找和分析資料的一個過程,主要的目的是找 出隱含在裡面有用的資訊。

Roger et al.

(2002)

資料探勘是一種從整個資料庫裡的資料,利用一種或多種 電腦技術來自動分析與去擷取知識的過程。

資料來源:本研究整理

2.4.2 資料探勘的功能

一 般 而 言 , 資 料 探 勘 依 其 模 型 主 要 可 分 為 六 大 主 要 功 能

【15,16,17,18,19,20,21】,這些功能的內容及可使用的技巧概述如下:

(29)

一、分類 (Classification)

分類是指檢視新物件的特性,然後將其指定到預先定義好的類別中,

即利用一連串的輸入變數來預測「類別變數」。所要檢視的物件,通常是 指資料庫中的紀錄,包含更新資料紀錄及標上類別編號等。例如在信用卡 的分析上,發卡銀行會利用顧客的資產狀況及繳費記錄,將信用卡申請人 分類為低、中、高風險群,藉此分類方式對不同族群給予不同的額度及服 務。常用的方法有決策樹(Decision Tree)或類神經網路(Neural Network)等。

二、推估 (Estimation)

推估善於處理連續性的數值,憑著一些輸入資料,可用來推估一些未 知的連續性變數,例如按照信用申請者之教育程度及行為別,來推估其信 用卡消費量。相關的使用技術包括統計方法上之相關分析、迴歸分析及類 神經網路方法等。

三、預測 (Prediction)

預測是推估未來的數值及趨勢,歷史資料可用來建立模型以檢視近來 觀察值的資料,例如由過去行銷活動所產生的反應,來預測未來新活動的 回應率,或是由顧客的職業、年齡、收入等人口屬性特質及其消費行為來 預測可能的流失率等。使用的相關技術包括迴歸分析、時間序列分析(Time Series Analysis)、類神經網路及案例庫推理(Case-Based Reasoning)等。

四、關聯法則 (Association rule)

關聯法則主要描述在龐大資料庫中某些資料項目間彼此之關連性,其 形式為X→Y,其中 X 及 Y 分別表示資料庫中不同之項目組。關聯法則最 早應用於超市購物籃分析(Market Basket Analysis),藉由顧客的交易記錄,

找出商品間彼此的關聯性,以做為超市商品擺設及進貨庫存之參考。

五、群集化 (Clustering)

群集化就是將許多不同的群組,分成一些更相似的子群組或群集,目 的是要將組與組之間的差異找出來,將相似特性的項目組成一群。它與分 類不同的是,群集化沒有依靠事先明確定義的類別來進行分類,資料是根 據自身的相近性群聚在一起。因此,群集化可說是分類的前置作業,它也 是進行市場區隔的第一步。

六、序列規則 (Sequential Pattern)

序列規則技術的重點是考慮時間的因素,利用此方法分析不同時間點 上各事件的關聯性,也就是在一長期時間區段內,事件發生的順序。其最 大功能是協助我們找出顧客的消費生命週期序列規則主要分為順序性規則 與週期性規則兩種,順序性規則乃考慮事件發生之時間先後關係,而週期 性規則考慮時間區段的變化,分析時間區段內所發生的事情,是否其他相 同時間區段內也會發生。這兩種方法雖不同,但對使用者而言,隨著時間 的多樣變化,找出有用的規則已日形重要。

(30)

2.4.3 資料探勘的應用

陳佳楨(2003)【16】為了減少病患往來醫院的次數,及增加病患可選擇到 院看診的時段,以提升醫院經營效率及服務品質,於是將資料探勘技術的關聯 式法則應用在就診行為與醫師排班的研究。研究對象為埔里基督教醫院民國89 年全年之門診紀錄,篩選相關資料,如病歷碼、看診科別、看診時段、看診日 期,並新增星期別及週別兩欄資料。最後探勘的資料項目有五:流水編號、病 歷號、週別、「醫生代碼」集合(看診診別)、「星期別+時段+醫生代碼」

集合。醫生代碼為病患看診診別集合,而「星期別+時段+醫生代碼」集合是 為了要陳述時間順序的特性。其研究直接選取前200 組最具影響性的關聯法則 來做排班,評估準則為便利度。結果顯示將求診頻率高的醫師組合排在同ㄧ時 段,確實提升病患便利度及醫院服務品質。

陳文杰(2004)【15】為了找出交通意外發生原因以避免事故發生,將資料 探勘應用於交通事故分析,探討高速公路事故發生的主要因素,也將資料探勘 結果與統計結果作ㄧ比較。研究對象為90.01~92.12 共 24 個月內在高速公路發 生事故為對象,透過資料探勘(分類與迴歸樹)與統計方法(負二項迴歸)來進行分 析。結果發現,透過資料探勘可得出當交通流量分別到達4,677 及 2,096 時,有 較高機率會發生事故,而此現象是透過統計方法(負二項迴歸模式)所分析不出 來的。不過,在預測率方面,資料探勘與統計方法的預測率分別為58%及 53%,

差異不大。因此,此研究應證資料探勘技術中的分類樹,不但可以應用在交通 事故分析上,且還能得出統計模式所找不出的特性。

王秀雯(2004)【1】此研究目的是應用資料探勘技術,分析影響事故嚴重程 度的主要原應及影響程度,藉由資料探勘結果與統計模式結果的分析比較,評 估資料探勘在運輸安全應用的可行性,提供改善照是防制工作的參考。研究對 象為90.01~90.12 共 12 個月在台北市發生交通事故的受傷者,透過資料探勘(分 類與迴歸樹)與統計方法(多元羅吉特模式)兩種方法,來比較兩種模式對於影響 事故嚴重程度之變數及預測分類的正確率。結果顯示,在整體預測率而言,資 料探勘技術(分類樹)優於統計方法(多元羅吉特模式)。而在影響事故嚴重程度之 變數,兩者差異不大所找出變數大致相同。因此,資料探勘技術中的分類數是 可以應用在運輸安全領域。

謝文雄(2002)【25】此研究目的是應用資料探勘技術,從龐大的乘客交易 歷史資料庫中,了解客戶的消費行為並根據其行為的不同將其分群,藉此來協 助企業做市場區隔化來辨認目標市場,然後針對這些客戶進行直接行銷,以提 高其忠誠度,並在客戶尚未提出服務之前,就能適時提供適當的資訊給客戶,

進而保留住客戶。研究對象為某五金製造業客戶銷售資料庫,透過資料探勘技 術之群集分析、決策樹分析及關聯式分析等三種方法來探勘。經由群集分析可 將客戶分群,結果顯示僅有14.59%的客戶是屬於忠誠度高且利益高,所以這一 群為目標客戶。而經由決策樹分析可了解大部分顧客交易的頻率及金額多為大 於0.5 次且消費金額小於 2475 元。最後在關聯式分析可發現,忠誠度高的顧客

(31)

所購買的產品為四輪車,且若產品有購買風輪架和水泥車,通常也都會在購買 四輪車。

陳麗君(2003)【17】運用資料探勘技術的自我映射組織和模糊決策樹,建 立了信用卡黃金級客戶族群的特徵模式,以瞭解黃金及客戶的特徵組合。接者 利用黃金客戶過去消費的歷史資料,透過資料探勘的方法挖掘黃金及客戶在不 同時間區段其行為改變的趨勢。研究對象為某銀行發卡中心 90.01~91.12 共兩 年的歷史資料,期望發卡銀行可以從模式中,預測出目標客戶,將有限的資源 投注在重要的目標客戶群上,讓行銷效益更為豐碩。且也從顧客行為改變的特 徵模式,幫助企業挽留流失的黃金級客戶。結果分出等級最低、等級下降、有 潛力型及等級最高等四群。並依照四群給予不同的行銷建議。

許哲瑋(2003)【12】透過資料挖掘技術與多變量統計方法,以美妝保養品 為例,進行資料庫行銷的實證工作。研究範圍包括了產品關聯性分析、顧客屬 性特徵挖掘等二大主題。針對產品關聯性分析之研究,作者利用SAS Enterprise Miner 4.1 版軟體挖掘關聯法則規則,過程是在擷取交易明細資料後,分別利用 因素分析和關聯分析,重新規劃產品組合類別,並作為建立產品推薦系統,和 設計聯合銷售方案的參考,最後比較資料挖掘與多變量統計方法,再分析產品 關聯性時的差異,。針對顧客屬性特徵挖掘之研究,使用SQL 語法結合會員資 料與交易明細後,先以使用率做事前區隔把會員分成二群,再嘗試利用決策樹 學習法,描述各個顧客群的特徵屬性,並衡量潛在顧客成為高價值客戶的可能 性。

邱創政(2003)【9】提出一以顧客消費表現為基礎之群集分析演算法,根據 顧客的消費表現,包括曾經購買哪些商品,以及花費在毎各購買商品的消費金 額,作為顧客市場區隔之區隔變數,進行市場區隔。而該研究之顧客群集分析 演算法,是以K-means 演算法之演算流程架構為基礎,融入關聯法則支持度的 概念,以 RFM 指標做為比較顧客間消費表現的基礎,而其運用基因演算法選 取出使顧客群質心之顧客,以得到較佳且穩定的分群結果。研究對象為某一零 售商所提供的顧客交易資料,以實驗的方式證明其所建構之顧客分群法,確實 能有效地讓每位顧客群內之顧客都有較為相似的行為及模式。

張忠琦(2000)【19】為了能讓企業網頁內容客製化,提昇企業電子商務的 經營績效及網站的效能,運用資料探勘的技術針對伺服器網站日誌(Web Server logs)與企業網站內容(Web content)進行分析,以能得到每位使用者網站內容瀏 覽模式(Web Content Access Patterns) 。目的在於藉由網站使用度與網頁內容的 結合,能更有效的讓網站管理者了解使用者瀏覽企業網頁的行為規則,並且依 據網站內容瀏覽規則作為改善企業網站的內容配置與網站架構的參考。作者以 撰寫WAP-mine 演算法來找出瀏覽模式,WAP-Tree 會紀錄 Event Label、Count、

Label link 三件事,而 WAP-mine 演算法概念類似關聯式法則支持度的觀念,最 後再用K-means 的分群技術依照每位使用者的瀏覽特徵分群,做出客製化的網 頁內容。

(32)

邱義堂(2000)【10】運用資料探勘技術,針對電信業者發展一客戶流失預 測模式,以協助企業解決客戶流失問題。作者摒棄以往用用客戶基本資料、人 口統計及消費歷史資料等資料來分析,改用電信業者現有的營運資料來研究預 測流失客戶模式(如租用期間、繳費方式、申裝類別),經由對客戶大量通聯 記錄的分析(平均每日使用時間、平均每日使用次數),探索客戶退租前通話 行為變化,從中尋找流失徵兆,進而發展有效的預測模型。作者以C4.5 決策樹 歸納技術,再運用多專家決策(Multi-expert Strategy)分類方法做預測分類。研究 對象為某電信業者2000 年 10 月到 2001 年 1 月的客戶資料,經實驗驗證;該研 究模型選取 10.03%之全體客戶,平均可預測出有 50.64%的客戶會流失;若選 取29.00%全體客戶中,平均可預測出有 68.62%的客戶會流失。

表2.4 資料探勘應用領域相關文獻彙整

研究者 研究主題 應用對象 應用方法

張忠琦(2000) 資料探勘於網站使用度與網

頁內容探索之研究 網頁瀏覽 WAP-Tree 邱義堂(2000 通信資料庫之資料探勘:客戶

流失預測之研究 電信業者

C4.5 決策樹

(分類分析的一 種)

謝文雄(2002) 以資料探勘探討顧客消費之 行為

零售製造

業 群集分析

陳佳楨(2003)

資料探勘應用於就診行為與 醫師排班之研究─ 以埔里基 督教醫院

醫院排班 關聯式法則

邱創政(2003) 以消費表現為基礎之顧客群

集分析 金融業 群集分析

陳麗君(2003) 應用資料探勘技術於信用卡

黃金級客戶之顧客關係管理 金融業

類神經網路

(群集分析的一 種)

許哲瑋(2003)

資料挖掘與統計方法應用於 資料庫行銷之實證研究─以 美妝保養品業為例

化妝品 關聯法則

陳文杰(2004) 應用資料挖掘技術於高速公

路交通肇事次數之研究 交通預測 分類+迴歸樹

王秀雯(2004) 應用資料挖掘技術於交通事

故傷亡嚴重程度之研究 交通預測 分類+迴歸樹 資料來源:本研究整理

(33)

2.5 小結

根據上述各小節之彙整資料,首先於 2.1 節針對市區公車排班做一彙整,

發現過去有關改善公車服務績效的研究,多偏重於公車排班、人車調度及路線 設計及績效的課題。在 2.2 節可發現,國內對於如何因應乘客在不同時間及空 間上的需求分布,提出因地制宜的多元靠站方式(如直達車、區間車、越站停車 等)較少著墨,且受限於實際資料取得的困難,且前人的研究亦多以虛擬的簡例 或少數調查資料進行測試,也無法提出停靠站選取的準則,但由前人研究之電 腦模擬結果證明,依據乘客搭乘特性而設計出量身訂做之靠站型態,的確可提 升服務績效,降低業者及乘客成本。而 2.3 節可得知,電腦票證的實施除可乘 客使用便利、提供正確營運數據及提升營運效率外,最重要的是業者可由悠遊 卡資料裡得到乘客搭乘特性,如了解乘客流失率,了解搭乘該條公車路線的旅 次率(多久搭乘一次),轉乘旅次以及流失率(判別忠誠顧客),更重要的是 若能推論出乘客搭乘的時間與空間分佈(起迄運量表),可依照所有乘客的需 求特性,提供更客製化之服務型態。最後在 2.4 節中,介紹資料探勘的定義、

功能。經由彙整可發現資料探勘應用的範圍廣泛,過去國內極少應用在交通領 域,僅只應用在運輸安全課題,對於改善服務績效範疇,還未有人深入研究,

而許哲瑋【12】、邱創政【9】、謝文雄【25】等人皆運用資料探勘方法,以顧 客消費特性為基礎,探勘出消費者之潛在需求及特性,提出符合不同需求特徵 顧客之行銷策略。因此,應該可嘗試將此觀念運用在交通領域裡。

經由上述前人於各領域之研究,可發現自悠遊卡問世後,其產出資料已可 廣泛被應用在許多課題上,如:乘客總體需求分析【7,38】。而本研究認為可 更深入探討運用悠遊卡資料來改善公車靠站型態,以提供更符合乘客需求之服 務型態,此課題具有深入探討及加以應用的價值,因為悠遊卡所記錄的交易資 料是正確且真實的需求及數據,可進一步改善前人用虛擬的簡例或少數調查資 料的缺點,且若使用確實的數據及資料去改善,加上運用資料探勘此技術,更 能增加本研究結果的可靠性及實用性。

(34)

第三章 公車乘客起迄需求之推估

由於悠遊卡系統尚未與衛星定位系統整合,所以悠遊卡資料裡並無紀錄乘 客之刷卡地點及起迄點。為得到乘客運量起迄表,目前僅能經由比對悠遊卡系 統及衛星定位系統之時間,以推估乘客刷卡地點。因此,本章主要敘述如何從 悠遊卡原始資料經由資料轉換及處理,建立出乘客起迄需求矩陣,將分七節詳 述。3.1 節敘述乘客起迄需求推估的邏輯概念,主要描述現行衛星定位系統和悠 遊卡系統,如何紀錄乘客搭乘資料和公車定位資料及資料內容;3.2 節介紹本研 究之研究對象及其路線特性;3.3 節及 3.4 節分別敘述悠遊卡資料和衛星定位系 統之原始資料記錄格式;接著 3.5 節將敘述悠遊卡原始資料透過何種資料轉換 程序可獲得有益資訊,衛星定位系統經過何種資料處理可成為與乘客刷卡時間 資料比對之資料庫;並於3.6 節示範如何推估乘客起迄需求之過程,最後在 3.7 節呈現推導出之乘客起迄需求運量表。

3.1 起迄需求推估邏輯概念

欲建立乘客之起迄運量分布,要先能得知乘客之起迄點位置。不過,目前 衛星定位系統尚未與悠遊卡系統整合,所以我們無法直接從乘客的交易資料中 得知乘客的刷卡位置,因此將先了解現存資料紀錄那些內容,設法將原始資料 透過處理及轉換過程,進而推導出乘客刷卡站位,最後再由乘客刷卡站位試圖 推估出乘客起迄需求位置,建立一乘客起迄需求運量表。

圖 3.1 所示,此行駛路段範圍為兩段票,乘客刷卡方式為上車刷一段,下 車再刷一段。目前台北縣政府 e-bus 之衛星定位系統,以站牌為單位,會紀錄 該站位即將要進站、離站之公車車牌號碼,該公車之行駛路線和其進站時間(站 牌前50 公尺)及離站時間(站牌後 80 公尺)。如圖 3.1 所示,在捷運新埔站 該站站牌,它記錄了238-AC 公車,將於 08:00:00 進站,且於 08:02:30 離站,

該輛公車行駛路線為 802。同理,當公車行駛至樹林市衛生所站時,在樹林市 衛生所站該站站牌,它記錄了238-AC 公車,將於 09:00:00 進站,且於 09:01:30 離站,該輛公車行駛路線為 802。而在悠遊卡系統裡,當乘客上車刷卡時,會 紀錄該位乘客所使用悠遊卡之卡號ID 及上車刷卡時間,而在下車刷卡付費時,

亦同樣紀錄該位乘客所使用悠遊卡之卡號 ID 及下車刷卡時間。我們可經由比 對乘客上車刷卡時間及衛星定位系統裡公車當時位置,對應出乘客上車位置(乘 客起點),同理,可經由比對乘客下車刷卡時間及公車當時位置,對應出乘客 下車位置(乘客迄點),即可推估出乘客於該趟旅次之起迄點位置,並進而建 構出乘客OD 矩陣。

一段票刷卡行為則因單筆交易記僅能紀錄某一位置之資料(如搭乘起點或 迄點位置),如圖3.2 所示,其推估邏輯為經由多天持續觀察乘客的搭乘行為,

比對出乘客較固定之刷卡地點,以上車刷卡為例,乘客往程會記錄上車位置(起 點),返程也會紀錄上車位置(起點),經由多筆相同記錄,可推估乘客的往程 下車位置為返程的上車位置,進而推估乘客該趟旅次之起迄點位置。

(35)

圖3.1 起迄需求推估邏輯概念圖(兩段票現象)

12

6 9 3

1 2

5 4 8 7

1011 12

6 9 3

1 2

5 4 8 7

10 11 衛星定位系統紀錄資料

公車路線:802 公車車牌:238-AC 公車位置:捷運新埔站 公車進站時間:08:00:00 公車離站時間:08:02:30

衛星定位系統紀錄資料 公車路線:802

公車車牌:238-AC

公車位置:樹林市衛生所站 公車進站時間:09:00:00 公車離站時間:09:01:30

衛星

收發訊號

悠遊卡系統紀錄資料 卡片 ID:123456789 刷卡時間:09:00:50 刷卡方式:下車刷卡 行駛方向

乘客上車刷卡 乘客下車刷卡

悠遊卡系統紀錄資料 卡片 ID:123456789 刷卡時間:08:01:30 刷卡方式:上車刷卡

乘客上車刷卡時間 v.s.

公車停靠位置

乘客下車刷卡時間 v.s.

公車停靠位置 比對出乘客上車位置

(起點)

推估出乘客起迄點

比對出乘客下車位置

(迄點)

參考文獻

相關文件

 Definition: A problem exhibits optimal subst ructure if an optimal solution to the proble m contains within it optimal solutions to su bproblems..  怎麼尋找 optimal

✓ Express the solution of the original problem in terms of optimal solutions for subproblems. Construct an optimal solution from

✓ Express the solution of the original problem in terms of optimal solutions for subproblems.. Construct an optimal solution from

n The information contained in the Record-Route: header is used in the subsequent requests related to the same call. n The Route: header is used to record the path that the request

 Combining an optimal solution to the subproblem via greedy can arrive an optimal solution to the original problem. Prove that there is always an optimal solution to the

We try to explore category and association rules of customer questions by applying customer analysis and the combination of data mining and rough set theory.. We use customer

Furthermore, to provide a more accurate indicator to the manager about the importance and priority of the service development, Lee and Chen (2009) integrated Kano theory with QFD

(1999), "Mining Association Rules with Multiple Minimum Supports," Proceedings of ACMSIGKDD International Conference on Knowledge Discovery and Data Mining, San Diego,