“互联网+”时代的出租车资源配置研究
摘 要
本文针对“互联网+”时代的出租车资源配置问题,借助 MATLAB、EVIEWS、EXCEL 等软件,计算出供需满足度数量指标值以及出行时长指标值,分析不同时空出租车资源 的供求匹配程度。然后依据居民等车时间分布图以及百度指数趋势图对出租车公司补贴 方案成效进行定性分析,接着建立 BP 神经网络模型对未实行补贴政策的出租车单载客 次数进行拟合与预测,通过未补贴时载客次数预测值与有补贴的载客次数真实值的比 较,得出补贴方案可以适当缓解“打车难”问题,之后建立虚拟变量回归模型,求解结 果显示滴滴打车公司作业效率高于快的打车公司作业效率。最后,利用层次分析模型得 出了对司机补贴金额贡献率最大的四个因素,据此建立了不同情况对司机的补贴方案,
并结合问题一中定义的乘客满意度对所设计的补贴方案进行了合理性验证。
对问题一,为分析不同时空出租车资源的“供求匹配”程度,首先利用北京市不同 时段载客单车日均里程,空载单车日均里程,计算得到单车空载率和载客率,并且绘制 出相应图表观察各指标间的关系;其次引入出租车供求满足度数量指标描述不同时段出 租车资源供需状况,得出北京市白天出租车供小于求,晚上出租车供大于求,且在 7:00 左右和 11:30 左右,北京市出租车供求匹配程度最佳等相关结论。最后选取北京 5 个典 型区域引入供求满足度出行时长指标,分析结果显示丰台区出租车资源供应相对大于需 求,而朝阳区可能会出现等车难的现象。
对问题二,为分析各公司的出租车补贴方案是否对“缓解打车难”有帮助。选取滴 滴打车和快的大车两家公司,从北京居民打车时需等待时间变化的角度绘制分布图来定 性分析,显示等车平均时长在补贴前后有一定变化;利用百度指数,通过滴滴打车和快 的打车的移动端搜索指数的变动反映它们各自的热度趋势,间接体现选择两家公司的打 车难易度的不同。同时借助于 BP 神经网络模型对回归分析进行验证,进一步分析打车 难问题是否有改善。最后通过虚拟变量回归模型拟合出北京市单车载客次数和两家公司 各项补贴之间方程关系,得出滴滴打车公司补贴方案对“缓解打车难”更有帮助。
对问题三,关于设计补贴方案并论证其合理性。通过对影响出租车公司补贴的各项 因素集中分析评估,得到了四个所占权重较大的指标,分别是拒载率,候车时间,天气 恶劣度以及出行轨迹繁杂度。同时结合权重大小了解它们各自相对于出租车公司补贴的 影响程度,构建分段函数模型,设计补贴方案。最后对设计出的补贴方程所涉及到的拒 载率,候车时间进行定量分析,结合出租车公司盈利状况,对其合理性进行验证。
本文综合运用了虚拟变量回归、BP 神经网络、层次分析等数学模型,对出租车资 源配置以及出租车公司补贴方案进行了详细的分析和论证。后续对载客次数与每单补贴 金额的定量关系做了灵敏度分析。最后,本文综合评价了模型的优缺点,对模型进行了 改进和推广,分析了在其他领域的广阔应用前景。
关键词:出租车;虚拟变量回归;BP 神经网络;层次分析;MATLAB
目 录
“互联网+”时代的出租车资源配置研究 ... 1
摘 要 ... 1
目 录 ... 2
§1 问题的重述 ... 3
一、背景知识 ... 3
二、相关资料 ... 3
三、要解决的问题 ... 3
§2 问题的分析 ... 4
一、对问题的总体分析 ... 4
二、对具体问题的分析 ... 4
§3 模型的假设 ... 5
§4 名词解释与符号说明 ... 5
一、名词解释 ... 5
二、符号说明 ... 5
§5 模型的建立与求解 ... 6
一、问题一的分析与求解 ... 6
二、问题二的分析与求解 ... 11
三、问题三的分析与求解 ... 18
§6 误差分析与灵敏度分析 ... 22
一、误差分析 ... 22
二、灵敏度分析 ... 22
§7 模型的评价与推广 ... 25
一、模型的优点 ... 25
二、模型的缺点 ... 25
三、模型的推广 ... 25
§8 模型的改进 ... 25
参考文献 ... 26
附录 ... 26
程序 1:BP 神经网络 ... 26
程序 2 灵敏度分析 ... 27
程序 3 层次分析 ... 28
附表 1 不同时间段出租车基本数据 ... 30
附表 2 不同时间段出租车数据 ... 30
附表 3 滴滴打车普通补贴和载客次数变化基本数据 ... 31
附表 4 快的打车普通补贴和载客次数变化基本数据 ... 32
§1 问题的重述 一、背景知识
1.出租车
出租车,也称计程车、的士。是按照计价表显示金额收费的一种重要的交通工具,
和一般交通工具相比,计程车的收费普遍较高。出租车的英文“TAXI”为“taximeter”的 简写,意为“里程计”或 “计程表”。
2.打车软件
打车软件是一种基于智能手机的应用,乘客可以通过手机,便捷的发布打车信息,
借助打车软件,直接和抢单司机沟通。这大大地提高了工作效率。现如今传统服务业和 传统的消费行为正在逐渐的被打车软件所颠覆。
3.资源配置
资源配置是指相对稀少的资源在比较多种可能的用途后,做出最有利的选择。资源 被定义为社会经济活动之中人力和物力以及财力的总和,资源是社会经济发展最基本的 物质条件。当社会经济发展到一定阶段之后,与人类的需求相比,资源总是以相对稀缺 的形式表现,这迫使人们对相对稀缺的有限的资源进行合理的配置,以便消耗最少的资 源,生产出最多最好的商品和劳务,获得最大的效益。
二、相关资料
1. 滴滴快滴智能出行平台:http://v.kuaidadi.com/
2.2013-2014 年打车软件市场分析报告:http://www.sootoo.com/content/480044.shtml 三、要解决的问题
1.搜集出租车的相关数据,建立合理的指标,并分析不同时空出租车资源的“供求 匹配”程度。
2.分析各公司的出租车补贴方案是否对“缓解打车难”有帮助?
3.如果要创建一个新的打车软件服务平台,你们将设计什么样的补贴方案,并论证 其合理性。
§2 问题的分析 一、对问题的总体分析
图 1 问题的总思路流程图
二、对具体问题的分析 1.对问题一的分析
为分析不同时空出租车资源的“供求匹配”程度,首先利用北京市不同时段载客单 车日均里程,空载单车日均里程,计算得到单车空载率和载客率,并且绘制出相应图表 观察各指标间的关系;其次引入出租车供求满足度数量指标描述不同时段出租车资源供 需状况,得出北京市白天出租车供小于求,晚上出租车供大于求,且在 7:00 左右和 11:30 左右,北京市出租车供求匹配程度最佳等相关结论。最后选取北京 5 个典型区域引入供 求满足度出行时长指标,分析结果显示丰台区出租车资源供应相对大于需求,而朝阳区 可能会出现等车难的现象。
2.对问题二的分析
为分析各公司的出租车补贴方案对“缓解打车难”的帮助,本文选取滴滴打车和快 的打车两家公司,从北京居民打车时需等待时间变化的角度绘制分布图来定性分析,显 示等车平均时长在补贴前后有一定变化;利用百度指数,通过滴滴打车和快的打车的移 动端搜索指数的变动反映它们各自的热度趋势,间接体现选择两家公司的打车难易度的 不同。同时借助于 BP 神经网络模型对回归分析进行验证,进一步分析打车难问题是否 有改善。最后通过虚拟变量回归模型拟合出北京市单车载客次数和两家公司各项补贴之 间方程关系,得出滴滴打车公司补贴方案对“缓解打车难”更有帮助。
3.对问题三的分析
关于设计补贴方案并论证其合理性问题,通过对影响出租车公司补贴的各项因素集 中分析评估,得到了四个所占权重较大的指标,分别是拒载率,候车时间,天气恶劣度 以及出行轨迹繁杂度。同时结合权重大小了解它们各自相对于出租车公司补贴的影响程
供求满足度数 问题一 量指标
供求满足度出 行时长指标
百度指数定量分析 问题二
BP神经网络、虚拟 变量回归定性分析
滴滴公司补贴方案 更能缓解“打车难”
问题三 构建分段函数
设计补贴方案
结合盈利情况,对 合理性进行验证 层次分析
模型
误差分析、灵敏度分析和模型的推广与改进
互 联 网 + 时 代 的 出 租 车 资 源 配 置
描绘出不同时空出租车 资源的“供求匹配”程度 问题一
供求满足度出 行时长指标
百度指数定量分析 问题二
BP神经网络、虚拟 变量回归定性分析
滴滴公司补贴方案 更能缓解“打车难”
问题三 构建分段函数
设计补贴方案
结合盈利情况,对 合理性进行验证 层次分析
模型
误差分析、灵敏度分析和模型的推广与改进
互 联 网 + 时 代 的 出 租 车 资 源 配 置
描绘出不同时空出租车 资源的“供求匹配”程度
度,构建分段函数模型,设计补贴方案。最后对设计出的补贴方程所涉及到的拒载率,
候车时间进行定量分析,结合出租车公司盈利状况,对其合理性进行验证。
§3 模型的假设
1.假设城市每日离开的人数等于每日进城市的人数;
2.假设所有数据来源真实可靠,不含虚假及人为捏造数据;
3.假设出租车的平均营运速度、每次载客数及平均载客里程数是一个定值,不随 其他因素的变动而变化;
§4 名词解释与符号说明
一、名词解释
1.空载里程:出租车未载客时行驶的路程。
2.行驶总里程:一天中载客行驶里程与空载行驶里程之和。
3.空载率:等于出租车无客行驶里程占行驶总里程比值。
4.空载出行时长:也称空载时长,一天中某一时段出租车空载出行的分钟数。
5.BP 神经网络:是一种目前应用最广泛的按误差逆传播算法训练的多层前馈网络。
二、符号说明
序号 符号 符号说明
1
R
( ji
, ) 单位时间供求满足度数量指标。2
R
z(i) 出租车单位时间内的载客率。3
R
k( j) 出租车单位时间内的空载率。4
NP
i 出空载时长在每一个时长段内出现的概率。5
CP
i 出载客出行时长在每一个时长段内出现的概率。6
Q
T 出行时长指标的供需满足度指标。7
D
1i 虚拟变量。8
NT
平均空载时长 9CT
平均载客出行时长10
Q
T 平均空载时长/平均载客出行时长 11Y
ijj 阈值初始值12
Q
jj 权值初始值 13E
w 误差指标§5 模型的建立与求解 一、问题一的分析与求解
1.对问题的分析
问题要求建立合理的指标,并分析不同时空出租车资源的“供求匹配”程度。首先 利用收集到的北京市不同时段载客单车日均里程,空载单车日均里程,计算得到单车空 载率和载客率,并且绘制出相应图表观察各指标间的关系。然后引入出租车供求满足度 数量指标描述不同时段出租车资源供需状况,最后选取北京 5 个典型区域引入供求满足 度出行时长指标,定量地分析各区的供需满足度。
2.对问题的求解
模型Ⅰ 不同时间出租车资源供求模型
⑴ 模型的准备
从时间角度,研究出租车资源供求匹配程度的问题中,首先收集北京市出租车载客 单车日均里程和空载单车日均里程数据,进行统计分析,计算出每时段单车空载率和载 客率,接着作北京市出租车载客时长和空载时长折线图,阐述了载客时长与载客率,空 载时长与空载率的正相关关系。最后通过建立出租车供给和需求函数,得出供求满足度 数量指标
R
( ji
, ),可以反映不同时间出租车资源“供求匹配”程度。当R
( ji
, )接近 1 时,说明出租车供求相当,即北京市出租车供求满足程度最佳。
⑵ 模型的建立与求解
①首先,把一天分成 48 个单位,即单位时间为 30 分钟,作北京市出租车载客单车 日均里程分布图,如下:
北京市出租车载客单车日均里程分布图
0 1 2 3 4 5 6 7 8 9 10
0:00-1:30 1:30-2:00 2:30-3:00 3:30-4:00 4:30-5:00 5:30-6:00 6:30-7:00 7:30-8:00 8:30-9:00 9:30-10:00 10:30-11:00 11:30-12:00 12:30-13:00 13:30-14:00 14:30-15:00 15:30-16:00 16:30-17:00 17:30-18:00 18:30-19:00 19:30-20:00 20:30-21:00 21:30-22:00 22:30-23:00 23:30-24:00 0 1 2 3 4 5 6 7 8 9 10
图 1 北京市出租车载客单车日均里程分布图
分析:单位时间出租车载客日均里程越长,说明乘客人数越多,否则越少。由图可 知,全天不同时间段出租车上客行为有三个高峰阶段,分别是在上午的 7:30-11:30、下 午的 13:30-18:30、晚上的 20:00-22:30。并且下午高峰里程和晚上高峰里程要略大于上午 高峰里程,说明下午和晚上出行的乘客人数多于上午出行的乘客人数。
②然后,作北京市出租车空载单车日均里程分布图,如下:
北京市出租车空载单车日均里程分布图
0 1 2 3 4 5 6 7 8
0:00-1:30 1:30-2:00
2:30-3:00 3:30-4:00
4:30-5:00 5:30-6:00
6:30-7:00 7:30-8:00
8:30-9:00 9:30-10:00
10:30-11:00 11:30-12:00
12:30-13:00 13:30-14:00
14:30-15:00 15:30-16:00
16:30-17:00 17:30-18:00
18:30-19:00 19:30-20:00
20:30-21:00 21:30-22:00
22:30-23:00 23:30-24:00
图 2 北京市出租车空载单车日均里程分布图
分析:由图可以看出其趋势与载客单车日均里程分布图呈互补关系,一天不同时间 段出租车空载行为有三个低峰阶段,分别是上午的 7:30-11:30、下午的 13:30-18:30、晚 上的 20:00-22:30。说明这三个时段是乘客出行的密集时间点。
③接着,计算出空载率和载客率,空载率=无客行驶里程/(无客行驶里程+载客行驶 里程),载客率=载客行驶里程/(无客行驶里程+载客行驶里程),作北京市出租车空载率 和载客率折线图,如下:
出租车空驶率和载客率
0.00 0.10 0.20 0.30 0.40 0.50 0.60 0.70 0.80 0.90
0:00-1:302:30-3:004:30-5:006:30-7:008:30-9:00
10:30-11:0012:30-13:0014:30-15:0016:30-17:0018:30-19:0020:30-21:0022:30-23:00
空载率 载客率
图 3 北京市出租车空载率和载客率折线图
分析:从图中,我们可以直观的看出北京市出租车单位时间内空载率和载客率之间 的关系,全天出租车空载率和载客率是呈互补关系的。出租车单位时间行驶里程是一定 的,若载客率高,则空载率就低;载客率低,则空载率高。
④不同时间出租车资源供求模型
研究不同时间出租车资源“供求匹配”程度,我们建立出租车供求满足度数量指标 )
, ( j
i
R
,设R
z(i)是出租车单位时间内的载客率,R
k( j)是出租车单位时间内的空载率,其中
i
,j
1,2,3...46,47,48。R
( ji
, )指标可以反映不同时间出租车资源“供求匹配”程度。) , ( j
i
R
值小于 1 时,说明单位时间内可供应的出租车数量多,满足乘客出行需求;R
( ji
, ) 值大于 1 时,说明单位时间内可供应的出租车数量少,供不应求;当R
( ji
, )接近 1 时,说明出租车供求相当,即北京市出租车供求满足程度最佳。
a.出租车需求函数:对北京市活动系统中的出租车需求进行分析时,出行量用 L 表 示,出租车需求受城市经济发展水平,交通环境,天气状况等外界因素影响,这些外界 因素设为
A
0,此外出租车需求主要和等车时长有关,依据常识,我们知道,乘客等车时 间与每辆出租车载客时间有关,即一辆出租车的在某时间点的载客时长是乘客在此时间 点的等车时间,所以出租车需求模型为:) (
A
0T
zf
L
, 因为空载时间与载客率正相关,公式转化为:
A R i
f
L
0, zb.出租车供给函数:对北京市活动系统中的出租车供给进行分析时,供给量用
G
表 示,出租车的供给量受特定的社会环境影响,影响因素设为B
0,此外出租车供给主要和 出租车空载率相关,出租车空载率是代表出租车供给水平的一项指标,所以出租车需求 模型为:
B R j
f
G
0, k c.供求满足度数量指标R
( ji
, ):) , ( j
i
R
=
B R j
f
i R A f G
L
K o
z
,
0,
d.将数据代入方程,作不同时间段出租车满足度指标折线图,如图 4。
0 0.2 0.4 0.6 0.8 1 1.2 1.4 1.6
0:00-1:302:30-3:004:30-5:006:30-7:008:30-9:00
10:30-11:0012:30-13:0014:30-15:0016:30-17:0018:30-19:0020:30-21:0022:30-23:00
不同时间段出租车供求满足度指标 供求平衡线
图 4 不同时间段出租车满足度指标折线图
分析:由图可知北京市白天指标
R
( ji
, )<1,晚上指标R
( ji
, )>1,说明白天出租车供 小于求,晚上出租车供大于求。且在 7:00 左右和 11:30 左右,北京市出租车供求匹配程 度最佳。模型Ⅱ 空间出租车资源供求匹配模型
⑴ 模型的准备
出租车资源在空间上的供求匹配程度是不尽相同的,某些区域可能由于自身的属性 特征人口密度大,交通拥挤,出租车的供应远远不满足需求。在分析了北京市出租车载 客空间的分布特征的基础上,选取了海淀区、西城区、东城区、朝阳区、丰台区5个典 型区域,从出租车平均空载时长以及平均载客出行时长出发,定量地分析各区的供需满 足度。
①海淀区
海淀区文化资源丰厚,高校林立,有颐和园、镜明园等风景区,国家级高新技术产
业开发区中关村就位于区内。
②西城区
西城区位于北京中心城区西部,全区总人口124.33万人,是人口稠密的首都中心城 区,还有中南海国务院等中央政治机构。
③东城区
东城区处于中国首都的心脏,投资者众多,商业繁荣,拥有王府井商业街。
④朝阳区
朝阳区作为近郊区,在北京市面积最大,是未来北京的经济中心,经济发展迅猛,
CBD核心区域所在地。
⑤丰台区
丰台区交通发达,出行方便,作为后起之秀是北京的新兴城区,正在进行农业向工 商业的转型。
选取这5个区作为研究对象,将出租车的空载时长和载客出行时长进行细分,基于 空载次数计算出空载时长在每一个时长段内出现的概率
NP ,再按载客次数计算出载客
i 出行时长在每一个时长段内出现的概率CP ,由公式:
i
ni i
i
NP
t NT
ni i i
CP t CT
可以得到各区平均空载时长以及平均载客出行时长的大小[3],再通过:
CT Q
T NT
计算出基于出行时长指标的供需满足度,当
Q 越大,表明该区空载出租车司机要
T 花费更多的时间去搜寻乘客,从出租车资源供需匹配的角度来分析,供大于求,乘客的 满意度相对较高。当Q 越小,表明相对载客出行时长,该区出租车司机可以很快寻到
T 乘客,需求比较密集,此时可能供小于求,司机的满意度相对较高。⑵ 模型的建立与求解
对北京市选取的 5 个典型地区的数据记录进行统计计算,绘制出空载时长分布频率 表:
表 1 北京市五个地区空载时长分布频率
时长 [0,5) [5,10) [10,15) [15,20) [20,30) [30,40) [40,50) [50,60) 60 以上 海淀区 76.40% 12.51% 5.25% 2.27% 1.61% 0.50% 0.30% 0.17% 0.99%
西城区 91.27% 6.07% 0.92% 0.45% 0.38% 0.15% 0.09% 0.06% 0.61%
东城区 63.67% 14.05% 8.21% 5.34% 4.41% 1.43% 0.85% 0.25% 1.79%
朝阳区 67.14% 13.54% 6.98% 4.90% 3.55% 1.20% 1.40% 0.23% 1.06%
丰台区 71.57% 15.22% 5.38% 3.78% 1.03% 0.88% 0.52% 0.28% 1.34%
从频率分布表中可以看出五个区的空载时长大部分分布在[0,5)时长段内,比例各有 不同差异。其中,西城区出行需求非常密集,97%以上的空载时长都集中在 0-10 分钟时 长段,这与西城区的人口稠密高关系密切,其他几个区域在[0,5)时长段分布频率均低于 80%,在[5,15)中分布了 5%-15%的比例。
再对载客出行时长的频率分布进行计算,绘制出五个地区载客出行时长频率分布 表,如下:
表 2 北京市五个地区载客出行时长分布频率
时长 [0,5) [5,10) [10,15) [15,20) [20,30) [30,40) [40,50) [50,60) 60 以上
海淀区 77.09% 11.85% 4.65% 2.59% 1.71% 0.54% 0.32% 0.18% 1.06%
西城区 92.19% 5.12% 0.93% 0.45% 0.38% 0.15% 0.09% 0.06% 0.62%
东城区 64.60% 15.35% 4.14% 6.59% 4.79% 1.27% 1.05% 0.31% 1.91%
朝阳区 66.48% 13.41% 6.91% 4.85% 4.51% 1.19% 1.39% 0.24% 1.03%
丰台区 69.72% 14.27% 5.34% 3.05% 0.83% 0.71% 1.42% 3.58% 1.08%
从分布表同样可以看出五个区的载客出行时长大部分分布在[0,5)时长段内,,比例 也各有差异,西城区在这一时段内的分布频率最大,所以该区出租车人流量比较大,其 他几个区域[5,20)中分布了 15%-25%的比例。
通过分布表中空载时长在每一个时长段内出现的概率以及载客出行时长在每一个 时长段内出现的概率,利用公式计算出每一地区的
NT
和CT
。表 3 北京市五个地区
NT
NT
平均空载时长(NT
)海淀区 7.49
西城区 5.41
东城区 3.49
朝阳区 7.92
丰台区 8.1
表 4 北京市五个地区
CT
CT
平均载客出行时长(CT
)海淀区 7.32
西城区 5.8
东城区 3.5
朝阳区 9.75
丰台区 7.2
利用各区
NT
和CT
的数值,计算出它们的比值,得到Q ,通过表格反映出各地区
T的供需满足度的大小。
表 5 北京市五个地区
Q
TQ
T 平均空载时长/平均载客出行时长(Q
T)海淀区 1.02
西城区 0.93
东城区 0.99
朝阳区 0.81
丰台区 1.13
可以看出丰台区的
Q 大于 1,
T 海淀区和东城区的Q 近似为 1,
T 西城区和朝阳区的Q
T 小于 1。丰台区相对于朝阳区,平均空载时长远长于平均载客时长,反映出丰台区的寻 到客的出租车比例比朝阳区要低,从出租车资源匹配的角度,该区出租车供应相对大于 需求,一部分出租车出行时间大半用于寻客,可能与丰台区处于郊区,人口密度较小以 及公共交通发达等因素有关。而朝阳区虽然也是近郊区,但由于是 CBD 核心区域所在 地,商业经济繁荣,同时人口稠密,商业区人流量大,对于出租的需求比较密集,可能 还会出现等车难的现象,出租车资源的供应满足不了乘客的需求。对于海淀区和西城区而言,比值接近于 1,虽然不能表明地区内出租车资源的供给 和需求达到了平衡,但是在一定程度上体现了出租车供需匹配程度较高,司机满意度和 乘客满意度在一定程度上达到双赢。
二、问题二的分析与求解 1.对问题的分析
问题要求分析出租车公司的补贴方案是否缓解了打车难。对于这个问题的分析,我 们选取两家公司,分别是滴滴打车和快的打车,可以从四个角度定性与定量相结合就它 们各自的补贴方案对北京市居民打车难易度的影响进行研究。一是从北京居民打车时需 等待时间变化的角度定性分析。二是合理利用百度指数,通过滴滴打车和快的打车的移 动趋势搜索指数的变动反映它们的受关注程度的变化,间接体现选择两家公司的打车难 易度的不同。三是通过回归模型拟合出北京市单车载客次数和两家公司各项补贴之间方 程关系,再比较补贴前后单车载客次数的变化。四是借助于 BP 神经网络模型对回归分 析进行验证,进一步分析打车难问题是否有改善。
2.对问题的求解
模型Ⅲ 定性分析模型
⑴ 模型的准备
通过补贴方案实行前后,居民打车等待时间的变化以及移动端搜索指数的变动,借 助环形图分布范围以及折线图的趋势走动刻画打车难易度的不同,对两家公司的补贴方 案进行定性分析。
⑵ 模型的建立与求解
①
图 5 居民等车时间分布图
分析:通过等车时间的分布范围可以看出,在补贴方案实行前,候车时间在 10-20 分钟内所占的比例偏大,居民候车平均时间过长。随着补贴方案的推行,比例结构调整 显著,打车等待时间大部分集中在 5-10 分钟,居民候车平均时间缩短了,可见补贴方 案提高了居民的打车效率。
②百度指数分析
图 6 百度指数曲线图
图 7 百度指数曲线图
滴滴打车和快的打车在 2014 年的一月份都对司机每单进行相应补贴,每单 10-15 元不等,这引起他们各自移动端的搜索指数开始小幅上升,出租车司机对于它们的使用 频率提高,对于订单的热情度也相应提高,在一定程度上降低了一部分居民的等车问题,
缓解了打车难。
图 8 百度指数曲线图
图 9 百度指数曲线图
两家公司在二月份的补贴幅度增大,效果更为明显,移动端的搜索指数几乎呈直线上涨 趋势,说明出租车司机接单数在不断增加,人多车少司机挑活儿以及收车常规空当儿现 象相应减少,改善了居民无车可打的问题。
模型Ⅳ BP 神经网络模型
基于 BP 算法的多层前馈型神经网络的结构如图 10 所示。神经网络是由输入层、
一个或几个隐含层以及输出层构成。同层节点之间不存在任何耦合,每一层节点的输出 值只影响下一层节点的输出值。网络学习过程是由正向和反向传播构成。反向传播时的 节点单元特征函数通常为
Sigmoid
: f
(x
)
1/(1 e bx
),b
0
。我们在神经网络训练阶 段把事先准备好的样本数据按顺序通过输入层、隐含层和输出层,比较输出结果数据和 期望数据,如果没有满足要求的误差程度或是要求的训练次数,我们通过调节经过的输 出层、隐含层和输入层,来此来调节权值,从而使该神经网络成为具有一定适应能力的 模型。图 10 多层感知器结构示意图
a.初始化:设置各阈值和权值的初始值:
Y
ji(l)
0 ,Q
(jl)(l
0,1,2,3,L
)为数值教小的随 机数,一般取0
1的任意值。b. 输入样本和期望输出:提供训练样本及目标输出,对每个样本进行(3)
(5)步。 输 入的训练样本为:R
(R
1,R
2,R
n),目标输出为:C
(C
1,C
2,C
n)c.计算每一层层输入:
) (
)
( () (1 )
)
(l l l l
x Y f s f
r
d.计算训练的误差:
输出层:
)) (
( () ( )
)
( l
j l j qi l
j
d r f s
c
隐含层和输入层:
) ( ()
)
(l l
j
f sj
c
(n
)k c
j(l
)y k j
(l
1)e.修正权值和阈值:
1 () (1) 1 ( () ()
1
)
1
))
(
k y k x
c k y k
y
jil jil
j i l
jil jil
1 () (1) 1 ( () ()
1
)
1
))
(
k q k c x
q k q k
q
jl jl
j i l
jl jlf.计算性能指标:当所有的样本都经历了(3)
(5)步,也就是完成了一个训练周期,计算误差指标:
Q E
E
q
q q
w
(
1( )2)0.5 / 其中2
1( )
* 5 .
0
n j qj qjq
d y
E
g.若所有误差指标均满足精度要求,即
E
那么训练结束,否则,转到(2),继续下一个训练周期
是小的正数,具体数值根据实际情况选取。流程如下:图 11 BP 网络算法流程图
根据 BP 神经网络模型,自行设置输入数据以及目标输出,在本文中,设置隐含层 数为 1 层,隐含层节点数为 10 个。代入北京出租车公司未实行补贴前的数据,进行网 络训练。
0 1000 2000 3000 4000 5000 6000 7000 8000 9000 10000 10-4
10-3 10-2 10-1 100 101
10000 Epochs
Training-Blue Goal-Black
Performance is 0.0144715, Goal is 0.001
图 12 网络训练结果图
如图 12 所示,可以看出基于时间序列的神经网络误差是随时间的推进逐渐变小,
图 12 表示的是训练曲线,最终收敛于102数量级中段,达到精度要求,故该网络可以 使用。
0 5 10 15 20 25
26 28 30 32 34 36 38 40 42 44 46
载 客 次 数 预 测 值 载 客 次 数 真 实 值
图 13 原始数据与仿真数据的对比图
如图 13 所示,此函数的拟合程度比较好,误差也处于合理的范围之内。这也从侧 面体现了该模型的正确性。
根据 BP 神经网络预测出如果出租车公司未实行补贴,北京的出租车单车载客次数 为:37.2216、37.2814、37.3414、37.4014、37.4616、37.5218、37.5821、37.6426、37.7031 37.7637。
模型Ⅴ 虚拟变量回归模型
⑴ 模型的准备
滴滴打车公司和快的打车公司价格补贴战从 2014 年 1 月开始,滴滴打车补贴方案 从 2014 年 1 月 10 日至 2 月 18 日,而快的打车补贴方案从 2014 年 1 月 20 日至 2 月 18 日。为了方便处理数据,滴滴补贴方案选取 1 月 10 日至 2 月 15 日的补贴金额数据,快 的补贴方案选取 1 月 20 日至 2 月 25 日的补贴金额数据,之后每隔 7 天分别记录滴滴和 快的打车公司补贴金额,同时对应记录补贴前后的单车载客次数。若某段时间补贴金额 不变,则此时间段记录的补贴数据相同,其中司机每天 10 元,每天 10 单,说明记录的 数据在 10-100 元之间,同时是 10 元的整数倍。联系实际我们知道,快的打车方案实行 日期总是迟于滴滴打车方案的实行日期,宏观上可知滴滴打车公司作业效率大于快的打 车公司作业效率,本模型定量分析了两公司作业效率高低,比较了两公司的补贴方案对
“缓解打车难”的帮助大小。
⑵ 模型的建立与求解
研究各公司的出租车补贴方案时,首先我们从选取的,具有代表性的补贴方案入手,
滴滴打车公司和快的打车公司补贴方案有每单补贴额、奖励补贴、抽奖补贴。这三种补 贴方案的补贴金额为三个解释变量,单车载客次数为被解释变量。
由于奖励补贴是根据客户的评价优劣来定的,若乘客评价优,公司则会奖励司机一
定金额的补贴;若乘客评价非优,公司就不会奖励司机。并且奖励补贴金额大于无奖励 补贴金额,所以设虚拟解释变量
D
1i:
无奖励补贴 奖励补贴 ...
0 ...
1
D
1i另外抽奖补贴也是出租车公司重要的补贴的方式,抽奖补贴具有随机性,存在一定 的获奖概率,可分为两种情况,即抽到奖金或没抽到奖金,并且抽到奖金金额大于没抽 到奖金金额,所以设虚拟解释变量
D
2i:
没抽到奖金 抽到奖金 ...
0 ...
1
D
2i在定量解释变量(普通补贴)与被解释变量(单车载客次数)模型设定基础上以加法的 方式引入虚拟变量,从计量经济模型的意义看,其作用是改变了设定模型的截距水平,
而不是斜率水平,换句话说,是和的关系,而非乘积的关系。建立虚拟变量回归模型,
如下[1]:
i i i i
i
D D X
Y
1
2 1
3 2
(1) 1)基础类型:无奖励补贴和没抽到奖金的回归方程:
i i
i
X D D X
Y
E
( / , 1
0, 2
0)
1
2)比较类型:①有奖励补贴和没抽到奖金的回归方程:
i i
i
X D D X
Y
E
( / , 1
1, 2
0)
(
1
2)
②无奖励补贴和抽到奖金的回归方程:
i i
i
X D D X
Y
E
( / , 1
0, 2
1)
(
2
3)
③有奖励补贴和抽到奖金的回归方程:
i i
i
X D D X
Y
E
( / , 1
1, 2
1)
(
1
2
3)
显然,模型式(1)是以无奖励补贴和没抽到奖金为基础类型,并假设各种类型的单车 载客次数函数只是有不同截距,相对于每单普通补贴的斜率系数
相同。运用 EVIEWS 软件拟合方程,得
1,
2的t
检验统计量显著,验证了两个虚拟变量对截距有影响。设解释变量(每单补贴额)为 X ,被解释变量(变化后的载客次数)
Y
,作基础类型散 点图,即在无奖励补贴和没抽到奖金情况下的X和 相关图。如下: Y
图 14 滴滴打车和快的打车的基础类型相关图
由
X和 相关图可知, Y X
与Y具有明显的线性关系,利用 EVIEWS 对虚拟变量回归 后,得到基础类型和比较类型的指标表,如下:表 6 出租车公司基础类型和比较类型的指标表
滴滴打车
T
统计量R
2可决系数 回归方程基础类型 38.6486 0.97711
Y
27.1087
0.3645X
比较类型① 27.4528 0.9646
Y
(27.1087
2.9057)
0.3645X
比较类型② 18.9867 0.91321
Y
(27.1087
1.7683)
0.3645X
快的打车
T
统计量R
2可决系数 回归方程基础类型 58.6774 0.9900
Y
26.40173
0.3478X
比较类型① 46.4044 0.9604
Y
(26.40173
2.1321)
0.3478X
比较类型② 30.4587 0.92475
Y
(26.40173
1.2564)
0.3478X
分析:由上表可知,滴滴打车虚拟变量回归模型, 统计量T
通过检验,可绝系数R ,
2 拟合优度高,解释变量对被解释变量影响显著,模型对样本拟合很好。快的打车基础类 型和比较类型拟合也很好。但从方程系数
来看,滴滴打车的
值大于快的打车
值,说明当滴滴打车公司增加一个单位的补贴金额,则载客次数上升 0.3645 个单位,而快的 打车公司增加一个单位的补贴金额,则载客次数上升 0.3478 个单位,滴滴载客次数比快 的载客次数多出 0.0167 个单位。
载客次数增加,说明出租车单位时间接单数量增加,从而作业效率提高,所以滴滴 打车公司作业效率高于快的打车公司作业效率。
作不同补贴政策条件下滴滴和快的载客次数变化量折线图,如下:
0 0.5 1 1.5 2 2.5 3 3.5 4 4.5
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37
滴滴打车 载客次数变化量 快的打车 载客次数变化量
图 15 不同补贴方案条件下滴滴和快的载客次数变化量折线图
由图可以看出,滴滴打车公司补贴方案比快的补贴方案效果好。
结论:从各公司的出租车补贴方案角度出发,对比三种补贴方案,合理引入虚拟变 量,定量分析每种补贴方案推出后对应的载客次数的变化量,得出滴滴载客次数比快的 载客次数多出 0.0167 个单位,所以滴滴打车公司作业效率高于快的打车公司作业效率,
滴滴打车公司补贴方案对“缓解打车难”更有有帮助。
三、问题三的分析与求解
1.对问题的分析
关于设计补贴方案并论证其合理性,通过对影响出租车公司补贴的各项因素集中分 析评估,得到了四个所占权重较大的指标,分别是拒载率,候车时间,天气恶劣度以及 出行轨迹繁杂度。同时结合权重大小了解它们各自相对于出租车公司补贴的影响程度,
构建分段函数模型,设计补贴方案。最后对设计出的补贴方程所涉及到的拒载率,候车 时间进行定量分析,结合出租车公司盈利状况,对其合理性进行验证。
2.对问题的求解
模型Ⅵ 层次分析模型
①在对补贴进行评估的过程中,建立递阶层次结构
图 16 递阶层次结构图
其中目标层A为合理补贴,准则层分别为服务质量
B ,城市经济发展水平
1B ,出行
2 便利度B
3,用a
ij表示B
i和B
j对上层目标的相对重要性,最低层为方案层,包括P -
1P
9 九种方案。②以 A 为比较准则,B 层次各因素相对于目标层进行两两比较,判断哪一个元素或 指标更为重要,根据 1-9 标度说明它们的相对重要性,构造比较判断矩阵。
表 7 元素
a
ij取值规则元素 标度 规则
a ij
1 以上一层某个因素为准则,本层次因素
i
与因素j
同等重要3 以上一层某个因素为准则,本层次因素
i
与因素j
比较,i
比j
稍微重要5 以上一层某个因素为准则,本层次因素
i
与因素j
比较,i
比j
明显重要7 以上一层某个因素为准则,本层次因素
i
与因素j
比较,i
比j
强烈重要9 以上一层某个因素为准则,本层次因素
i
与因素j
比较,i
比j
极端重要a
ij取值也可以取上述各数的中值 2,4,6,8 及其倒数,因素 i 与因素 j 比较有a
ij,那 么因素 j 和因素 i 比较有1/a
ij,结合有关资料以及相关咨询,合理地建立 B 层次各因素 的两两比较判断矩阵A,
1 4 3 / 1
4 / 1 1 5 / 1
3 5 1 A
③层次单排序及一致性检验
a.利用和法对列向量进行归一化处理:
n
i ij ij ij
a A a
1
~
再将
A
~ij按行求和得W~ ;
b.将W~ 归一化处理得排序向量
W
(w
1,w
2,w
3,
,w
n)T;c.
ni i
i
w AW n
1) (
1 为最大特征值。利用 MATLAB 程序得到
max=3.0858权向量为
w
(0.6267,0.0936,0.2797)T d.一致性检验由于客观事物的复杂性,可能会使我们的判断带有主观性和片面性,所以得到的判 断矩阵不可能完全一致,这就导致了
max> n ,有必要进行一致性检验。W
AW
max ,且
max n
,若
max比 n 大得越多,不一致程度越严重。CI
作 为 衡 量 不 一 致 程 度 的 数 量 标 准 , 由 最 大 特 征 值 可 以 计 算 出 1m a x
n CI n
=0.0739
根据Satty提出的平均随机一致性指标,经查表,n=3的时候,得RI=0.58 计算出一致性比例
RI
CR CI
=0.0739<0.1,通过了一致性检验,认为其比较矩阵的 不一致程度在容许范围之内,故可用来计算权重。④计算组合权向量
构造方案层对准则层的每个准则的判断矩阵 a.
P ,
1P ,
2P 对
3B 的判断矩阵
1
1 6 / 1 2 / 1
6 1 5
2 5 / 1 1
B
1b.
P ,
4P 对
5B 的判断矩阵
2
1 4 5
4 / 1 1 3
5 / 1 3 / 1 1
B
2c.
P ,
6P ,
7P 对
8B
3的判断矩阵
1 2 / 1 3
2 1 7
3 / 1 7 / 1 1
B
3用 MATLAB 软件求出上述比较判断矩阵的特征值及其对应的特征向量,得到层次单 排序的相对重要性权重向量,以及
CI
和CR
。表 8 权重值表
矩阵 层次单排序的权重向量
maxCI RI CR
P
B
1
(0.1721,0.7258,0.1020)T 3.0291 0.0145 0.58 0.0251P
B
2
(0.1007,0.2255,0.6738)T 3.0858 0.0429 0.58 0.0739P
B
3
(0.0925,0.6153,0.2922)T 3.0026 0.0013 0.58 0.0023经检验均满足一致性要求
⑤层次总排序
B 层相对于 A 的排序向量为 w
(2)
(0.6267,0.0936,0.2797)T,而 P 层以 B 层的各个因素 为准则时的排序向量分别为p
1(3)
(0.1721,0.7258,0.1020,0,0,0,0,0,0)Tp
2(3)
(0,0,0,0.1007,0.2255,0.6738,0,0,0)Tp
3(3)
(0,0,0,0,0,0,0.0925,0.6153,0.2922)T则 P 层相对于总目标的排序向量为
) 2 ) ( 3 ( 3 ) 3 ( 2 ) 3 (
1 , , )
(
p p p w
W
(0.1079,0.4549,0.0639,0.0094,0.0211,0.0631,0.0259,0.1721,0.0817)T⑥层次总排序的一次性检验 ) ,
,
( 1(2) 2(2) 3(2)
) 2
(
CI CI CI
CI
=(0.0145,0.0429,0.0013) ), ,
( 1(2) 2(2) 3(2)
) 2
(
RI RI RI
RI
=(0.58,0.58,0.58)) 2 ( ) 2 (
3
CI w
CI
=(0.0145,0.0429,0.0013)(0.6267,0.0936,0.2797)T=0.0135) 2 ( ) 2 (
3
RI w
RI
=(0.58,0.58,0.58)(0.6267,0.0936,0.2797)T=0.58003 3 2 3
RI CR CI
CR
=0.0972<0.1所以层次总排序也通过了一致性检验。
(3)模型的结果
根据程序运行结果可知影响补贴金额的主要因素按重要程度排序依次为:拒载率、
候车时间、天气恶劣程度、出行轨迹繁杂度。
模型Ⅶ 补贴分段函数模型 (1)模型的准备
打车软件的盛行,对解决打车难问题起到了一定作用,而且可以在一定程度上降低 出租车的空驶率。对于使用打车软件的出租车司机来说,可以明显降低空驶率,提高驾 驶效率,而且还有高额的打车补贴;对于使用打车软件的乘客来说,可以明显减少打车
所用时间,同时还能够报销一部分车费,简直一举两得。但是由第二问模型求解结果表 明打车软件并不能很好的缓解打车难的问题。由于出租车司机为获取额外的打车补贴,
就会有意识的选择使用打车软件的乘客,这必然会导致一部分在街头拦车的市民被拒 载。其中最受影响的是不经常使用互联网的中老年群体。打车软件的兴起反而加大了他 们打车的困难度,使他们更容易被拒载。这也是现在补贴方案所未能考虑到的问题。
(2)模型的建立与求解
考虑存在的漏洞,我们结合影响补贴金额的四个主要因素,基于现行的补贴方案,
设计了一种新的补贴方式:
通过查阅相关资料,我们得知平均拒载率为 30%,平均候车时间为 15 分钟。我们将 拒载率和候车时间看做两个独立的自变量,结合乘客的心理预期和满意度将对司机补贴 金额与这两个变量在不同取值条件下建立补贴方程式,并据此对出租车司机进行补贴。
考虑到天气恶劣度和出行轨迹繁杂度不易量化且对补贴金额贡献率较小,在补贴方程式 中将其作为整体直接代入,得:
30 0
% 20 0
)
% 10 1 )](
25 6
. 0 ( ) 30 5
. 0 [(
30 15
% 40
% 20 )
% 10 1 )](
18 6
. 0 ( ) 20 5 . 0 [(
2 1
2 1
2 1
2 1
x x
t x
x
x x
t x
y x
其中
x 代表拒载率,
1x 代表候车时间, t 代表外部环境整体影响因素。当打车软件数据
2 表明司机的拒载率介于 20%至 40%、乘客等车时间介于 15 至 30 分钟内,对出租车司机 实行第一种补贴;当司机的拒载率低于 20%以及乘客候车时间低于 15 分钟时,对乘客 实行第二种补贴;当外部环境较为恶劣,已经影响出租车的正常行驶状态,t 值取 1,即 在原来补贴的基础上再增加 10%的补贴,以补偿外部环境对司机造成的损失。考虑到打 车软件补贴可能造成的拒载率的急剧增加,方案规定,凡是拒载率超过 40%的司机,八 个小时内不得网上接单,即不享有任何补贴的权利。(3)模型的验证
通过函数模型可以看出,当拒载率达到 40%,出租车公司给予的补贴为 0,同时对 司机进行相应接单惩罚,以此对拒载率进行限制,缓解“打车难”。当司机拒载率为 0 时,将会获得 30 块的补贴,以此刺激司机提高接单量。从出租车公司的规模和盈利的 角度,补贴金额也比较合理,不至于影响公司的获利。
§6 误差分析与灵敏度分析 一、误差分析
1.问题三中,在两公司补贴方案实施期间内,每隔 7 天分别记录滴滴和快的打车 公司补贴金额,这样处理数据虽然便于定性分析问题,但会产生一定的误差,由于误差 在可控范围内,所以不影响分析结果。
2.问题三分段补贴函数模型中,由于数据的限制,无法利用数据拟合计算出较为 精准的补贴函数,可能会对补贴结果产生一些误差。
二、灵敏度分析
在问题二中,对载客次数和每单补贴金额其他指标之间的关系进行了回归拟合,得 到 滴 滴 打 车 回 归 方 程
Y
27.1087
0.3645X
以 及 快 的 打 车 回 归 模 型X Y
26.40173
0.3478 。1.对于滴滴打车进行讨论,针对每单补贴金额的不同增加值,我们运用 MATLAB 软件进行灵敏度分析[7]。
表 9 不同 a 值和x1值下对应的 y 值
y x1 10 20 30 40 50 60 70 80
y1(a0.3645) 30.7537 34.3987 38.0437 41.6887 45.3337 48.9787 52.6237 56.2687 y2(a0.3845) 30.9537 34.7987 38.6437 42.4887 46.3337 50.1787 54.0237 57.8687 y3(a0.4045) 31.1537 35.1987 39.2437 43.2887 47.3337 51.3787 55.4237 59.4687 y4(a0.4245) 31.3537 35.5987 39.8437 44.0887 48.3337 52.5787 56.8237 61.0687 y5(a0.4445) 31.5537 35.9987 40.4437 44.8887 49.3337 53.7787 58.2237 62.6687 y6(a0.4645) 31.7537 36.3987 41.0437 45.6887 50.3337 54.9787 59.6237 64.2687
根据表格作图,得图 17
图 17 灵敏度分析图
由灵敏度分析可知,当 x1 确定下来时,参变量 a 值变化引起 y 值变化量随着每单 补贴金额的增多有一定的增大;当 a 值一定时,y 值随着 x1 值的增加而增加,司机的接 单热情随着滴滴打车公司的补贴显著提高,载客次数不断增加。
2.对于快的打车进行讨论,针对每单补贴金额的不同增加值,我们运用 MATLAB 软件进行灵敏度分析。