收藏本站
《兰州交通大学》 2016年
收藏 | 手机打开
二维码
手机客户端打开本文

基于出租车供需关系的大规模出租车轨迹数据挖掘研究

吕江波  
【摘要】:随着城市人口规模的扩大,人们生活节奏的加快,不断增加了人们对出租车的需求。“打车难”成为城市一大通病,在拥堵路段、上下班高峰时段、重要节假日或是遇上恶劣天气,打车更是难上加难。有研究表明,“打车难”很大程度上是出租车相对供给不足所致,表现在出租车绝对供给满足城市规模对出租车保有量的要求,但出现了出租车空驶率居高不下,而人们又打不到车的奇怪的现象,将这种现象称为出租车供需相对失衡。出租车高空驶率不仅会提高出租车司机的运营成本、减少司机收入,而且会占用道路资源,同时还会加重环境污染和能源浪费。出租车相对供给问题是为了解决特定时间和特定地点出租车供给问题,它的本质是乘客和司机信息不对称,它是微观的、动态的。如何解决出租车供需相对失衡问题,避免出租车因盲目空驶浪费资源,通过有效的方式减少乘客和司机的信息不对称,提高乘客打车效率,这是目前政府亟待解决的问题。现在几乎所有出租车上都装有GPS定位设备,形成了大量的出租车轨迹数据,这些轨迹数据中蕴藏大量有价值的信息。本文旨在将空间分析技术与大数据挖掘技术相结合,研究海量出租车轨迹数据预处理方法和数据挖掘方法,发现轨迹数据中潜在的价值。重点从两方面进行了数据挖掘研究:一是研究利用海量轨迹数据计算出租车空驶率的方法,二是从出租车供需关系角度出发,提取轨迹中空驶点、上车点和下车点三类特征点,对特征点进行热点分析,从而分析出租车供需时空特征。以下是本文主要研究的内容:(1)研究Hadoop核心组件及相关技术基础理论:理解HDFS分布式存储的架构和原理,研究MapReduce并行程序抽象模型、程序运行原理以及MapReduce作业流程。熟悉分布式数据仓库Hive和GIS Tools for Hadoop基本框架。(2)研究海量轨迹数据预处理方法:在总结轨迹数据误差分类的基础上,提出了基于Hadoop的出租车轨迹数据预处理模型,该模型基于Hive实现轨迹错误数据统计分析,编写MapReduce并行程序完成小文件合并和错误数据处理。(3)研究轨迹数据时空特征挖掘方法。研究利用海量轨迹数据计算出租车空驶率的方法。围绕特征点热点分析提出分布式特征点提取核心算法和分布式特征点格网统计算法,研究Getis-Ord Gi*聚类算法,通过实验确定Getis-Ord Gi*热点分析工具参数,利用ArcGIS时态数据可视化表示时空热点数据。(4)实例研究。搭建Hadoop集群,对深圳市13799辆出租车9天的轨迹数据进行数据预处理和时空特征挖掘,计算各时段空驶率,分析空驶率时间分布,通过热点分析得到全天各时段空驶热点、上车热点和下车热点,并对热点进一步分析,包括热点宏观分析、热点分区统计分析和热点叠加分析。实验证明,对大规模出租车轨迹数据进行时空特征挖掘,实时动态获取各时间段空驶热点、上车热点和下车热点,从而分析出租车供给和需求在时间上和空间上的差异,可以有效弥补乘客和司机信息不对称,为研究出租车供需相对失衡提供参考。
【学位授予单位】:兰州交通大学
【学位级别】:硕士
【学位授予年份】:2016
【分类号】:TP311.13

【参考文献】
中国期刊全文数据库 前3条
1 夏钰,陈学武;基于神经网络BP算法的出租汽车保有量预测法[J];交通与计算机;2005年05期
2 王金山,任蓓,王伦夫,徐闯;合肥市出租车数量确定的模型及应用研究[J];运筹与管理;2004年06期
3 陆建,王炜;城市出租车拥有量确定方法[J];交通运输工程学报;2004年01期
中国硕士学位论文全文数据库 前10条
1 薛纯;基于Hadoop和Mapnik的矢量数据渲染技术研究[D];兰州交通大学;2015年
2 殷兵;基于Hadoop的分布式遥感图像处理研究[D];华东师范大学;2015年
3 赵苗苗;基于出租车轨迹数据挖掘的推荐模型研究[D];首都经济贸易大学;2015年
4 李三淼;Hadoop中小文件处理方法的研究与分析[D];安徽大学;2015年
5 赵玉龙;基于Hadoop的海量小文件处理性能研究与优化[D];内蒙古科技大学;2014年
6 温雅静;基于热点载客区域的出租车应急调度方案研究[D];北京交通大学;2014年
7 祁文田;基于GPS数据的出租车载客点空间特征分析[D];吉林大学;2013年
8 陈光景;Hadoop小文件处理技术的研究和实现[D];南京邮电大学;2013年
9 童晓君;基于出租车GPS数据的居民出行行为分析[D];中南大学;2012年
10 付天新;基于MapReduce模型的生态遥感参数反演并行化方法与实现[D];兰州交通大学;2012年
【共引文献】
中国期刊全文数据库 前10条
1 吕明;曹祎;罗霞;;信息条件下城市出租车乘客等待时间测算模型[J];重庆交通大学学报(自然科学版);2016年06期
2 张晓谦;;基于主成份回归分析的出租车数量预测[J];科技创新与应用;2016年27期
3 张洋;赵思雨;王旭;罗颖;;出租车营运利润分配最优模型研究[J];中国传媒大学学报(自然科学版);2016年04期
4 陈永红;王垆阳;邢建平;崔冰;;基于参数化宏观建模的城市出租车与专车保有量测算[J];信息技术与信息化;2016年08期
5 谢琛;;出租车资源优化配置的研究[J];金融经济;2016年14期
6 张娟;何启明;;“互联网+”出租车资源配置优化研究[J];自动化与仪器仪表;2016年07期
7 刘嘉琪;邹泞憶;周梓楠;王颖喆;;互联网时代出租车供需匹配及补贴方案确定[J];经济数学;2016年02期
8 陈荣平;赵晓刚;向雅乐;谭典;;“互联网+”时代不同时空域出租车资源供需匹配模型[J];数学理论与应用;2016年02期
9 樊文壮;胡文力;;基于模糊分析的区域出租车资源紧缺程度评价研究[J];电脑知识与技术;2016年07期
10 陈诚;吴深相;张兰怡;邱荣祖;;基于盈亏平衡分析的道路包车客运运力投放[J];武汉理工大学学报(交通科学与工程版);2016年02期
中国硕士学位论文全文数据库 前10条
1 王茂洋;基于云GIS平台的贵州省生态环境监测与评价系统研究与实现[D];贵州师范大学;2016年
2 崔邓;基于智能手机轨迹提取停留点的时空聚类算法研究[D];西南大学;2016年
3 冯琦森;基于出租车轨迹的居民出行热点路径和区域挖掘[D];重庆大学;2016年
4 王郑委;基于大数据Hadoop平台的出租车载客热点区域挖掘研究[D];北京交通大学;2016年
5 王亮;利益相关者视角下出租车行业管制问题研究[D];西北大学;2015年
6 孙庆军;基于公交需求变化的柔性公交线网设计[D];哈尔滨工业大学;2015年
7 尹凤娇;基于轨迹数据的频繁项挖掘技术研究[D];大连工业大学;2015年
8 葛丽娟;基于出租汽车运营数据的交通基础模型研究及计算[D];长安大学;2015年
9 殷兵;基于Hadoop的分布式遥感图像处理研究[D];华东师范大学;2015年
10 赵苗苗;基于出租车轨迹数据挖掘的推荐模型研究[D];首都经济贸易大学;2015年
【二级参考文献】
中国期刊全文数据库 前2条
1 韩中庚;;“彩票中的数学”问题的优化模型与评述[J];工程数学学报;2003年05期
2 董强,刘超慧,马熠;公交车调度问题的研究[J];工程数学学报;2002年S1期
中国硕士学位论文全文数据库 前10条
1 程豪;基于Hadoop的交通大数据计算应用研究[D];长安大学;2014年
2 梁世磊;基于Hadoop平台的随机森林算法研究及图像分类系统实现[D];厦门大学;2014年
3 刘盼盼;基于空间聚类和Weka平台的出租车载客热点区域挖掘研究[D];吉林大学;2014年
4 吴磊;基于hadoop的连接算法中数据倾斜问题的研究[D];中国科学技术大学;2014年
5 马云飞;基于出租车轨迹点的居民出行热点区域与时空特征研究[D];南京师范大学;2014年
6 李佳;基于Hadoop的图片地理定位研究[D];厦门大学;2014年
7 马艳丽;C2C电子商务信用评价模型研究[D];首都经济贸易大学;2014年
8 温雅静;基于热点载客区域的出租车应急调度方案研究[D];北京交通大学;2014年
9 邱晨健;栅格地图分布式存储方案设计与性能分析[D];西安电子科技大学;2014年
10 陈星雨;基于OPENGL和GDAL的卫星遥感图像处理系统的研究[D];华南理工大学;2013年
【相似文献】
中国期刊全文数据库 前10条
1 石杰楠;数据挖掘研究综述[J];航天制造技术;2005年04期
2 王金龙;;数据挖掘研究进展[J];青岛理工大学学报;2007年04期
3 王海燕;王慧颖;;数据挖掘研究进展及其发展趋势[J];科技广场;2009年09期
4 安康;韩兆洲;;对统计学领域数据挖掘研究的反思[J];统计与决策;2010年10期
5 郑继刚;王边疆;;数据挖掘研究的现状与发展趋势[J];红河学院学报;2010年02期
6 赵志强;;数据挖掘研究及发展探析[J];黑龙江科技信息;2011年29期
7 严骏;;基于云计算的海量数据挖掘研究[J];信息与电脑(理论版);2013年04期
8 艾迪明,齐剑锋,涂序彦;关于分布式、异构、历史遗留数据的数据挖掘研究[J];计算机工程与应用;2003年01期
9 金光,钱家麒,黄蔚民;公安业务信息数据挖掘研究[J];警察技术;2003年04期
10 章成志;数据挖掘研究现状及最新进展[J];南京工业职业技术学院学报;2003年02期
中国重要会议论文全文数据库 前9条
1 包剑;冀常鹏;李义杰;;基于TGIS的数据挖掘研究[A];’2004计算机应用技术交流会议论文集[C];2004年
2 臧根林;;流动人口治安信息数据挖掘研究[A];第二十三届中国数据库学术会议论文集(技术报告篇)[C];2006年
3 曹波伟;薛青;唐志武;任晓明;;面向军事基础数据的数据挖掘研究[A];2009系统仿真技术及其应用学术会议论文集[C];2009年
4 冯迪;李晋宏;曹原;;基于网页的数据挖掘研究[A];2007通信理论与技术新发展——第十二届全国青年通信学术会议论文集(上册)[C];2007年
5 宋擒豹;沈钧毅;;一种例外模式的挖掘算法[A];第十七届全国数据库学术会议论文集(研究报告篇)[C];2000年
6 吴爱华;汪卫;申展;王晨;施伯乐;;频繁有序标号树的频繁约束挖掘[A];第二十届全国数据库学术会议论文集(技术报告篇)[C];2003年
7 费玉莲;凌云;王勋;;基于增强隐马尔可夫模型的视频数据挖掘研究[A];全国第16届计算机科学与技术应用(CACIS)学术会议论文集[C];2004年
8 常郝;周国祥;;基于自组织特征映射神经网络的数据挖掘研究[A];计算机技术与应用进展——全国第17届计算机科学与技术应用(CACIS)学术会议论文集(上册)[C];2006年
9 秦昆;李德毅;胡晓雷;覃茂运;闫吉星;;基于复杂网络的气象数据挖掘研究[A];2006全国复杂网络学术会议论文集[C];2006年
中国博士学位论文全文数据库 前7条
1 张保稳;时间序列数据挖掘研究[D];西北工业大学;2002年
2 王亚琴;道路交通流数据挖掘研究[D];复旦大学;2007年
3 徐雪琪;基于统计视角的数据挖掘研究[D];浙江工商大学;2007年
4 覃明贵;城市道路交通数据挖掘研究与应用[D];复旦大学;2010年
5 于霄;基于间隔理论的序列数据挖掘研究[D];哈尔滨工业大学;2012年
6 汤春蕾;交易序列数据挖掘研究[D];复旦大学;2011年
7 孟军;相容粒计算模型及其数据挖掘研究[D];大连理工大学;2012年
中国硕士学位论文全文数据库 前10条
1 刘传勇;基于RFID的物流大数据资产管理及数据挖掘研究[D];上海师范大学;2015年
2 陈聪;近现代名中医失眠医案的数据挖掘研究[D];山东中医药大学;2015年
3 时秀颖;湿疹中医医案诊治规律的数据挖掘研究[D];辽宁中医药大学;2016年
4 吕江波;基于出租车供需关系的大规模出租车轨迹数据挖掘研究[D];兰州交通大学;2016年
5 陈笑怡;泛在学习中教学质量评价的数据挖掘研究[D];上海交通大学;2011年
6 王庆;基于灰色系统理论的财务数据挖掘研究和应用[D];厦门大学;2001年
7 费蓉;针对供应链管理的数据挖掘研究[D];西安理工大学;2005年
8 关心;面向税务稽查选案的数据挖掘研究[D];辽宁工程技术大学;2005年
9 张韬;基于多种网络的数据挖掘研究[D];哈尔滨工业大学;2010年
10 朱红;基于人才认知的数据挖掘研究[D];昆明理工大学;2002年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026