客票数据驱动的道路客运出行行为模式辨识及规律研究
【摘要】:新型城镇化重塑了城市空间格局,也深刻影响了城市居民日常交通出行。不仅如此,在其推动下,新的移民不断流向城市,流动范围扩大、流动过程复杂,城际出行行为模式也产生了新的变化。多年来,道路客运凭借灵活、廉价等优势承接着为新型城镇化衍生的交通需求提供运输服务的任务。但随着高铁和私人轿车的快速发展,道路客运面临着多重冲击。因此探索道路客运高质量转型发展是构建健康、高效综合立体交通网的基本要求,而研究旅客出行行为模式则是实现其转型发展的关键。本文利用道路客运客票数据,从个体和团体双重视角出发研究城际出行行为模式,包括针对出行语义模式和出行间隔模式的辨识模型及规律分析。首先,从出行目的辨识研究、出行模式辨识研究和出行规律及机理研究三方面梳理国内外研究方法与体系,阐述本文研究方法的思想来源及在研究体系中所处的位置;其次,立足于客票数据重构结果,分别从个体和团体两个视角揭示城际旅客特征;在此基础上,提出两种改进的概率图模型(PGM)分别解决结伴旅客出行语义模式辨识问题及个体常旅客出行间隔模式辨识问题;最后,以模式识别结果为对象,借助面板回归、多元线性回归等计量模型定量分析考虑出行目的的出行量演化机制及考虑出行间隔模式的出行行为波动机制,为综合立体交通网资源优化配置等实践工作提供理论支持。本文的主要研究成果包括:1、以道路客运为例,提出了面向实名制客票数据的清洗流程及重构算法。基于数据处理结果,在个体视角下研究发现,客流总量分布存在六个典型时段,在空间上符合幂律,同时各个时段返回原籍比例存在一定差异;个体总出行次数、到访目的地数量符合幂律,而出行间隔符合泊松分布并存在以一周和一年为周期的波动。在团体视角下研究发现,道路客运出行存在明显的结伴现象,且结伴出行比例在不同时段、不同目的地存在差异;团体成员数、潜在同伴数均符合幂律。2、以结伴旅客为对象,解决了无标签和低空间分辨率条件下基于客票数据的出行目的补全问题,并考虑出行目的的模糊性和多义性将其扩展为“出行语义模式”。一方面,从团体视角出发,增加对同伴及同行关系的考虑,使得对客票数据的利用更加充分。具体而言,通过将团体、团体成员出行特征及出行目的与自然语言处理中文档、词和主题的概念类比,将出行语义模式辨识问题定义为主题挖掘问题,并构建嵌入出发时间的主题模型(TTM)。另一方面,考虑客票数据特性,提取了包括人口统计、历史出行和同行网络在内的多个特征,并提出其离散化及文本化处理方法。基于补充出行调查,验证了TTM和所设计特征的有效性,并发现TTM相对基准模型可以获得更为准确、稳定、均衡的结果。最终,在案例研究中,根据Gibbs采样算法得到出行特征分布和出发时间分布聚类并标注出公务商务、放假返乡、旅游休闲和一般私务四种主要类型出行目的,同时检测出无法用既有知识概括的非常规模式。出行目的补全有助于提升客票数据在出行需求建模等方面的应用深度。3、以个体常旅客为对象,揭示了城际出行时间模式及其规律。针对阳历和阴历同时通行导致不同年份出行时间无法逐天对齐的问题,本文采用出行间隔替代出发时刻,既保留了有关出行频率的信息,又实现了时间尺度的统一;同时从绝对时钟和相对时钟两种视角出发计算出行间隔,确定了出行间隔模式内禀形成机制的存在性。针对微观层面出行间隔模式辨识问题,采用词袋法表示个体出行特征,并构建双层高斯混合模型(BLGMM),利用预聚类初始化、扩展期望极大(EM)算法精细优化相结合的两步法进行参数估计。通过将辨识结果与年龄、性别、出发日期、出发时段及同伴人数等特征交叉分析,发现不同模式在特征分布上存在显著差异。出行间隔模式的揭示有助于在微观层面掌握旅客出行时间规律,支撑个性化、需求响应式的出行服务,充分实现增量旅客向存量旅客的转化。4、以基于PGM的模式识别结果为基础,进一步采用计量分析的方法研究城际出行行为模式规律性。在年出行量演化机制方面,首先构建以区县客流为对象的面板数据集,其中以出行目的为场景分解总出行量,并以高铁是否开通为条件对区县分组;其次引入18个面板回归模型,探索不同场景下出行量影响因素及其滞后效应;模型结果及稳健性检验最终表明,提升二级公路密度对增加务工返乡、旅游休闲出行量有明显促进作用。在出行间隔模式波动性产生机制方面,首先提出混合模型下的局部标准差及局部变异系数;进而引入多元线性回归,探索出行波动性产生机制。