收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于强化学习的机票动态定价策略研究

刘泽霖  
【摘要】:随着互联网和旅游业的高速发展,在线旅行社(OTA)凭借出色的服务逐渐取代了传统的旅游代理商,成为人们旅行购票必不可少的一部分。而在OTA所经营的诸多业务中,机票业务占据了相当大的一部分。出于自身利润的考虑,OTA希望能够通过对机票产品价格的动态调整,最大化机票销售的利润。目前,大多数OTA都是通过在为航空公司代售机票并在此基础上额外收取一笔佣金来赚取利润,许多OTA尝试通过基于自身行业经验来调整佣金以获得更多利润。但由于在真实世界中机票的需求和用户的行为模式十分复杂,因此专家经验以及数学模型等方法应用在调价决策上存在着许多缺点。基于强化学习算法擅长解决策略优化问题的特点,本文采用强化学习的算法来对动态定价的策略进行研究。另一方面,由于强化学习的训练需要通过和环境不断进行交互来完成,而在动态定价问题中,直接和真实环境进行交互将会在市场上带来非常巨大的负面作用。考虑到这两个因素,如何模拟用户的行为并以此为基础开发出能够体现市场真实反馈的模拟环境是一个十分重要的研究。因此,我们提出了一种机票购买仿真模型。该模型可以根据历史数据模拟生成用户群体,再根据机票价格等其他信息,模拟用户的购买行为。模型还能够根据历史数据和新产生的数据不断调整自身参数,拥有一定的自学习能力并且使仿真模型具有更好的效果。此外,在强化学习算法的研究中,由于定价问题中市场、用户有着不确定性较高的特点,因此强化学习算法的表现会受到状态不可测所带来的影响。同时,用户的消费需求也会随着外部条件改变而改变,使用同一种定价模式无法兼顾到不同需求的用户,必然导致模型的效果不够优秀。所以基于上述两点,我们提出了一种基于模式转换的循环神经网络强化学习算法。最后在真实世界的数据集上的实验结果表明,我们的用户模拟仿真模型可以较好地模拟出用户的行为,同时我们的强化学习动态定价算法在和其他算法的对比中表现良好。


知网文化
【相似文献】
中国期刊全文数据库 前19条
1 张佳彤;;打车软件参与下出租车动态定价策略研究[J];唐山学院学报;2016年06期
2 孔德洋;王敏敏;马丹;;电动汽车分时租赁动态定价策略研究[J];上海汽车;2017年01期
3 董春利;王莉;;基于粒子滤波的强化学习算法研究[J];无线互联科技;2016年15期
4 张欣;戴帅;;基于模糊聚类的分层强化学习算法[J];计算机工程与科学;2010年01期
5 岳晓娟;;零售商定价策略研究综述[J];中小企业管理与科技(上旬刊);2013年03期
6 李春贵;多步截断优先扫描强化学习算法[J];计算机工程;2005年11期
7 李学勇,欧阳柳波,李国徽;基于隐偏向信息学习的强化学习算法[J];南华大学学报(理工版);2004年02期
8 李春贵,刘永信,陈波;多步截断行动—评价强化学习算法[J];内蒙古大学学报(自然科学版);2005年02期
9 李春贵;刘永信;王萌;;集成规划的行动-自适应评价强化学习算法[J];内蒙古大学学报(自然科学版);2008年03期
10 殷锋社;;基于知识的Agent强化学习算法分析与研究[J];电子设计工程;2011年11期
11 郑宇;罗四维;吕子昂;;基于模型的层次化强化学习算法[J];北京交通大学学报;2006年05期
12 王培屹;;浅析强化学习算法研究与应用[J];科技信息;2011年11期
13 黄浩晖;杨宛璐;陈玮;;基于性能势的A*平均奖赏强化学习算法研究[J];计算机仿真;2014年07期
14 谢光强;陈学松;;一种新的基于蚁群优化的模糊强化学习算法[J];计算机应用研究;2011年04期
15 何源;张文生;;基于核方法的强化学习算法[J];微计算机信息;2008年04期
16 董亚晓;杨寒冰;樊浩;;分布式强化学习算法在异常财务数据分析中的应用[J];电子设计工程;2021年13期
17 赵娜;陈合稚;;考虑损失规避和参考效应的联合库存和定价策略研究[J];物流技术;2016年12期
18 董春利;王莉;;基于粒子滤波的直接策略搜索强化学习算法研究[J];江苏科技信息;2017年07期
19 杨旭东;刘全;李瑾;;一种基于资格迹的并行强化学习算法[J];苏州大学学报(自然科学版);2012年01期
中国重要会议论文全文数据库 前20条
1 邹哲;蒋寅;万涛;朱海明;于春青;;居住地选择模型及其在天津的实证研究[A];公交优先与缓堵对策——中国城市交通规划2012年年会暨第26次学术研讨会论文集[C];2012年
2 汪贤裕;彭怡;;引入风险机制的厂商—经理选择模型[A];中国运筹学会第六届学术交流会论文集(上卷)[C];2000年
3 徐华;;理性选择模型与利他主义[A];用科学发展观统领中国经济发展——全国高校社会主义经济理论与实践研讨会第十九次大会论文集[C];2005年
4 杨文国;黄钧;池宏;祁明亮;;信息缺失下的应急方案选择模型及算法研究[A];第九届中国管理科学学术年会论文集[C];2007年
5 魏莹;邓黎;;基于收益管理的云服务定价策略研究[A];中国系统工程学会第十八届学术年会论文集——A13其他管理领域的创新研究成果问题[C];2014年
6 陈宗海;段家庆;任皴;罗杨宇;李成荣;;针对机器人觅食任务的强化学习算法及其仿真研究[A];'2008系统仿真技术及其应用学术会议论文集[C];2008年
7 刘坤;张婷婷;柴来;;基于强化学习算法的智能体路径寻优[A];2019第七届中国指挥控制大会论文集[C];2019年
8 杨清清;郭滕达;李本先;;不确定环境下合约市场中服务产品动态定价策略研究[A];第十四届中国管理科学学术年会论文集(上册)[C];2012年
9 杨转玲;陈希镇;;风险修正下的证券组合选择模型[A];中国现场统计研究会第十三届学术年会论文集[C];2007年
10 王立荣;陆强;周德明;;自我约束情景下的行为选择模型探讨及解释[A];第十八届中国管理科学学术年会论文集[C];2016年
11 周小亮;;偏好、制度与选择:理性选择模型质疑、反思与重构[A];外国经济学说与中国研究报告(2011)[C];2010年
12 何文芳;杨华;;人力资源配置的三维选择模型研究[A];中国企业运筹学学术交流大会论文集[C];2007年
13 岳晓宁;陈达人;;滑雪场的定价策略研究[A];Proceedings of 2010 Chinese Control and Decision Conference[C];2010年
14 孟祥萍;苑全德;皮玉珍;;基于量子理论的多Agent系统强化学习研究[A];'2006系统仿真技术及其应用学术交流会论文集[C];2006年
15 李琳;范体军;;面向零售商主导的生鲜农产品供应链的定价策略研究[A];第十六届中国管理科学学术年会论文集[C];2014年
16 赵丽艳;顾基发;;R&D项目选择模型综述[A];系统工程与可持续发展战略——中国系统工程学会第十届年会论文集[C];1998年
17 赵喜;张根保;李明;李平;;基于目标最优的质量改进方案选择模型[A];第三届中国质量学术论坛论文集[C];2008年
18 李静坤;程冰心;;基于Agent的并行仿真模型静态划分方法研究[A];2020中国系统仿真与虚拟现实技术高层论坛论文集[C];2020年
19 林洁;覃海燕;王婧;;牵引空投仿真模型体系研究[A];2020中国系统仿真与虚拟现实技术高层论坛论文集[C];2020年
20 谢文硕;谢波;;基于EBOM的性能仿真模型研究[A];2020中国航空工业技术装备工程协会年会论文集[C];2020年
中国博士学位论文全文数据库 前20条
1 陈兴国;基于值函数估计的强化学习算法研究[D];南京大学;2013年
2 袁银龙;深度强化学习算法及应用研究[D];华南理工大学;2019年
3 尚筱雅;基于改进强化学习算法的终端电网在线等值建模方法及其应用[D];华南理工大学;2018年
4 郑宇;分层强化学习算法及其应用研究[D];北京交通大学;2009年
5 戴朝晖;基于混合抽象机制的多智能体系统动态分层强化学习算法研究[D];中南大学;2012年
6 孙晓梅;多源交通信息下的动态路径选择模型与方法研究[D];吉林大学;2011年
7 倪训友;基于Agent仿真模型的城市停车诱导信息板选址优化及其动态信息发布方法[D];上海交通大学;2017年
8 雷永林;仿真模型重用理论、方法与异构集成技术研究[D];国防科学技术大学;2006年
9 李博;高速铁路票额分配和动态定价优化研究[D];北京交通大学;2019年
10 宋文波;以旅客需求为导向的高速铁路票额分配理论和方法研究[D];北京交通大学;2019年
11 孙德杰;多条件下商品动态定价及库存控制方法研究[D];燕山大学;2017年
12 周东祥;多层次仿真模型组合理论与集成方法研究[D];国防科学技术大学;2007年
13 朱智;模型驱动的装备仿真模型语义工程化建模技术研究[D];国防科技大学;2018年
14 陈超;语境驱动的仿真模型可组合性测试方法研究[D];国防科学技术大学;2007年
15 孙立光;步行设施内的行人行为微观仿真模型研究[D];清华大学;2009年
16 杨柳青;道路交通流仿真模型构建及其应用研究[D];北京工业大学;2014年
17 方峻;基于元胞自动机的行人微观仿真模型研究与应用[D];清华大学;2012年
18 刘国庆;深度强化学习中样本效率提升方法研究[D];中国科学技术大学;2021年
19 杨尚东;基于任务先验的强化学习探索研究[D];南京大学;2019年
20 程引;基于强化学习的时间序列决策系统设计与应用[D];上海交通大学;2018年
中国硕士学位论文全文数据库 前20条
1 刘泽霖;基于强化学习的机票动态定价策略研究[D];上海交通大学;2020年
2 刘飞宇;面向复杂问题的强化学习算法研究[D];中国科学技术大学;2021年
3 刘慧敏;大学生的投资理财行为特征分析[D];中南财经政法大学;2019年
4 贺露露;基于结构化的组稀疏投资选择模型[D];西安工程大学;2019年
5 杨文豪;混合特征选择模型在妊娠期糖尿病诊断中的应用研究[D];太原理工大学;2019年
6 瞿卫东;考虑风险规避的路径选择模型研究[D];吉林大学;2018年
7 程展鸿;两类组合路径选择模型的随机交通悖论特性分析[D];哈尔滨工业大学;2018年
8 高怡;一日游景点选择模型研究[D];河北工业大学;2016年
9 赵翔宇;基于冲突选择模型的用户偏好挖掘及活动参与预测研究[D];中国科学技术大学;2017年
10 刘环环;工业企业节能政策工具选择模型研究[D];大连理工大学;2009年
11 涂铮铮;基于进化和强化学习算法的动态路径规划研究[D];电子科技大学;2020年
12 李金霞;基于稀疏约束的图嵌入特征选择模型研究[D];青岛大学;2020年
13 张琪;送货上门与门店自提模式下零售商线上定价策略研究[D];西南财经大学;2019年
14 潘辉燕;速研科技公司SaaS服务定价策略研究[D];深圳大学;2019年
15 张瑞玲;考虑团购时间和团购尺寸的网络团购定价策略研究[D];河北工业大学;2017年
16 王林炜;考虑赠品促销的预售模式下电商定价策略研究[D];东南大学;2017年
17 李玥;基于服务质量的航空公司动态定价策略研究[D];南京航空航天大学;2018年
18 岳晓春;兰州尚品生活馆项目定价策略研究[D];兰州大学;2013年
19 翁可成;中小企业信用风险及定价策略研究[D];福州大学;2017年
20 张艳;国际市场进入模式的演进及选择模型阐释[D];对外经济贸易大学;2005年
中国重要报纸全文数据库 前11条
1 记者 田金刚;德诚珠宝集团副总裁方思杰:企业布局“一带一路”要建立科学的选择模型[N];中国黄金报;2018年
2 通讯员 陈新建 瞿月朗;强化学习 聚焦“四风”创出特色[N];西安日报;2014年
3 勇文;连铸结晶器保护渣选择模型[N];世界金属导报;2006年
4 本报特约通讯员 王赫;带你玩转陆海空天新装备[N];中国国防报;2017年
5 张山;中国古建仿真模型出口大有作为[N];国际商报;2006年
6 李雪;动态定价或加重就医负担[N];广西日报;2020年
7 赵勇;动态定价促进航空公司收益水平提升[N];中国民航报;2019年
8 本报记者 龙昊;科技将保障消费金融运行[N];中国经济时报;2017年
9 方欣;航空公司动态定价迎来决定性时刻[N];中国民航报;2017年
10 本报记者  姜恒;日本:实行动态定价 药价逐年走低[N];中国医药报;2006年
11 荷兰保险行业IBM 全球企业咨询服务部负责人 Koos Quak 全球企业咨询服务部财务管理顾问 Gert-Jan van Zuijlen;AI动态定价助力险企更贴近市场[N];中国银行保险报;2019年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978