收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

电梯群控系统的自适应多目标优化方法研究

孙正雅  
【摘要】: 本文主要研究了电梯群控系统的自适应多目标优化方法。由于电梯群控系统重要的实际意义,其自适应多目标优化问题得到了广泛关注。电梯群控系统是一个典型的多目标系统,为探索解决问题的有效方法,论文首先系统地总结了电梯群控系统多目标优化方法。在此基础上,建立了电梯群控系统的自适应多目标优化结构,并且对结构中各组成模块的功能进行了介绍,同时详细阐述了自适应多目标优化原理。 在自适应多目标优化过程中,优化评价函数参数是解决整个问题的关键。论文以马尔可夫决策过程为背景,模型化评价函数参数优化问题,根据所研究问题的特点定义模型各要素。并且通过对自适应优化方法的总结、分析与比较,提出基于强化学习的评价函数参数优化方法,即利用强化学习的SARSA(λ)值迭代算法和策略梯度算法实现算法的迭代更新,并且将两者分别与Tile coding函数逼近相结合。然后利用随机过程、矩阵论以及不动点理论,分析证明相关算法收敛性。 针对所提出的评价函数参数优化方法存在收敛速度慢、训练时间长等问题,将隐偏向信息学习与强化学习相结合,进一步提出了改进的评价函数参数优化方法。仿真实验表明,改进方法的收敛速度明显提高,同时缩短了学习时间。 设计结合自适应多目标优化单元的电梯群控虚拟仿真环境的结构,定义各部分功能函数之间的接口。结合电梯群控虚拟仿真环境进行仿真,生成了两种不同的交通流用于算法的仿真与训练,首先分析比较两种评价函数参数优化方法在解决电梯群控系统的自适应多目标优化问题中的学习能力,然后通过与其他方法进行比较,仿真结果不仅体现了所研究的自适应多目标调度优化方法对于不同的交通模式具有较强的适应性,而且获得了综合性能更好的优化结果。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 薛丽华;殷苌茗;李立云;胡明辉;;基于多智能体的融合Sarsa(λ)学习算法[J];计算机工程与应用;2008年04期
2 宗群;孙正雅;宋超峰;;基于平均报酬强化学习的电梯群组调度研究[J];系统仿真学报;2007年21期
3 余华;孙德宝;;基于CAN总线的电梯群控系统的通讯接口设计与实现[J];国内外机电一体化技术;2005年02期
4 曹建忠;罗飞;许玉格;;新型电梯群控系统的建模和控制策略研究[J];微计算机信息;2006年13期
5 黄剑礼;周义江;;CAN总线在电梯群控系统中的应用研究[J];福建电脑;2007年06期
6 邹莉;;电梯交通模式的模糊神经网络识别[J];工业控制计算机;2010年02期
7 游林儒;付文斌;毕淑娥;姜喜瑞;;电梯群控系统的动态最优问题[J];电气自动化;2003年03期
8 余华;孙德宝;;基于CAN总线的电梯群控系统的通讯接口设计与实现[J];电气传动自动化;2006年01期
9 李玲;;基于遗传算法的多目标电梯群控技术[J];机械工程与自动化;2009年06期
10 王金奇;宁奇愚;李翔;;电梯群控多目标算法研究[J];微处理机;2010年05期
11 殷翔,黄展翔;强化学习在仿真机器人足球踢球动作中的应用[J];苏州大学学报(工科版);2002年04期
12 李春贵,刘永信;一种有限时段Markov决策过程的强化学习算法[J];广西工学院学报;2003年01期
13 姜庆臣;王艳春;;一种集成智能的电梯群控技术[J];齐齐哈尔大学学报;2005年04期
14 刘菲;曾广周;;基于强化学习的多移动Agent学习算法[J];计算机工程与应用;2006年05期
15 宋一然;;基于强化学习的多机器人路径规划方法[J];莆田学院学报;2006年02期
16 文方;熊瑛;孙敏;;基于滚动优化算法的电梯群控设计[J];电气传动;2008年07期
17 何锫;王峰;肖淑苹;;基于异联想记忆Hopfield网络的强化学习[J];微计算机信息;2008年26期
18 李寰;姜华;许丽莉;;基于DNA-GA的电梯群控系统研究[J];微计算机信息;2009年28期
19 邹莉;;多目标电梯群控系统的研究[J];自动化与仪器仪表;2010年03期
20 张汝波,顾国昌,刘照德,王醒策;强化学习理论、算法及应用[J];控制理论与应用;2000年05期
中国重要会议论文全文数据库 前10条
1 文锋;陈宗海;陈春林;;基于RLS-TD和值梯度的强化学习方法用于LQR控制问题[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
2 卓睿;陈宗海;陈春林;;强化学习在移动机器人导航上的应用[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
3 张伟;李建更;张家旺;;多智能体强化学习在机器人足球比赛中的应用[A];2005年中国智能自动化会议论文集[C];2005年
4 张家旺;韩光胜;张伟;;基于ASPL模型的多智能体强化学习在RoboCup中的应用[A];2005中国机器人大赛论文集[C];2005年
5 敬斌;田野;;Robocup中的传球策略[A];2005中国机器人大赛论文集[C];2005年
6 陈春林;陈宗海;卓睿;;分层式强化学习的定性空间表达[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
7 丁振华;高原;;基于GADST的电梯群控系统的多目标优化[A];2007系统仿真技术及其应用学术会议论文集[C];2007年
8 涂自然;王维;梁以业;禹建丽;;基于强化学习的自适应变步长机器人路径规划算法[A];2003年中国智能自动化会议论文集(上册)[C];2003年
9 叶道年;陈卫东;;机器人团队协作的强化学习[A];2004中国机器人足球比赛暨学术研讨会论文集[C];2004年
10 方宝富;王浩;姚宏亮;杨静;周晋;;Q学习在机器人足球中的应用[A];2004中国机器人足球比赛暨学术研讨会论文集[C];2004年
中国博士学位论文全文数据库 前10条
1 金钊;加速强化学习方法研究[D];云南大学;2010年
2 徐明亮;强化学习及其应用研究[D];江南大学;2010年
3 陈学松;强化学习及其在机器人系统中的应用研究[D];广东工业大学;2011年
4 仲宇;分布式强化学习理论及在多机器人中的应用研究[D];哈尔滨工程大学;2003年
5 李誌;基于视觉听觉语义相干性的强化学习系统的研究[D];太原理工大学;2012年
6 郭庆;多Agent系统协商中若干关键技术的研究[D];浙江大学;2003年
7 戴朝晖;基于混合抽象机制的多智能体系统动态分层强化学习算法研究[D];中南大学;2012年
8 杨东勇;多机器人协作的学习与进化方法[D];浙江大学;2005年
9 庄晓东;多移动机器人运动控制策略的强化学习研究[D];中国海洋大学;2005年
10 祖丽楠;多机器人系统自主协作控制与强化学习研究[D];吉林大学;2006年
中国硕士学位论文全文数据库 前10条
1 孙正雅;电梯群控系统的自适应多目标优化方法研究[D];天津大学;2007年
2 尹晓虎;多Agent协同的强化学习方法研究[D];国防科学技术大学;2003年
3 宋梅萍;多移动机器人协作任务的分布式决策控制系统[D];哈尔滨工程大学;2003年
4 卢方国;强化学习在个性化信息Agent的应用研究[D];广东工业大学;2004年
5 郭一明;基于强化学习的劣化系统维修策略研究[D];合肥工业大学;2011年
6 钱征;基于强化学习的倒立摆控制研究[D];北京工业大学;2005年
7 王瑞霞;基于强化学习的倒立摆控制[D];北京工业大学;2005年
8 顾鑫;个性化智能信息检索系统研究[D];哈尔滨工程大学;2004年
9 张驰;基于ROBOCUP的多智能体系统设计与实现[D];北京工业大学;2004年
10 袁继彬;大规模Markov系统基于性能势学习的NDP优化方法研究[D];合肥工业大学;2005年
中国重要报纸全文数据库 前10条
1 孙佳宇;强化学习教育 增强服务意识[N];人民公安报;2009年
2 首席记者 朱丽华;强化学习 落实责任 确保取得实效[N];盘锦日报;2009年
3 书分;解放区审计局强化学习抓作风[N];焦作日报;2006年
4 王良豪 记者 刘伟 龙先华;通过创新工作取得活动效果[N];六盘水日报;2008年
5 记者 刘琰;强化学习 增强本领 扎实工作[N];周口日报;2009年
6 谭育才;强化学习 克己奉公[N];赤峰日报;2008年
7 章斌、特约记者夏吉龙;8710部队 破解难题强化学习教育效果[N];人民武警;2010年
8 通讯员 马全有;强化学习 搞好服务 解放思想[N];甘肃法制报;2007年
9 李北川;强化学习 找准问题 着力整改[N];凉山日报(汉);2007年
10 陈滟澎 张玮(作者单位:市交通局公路处);强化学习提高机关办事效能[N];廊坊日报;2006年
中国知网广告投放
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978