收藏本站
《上海交通大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

基于强化学习的动态单机调度研究

孙晟  
【摘要】: 生产调度位于计算机集成制造系统体系结构中的中间层,是控制与管理一体化的接合部。向上要给企业经营战略决策层提供决策依据,向下要安排生产加工任务,指导监督控制层的运作。因此,生产调度是实施计算机集成制造系统的关键。 在实际生产过程中,绝大多数的调度问题都属于动态调度问题。目前,大部分动态调度问题都利用调度规则来进行解决,但调度规则本质上是一种局域内的贪心搜索方法,盲目追求单一目标,同时其无法根据系统环境状态的改变进行自适应调整,因此没有一种调度规则能够在系统各项重要调度性能指标下都表现出良好的调度性能。因为Agent具有适应动态变化环境以及交互协商的能力,因此很多学者利用Agent技术来解决动态调度问题,但如何提高Agent的学习能力是Agent适应动态变化环境和提高交互协商能力的基础和关键。强化学习是实现Agent学习机制的有效途径,作为一种常用的强化学习算法,Q学习由于不受应用模型约束,在制造领域得到了广泛研究,但目前基于Q学习的Agent生产调度优化研究还很少。 本文构建了模式驱动调度系统,并结合智能体技术,对强化学习在这一系统中的应用机制进行了研究。通过MATLAB实验仿真,对模式驱动调度系统在动态单机调度问题中的调度性能进行了分析。仿
【学位授予单位】:上海交通大学
【学位级别】:硕士
【学位授予年份】:2007
【分类号】:F406

手机知网App
【引证文献】
中国硕士学位论文全文数据库 前1条
1 谢皓;柔性作业车间调度问题的算法研究[D];武汉科技大学;2012年
【参考文献】
中国期刊全文数据库 前7条
1 杨璐,洪家荣,黄梯云;用加强学习方法解决基于神经网络的时序实时建模问题[J];哈尔滨工业大学学报;1996年04期
2 张汝波,周宁,顾国昌,张国印;基于强化学习的智能机器人避碰方法研究[J];机器人;1999年03期
3 张宇,孙宪鹏;基于多代理结构的Job Shop动态优化调度策略的研究[J];制造业自动化;2001年03期
4 蒋国飞,吴沧浦;基于Q学习算法和BP神经网络的倒立摆控制[J];自动化学报;1998年05期
5 俞星星,阎平凡;强化学习系统及其基于可靠度最优的学习算法[J];信息与控制;1997年05期
6 郭文胜,殷国富,胡晓兵;基于Multi-Agent的虚拟车间调度作业原理与算法[J];中国机械工程;2001年12期
7 赵继,韩松乔,王茂华;基于Agent敏捷化车间调度系统的研究[J];中国机械工程;2002年20期
【共引文献】
中国期刊全文数据库 前10条
1 胡玉新,李宇成;模糊控制系统的模拟调试[J];北方工业大学学报;1999年03期
2 张冬梅;刘强;;一种基于强化学习的传感器网络应用重构决策方法[J];北京交通大学学报;2010年03期
3 杨萍;毕义明;孙淑玲;;具有自主决策能力的机动单元智能体研究[J];兵工学报;2007年11期
4 赵晓华;李振龙;于泉;张杰;;基于切换模型的两交叉口信号灯Q学习协调控制[J];北京工业大学学报;2007年11期
5 阮晓钢;郜园园;宋洪军;;基于操作条件反射自动机的仿生自主学习方法[J];北京工业大学学报;2011年11期
6 孙若莹;李忱;赵刚;;基于强化学习的牛鞭效应对策模型[J];北京信息科技大学学报(自然科学版);2011年01期
7 童亮,陆际联,龚建伟;一种快速强化学习方法研究[J];北京理工大学学报;2005年04期
8 王华;崔晓婷;刘向东;张宇河;;基于Q-学习的卫星姿态在线模糊神经网络控制[J];北京理工大学学报;2006年03期
9 胡光华,吴沧浦;多步 R 学习算法(英文)[J];Journal of Beijing Institute of Technology(English Edition);1999年03期
10 毕金波,吴沧浦;有效的自适应λ即时差异学习(英文)[J];Journal of Beijing Institute of Technology(English Edition);1999年03期
中国重要会议论文全文数据库 前10条
1 毛剑琳;向凤红;冯丽辉;;一种改进的IEEE802.15.4自适应实时带宽分配策略[A];第二十七届中国控制会议论文集[C];2008年
2 马丽;刘惟一;;多个交通路口调度博弈模型及其均衡求解的增强学习算法[A];第二十七届中国控制会议论文集[C];2008年
3 ;Complexity Analysis of Quantum Reinforcement Learning[A];第二十九届中国控制会议论文集[C];2010年
4 朴松昊;洪炳熔;褚海涛;;基于BDI的多Agent协作模型研究[A];2003中国控制与决策学术年会论文集[C];2003年
5 刘长有;孙光余;;一种应用Elman型回归网络的Q-学习[A];2004中国控制与决策学术年会论文集[C];2004年
6 唐昊;周雷;陆阳;袁继彬;;SMDP基于TD(λ)学习的统一神经元动态规划优化方法[A];2005中国控制与决策学术年会论文集(上)[C];2005年
7 邹亮;徐建闽;;基于Q-learning的电子地图动态最短路径求解方法[A];2005中国控制与决策学术年会论文集(下)[C];2005年
8 ;Hybrid Q-learning Algorithm About Cooperation in MAS[A];2009中国控制与决策会议论文集(3)[C];2009年
9 ;An Adaptive Inventory Control for a Supply Chain[A];2009中国控制与决策会议论文集(3)[C];2009年
10 谢志华;郑应平;;基于再励学习的排队系统优化控制[A];1995年中国控制会议论文集(下)[C];1995年
中国博士学位论文全文数据库 前10条
1 王作为;具有认知能力的智能机器人行为学习方法研究[D];哈尔滨工程大学;2010年
2 高延增;超小型水下机器人关键性能提升技术研究[D];华南理工大学;2010年
3 宋岩;基于多Agent和本体的散杂货港口集团船舶调度系统研究[D];北京交通大学;2011年
4 黄正行;临床过程分析与优化技术研究[D];浙江大学;2010年
5 林龙信;仿生水下机器人的增强学习控制方法研究[D];国防科学技术大学;2010年
6 冯奇;POMDP近似解法研究及在中医诊疗方案优化中的应用[D];北京交通大学;2011年
7 孙祥;大学生就业区域流向及引导策略研究[D];合肥工业大学;2011年
8 陈学松;强化学习及其在机器人系统中的应用研究[D];广东工业大学;2011年
9 李珺;基于强化学习的多机器人追捕问题研究[D];哈尔滨工业大学;2010年
10 李红梅;智能优化方法在电力系统调频中的应用研究[D];上海交通大学;2011年
中国硕士学位论文全文数据库 前10条
1 姜辉;二级倒立摆控制方法研究[D];哈尔滨工程大学;2010年
2 李志强;Q学习在单路口交通信号控制中的应用研究[D];长沙理工大学;2010年
3 李红涛;智能预测控制算法在倒立摆中的应用研究[D];长沙理工大学;2010年
4 姜新丽;基于强化学习的多机器人协作控制方法研究[D];沈阳理工大学;2010年
5 马志晟;基于多Agent的生产调度系统的研究[D];哈尔滨理工大学;2010年
6 张磊;复杂产品纵横双向调度算法研究[D];哈尔滨理工大学;2010年
7 乐天助;认知网络路由技术研究[D];西安电子科技大学;2011年
8 张小刚;面向社区服务的联机分析系统研究与实现[D];西安电子科技大学;2009年
9 孙亚光;基于蚁群算法的无线传感器网络路由协议的研究[D];北京交通大学;2011年
10 吴兴健;基于改进的遗传蚁群混合算法的TSP问题求解研究[D];大连海事大学;2011年
【同被引文献】
中国期刊全文数据库 前10条
1 王国新;宁汝新;王爱民;唐承统;武志军;;基于仿真的调度规则组合决策研究[J];北京理工大学学报;2006年07期
2 宋锦河;基于模拟退火算法的生产调度问题[J];长春工程学院学报(自然科学版);2004年01期
3 王超;刘阶萍;常伟涛;赵军;;不确定条件下的作业车间生产调度综述[J];装备制造技术;2011年04期
4 徐俊刚,戴国忠,王宏安;生产调度理论和方法研究综述[J];计算机研究与发展;2004年02期
5 张超勇,饶运清,李培根,刘向军;求解作业车间调度问题的一种改进遗传算法[J];计算机集成制造系统;2004年08期
6 王延斌,高国安,赵立忠;具有工件约束的模具制造优化调度算法研究[J];计算机集成制造系统;2005年10期
7 鞠全勇;朱剑英;;双资源多工艺路线作业车间模糊调度问题研究[J];机械科学与技术;2006年12期
8 张超勇;饶运清;李培根;邵新宇;;柔性作业车间调度问题的两级遗传算法[J];机械工程学报;2007年04期
9 张国辉;高亮;李培根;张超勇;;改进遗传算法求解柔性作业车间调度问题[J];机械工程学报;2009年07期
10 张芒;;制造业信息化整合的利器-制造执行管理系统(MES)[J];科技信息(科学教研);2008年05期
中国硕士学位论文全文数据库 前4条
1 安进;车间生产批量优化调度研究[D];南京航空航天大学;2005年
2 丁书斌;基于混合遗传算法的车间调度方法研究与应用[D];大连理工大学;2006年
3 蒋丽雯;基于遗传算法的车间作业调度问题研究[D];上海交通大学;2007年
4 秦娜;基于Petri网和PSO算法的JSP优化调度方案的研究[D];长沙理工大学;2009年
【二级参考文献】
中国期刊全文数据库 前4条
1 杨立君;对Flowshop排序问题启发式方法的评价与改进[J];工业工程与管理;1998年01期
2 幸研,易红,汤文成,仇晓黎;敏捷化车间虚拟环境的研究[J];制造业自动化;2000年02期
3 林元烈,林建星;首达时间依分布最优模型与风险最小模型[J];清华大学学报(自然科学版);1996年02期
4 庞哈利,郑秉霖,徐心和;具有准时制工艺要求的混合FLOWSHOP调度问题——实例研究[J];信息与控制;1999年02期
【相似文献】
中国期刊全文数据库 前10条
1 张志刚;游义刚;;Repast竞价策略模型在电力市场教学中的研究[J];中国电力教育;2011年12期
2 赵殿侠;强化学习抓落实 周密安排求实效[J];政府法制;2005年11期
3 刘伟兵;黎民;王先甲;;基于Q-学习的进化博弈决策模型[J];武汉大学学报(工学版);2008年04期
4 何波;;基于Agent的电子商务自动谈判研究[J];图书情报工作;2011年04期
5 刘伟兵;王先甲;;进化博弈中多代理人强化学习模型[J];系统工程理论与实践;2009年03期
6 曹旭;邓胜春;黄虎杰;;供应商管理库存模式下库存优化研究[J];科学技术与工程;2006年15期
7 王雯;傅卫平;王更生;郝良;;具有学习能力的供应链系统的复杂动力学[J];机械工程学报;2011年08期
8 姬玫;;对中国留学生英语言强化学习的观察与思考[J];兰州商学院学报;2007年03期
9 权小锋;尹洪英;;供应链分销系统奖金优化与仿真分析[J];物流技术;2007年09期
10 顾淑林,范保群;创新的强化学习:成功赶超的关键[J];管理工程学报;2000年S1期
中国重要会议论文全文数据库 前10条
1 文锋;陈宗海;陈春林;;基于RLS-TD和值梯度的强化学习方法用于LQR控制问题[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
2 卓睿;陈宗海;陈春林;;强化学习在移动机器人导航上的应用[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
3 张伟;李建更;张家旺;;多智能体强化学习在机器人足球比赛中的应用[A];2005年中国智能自动化会议论文集[C];2005年
4 张家旺;韩光胜;张伟;;基于ASPL模型的多智能体强化学习在RoboCup中的应用[A];2005中国机器人大赛论文集[C];2005年
5 敬斌;田野;;Robocup中的传球策略[A];2005中国机器人大赛论文集[C];2005年
6 陈春林;陈宗海;卓睿;;分层式强化学习的定性空间表达[A];’2004系统仿真技术及其应用学术交流会论文集[C];2004年
7 涂自然;王维;梁以业;禹建丽;;基于强化学习的自适应变步长机器人路径规划算法[A];2003年中国智能自动化会议论文集(上册)[C];2003年
8 方宝富;王浩;姚宏亮;杨静;周晋;;Q学习在机器人足球中的应用[A];2004中国机器人足球比赛暨学术研讨会论文集[C];2004年
9 叶道年;陈卫东;;机器人团队协作的强化学习[A];2004中国机器人足球比赛暨学术研讨会论文集[C];2004年
10 魏阳;薛青;王建伟;刘广洋;;虚拟环境中半自治作战智能体技术及应用[A];图像图形技术与应用进展——第三届图像图形技术与应用学术会议论文集[C];2008年
中国重要报纸全文数据库 前10条
1 孙佳宇;强化学习教育 增强服务意识[N];人民公安报;2009年
2 首席记者 朱丽华;强化学习 落实责任 确保取得实效[N];盘锦日报;2009年
3 王良豪 记者 刘伟 龙先华;通过创新工作取得活动效果[N];六盘水日报;2008年
4 书分;解放区审计局强化学习抓作风[N];焦作日报;2006年
5 记者 刘琰;强化学习 增强本领 扎实工作[N];周口日报;2009年
6 谭育才;强化学习 克己奉公[N];赤峰日报;2008年
7 章斌、特约记者夏吉龙;8710部队 破解难题强化学习教育效果[N];人民武警;2010年
8 通讯员 马全有;强化学习 搞好服务 解放思想[N];甘肃法制报;2007年
9 李北川;强化学习 找准问题 着力整改[N];凉山日报(汉);2007年
10 陈滟澎 张玮(作者单位:市交通局公路处);强化学习提高机关办事效能[N];廊坊日报;2006年
中国博士学位论文全文数据库 前10条
1 金钊;加速强化学习方法研究[D];云南大学;2010年
2 徐明亮;强化学习及其应用研究[D];江南大学;2010年
3 陈学松;强化学习及其在机器人系统中的应用研究[D];广东工业大学;2011年
4 仲宇;分布式强化学习理论及在多机器人中的应用研究[D];哈尔滨工程大学;2003年
5 李誌;基于视觉听觉语义相干性的强化学习系统的研究[D];太原理工大学;2012年
6 郭庆;多Agent系统协商中若干关键技术的研究[D];浙江大学;2003年
7 李扬;网络环境下多智能体协调控制研究[D];中国海洋大学;2012年
8 戴朝晖;基于混合抽象机制的多智能体系统动态分层强化学习算法研究[D];中南大学;2012年
9 杨东勇;多机器人协作的学习与进化方法[D];浙江大学;2005年
10 庄晓东;多移动机器人运动控制策略的强化学习研究[D];中国海洋大学;2005年
中国硕士学位论文全文数据库 前10条
1 孙晟;基于强化学习的动态单机调度研究[D];上海交通大学;2007年
2 尹晓虎;多Agent协同的强化学习方法研究[D];国防科学技术大学;2003年
3 宋梅萍;多移动机器人协作任务的分布式决策控制系统[D];哈尔滨工程大学;2003年
4 卢方国;强化学习在个性化信息Agent的应用研究[D];广东工业大学;2004年
5 郭一明;基于强化学习的劣化系统维修策略研究[D];合肥工业大学;2011年
6 钱征;基于强化学习的倒立摆控制研究[D];北京工业大学;2005年
7 王瑞霞;基于强化学习的倒立摆控制[D];北京工业大学;2005年
8 顾鑫;个性化智能信息检索系统研究[D];哈尔滨工程大学;2004年
9 刘飞;强化学习方法在多机器人博弈系统中的应用研究[D];华北电力大学(北京);2011年
10 张驰;基于ROBOCUP的多智能体系统设计与实现[D];北京工业大学;2004年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026