收藏本站
《厦门大学》 2007年
收藏 | 手机打开
二维码
手机客户端打开本文

基于仿真的可重入生产系统的神经元动态规划调度研究

王颖  
【摘要】: 可重入生产系统是以半导体和薄胶片生产为代表的一类复杂生产系统,在微电子行业飞速发展的今天,可重入生产系统已受到工业界和学术界的广泛关注。 本文对可重入生产系统的描述、模型、性能及调度等方面进行了系统的研究,提出一些新的思想和方法,主要的工作和创新之处总结如下: 1、建立可重入生产系统状态空间及调度集,计算可重入生产系统的状态转移概率表明该系统是连续的Markov决策过程,并提出系统的待调度状态集及非待调度状态集的生成算法。 2、针对可重入生产系统提出瓶颈工作站和阻塞状态的数学描述,证明单瓶颈工作站是系统中最忙碌、机器利用率最高的工作站,进而提出模型的简化方法:针对单瓶颈系统可直接简化非瓶颈工作站;针对多瓶颈系统,则提出NBJP调度策略作为简化非瓶颈工作站时的还原补偿策略;并提出有条件的相邻工序合并方法。最后给出系统简化及调度策略的还原算法。 3、针对二站封闭式可重入生产系统证明了平均输出率和双机生产时间作为性能指标的等价性,并将结论推广至多站系统,在此基础上推导出封闭式可重入生产系统连续Markov决策过程的动态规划模型。对封闭式和开放式可重入生产系统的连续Markov决策过程分别采用不同的离散化方法,并人工构造终止状态,获得两种投料策略下系统离散Markov决策过程的随机最短路径动态规划模型。 4、针对可重入生产系统的动态规划模型,基于神经元动态规划设计了可重入生产系统的调度仿真框架,分别在封闭式和开放式投料策略下,选择合适的初始状态、函数结构、特征向量和归一化方法,并提出将启发式策略的性能指标作为特征分量的想法,针对该动态规划模型设计了采用神经元动态规划方法进行迭代求解的算法,并比较分析了封闭式和开放式可重入生产系统的平均产品输出率及平均机器利用率。 5、针对HP公司提出的可重入生产系统Benchmark标准问题—TRC模型重新建立了考虑机器故障和维修时间的可重入生产系统的状态表示、状态分类、调度集、一步转移概率和一步转移代价体系,采用模型简化方法对三种参数设置下的TRC模型进行简化,选择合适的投料策略,设定合理的特征向量及归一化方法,采用神经元动态规划求解其调度策略,并与以往的调度结果进行比较,得到满意的结果。TRC模型调度研究的成功全面证明了本文建立的可重入生产系统的调度体系的有效性和优越性。
【学位授予单位】:厦门大学
【学位级别】:博士
【学位授予年份】:2007
【分类号】:TP391.9

手机知网App
【参考文献】
中国期刊全文数据库 前3条
1 黄丹,严隽薇,乔非,吴启迪;基于Petri网的半导体生产线建模[J];计算机工程;2005年05期
2 王遵彤,乔非,吴启迪;基于CBR的半导体生产线组合调度策略研究[J];计算机工程;2005年07期
3 吕文彦,党延忠;基于B-T规则与遗传算法的可重入生产系统调度[J];系统仿真学报;2005年04期
【共引文献】
中国期刊全文数据库 前10条
1 李春贵,吴沧浦,刘永信;一种集成规划的SARSA(λ)强化学习算法[J];北京理工大学学报;2002年03期
2 林海,孙吉贵;预测及其主要模型的实现系统[J];吉林大学学报(信息科学版);2002年04期
3 吕志来,张保会,哈恒旭;一种变结构的时间序列预测算法及其在电力系统暂态稳定预测中的应用[J];电工技术学报;2002年03期
4 秦斌 ,王欣 ,吴敏;基于RBF神经网络的铁水硅含量预报模型[J];电气传动;2002年03期
5 梁冰,洪炳镕,曙光;自主机器人视觉与行为模型及避障研究[J];电子学报;2003年S1期
6 王玉涛,周建常,王师;神经网络模型与时差方法结合预报铁水硅含量[J];钢铁;1999年11期
7 汪新红,何秉宇;干旱地区水污染控制系统初探[J];干旱环境监测;1999年04期
8 陆军,徐莉,周小平;强化学习方法在移动机器人导航中的应用[J];哈尔滨工程大学学报;2004年02期
9 宋梅萍,顾国昌,张汝波;移动机器人的自适应式行为融合方法[J];哈尔滨工程大学学报;2005年05期
10 张彦铎,闵锋;基于人工神经网络的强化学习在机器人足球中的应用[J];哈尔滨工业大学学报;2004年07期
中国重要会议论文全文数据库 前10条
1 胡光华;;平均准则TD策略迭代算法[A];中国运筹学会第六届学术交流会论文集(上卷)[C];2000年
2 胡光华;殷英;李世云;;即时差分策略迭代算法[A];中国运筹学会第七届学术交流会论文集(下卷)[C];2004年
3 郭永江;张汉勤;;带有无限到达源的Re-entrant Line的稳定性(英文)[A];中国运筹学会第八届学术交流会论文集[C];2006年
4 王直杰;方建安;邵世煌;;一种增强式学习算法及其在控制中的应用[A];1996中国控制与决策学术年会论文集[C];1996年
5 朴松昊;洪炳熔;褚海涛;;基于BDI的多Agent协作模型研究[A];2003中国控制与决策学术年会论文集[C];2003年
6 刘长有;孙光余;;一种应用Elman型回归网络的Q-学习[A];2004中国控制与决策学术年会论文集[C];2004年
7 邹亮;徐建闽;;基于Q-learning的电子地图动态最短路径求解方法[A];2005中国控制与决策学术年会论文集(下)[C];2005年
8 谢志华;郑应平;;基于再励学习的排队系统优化控制[A];1995年中国控制会议论文集(下)[C];1995年
9 谢广明;郑大钟;;一类制造系统生产线模型循环控制稳定性分析[A];1998年中国控制会议论文集[C];1998年
10 Meng Joo Er;;Modeling and Fuzzy Q-Learning Control of Biped Walking[A];第二十四届中国控制会议论文集(上册)[C];2005年
中国博士学位论文全文数据库 前10条
1 陈昌富;仿生算法及其在边坡和基坑工程中的应用[D];湖南大学;2001年
2 张涛;非线性系统控制策略的研究[D];浙江大学;2001年
3 徐昕;增强学习及其在移动机器人导航与控制中的应用研究[D];国防科学技术大学;2002年
4 佘震宇;复杂经济系统演化建模研究[D];天津大学;2003年
5 郑淑丽;Web信息集成系统及查询优化方法研究[D];合肥工业大学;2003年
6 李四明;基于智能Agent的网上农业信息挖掘研究[D];中国农业大学;2003年
7 方远;复合代理体及其在企业管理信息系统中的应用研究[D];东华大学;2001年
8 邹国平;基于智能的高速公路交通控制与管理系统研究[D];长安大学;2002年
9 李威武;城域智能交通系统中的控制与优化问题研究[D];浙江大学;2003年
10 于江涛;多智能体模型、学习和协作研究与应用[D];浙江大学;2003年
中国硕士学位论文全文数据库 前10条
1 蔡逢煌;二次供水节能优化研究[D];福州大学;2001年
2 王醒策;基于强化学习的多机器人编队方法研究[D];哈尔滨工程大学;2002年
3 张必勇;强化学习在用户学习中的应用研究[D];太原理工大学;2003年
4 赵秀粉;蓝牙技术及多代理技术在车间控制系统中的应用研究[D];重庆大学;2003年
5 宋梅萍;多移动机器人协作任务的分布式决策控制系统[D];哈尔滨工程大学;2003年
6 邹丹;自主式水下机器人运动规划技术[D];哈尔滨工程大学;2003年
7 罗宁泉;增强学习在共面双机空战格斗中的应用[D];沈阳工业大学;2003年
8 滕轶栋;移动通信系统信道分配算法研究[D];浙江工业大学;2004年
9 李学勇;基于巩固学习的网络蜘蛛搜索策略研究[D];湖南大学;2003年
10 陈雪江;基于强化学习的多机器人协作机制研究[D];浙江工业大学;2004年
【同被引文献】
中国期刊全文数据库 前10条
1 冉洪流,周本刚;布朗模型在北京西北地区的应用[J];地震学报;2004年S1期
2 舒海生,李庆芬,颜声远,宋本基;FMS动态调度仿真模型的研究[J];哈尔滨工程大学学报;2005年02期
3 黄丹,乔非,严隽薇;基于分层Petri网的半导体生产线建模[J];计算机工程与应用;2004年35期
4 黄丹,严隽薇,乔非,吴启迪;基于Petri网的半导体生产线建模[J];计算机工程;2005年05期
5 姜思杰,李志华;基于Petri网的柔性制造系统动态优化模型[J];计算机集成制造系统-CIMS;2005年04期
6 郑锋,孙树栋,吴坚;基于扩展Petri网的混合流程生产过程建模[J];机械科学与技术;2003年02期
7 蒋昌俊;Petri网理论与方法研究综述[J];控制与决策;1997年06期
8 黄敏,汪定伟;基于遗传算法和排队网的串联CONWIP系统流通卡数的确定方法[J];自动化学报;2002年03期
9 刘民,吴澄,蒋新松;进化规划方法在并行多机调度问题中的应用[J];清华大学学报(自然科学版);1998年08期
10 周卫东,杨加敏,贾磊,李歧强;一种Petri网结合遗传算法的优化方法及应用[J];山东大学学报(工学版);2005年04期
【二级参考文献】
中国期刊全文数据库 前3条
1 刘民,吴澄,杨英杰;并行多机调度问题的一种基于组合规则的遗传算法[J];电子学报;2000年05期
2 吕文彦,党延忠;基于Petri网与遗传算法的可重入生产系统调度[J];计算机工程与应用;2005年19期
3 卫军胡,韩九强,孙国基;离散事件系统仿真技术在制造系统调度中的应用[J];系统仿真学报;2000年01期
中国博士学位论文全文数据库 前1条
1 薛雷;基于Petri网的集成电路柔性制造系统建模、分析及调度[D];西安电子科技大学;2001年
【相似文献】
中国期刊全文数据库 前10条
1 金辉宇,于海斌;神经元动态规划综述[J];信息与控制;2001年04期
2 唐昊,奚宏生,殷保群;CTMDP基于随机平稳策略的仿真优化算法(英文)[J];自动化学报;2004年02期
3 郑应平,赵丽娜,王利存;可重入生产系统的QBD型模型[J];自动化学报;2001年05期
4 赵丽娜,郑应平;可重入生产系统的一种新型优化调度策略[J];控制理论与应用;2000年05期
5 赵丽娜,郑应平;开环可重入生产系统的排队网络模型及求解算法[J];控制与决策;2000年02期
6 吕文彦,党延忠;基于综合规则与遗传算法的可重入生产系统调度[J];计算机工程;2005年13期
7 陈晓慧;张启忠;;可重入式生产车间调度的计算机仿真与优化研究[J];计算机科学;2009年09期
8 唐昊;周雷;袁继彬;;平均和折扣准则MDP基于TD(0)学习的统一NDP方法[J];控制理论与应用;2006年02期
9 唐昊;陈栋;周雷;吴玉华;;SMDP基于Actor网络的统一NDP方法[J];控制与决策;2007年02期
10 陈晓慧;张启忠;易树平;段鹰;赖志柱;;基于遗传算法的可重入钢管生产优化调度[J];北京科技大学学报;2009年08期
中国重要会议论文全文数据库 前2条
1 袁继彬;唐昊;韩江洪;;马尔可夫决策过程基于TD(0)学习和性能势的NDP优化[A];第二十三届中国控制会议论文集(上册)[C];2004年
2 唐昊;周雷;陆阳;袁继彬;;SMDP基于TD(λ)学习的统一神经元动态规划优化方法[A];2005中国控制与决策学术年会论文集(上)[C];2005年
中国博士学位论文全文数据库 前3条
1 王颖;基于仿真的可重入生产系统的神经元动态规划调度研究[D];厦门大学;2007年
2 吕文彦;基于规则的可重入生产系统调度问题研究[D];大连理工大学;2006年
3 李卫民;混合动力汽车控制系统与能量管理策略研究[D];上海交通大学;2008年
中国硕士学位论文全文数据库 前6条
1 左婷;基于Petri网的可重入生产系统调度问题研究[D];燕山大学;2012年
2 程培林;基于面向对象混合Petri网的可重入生产系统建模研究[D];燕山大学;2011年
3 袁继彬;大规模Markov系统基于性能势学习的NDP优化方法研究[D];合肥工业大学;2005年
4 陈栋;SMDP基于性能势的NDP优化方法及应用研究[D];合肥工业大学;2006年
5 周雷;折扣和平均准则下SMDP基于性能势的统一强化学习算法[D];合肥工业大学;2006年
6 李豹;大规模Markov决策过程基于性能势的并行算法研究与应用[D];合肥工业大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026