收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

基于仿真的可重入生产系统的神经元动态规划调度研究

王颖  
【摘要】: 可重入生产系统是以半导体和薄胶片生产为代表的一类复杂生产系统,在微电子行业飞速发展的今天,可重入生产系统已受到工业界和学术界的广泛关注。 本文对可重入生产系统的描述、模型、性能及调度等方面进行了系统的研究,提出一些新的思想和方法,主要的工作和创新之处总结如下: 1、建立可重入生产系统状态空间及调度集,计算可重入生产系统的状态转移概率表明该系统是连续的Markov决策过程,并提出系统的待调度状态集及非待调度状态集的生成算法。 2、针对可重入生产系统提出瓶颈工作站和阻塞状态的数学描述,证明单瓶颈工作站是系统中最忙碌、机器利用率最高的工作站,进而提出模型的简化方法:针对单瓶颈系统可直接简化非瓶颈工作站;针对多瓶颈系统,则提出NBJP调度策略作为简化非瓶颈工作站时的还原补偿策略;并提出有条件的相邻工序合并方法。最后给出系统简化及调度策略的还原算法。 3、针对二站封闭式可重入生产系统证明了平均输出率和双机生产时间作为性能指标的等价性,并将结论推广至多站系统,在此基础上推导出封闭式可重入生产系统连续Markov决策过程的动态规划模型。对封闭式和开放式可重入生产系统的连续Markov决策过程分别采用不同的离散化方法,并人工构造终止状态,获得两种投料策略下系统离散Markov决策过程的随机最短路径动态规划模型。 4、针对可重入生产系统的动态规划模型,基于神经元动态规划设计了可重入生产系统的调度仿真框架,分别在封闭式和开放式投料策略下,选择合适的初始状态、函数结构、特征向量和归一化方法,并提出将启发式策略的性能指标作为特征分量的想法,针对该动态规划模型设计了采用神经元动态规划方法进行迭代求解的算法,并比较分析了封闭式和开放式可重入生产系统的平均产品输出率及平均机器利用率。 5、针对HP公司提出的可重入生产系统Benchmark标准问题—TRC模型重新建立了考虑机器故障和维修时间的可重入生产系统的状态表示、状态分类、调度集、一步转移概率和一步转移代价体系,采用模型简化方法对三种参数设置下的TRC模型进行简化,选择合适的投料策略,设定合理的特征向量及归一化方法,采用神经元动态规划求解其调度策略,并与以往的调度结果进行比较,得到满意的结果。TRC模型调度研究的成功全面证明了本文建立的可重入生产系统的调度体系的有效性和优越性。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 金辉宇,于海斌;神经元动态规划综述[J];信息与控制;2001年04期
2 唐昊,奚宏生,殷保群;CTMDP基于随机平稳策略的仿真优化算法(英文)[J];自动化学报;2004年02期
3 郑应平,赵丽娜,王利存;可重入生产系统的QBD型模型[J];自动化学报;2001年05期
4 赵丽娜,郑应平;可重入生产系统的一种新型优化调度策略[J];控制理论与应用;2000年05期
5 赵丽娜,郑应平;开环可重入生产系统的排队网络模型及求解算法[J];控制与决策;2000年02期
6 吕文彦,党延忠;基于综合规则与遗传算法的可重入生产系统调度[J];计算机工程;2005年13期
7 陈晓慧;张启忠;;可重入式生产车间调度的计算机仿真与优化研究[J];计算机科学;2009年09期
8 唐昊;周雷;袁继彬;;平均和折扣准则MDP基于TD(0)学习的统一NDP方法[J];控制理论与应用;2006年02期
9 唐昊;陈栋;周雷;吴玉华;;SMDP基于Actor网络的统一NDP方法[J];控制与决策;2007年02期
10 陈晓慧;张启忠;易树平;段鹰;赖志柱;;基于遗传算法的可重入钢管生产优化调度[J];北京科技大学学报;2009年08期
11 吕文彦,党延忠;基于Petri网与遗传算法的可重入生产系统调度[J];计算机工程与应用;2005年19期
12 金锋;宋士吉;吴澄;;基于NDP的遗传算法及其在JSP中的应用[J];清华大学学报(自然科学版);2006年04期
13 代桂平;唐昊;奚宏生;;随机平稳策略下半Markov决策过程的仿真优化算法[J];控制理论与应用;2006年04期
14 王中杰,吴启迪;半导体生产线控制与调度研究[J];计算机集成制造系统-CIMS;2002年08期
15 李豹;程文娟;周雷;唐昊;;Rollout及其并行求解算法在多类商品库存控制中的应用[J];系统仿真学报;2007年17期
16 唐昊,奚宏生,殷保群;Markov控制过程基于神经元动态规划的优化算法[J];中国科学技术大学学报;2001年05期
17 车阿大;晏鹏宇;杨乃定;;复杂无等待自动化制造系统的调度算法研究[J];计算机集成制造系统;2007年08期
18 张洁,翟文彬,严隽琪,马登哲;基于模糊神经网络的半导体生产线重调度策略优化[J];机械工程学报;2005年10期
19 ;[J];;年期
20 ;[J];;年期
中国重要会议论文全文数据库 前2条
1 袁继彬;唐昊;韩江洪;;马尔可夫决策过程基于TD(0)学习和性能势的NDP优化[A];第二十三届中国控制会议论文集(上册)[C];2004年
2 唐昊;周雷;陆阳;袁继彬;;SMDP基于TD(λ)学习的统一神经元动态规划优化方法[A];2005中国控制与决策学术年会论文集(上)[C];2005年
中国博士学位论文全文数据库 前3条
1 王颖;基于仿真的可重入生产系统的神经元动态规划调度研究[D];厦门大学;2007年
2 吕文彦;基于规则的可重入生产系统调度问题研究[D];大连理工大学;2006年
3 李卫民;混合动力汽车控制系统与能量管理策略研究[D];上海交通大学;2008年
中国硕士学位论文全文数据库 前6条
1 左婷;基于Petri网的可重入生产系统调度问题研究[D];燕山大学;2012年
2 程培林;基于面向对象混合Petri网的可重入生产系统建模研究[D];燕山大学;2011年
3 袁继彬;大规模Markov系统基于性能势学习的NDP优化方法研究[D];合肥工业大学;2005年
4 陈栋;SMDP基于性能势的NDP优化方法及应用研究[D];合肥工业大学;2006年
5 周雷;折扣和平均准则下SMDP基于性能势的统一强化学习算法[D];合肥工业大学;2006年
6 李豹;大规模Markov决策过程基于性能势的并行算法研究与应用[D];合肥工业大学;2007年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978