收藏本站
《沈阳工业大学》 2004年
收藏 | 手机打开
二维码
手机客户端打开本文

强化学习及其在空中拦截中的应用

孙光余  
【摘要】:随着导弹和飞机的机动性能大大提高,单纯的轨道拦截法己经不能满足空中防御的要求,作为一种双边对策的研究方法,微分对策在空中拦截中的应用有了重要的意义。但是由于微分对策理论来源于最优控制理论,因此它需要精确的数学模型,以及在求解时会遇到非线性两点边值问题和奇异面问题,所以其应用很困难。 近年来,随着人工智能的兴起,国内外许多学者致力于将智能控制理论引入微分对策理论的研究中,以解决其应用的问题。而要达到智能化制导就不可避免地涉及知识的自动提取和利用问题。作为机器学习的一种方法,增强学习恰可使知识的获取过程自动化,并扩展所能得到的知识资源范围。 本文研究了三维空间的空中拦截的动态对策问题,采用增强学习与微分对策相结合的方法,避免了传统的控制理论根据被控对象的精确数学模型和性能指标来求解最优解析解的方法带来的困难。并依据人的模糊思维建立类似于空战的对策准则,实现状态空间的离散化以减小动作空间范围,提高网络学习效率。 本文针对传统增强学习中出现的“维数灾难”问题以及学习问题中的“StructureCredit-Assignment”问题采用Elman神经网络近似Q-学习的评价函数的解决方法。 然后应用提出的方法作了三维空中拦截的仿真,仿真结果验证了本文所采用的方法的有效性,表明将增强学习与微分对策理论相结合,并应用于对机动的机动目标拦截问题中是一种有前途的发展方向。 本文首先分析空中拦截的重要性及其研究方法的发展,并给出设计方案的依据及总体框架。在第二章介绍了增强学习的特点、发展历史和各种算法。在第三章设计了基于Q-学习的微分对策方法。第四章应用双方优化的方法、第五章应用双边优化和单边优化相结合的方法,分别提供了空中拦截智能制导的实现方法的仿真试验,并对仿真结果作了分析。
【学位授予单位】:沈阳工业大学
【学位级别】:硕士
【学位授予年份】:2004
【分类号】:TP18

手机知网App
【相似文献】
中国期刊全文数据库 前10条
1 孙天昊;陈飞;朱庆生;曹峰;;基于贝叶斯分类的增强学习协商策略[J];计算机科学;2011年09期
2 宋崇辉;边春元;张勰;史成龙;;鲁棒后退时域控制中HJI方程的数值解法及控制器设计[J];中国科学:信息科学;2011年09期
3 花文华;陈兴林;宋申民;;基于目标机动检测的集成估计与制导方法[J];中南大学学报(自然科学版);2011年06期
4 刘志勇;袁媛;;基于测地距离的半监督增强[J];计算机工程与应用;2011年21期
5 贾国祥;;网络教学中提高学生上网学习机制的研究[J];继续教育研究;2011年07期
6 赵玉鹏;;论机器学习[J];安阳工学院学报;2011年04期
7 高永;郑小洪;侯志强;;基于整数规划的超视距空战目标分配模型研究[J];系统仿真学报;2011年S1期
8 ;[J];;年期
9 ;[J];;年期
10 ;[J];;年期
中国重要会议论文全文数据库 前10条
1 雍炯敏;;数学金融学与微分对策(英文)[A];信息科学与微电子技术:中国科协第三届青年学术年会论文集[C];1998年
2 郑丕谔;李光泉;胡炬;;微分对策问题开环解的新算法[A];科学决策与系统工程——中国系统工程学会第六次年会论文集[C];1990年
3 唐万生;李光泉;;广义系统的微分对策问题[A];全国青年管理科学与系统科学论文集(第1卷)[C];1991年
4 姜玉宪;;微分对策的智能控制研究法[A];1994年中国控制会议论文集[C];1994年
5 徐哲;冯敏;姚正平;黄洪鹍;;分布式机器人中带协同的增强学习问题[A];马斯特杯2003年中国机器人大赛及研讨会论文集[C];2003年
6 蔡立军;周风岐;;具有有界控制的导弹空间末制导律[A];1995年中国控制会议论文集(下)[C];1995年
7 蔡立军;周凤岐;;高超音速导弹的一种最优制导律[A];1997年中国控制会议论文集[C];1997年
8 许品刚;黄力伟;邵卫;;企业间竞争的微分对策模型及其解法[A];1997中国控制与决策学术年会论文集[C];1997年
9 徐自祥;周德云;苏军;刘荣桂;;线性二次型微分对策(LQDG)的精细积分法[A];全国自动化新技术学术交流会会议论文集(一)[C];2005年
10 李岩;卢翔;于凯妍;刘景泰;;基于微分对策的竞争型遥操作机器人追逃策略研究[A];中国自动化学会控制理论专业委员会C卷[C];2011年
中国重要报纸全文数据库 前10条
1 本报记者 周爱玲;增强学习的趣味性[N];酒泉日报;2011年
2 湖南省社科院副院长、研究员 周小毛;增强学习的吸引力[N];湖南日报;2011年
3 陈维旭 湖南总队;增强学习内动力[N];人民武警报;2011年
4 王艳梅(作者系崇阳县教育局党委书记、局长);强化学习动力 增强学习实效[N];咸宁日报;2005年
5 郭振勇 张宁;拓展学习平台 增强学习实效[N];解放军报;2010年
6 本报记者;联系实际增强学习针对性[N];哈尔滨日报;2007年
7 ;不断增强学习宣传贯彻活动的实效[N];深圳特区报;2007年
8 记者 匡丽娜 张珂 实习生 刘飞川;切实增强学习的自觉性和紧迫感[N];重庆日报;2008年
9 首席记者 高扬;增强学习能力 提高服务水平[N];牡丹江日报;2010年
10 王红峰;让学习为创业创新插上飞翔的翅膀[N];台州日报;2008年
中国博士学位论文全文数据库 前10条
1 王珺;开环非合作微分对策及其在经济中的应用[D];吉林大学;2011年
2 张晶;中国房地产市场两类主从微分对策研究[D];重庆大学;2011年
3 徐昕;增强学习及其在移动机器人导航与控制中的应用研究[D];国防科学技术大学;2002年
4 肖华;部分信息下正倒向随机系统的最优控制和微分对策理论[D];山东大学;2011年
5 薄涛;格斗空战行为建模技术研究[D];国防科学技术大学;2002年
6 聂佳佳;基于微分对策的供应链合作广告策略[D];重庆大学;2009年
7 张建军;短销售周期供应链协调问题及其博弈分析[D];同济大学;2008年
8 王学宁;策略梯度增强学习的理论、算法及应用研究[D];国防科学技术大学;2006年
9 徐自祥;微分对策理论及在作战指挥控制中的应用研究[D];西北工业大学;2006年
10 陈万米;小型足球机器人系统的实时控制及决策规划研究与实验[D];上海大学;2009年
中国硕士学位论文全文数据库 前10条
1 孙光余;强化学习及其在空中拦截中的应用[D];沈阳工业大学;2004年
2 罗宁泉;增强学习在共面双机空战格斗中的应用[D];沈阳工业大学;2003年
3 王晓光;基于微分对策理论的无人飞机空战建模及其仿真[D];沈阳航空航天大学;2012年
4 陈明银;基于对策信息结构不确定的二次型微分对策研究[D];电子科技大学;2010年
5 毛赤龙;“2对2”多阶段规范交战模式研究[D];国防科学技术大学;2003年
6 付宪法;寡头市场广告竞争微分对策模型研究[D];重庆大学;2010年
7 宫瑞敏;基于增强学习的计算机博弈策略的研究与实现[D];沈阳理工大学;2011年
8 刘惠敏;三类经济系统的基于微分对策的鲁棒H_∞控制[D];东北大学;2009年
9 左磊;基于值函数逼近与状态空间分解的增强学习方法研究[D];国防科学技术大学;2011年
10 翟铭坤;成本约束下可耗竭资源开采微分对策研究[D];重庆大学;2012年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62791813
  • 010-62985026