期刊库|学位论文库|会议论文库|飞度BOOK|站内搜索注册|充值中心|购买知网卡|送卡上门|帮助中心|
全文文献: “飞度BOOK”首届期刊庙会开幕啦!
做个飞度客,万千杂志,想看就看!
《沈阳工业大学》 2003年
加入收藏 获取最新

增强学习在共面双机空战格斗中的应用

罗宁泉  
【摘要】: 微分对策作为解决追逃动态对策问题主要工具已经经历了近50年的发展,就其本身而言已经发展的相当成熟,但距实际应用还有一段距离。这主要是由于微分对策理论来源于最优控制理论,因此它需要精确的数学模型,以及在求解时会遇到非线性两点边值问题和奇异面问题。 近年来,随着人工智能的兴起,国内外许多学者致力于将智能控制理论引入微分对策理论的研究中。而要达到智能化制导就不可避免地涉及知识的自动提取和利用问题。作为机器学习的一种方法,增强学习恰可使知识的获取过程自动化,并扩展所能得到的知识资源范围。 本文研究了共面双机空战格斗的动态对策问题,采用增强学习与微分对策相结合的方法,避免了传统的控制理论根据被控对象的精确数学模型和性能指标来求解最优解析解的方法带来的困难。并依据人的模糊思维建立空战对策准则,实现状态空间的离散化以减小动作空间范围,提高网络学习效率。 本文针对传统增强学习中出现的“维数灾难”问题以及学习问题中的“Structure Credit-Assignment”问题采用BP神经网络近似Q-学习的评价函数的解决方法。 在仿真试验中考虑诸多实际因素,并采用了实际空气动力学参数,仿真结果验证本文所采用的方法的有效性,表明将增强学习与微分对策理论相结合,并应用于空战格斗问题中是—种有前途的发展方向。 本文首先分析双机格斗的重要性及其研究方法的发展,并给出设计方案的依据及总体框架。在第二章介绍了增强学习的特点、发展历史和各种算法。在第三章设计了基于Q-学习智能空战制导控制,并给出空战对策准则。在第四章对水平面双机空战格斗常、变速数学模型进行了仿真试验,对仿真结果作了分析。
【关键词】:智能控制 微分对策 增强学习 神经网络 空战格斗 系统仿真
【学位授予单位】:沈阳工业大学
【学位级别】:硕士
【学位授予年份】:2003
【分类号】:E84
【DOI】:CNKI:CDMD:2.2004.030034
【目录】:
  • 摘要5-6
  • Abstract6-11
  • 1 引言11-19
  • 1.1 双机格斗的研究在空战分析中的重要性11-12
  • 1.2 双机格斗理论发展状况12-16
  • 1.2.1 矩阵对策方法12-13
  • 1.2.2 自适应机动逻辑方法(AML)13
  • 1.2.3 微分对策法13-15
  • 1.2.4 人工智能方法15-16
  • 1.3 设计方案选择依据及主要内容16-19
  • 2 增强学习19-30
  • 2.1 增强学习的概念、特点19-21
  • 2.2 增强学习的发展历史21-22
  • 2.3 增强学习的各种算法22-27
  • 2.3.1 非联想算法(Non-associative)增强学习22-23
  • 2.3.2 联想(Associative)增强学习23-24
  • 2.3.3 延时增强学习算法24-27
  • 2.3.4 近年来完善的增强学习算法27
  • 2.4 增强学习的应用27-30
  • 2.4.1 在游戏比赛中的应用27-28
  • 2.4.2 在控制系统中应用28
  • 2.4.3 在机器人中的应用28
  • 2.4.4 在调度管理中应用28-29
  • 2.4.5 在导弹拦截问题中应用29-30
  • 3 空战格斗的智能控制的建模及具体实现30-43
  • 3.1 双机空战格斗问题的描述30-33
  • 3.2 基于Q-学习的微分对策求解33-40
  • 3.2.1 主要定理33-35
  • 3.2.2 Q-学习算法及其收敛性定理35-36
  • 3.2.3 基于微分对策理论的Q-学习算法36-37
  • 3.2.4 回报函数(Reward Function)定义37-38
  • 3.2.5 评价函数(Value Function)的神经网络近似38-40
  • 3.3 空战对策准则的建立40-41
  • 3.4 基于Q-学习双机空战格斗智能算法41-43
  • 4 基于Q-学习的双机空战格斗仿真试验43-62
  • 4.1 基于Q-学习的水平面常速空战仿真试验43-55
  • 4.1.1 水平面二维常速双机空战建模43-44
  • 4.1.2 空战对策准则实现44-47
  • 4.1.3 基于神经网络的评价函数的实现47-48
  • 4.1.4 仿真试验及分析48-52
  • 4.1.5 仿真参数分析52-55
  • 4.2 基于Q-学习水平面变速空战仿真试验55-62
  • 4.2.1 水平面二维变速空战仿真条件56-57
  • 4.2.2 仿真试验及分析57-62
  • 结论62-64
  • 参考文献64-69
  • 在学研究成果69-70
  • 致谢70
全文下载: CAJ格式
不支持迅雷等加速下载工具,请取消加速工具后下载
CAJViewer7.0阅读器支持所有CNKI文件格式,AdobeReader仅支持PDF格式

【相似文献】
中国期刊全文数据库 前10条
1 ;坚持边学边改 增强学习实效[J];党员之友;2001年09期
2 ;进一步增强学习邓小平理论的自觉性[J];冶金政工研究;1998年03期
3 宋巍;进一步增强学习邓小平理论的自觉性[J];理论学习与探索;1998年05期
4 ;增强学习邓小平理论的紧迫性[J];了望;1998年31期
5 王义宁,姜玉宪;空战决策中的智能微分对策法[J];飞行力学;2003年01期
6 曹选红;坚持四个结合 增强学习实效[J];西南民兵杂志;2003年12期
7 ;注重学习方法 增强学习吸引力[J];党政论坛;1998年11期
8 梁凤书;充分认识两个《条例》的重大意义 增强学习贯彻的自觉性[J];先锋队;2004年18期
9 龙玉平;;“优秀缺点”不光荣[J];当代广西;2005年19期
10 唐鹏;;领导干部要勤于学习善于学习[J];学习月刊;2007年10期
中国重要会议论文全文数据库 前10条
1 郑丕谔;李光泉;胡炬;;微分对策问题开环解的新算法[A];科学决策与系统工程——中国系统工程学会第六次年会论文集[C];1990年
2 徐哲;冯敏;姚正平;黄洪鹍;;分布式机器人中带协同的增强学习问题[A];马斯特杯2003年中国机器人大赛及研讨会论文集[C];2003年
3 唐万生;李光泉;;广义系统的微分对策问题[A];全国青年管理科学与系统科学论文集(第1卷)[C];1991年
4 吴江;管晓宏;高峰;孙国基;;考虑风险的发电商优化报价学习模型[A];第二十四届中国控制会议论文集(下册)[C];2005年
5 姜玉宪;;微分对策的智能控制研究法[A];1994年中国控制会议论文集[C];1994年
6 许品刚;黄力伟;邵卫;;企业间竞争的微分对策模型及其解法[A];1997中国控制与决策学术年会论文集[C];1997年
7 黄小原;钟麦英;;Nash均衡条件下的H_∞控制及其应用[A];1999中国控制与决策学术年会论文集[C];1999年
8 蔡立军;周风岐;;具有有界控制的导弹空间末制导律[A];1995年中国控制会议论文集(下)[C];1995年
9 蔡立军;;线性二次型微分对策问题的一种解法[A];1996年中国控制会议论文集[C];1996年
10 蔡立军;周凤岐;;高超音速导弹的一种最优制导律[A];1997年中国控制会议论文集[C];1997年
中国重要报纸全文数据库 前10条
1 王艳梅(作者系崇阳县教育局党委书记、局长);强化学习动力 增强学习实效[N];咸宁日报;2005年
2 本报记者;联系实际增强学习针对性[N];哈尔滨日报;2007年
3 ;不断增强学习宣传贯彻活动的实效[N];深圳特区报;2007年
4 记者 匡丽娜 张珂 实习生 刘飞川;切实增强学习的自觉性和紧迫感[N];重庆日报;2008年
5 王红峰;让学习为创业创新插上飞翔的翅膀[N];台州日报;2008年
6 尹坤;太旗运管所业务学习突出“新、精、真”[N];锡林郭勒日报;2008年
7 何永华 记者 秦永生;增强学习 打开财政工作新局面[N];锦州日报;2007年
8 贾小民陈红卫;认真部署十七大精神学习宣传工作[N];商洛日报;2007年
9 州秘宣;进一步增强学习贯彻科学发展观的自觉性和坚定性[N];甘南日报(汉文版);2008年
10 中共咸安区劳动和社会保障局党组中心组;坚持“四结合” 打造学习型班子[N];咸宁日报;2006年
中国博士学位论文全文数据库 前5条
1 徐昕;增强学习及其在移动机器人导航与控制中的应用研究[D];国防科学技术大学;2002年
2 薄涛;格斗空战行为建模技术研究[D];国防科学技术大学;2002年
3 李家军;信用风险控制及其博弈分析[D];西北工业大学;2005年
4 樊建;基于增强学习和ART2神经网络的移动机器人路径规划研究[D];上海大学;2006年
5 张庶萍;竞争环境下的广告策略研究[D];天津大学;2005年
中国硕士学位论文全文数据库 前10条
1 罗宁泉;增强学习在共面双机空战格斗中的应用[D];沈阳工业大学;2003年
2 孙光余;强化学习及其在空中拦截中的应用[D];沈阳工业大学;2004年
3 毛赤龙;“2对2”多阶段规范交战模式研究[D];国防科学技术大学;2003年
4 古平;基于电子交易市场的撮合模型研究[D];重庆大学;2002年
5 彭维;城市交通信号智能控制方法研究[D];吉林大学;2007年
6 王正波;纵向联合促销的微分对策分析及其商务政策制定[D];重庆大学;2005年
7 田晓薇;基于寡头竞争结构的移动通信市场广告博弈策略研究[D];天津大学;2004年
8 刘玉霞;基于微分对策论的供应链广告模型[D];西北工业大学;2006年
9 程丽媛;自由飞行空域中多机冲突探测与解脱技术研究[D];南京航空航天大学;2005年
10 徐鸣;空空导弹智能化制导律和三维动画仿真研究[D];南京航空航天大学;2006年
关于知网|版权声明|学术会议服务|广告服务|在线咨询
京ICP证040431号互联网出版许可证新出网证(京)字008号北京市公安局海淀分局备案号:110 1081725
订购咨询热线:800-810-6613、010-62985026免费送卡上门
主办:清华大学
数字出版:中国学术期刊电子杂志社
在线发行:同方知网(北京)技术有限公司
关 闭
关 闭
关 闭