收藏本站
收藏 | 手机打开
二维码
手机客户端打开本文

增强学习在共面双机空战格斗中的应用

罗宁泉  
【摘要】: 微分对策作为解决追逃动态对策问题主要工具已经经历了近50年的发展,就其本身而言已经发展的相当成熟,但距实际应用还有一段距离。这主要是由于微分对策理论来源于最优控制理论,因此它需要精确的数学模型,以及在求解时会遇到非线性两点边值问题和奇异面问题。 近年来,随着人工智能的兴起,国内外许多学者致力于将智能控制理论引入微分对策理论的研究中。而要达到智能化制导就不可避免地涉及知识的自动提取和利用问题。作为机器学习的一种方法,增强学习恰可使知识的获取过程自动化,并扩展所能得到的知识资源范围。 本文研究了共面双机空战格斗的动态对策问题,采用增强学习与微分对策相结合的方法,避免了传统的控制理论根据被控对象的精确数学模型和性能指标来求解最优解析解的方法带来的困难。并依据人的模糊思维建立空战对策准则,实现状态空间的离散化以减小动作空间范围,提高网络学习效率。 本文针对传统增强学习中出现的“维数灾难”问题以及学习问题中的“Structure Credit-Assignment”问题采用BP神经网络近似Q-学习的评价函数的解决方法。 在仿真试验中考虑诸多实际因素,并采用了实际空气动力学参数,仿真结果验证本文所采用的方法的有效性,表明将增强学习与微分对策理论相结合,并应用于空战格斗问题中是—种有前途的发展方向。 本文首先分析双机格斗的重要性及其研究方法的发展,并给出设计方案的依据及总体框架。在第二章介绍了增强学习的特点、发展历史和各种算法。在第三章设计了基于Q-学习智能空战制导控制,并给出空战对策准则。在第四章对水平面双机空战格斗常、变速数学模型进行了仿真试验,对仿真结果作了分析。


知网文化
【相似文献】
中国期刊全文数据库 前20条
1 宋巍;进一步增强学习邓小平理论的自觉性[J];理论学习与探索;1998年05期
2 ;进一步增强学习邓小平理论的自觉性[J];冶金政工研究;1998年03期
3 ;增强学习邓小平理论的紧迫性[J];了望;1998年31期
4 王义宁,姜玉宪;空战决策中的智能微分对策法[J];飞行力学;2003年01期
5 曹选红;坚持四个结合 增强学习实效[J];西南民兵杂志;2003年12期
6 ;注重学习方法 增强学习吸引力[J];党政论坛;1998年11期
7 万少松,刘兴堂,严聪;双机空战效能评估的半实物仿真研究[J];空军工程大学学报(自然科学版);2000年04期
8 梁凤书;充分认识两个《条例》的重大意义 增强学习贯彻的自觉性[J];先锋队;2004年18期
9 龙玉平;;“优秀缺点”不光荣[J];当代广西;2005年19期
10 唐鹏;;领导干部要勤于学习善于学习[J];学习月刊;2007年10期
11 孙德才;;以灵活方法增强学习效果[J];华北民兵;2010年04期
12 宫秀玲;;良好风气学为先[J];思想政治工作研究;2007年06期
13 本刊编辑部;;刻苦学习 实现理想[J];中共银川市委党校学报;2008年01期
14 ;桂林:创新载体 增强学习感召力[J];当代广西;2010年08期
15 陶武先;弘扬求真务实之风 增强学习贯彻实效[J];求是;2004年15期
16 章新华;微分对策在舰艇规避中的应用[J];军事运筹与系统工程;1995年03期
17 ;搞好“四个结合” 增强学习效果[J];党员之友;1996年12期
18 李明亮;;建设“学习型党委”[J];华北民兵;2007年09期
19 张磊;;党委中心组要增强学习的理论含量[J];党建;2009年05期
20 向德忠;;增强学习型政党建设的紧迫感和针对性[J];学习月刊;2010年16期
中国重要会议论文全文数据库 前10条
1 雍炯敏;;数学金融学与微分对策(英文)[A];信息科学与微电子技术:中国科协第三届青年学术年会论文集[C];1998年
2 郑丕谔;李光泉;胡炬;;微分对策问题开环解的新算法[A];科学决策与系统工程——中国系统工程学会第六次年会论文集[C];1990年
3 徐哲;冯敏;姚正平;黄洪鹍;;分布式机器人中带协同的增强学习问题[A];马斯特杯2003年中国机器人大赛及研讨会论文集[C];2003年
4 唐万生;李光泉;;广义系统的微分对策问题[A];全国青年管理科学与系统科学论文集(第1卷)[C];1991年
5 蔡文澜;王俊生;陶军;徐惠斌;马宏绪;;一种PEGASUS策略梯度算法的理论及应用[A];中国仪器仪表学会第九届青年学术会议论文集[C];2007年
6 吴江;管晓宏;高峰;孙国基;;考虑风险的发电商优化报价学习模型[A];第二十四届中国控制会议论文集(下册)[C];2005年
7 姜玉宪;;微分对策的智能控制研究法[A];1994年中国控制会议论文集[C];1994年
8 许品刚;黄力伟;邵卫;;企业间竞争的微分对策模型及其解法[A];1997中国控制与决策学术年会论文集[C];1997年
9 王倩影;冯国灿;汤鑫;;δ-距离及其在半监督增强中的应用[A];第十五届全国图象图形学学术会议论文集[C];2010年
10 黄小原;钟麦英;;Nash均衡条件下的H_∞控制及其应用[A];1999中国控制与决策学术年会论文集[C];1999年
中国博士学位论文全文数据库 前10条
1 徐昕;增强学习及其在移动机器人导航与控制中的应用研究[D];国防科学技术大学;2002年
2 王珺;开环非合作微分对策及其在经济中的应用[D];吉林大学;2011年
3 张晶;中国房地产市场两类主从微分对策研究[D];重庆大学;2011年
4 王学宁;策略梯度增强学习的理论、算法及应用研究[D];国防科学技术大学;2006年
5 陈万米;小型足球机器人系统的实时控制及决策规划研究与实验[D];上海大学;2009年
6 肖华;部分信息下正倒向随机系统的最优控制和微分对策理论[D];山东大学;2011年
7 薄涛;格斗空战行为建模技术研究[D];国防科学技术大学;2002年
8 聂佳佳;基于微分对策的供应链合作广告策略[D];重庆大学;2009年
9 张建军;短销售周期供应链协调问题及其博弈分析[D];同济大学;2008年
10 徐自祥;微分对策理论及在作战指挥控制中的应用研究[D];西北工业大学;2006年
中国硕士学位论文全文数据库 前10条
1 罗宁泉;增强学习在共面双机空战格斗中的应用[D];沈阳工业大学;2003年
2 孙光余;强化学习及其在空中拦截中的应用[D];沈阳工业大学;2004年
3 宫瑞敏;基于增强学习的计算机博弈策略的研究与实现[D];沈阳理工大学;2011年
4 王晓光;基于微分对策理论的无人飞机空战建模及其仿真[D];沈阳航空航天大学;2012年
5 陈明银;基于对策信息结构不确定的二次型微分对策研究[D];电子科技大学;2010年
6 毛赤龙;“2对2”多阶段规范交战模式研究[D];国防科学技术大学;2003年
7 付宪法;寡头市场广告竞争微分对策模型研究[D];重庆大学;2010年
8 左磊;基于值函数逼近与状态空间分解的增强学习方法研究[D];国防科学技术大学;2011年
9 潘璐;基于增强学习的博弈主体的研究[D];沈阳工业大学;2007年
10 古平;基于电子交易市场的撮合模型研究[D];重庆大学;2002年
中国重要报纸全文数据库 前10条
1 本报记者 周爱玲;增强学习的趣味性[N];酒泉日报;2011年
2 湖南省社科院副院长、研究员 周小毛;增强学习的吸引力[N];湖南日报;2011年
3 河北总队政治部主任 王建明;向基层延伸 向实践拓展[N];人民武警;2008年
4 陈维旭 湖南总队;增强学习内动力[N];人民武警报;2011年
5 王艳梅(作者系崇阳县教育局党委书记、局长);强化学习动力 增强学习实效[N];咸宁日报;2005年
6 郭振勇 张宁;拓展学习平台 增强学习实效[N];解放军报;2010年
7 本报记者;联系实际增强学习针对性[N];哈尔滨日报;2007年
8 ;不断增强学习宣传贯彻活动的实效[N];深圳特区报;2007年
9 首席记者 高扬;增强学习能力 提高服务水平[N];牡丹江日报;2010年
10 记者 匡丽娜 张珂 实习生 刘飞川;切实增强学习的自觉性和紧迫感[N];重庆日报;2008年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978