收藏本站
收藏 | 论文排版

基于深度强化学习的干扰决策技术研究

李永锋  
【摘要】:在现代战场上,随着雷达体制的改变,雷达工作模式的增多和雷达抗干扰能力的增强,战场环境变得更为复杂。干扰方根据侦察的雷达信号实时判断雷达工作模式的难度提升。针对雷达的任意一种工作模式,干扰方可以选择多种干扰样式对其进行干扰。传统干扰决策方法依靠经验或模板匹配选取干扰样式,不能保证选择的干扰样式是最优的。为了提高复杂电磁环境下干扰决策的性能,提出了基于监督抽样的深度强化学习干扰决策方法。本文主要研究了基于深度强化学习的干扰决策技术,建立基于深度强化学习的干扰决策模型,在识别雷达工作模式的基础上,分别研究了基于深度Q学习(Deep Q-network,DQN)的干扰决策方法及其改进方法以及基于深度双Q网络(Double Deep Q-network,DDQN)的干扰决策方法及其改进方法。仿真结果显示本文的方法具有更好的决策性能。论文的主要研究工作如下:1.分析了雷达干扰决策的过程,提出基于深度强化学习的干扰决策模型。分别分析了深度强化学习干扰决策模型里雷达常用的工作模式以及干扰方可采取的干扰样式。研究了干扰方实施干扰后获得的干扰收益并重点讨论了计算干扰收益的方法。2.分析了常用的雷达信号特征参数,根据雷达工作模式的特点,选择差异大的信号特征,并对选取的信号特征建模。探讨了几种常用的雷达工作模式识别方法及其识别雷达工作模式的过程。研究了基于反向传播(Back Propagation,BP)神经网络识别雷达工作模式的过程并构建了基于BP神经网络的雷达工作模式识别模型。最后进行仿真实验,对比不同方法的识别效果。仿真结果表明基于BP神经网络的工作模式识别方法受参数测量误差的影响较小,并且正确率高。3.分析了DQN决策算法决策的基础过程——马尔科夫决策过程、算法基本原理和模型。探讨了基于DQN的干扰决策原理,给出了基于DQN的干扰决策步骤。针对DQN算法由随机抽样导致的训练样本不均衡问题,提出了监督抽样的方法,并研究了基于监督抽样的DQN干扰决策方法。最后进行仿真实验,仿真验证了DQN及其改进方法的决策性能。4.分析了DDQN决策算法模型以及基于DDQN的干扰决策原理,给出了基于DDQN的干扰决策步骤。针对DDQN算法中由随机抽样导致的训练样本不均衡问题,采用本文提出的监督抽样方法进行改进,研究了基于监督抽样的DDQN干扰决策方法。最后进行仿真实验,仿真验证了DDQN及其改进方法决策的有效性,并对比了DQN及其改进方法与DDQN及其改进方法的决策性能。


知网文化
【相似文献】
中国期刊全文数据库 前19条
1 李圣衍;郭波;;基本间歇采样干扰样式应用研究[J];航天电子对抗;2015年06期
2 陈洁;钟子发;刘松;;TDMA数字移动通信系统最佳干扰样式研究[J];舰船电子对抗;2008年03期
3 杨小明;陶然;;直接序列扩频通信系统中干扰样式的自动识别[J];兵工学报;2008年09期
4 任丽莉;陈伟衡;刘广君;;基于System Generator的干扰模块设计[J];舰船电子对抗;2021年01期
5 任天鹏;张尔扬;;OFDM解调器在若干干扰样式下的性能分析[J];电子信息对抗技术;2006年06期
6 彭世蕤;朱宾刚;苏元伟;;Link4A数据链压制干扰效果分析[J];现代防御技术;2009年06期
7 张崔永;赵风东;杨志祥;;新型干扰样式对某型雷达干扰效果研究[J];雷达科学与技术;2013年03期
8 吕亚昆;吴彦鸿;;低截获概率雷达自适应干扰及关键技术[J];电子信息对抗技术;2017年05期
9 邵微笑;游福初;王森;李亮;;导前与灵巧噪声组合干扰样式研究[J];舰船电子对抗;2015年06期
10 朱宾刚;彭世蕤;;Link4A干扰效能分析[J];舰船电子对抗;2010年01期
11 王星,王红卫,李彬;地面反射欺骗式干扰[J];电讯技术;2004年04期
12 刘志杰;米辉波;;扩频/跳频通信电台的干扰样式研究[J];无线电工程;1988年05期
13 吕卫华;徐大专;;弹载数据链抗干扰性能分析[J];南京航空航天大学学报;2015年03期
14 徐鹏;王振华;刘东青;;移频调制的非均匀重复转发干扰样式[J];现代防御技术;2019年03期
15 邹猛;对合成孔径雷达的干扰样式及功率分析[J];电子对抗技术;2005年06期
16 徐海全;王国宏;关成斌;;基于模糊综合评判的压制干扰样式的鉴别方法[J];电光与控制;2011年12期
17 孟祥航;杨巍;邢强;;基于SVM的干扰样式选择[J];航天电子对抗;2018年05期
18 李圣衍;郭波;;SMSP干扰样式改进及效果分析[J];航天电子对抗;2016年06期
19 谭铭;王春阳;李欣;;基于间歇采样的正弦加权调频干扰研究[J];计算机仿真;2016年08期
中国重要会议论文全文数据库 前20条
1 朱莹;王金广;高其娜;徐玉虎;;雷达干扰技术建模与仿真研究的现状和发展[A];'2010系统仿真技术及其应用学术会议论文集[C];2010年
2 郭磊;;间歇采样转发对脉压雷达的干扰效能评估[A];2011年通信与信息技术新进展——第八届中国通信学会学术年会论文集[C];2011年
3 张智光;;离散与连续混合多变量随机决策方法及其在水环境—经济系统中的应用[A];全国青年管理科学与系统科学论文集(第1卷)[C];1991年
4 吕瑞华;张世英;;复杂系统多层局势决策方法研究[A];2003年中国管理科学学术会议论文集[C];2003年
5 张文博;陈希;;数据驱动下的个性化智能辅助诊疗决策方法[A];第十五届(2020)中国管理学年会论文集[C];2020年
6 刘殿国;徐兵;;可拓决策方法的探讨[A];管理科学与系统科学进展——全国青年管理科学与系统科学论文集(第4卷)[C];1997年
7 马良;;集对分析模型下的群组决策方法[A];1996中国控制与决策学术年会论文集[C];1996年
8 王全鹏;吴斌;刘敏;;综合评价及决策方法在特殊群体选拔中的应用[A];决策科学与评价——中国系统工程学会决策科学专业委员会第八届学术年会论文集[C];2009年
9 朱新河;严志军;严立;;设备润滑管理模式及其决策方法研究[A];第五届设备管理第八届设备润滑与液压学术会议论文集——《设备管理设备润滑与液压技术》[C];2004年
10 许国志;刘豹;陈珽;顾基发;;序言[A];科学决策与系统工程——中国系统工程学会第六次年会论文集[C];1990年
11 武刚;冯玉强;;基于粗糙案例推理在线自我学习决策方法[A];第八届中国管理科学学术年会论文集[C];2006年
12 王坚强;;信息不完全确定的大群体多准则语言决策方法[A];2009中国控制与决策会议论文集(2)[C];2009年
13 夏洪胜;张素娟;;下层多人分散独立的两层多目标决策问题的交互式决策方法[A];1995中国控制与决策学术年会论文集[C];1995年
14 王少华;徐隆洋;梅勇飞;李宝余;;装备机动抢修路线决策方法研究[A];OSEC首届兵器工程大会论文集[C];2017年
15 夏洪胜;贺建勋;;一种全局搜索决策方法[A];1993中国控制与决策学术年会论文集[C];1993年
16 ;第八章 决策方法的选择及其应用[A];21世纪数量经济学(第2卷)[C];2001年
17 陈琳;耿小兵;李青松;;放射性污染区修复决策方法研究[A];第十七届全国核电子学与核探测技术学术年会论文集[C];2014年
18 申晓留;杨京京;郭瑞鹏;;基于预案的应急决策方法研究[A];全国第九届企业信息化与工业工程学术会议论文集[C];2005年
19 陶菊春;;组合投资的一种实用目标决策方法[A];系统工程与可持续发展战略——中国系统工程学会第十届年会论文集[C];1998年
20 高玉波;;传统BORDA数决策方法的几点改进[A];跨世纪的中国企业改革和发展理论与实践研讨会论文集[C];1999年
中国博士学位论文全文数据库 前7条
1 孟悦;基于多维特征参数的设备预诊及维护决策方法研究[D];哈尔滨工业大学;2018年
2 陈希;双边匹配决策方法研究[D];东北大学;2010年
3 刘树利;模糊多属性行为决策方法及其商务推荐应用[D];东南大学;2017年
4 李永海;基于相似案例分析的决策方法与应用研究[D];东北大学;2014年
5 何祥坤;自动驾驶汽车紧急避撞系统的运动控制与决策方法研究[D];清华大学;2018年
6 柳向;对组网雷达的协同干扰技术研究[D];国防科技大学;2019年
7 李荣波;梯级电站优化调度与负荷调整模型及决策方法研究[D];华北电力大学(北京);2017年
中国硕士学位论文全文数据库 前20条
1 李永锋;基于深度强化学习的干扰决策技术研究[D];西安电子科技大学;2020年
2 李越;通信干扰样式识别与参数估计算法研究[D];西安电子科技大学;2019年
3 徐天宇;单/多载波数字调制信号的最佳干扰样式研究[D];哈尔滨工程大学;2018年
4 秦怡;GPS非平稳干扰样式研究与实现[D];西安电子科技大学;2007年
5 童煊;多用户卫星处理转发器的干扰研究[D];西安电子科技大学;2007年
6 肖聪;无线电信号压制性干扰研究与验证[D];电子科技大学;2010年
7 陈凯;对相控阵雷达的智能干扰决策技术研究[D];西安电子科技大学;2012年
8 石熠;直接序列扩频通信系统的干扰研究[D];西安电子科技大学;2011年
9 郭琳;线性调频雷达的干扰技术及其实现[D];复旦大学;2012年
10 高大容;对MIMO雷达的干扰技术研究[D];西安电子科技大学;2015年
11 陈辉;雷达干扰辅助决策研究[D];西安电子科技大学;2014年
12 江舸;针对末制导雷达干扰的干扰样式研究[D];电子科技大学;2007年
13 靳学明;对合成孔径雷达干扰技术研究[D];电子科技大学;2012年
14 李晓东;现代雷达干扰技术研究[D];电子科技大学;2011年
15 周脉成;基于博弈论的雷达干扰决策技术研究[D];西安电子科技大学;2014年
16 杜富强;电子对抗与反对抗策略研究[D];西安电子科技大学;2017年
17 黄帅;基于语言评价的满意双边匹配决策方法[D];广西大学;2015年
18 杨旋;对机载多功能雷达的干扰样式研究[D];中国舰船研究院;2012年
19 李世豪;复杂空战环境下基于博弈模型的无人机机动决策方法研究[D];南京航空航天大学;2019年
20 寇馨月;基于自信模糊偏好关系的双边匹配决策方法[D];大连理工大学;2019年
中国重要报纸全文数据库 前5条
1 潘传宝;略论领导决策方法[N];中国航空报;2002年
2 高立法;债券投资的决策方法[N];财会信报;2006年
3 刘宁;多重目标:关于现代决策方法的思考[N];学习时报;2006年
4 缪志聪;“教给学生思考和决策方法”[N];江苏教育报;2010年
5 柴琨琦;雷达干扰技术:毫秒间的识别与欺骗[N];中国航天报;2019年
 快捷付款方式  订购知网充值卡  订购热线  帮助中心
  • 400-819-9993
  • 010-62982499
  • 010-62783978