声明
第一章 绪论
1.1 论文研究背景及意义
1.2 国内外研究现状
1.2.1 数据链抗干扰技术研究现状
1.2.2 强化学习研究现状
1.2.3 航路规划研究现状
1.3 研究内容及章节安排
1.3.1 主要研究内容
1.3.2 论文章节安排
第二章 相关理论
2.1 数据链抗干扰技术
2.1.1 RS码和交织
2.1.2 扩频
2.2 强化学习
2.2.1 基本原理
2.2.2 无模型的强化学习方法
2.2.3 Actor-Critic
2.3 深度强化学习
2.3.1 深度学习
2.3.2 深度确定性策略梯度
2.4 博弈论
2.4.1 博弈论基本概念及分类
2.4.2 纳什均衡
2.5 本章小结
第三章 固定干扰源环境中的自适应抗干扰策略
3.1 问题描述
3.2 固定干扰源环境下抗干扰模型
3.2.1 系统模型
3.2.2 状态、动作及环境定义
3.2.3 奖赏函数和值函数设定
3.3 固定干扰源环境下自适应抗干扰算法设计
3.3.1 贝叶斯-斯坦伯格功率博弈
3.3.2 基于DDPG的算法网络结构
3.3.3 基于DDPG的自适应航路优化算法
3.3.4 奖赏塑形
3.4 仿真与分析
3.4.1 可视化分析
3.4.2 收敛性和有效性分析
3.5 本章小结
第四章 移动干扰源环境中的动态自适应抗干扰策略
4.1 问题描述
4.2 元学习
4.3 移动干扰源环境下抗干扰模型
4.3.1 系统模型
4.3.2 基本要素定义
4.3.3 环境定义
4.4 基于MAML的动态自适应航路优化算法
4.4.1 MAML算法
4.4.2 动态自适应航路优化算法
4.4.3 策略优化
4.4.4 动态抗干扰网络
4.5 仿真及结果分析
4.5.1 基本模型的收敛性分析
4.5.2 动态环境下的适应性分析
4.6 本章小结
第五章 总结与展望
5.1 本文工作总结
5.2 主要创新点
5.3 下一步工作展望
致谢
参考文献
作者在学期间取得的学术成果
国防科学技术大学国防科技大学;