声明
主要符号使用说明
第一章 绪论
1.1 研究背景
1.1.1 现代空战
1.1.2 超视距空战
1.2 国内外研究现状
1.2.1 超视距空战理论研究现状
1.2.2 强化学习算法研究现状
1.3 研究内容与组织结构
1.3.1 论文研究内容
1.3.2 论文组织结构
第二章 超视距多机空战决策建模
2.1 引言
2.2 任务描述
2.3 超视距空战数学模型
2.3.1 空间威胁建模
2.3.2 基于POMDP的空战决策序列建模
2.3.3 基于非参量法的回报建模
2.4 本章小结
第三章 超视距多机空战决策方法
3.1 引言
3.2 MADDPG
3.2.1 场景应用
3.2.2 MADDPG原理
3.2.3 算法框架
3.3 面向超视距多机空战决策的算法设计
3.3.1面向超视距多机空战决策的探索策略设计
3.3.2 面向超视距多机空战决策的AC网络结构设计
3.3.3 基于MADDPG的超视距多机空战决策方法
3.4 本章小结
第四章 超视距多机空战仿真实验设计与分析
4.1 引言
4.2 实验环境
4.2.1 交互环境的搭建
4.2.2 Tensorflow框架搭建
4.3 空战态势评估回报模型可行性验证
4.3.1 回报模型可行性分析
4.3.2 实验设计
4.3.3 实验结果与分析
4.4 面向超视距多机空战决策方法的有效性验证
4.4.1 实验设计
4.4.2 实验结果与分析
4.5 本章小节
第五章 总结与展望
5.1 论文工作总结
5.2 未来工作展望
致谢
参考文献
作者在学期间取得的学术成果
国防科学技术大学国防科技大学;