首页> 中文学位 >基于多智能体强化学习的超视距空战决策方法研究
【6h】

基于多智能体强化学习的超视距空战决策方法研究

代理获取

目录

声明

主要符号使用说明

第一章 绪论

1.1 研究背景

1.1.1 现代空战

1.1.2 超视距空战

1.2 国内外研究现状

1.2.1 超视距空战理论研究现状

1.2.2 强化学习算法研究现状

1.3 研究内容与组织结构

1.3.1 论文研究内容

1.3.2 论文组织结构

第二章 超视距多机空战决策建模

2.1 引言

2.2 任务描述

2.3 超视距空战数学模型

2.3.1 空间威胁建模

2.3.2 基于POMDP的空战决策序列建模

2.3.3 基于非参量法的回报建模

2.4 本章小结

第三章 超视距多机空战决策方法

3.1 引言

3.2 MADDPG

3.2.1 场景应用

3.2.2 MADDPG原理

3.2.3 算法框架

3.3 面向超视距多机空战决策的算法设计

3.3.1面向超视距多机空战决策的探索策略设计

3.3.2 面向超视距多机空战决策的AC网络结构设计

3.3.3 基于MADDPG的超视距多机空战决策方法

3.4 本章小结

第四章 超视距多机空战仿真实验设计与分析

4.1 引言

4.2 实验环境

4.2.1 交互环境的搭建

4.2.2 Tensorflow框架搭建

4.3 空战态势评估回报模型可行性验证

4.3.1 回报模型可行性分析

4.3.2 实验设计

4.3.3 实验结果与分析

4.4 面向超视距多机空战决策方法的有效性验证

4.4.1 实验设计

4.4.2 实验结果与分析

4.5 本章小节

第五章 总结与展望

5.1 论文工作总结

5.2 未来工作展望

致谢

参考文献

作者在学期间取得的学术成果

展开▼

著录项

  • 作者

    袁唯淋;

  • 作者单位

    国防科学技术大学国防科技大学;

  • 授予单位 国防科学技术大学国防科技大学;
  • 学科 控制科学与工程
  • 授予学位 硕士
  • 导师姓名 潘亮;
  • 年度 2018
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 TP1V44;
  • 关键词

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号