首页> 中文学位 >基于多智能体强化学习的超视距空战决策方法研究

【6h】

基于多智能体强化学习的超视距空战决策方法研究

代理获取

页面导航

目录
著录项
相似文献
相关主题

目录

声明

主要符号使用说明

第一章绪论

1.1 研究背景

1.1.1 现代空战

1.1.2 超视距空战

1.2 国内外研究现状

1.2.1 超视距空战理论研究现状

1.2.2 强化学习算法研究现状

1.3 研究内容与组织结构

1.3.1 论文研究内容

1.3.2 论文组织结构

第二章超视距多机空战决策建模

2.1 引言

2.2 任务描述

2.3 超视距空战数学模型

2.3.1 空间威胁建模

2.3.2 基于POMDP的空战决策序列建模

2.3.3 基于非参量法的回报建模

2.4 本章小结

第三章超视距多机空战决策方法

3.1 引言

3.2 MADDPG

3.2.1 场景应用

3.2.2 MADDPG原理

3.2.3 算法框架

3.3 面向超视距多机空战决策的算法设计

3.3.1面向超视距多机空战决策的探索策略设计

3.3.2 面向超视距多机空战决策的AC网络结构设计

3.3.3 基于MADDPG的超视距多机空战决策方法

3.4 本章小结

第四章超视距多机空战仿真实验设计与分析

4.1 引言

4.2 实验环境

4.2.1 交互环境的搭建

4.2.2 Tensorflow框架搭建

4.3 空战态势评估回报模型可行性验证

4.3.1 回报模型可行性分析

4.3.2 实验设计

4.3.3 实验结果与分析

4.4 面向超视距多机空战决策方法的有效性验证

4.4.1 实验设计

4.4.2 实验结果与分析

4.5 本章小节

第五章总结与展望

5.1 论文工作总结

5.2 未来工作展望

致谢

参考文献

作者在学期间取得的学术成果

展开▼

著录项

作者
袁唯淋;
展开▼
作者单位

国防科学技术大学国防科技大学;

展开▼
授予单位国防科学技术大学国防科技大学;
学科控制科学与工程
授予学位硕士
导师姓名潘亮;
年度 2018
页码
总页数
原文格式 PDF
正文语种 chi
中图分类 TP1V44;
关键词

相似文献

中文文献
外文文献
专利

1. 基于Q-network强化学习的超视距空战机动决策 [J] . 张强 ,杨任农 ,俞利新 . 空军工程大学学报（自然科学版） . 2018,第006期
2. 基于随机森林强化学习的干扰智能决策方法研究 [J] . 裴绪芳 ,陈学强 ,吕丽刚 . 通信技术 . 2019,第009期
3. 强化学习算法在超视距空战辅助决策上的应用研究 [J] . 吴宜珈 ,赖俊 ,陈希亮 . 航空兵器 . 2021,第002期
4. 一种棋类计算机博弈强化学习智能体的决策依据解释方法 [J] . 刘贺 ,张小川 ,刁志东 . 重庆理工大学学报（自然科学版） . 2021,第012期
5. 一种棋类计算机博弈强化学习智能体的决策依据解释方法 [J] . 刘贺 ,张小川 ,刁志东 . 重庆理工大学学报 . 2021,第012期
6. 基于强化学习的智能体避障研究 [C] . YING Xiao-kun ,应小昆 ,PANG Yi . 第九届中国多智能体系统与控制会议（MASC2013） . 2014
7. 基于强化学习的游戏环境中智能体决策模型的设计研究 [A] . 王寻 . 2020

代理获取

客服邮箱：kefu@zhangqiaokeyan.com

京公网安备：11010802029741号 ICP备案号：京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有

客服微信
服务号