基于强化学习的多发导弹协同攻击智能制导律

陈中原; 韦文书; 陈万春

首页> 中文期刊> 《兵工学报》 >基于强化学习的多发导弹协同攻击智能制导律

基于强化学习的多发导弹协同攻击智能制导律

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

为实现多发导弹对目标的协同攻击,提升打击效能,提出一种基于深度确定性策略梯度下降神经网络的强化学习协同制导律.修正了基于线性交战动力学的剩余飞行时间估计方程,不再受小角度假设的约束,进而提高剩余飞行时间估计精度.以各弹的剩余飞行时间误差为协调变量,与各弹的剩余飞行距离一同作为强化学习算法的观测量.利用脱靶量和剩余飞行时间误差构造奖励函数,离线训练生成强化学习智能体.闭环制导过程中,强化学习智能体将实时生成可实现同时打击的制导指令.仿真结果表明:该强化学习制导律能够实现多发导弹对目标的同时攻击;与传统协同制导律相比,强化学习协同制导律的脱靶量较小,攻击时间误差也较小.

著录项

来源
《兵工学报》 |2021年第8期|1638-1647|共10页
作者
陈中原; 韦文书; 陈万春;
展开▼
作者单位

北京航空航天大学宇航学院北京100191;

中国运载火箭技术研究院北京100076;

北京航空航天大学宇航学院北京100191;

展开▼
原文格式 PDF
正文语种 chi
中图分类 TJ765.3+1;
关键词
导弹; 协同制导律; 同时攻击; 强化学习; 深度确定性策略梯度下降算法;

相似文献

中文文献
外文文献
专利

1. 多导弹系统协同攻击机动目标分布式制导律 [J] . 毛昱天 ,杨明 ,张锐 . 导航定位与授时 . 2018,第003期
2. 基于Agent的智能反舰导弹协同攻击仿真中的通信机制研究 [J] . 徐海峰 ,潘长鹏 ,徐微 . 计算机研究与发展 . 2006,第0z1期
3. 基于增强学习的空空导弹智能精确制导律研究 [J] . 卢超群 ,江加和 ,任章 . 战术导弹控制技术 . 2006,第004期
4. 智能反舰导弹武器系统协同攻击仿真研究 [J] . 潘长鹏 ,谭乐祖 ,姜青山 . 飞航导弹 . 2007,第1期
5. 智能反舰巡航导弹协同攻击效能评估 [J] . 吴福初 ,潘长鹏 ,刘卫东 . 战术导弹技术 . 2007,第4期
6. 基于Agent的智能反舰导弹协同攻击仿真中的通信机制研究 [C] . 徐海峰 ,潘长鹏 ,徐微 . 第一届Agent理论与应用学术会议 . 2006
7. 无人机攻防一体化智能火控系统与导弹智能化制导律研究 [A] . 俞卫树 . 2008

基于强化学习的多发导弹协同攻击智能制导律

摘要

著录项

相似文献

相关主题

期刊订阅