基于强化学习的多无人机避碰计算制导方法

赵毓; 郭继峰; 郑红星; 白成超

首页> 中文期刊>导航定位与授时 >基于强化学习的多无人机避碰计算制导方法

基于强化学习的多无人机避碰计算制导方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对大量固定翼无人机在有限空域内的协同避碰问题,提出了一种基于多智能体深度强化学习的计算制导方法.首先,将避碰制导过程抽象为序列决策问题,通过马尔可夫博弈理论对其进行数学描述.然后提出了一种基于深度神经网络技术的自主避碰制导决策方法,该网络使用改进的Actor-Critic模型进行训练,设计了实现该方法的机器学习架构,并给出了相关神经网络结构和机间协调机制.最后建立了一个实体数量可变的飞行场景模拟器,在其中进行“集中训练”和“分布执行”.为了验证算法的性能,在高航路密度场景中进行了仿真实验.仿真结果表明,提出的在线计算制导方法能够有效地降低多无人机在飞行过程中的碰撞概率,且对高航路密度场景具有很好的适应性.

著录项

来源
《导航定位与授时》|2021年第1期|31-40|共10页
作者
赵毓; 郭继峰; 郑红星; 白成超;
展开▼
作者单位

哈尔滨工业大学航天学院哈尔滨150001;

哈尔滨工业大学航天学院哈尔滨150001;

哈尔滨工业大学航天学院哈尔滨150001;

哈尔滨工业大学航天学院哈尔滨150001;

展开▼
原文格式 PDF
正文语种 chi
中图分类飞行控制系统与导航;
关键词
多智能体; 强化学习; 计算制导; 固定翼; 避碰;

相似文献

中文文献
外文文献
专利

1. 规则约束下基于深度强化学习的船舶避碰方法 [J] . 周双林 ,杨星 ,刘克中 . 中国航海 . 2020,第003期
2. 基于强化学习的智能机器人避碰方法研究 [J] . 周鹏程 . 消费电子 . 2013,第018期
3. 基于tau矢量场制导的多无人机协同standoff跟踪方法 [J] . 杨祖强 ,方舟 ,李平 . 浙江大学学报（工学版） . 2016,第005期
4. 基于集合制导和动态窗口约束的无人船自主动态避碰方法研究 [J] . 陈天元 ,袁伟 ,俞孟蕻 . 中国造船 . 2020,第003期
5. 基于模型预测控制的多无人机避碰航迹规划研究 [J] . 李相民 ,薄宁 ,代进进 . 西北工业大学学报 . 2017,第003期
6. 某型导弹制导方法误差的积分计算方法 [C] . 蔡德和 . 中国宇航学会无人飞行器学会飞行试验系统工程专业委员会第七届学术年会 . 1997
7. 基于避碰规则与强化学习的船舶智能避碰决策研究 [A] . 冯涂超 . 2020

基于强化学习的多无人机避碰计算制导方法

摘要

著录项

相似文献

相关主题

期刊订阅