基于增量式发育深度强化学习的无人机路径规划

杨秀霞; 王晨蕾; 张毅; 于浩; 姜子劼

首页> 中文期刊> 《飞行力学》 >基于增量式发育深度强化学习的无人机路径规划

基于增量式发育深度强化学习的无人机路径规划

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

为了克服深度强化学习训练时间长、收敛速度慢的问题,针对密集动态障碍环境下的无人机(UAV)路径规划,引入了增量式发育知识库,对深度确定性策略梯度(Deep Deterministic Policy Gradient,DDPG)算法进行改进。首先,根据模糊匹配的思想建立威胁模式知识库,将飞行过程中遇到的密集动态障碍作为知识进行增量式存储,避免对相似障碍环境的重复训练。其次,在底层DDPG算法规划安全航路的基础上构建避障策略知识库,根据威胁模式直接输出避障策略,缩短训练时间。最后,搭建发育式的威胁-避障映射关系,实现“线上实时避障,线下自主寻优”,不断提升UAV避障性能。对比实验结果表明,所提方法能极大提高DDPG训练效率,满足UAV在密集动态障碍环境中实时避障的需求。

著录项

来源
《飞行力学》 |2023年第3期|40-46|共7页
作者
杨秀霞; 王晨蕾; 张毅; 于浩; 姜子劼;
展开▼
作者单位

海军航空大学;

山东烟台264000;

展开▼
原文格式 PDF
正文语种 chi
中图分类无人驾驶飞机;自动控制、自动控制系统;
关键词
无人机; DDPG算法; 增量式发育知识库; 避障;

相似文献

中文文献
外文文献
专利

1. 基于多智能体深度强化学习的无人机路径规划 [J] . 司鹏搏 ,吴兵 ,杨睿哲 . 北京工业大学学报 . 2023,第4期
2. 基于深度强化学习的无人机区域覆盖路径规划研究 [J] . 董加鑫 . 工业控制计算机 . 2021,第5期
3. 基于深度强化学习的无人机数据采集和路径规划研究 [J] . 牟治宇 ,张煜 ,范典 . 物联网学报 . 2020,第3期
4. 基于强化学习布谷鸟搜索算法的应急无人机路径规划 [J] . 骆文冠 ,于小兵 . 灾害学 . 2023,第2期
5. 基于逆向强化学习的无人机路径规划 [J] . 杨秀霞 ,王晨蕾 ,张毅 . 电光与控制 . 2023,第8期
6. 基于Q强化学习与CMAC的移动机器人局部路径规划 [C] . 王仲民 ,天津工程师范学院 ,岳宏 . 第二十四届中国控制会议 . 2005

基于增量式发育深度强化学习的无人机路径规划

摘要

著录项

相似文献

相关主题

期刊订阅