首页> 中文期刊> 《信息与控制》 >基于改进深度强化学习的无人机自主导航方法

基于改进深度强化学习的无人机自主导航方法

     

摘要

深度强化学习算法在实现无人机(unmanned aerial vehicle, UAV)导航任务的应用越来越广泛。然而,利用融合先验策略的训练过程中,由于其占比线性衰减,导致模型训练速度缓慢,导航成功率下降。针对以上问题,本文提出一种UAV导航算法。首先,搭建虚拟UAV环境模型,构造动作空间。其次,依据稀疏化思想,设计奖励函数,根据UAV的学习状态设计自适应衰减因子,改进不同学习状态下先验策略的比重,训练网络模型。最后,依据训练好的网络模型实现UAV导航决策。仿真结果显示,所提算法导航成功率稳定处于较高水平时的训练时间比原型算法缩短了大约20%,大幅度提升了网络训练效率,降低时间成本,同时由于先验策略比重更加贴合当时的学习能力,UAV导航质量与成功率也有了一定提高,为推动深度强化学习在UAV导航的实际应用提供了新的思路。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号