首页> 中文期刊>电气自动化 >基于指导轨迹加速的机械臂强化学习运动规划

基于指导轨迹加速的机械臂强化学习运动规划

     

摘要

针对深度强化学习运动规划器训练速度慢的问题,基于软动作-评论家强化学习算法,研究了指导轨迹和奖励函数设计对运动规划成功率和收敛速度的影响。结果表明,在密集奖励函数的情况下,指导轨迹加快了训练速度,但对成功率的影响较小,在稀疏奖励的情况下只有使用指导轨迹才可以收敛。试验验证密集奖励函数和指导轨迹对强化学习运动规划器的训练效果提升起了重要作用。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号