首页> 外文期刊>Neurocomputing >Deterministic generative adversarial imitation learning
【24h】

Deterministic generative adversarial imitation learning

机译:确定性生成对抗模仿学习

获取原文
获取原文并翻译 | 示例

摘要

This paper proposes a deterministic generative adversarial imitation learning method which allows the robot to implement the motion planning task rapidly by learning from the demonstration data without reward function. In our method, the deep deterministic policy gradient method is used as the generator for learning the action policy on the basis of discriminator, and the demonstration data is input into the generator to ensure its stability. Three experiments on the push and pick-and-place tasks are conducted in the gym robotic environment. Results show that the learning speed of our method is much faster than the stochastic generative adversarial imitation learning method, and it can effectively learn from the demonstration data in different states of the task with higher learning stability. The proposed method can complete the motion planning task without environmental reward quickly and improve the stability of the training process. (C) 2020 Elsevier B.V. All rights reserved.
机译:本文提出了一种确定性的生成对抗式模仿学习方法,该方法允许机器人通过从没有奖励功能的演示数据中学习来快速执行运动计划任务。在我们的方法中,使用深度确定性策略梯度法作为生成器,基于判别器学习动作策略,并将演示数据输入生成器以确保其稳定性。在健身房机器人环境中进行了关于推入和放置任务的三个实验。结果表明,我们的方法的学习速度比随机生成的对抗式模仿学习方法快得多,并且可以有效地从任务不同状态的演示数据中学习,具有较高的学习稳定性。所提出的方法可以快速完成运动计划任务,而无需环境奖励,可以提高训练过程的稳定性。 (C)2020 Elsevier B.V.保留所有权利。

著录项

  • 来源
    《Neurocomputing》 |2020年第may7期|60-69|共10页
  • 作者

  • 作者单位

    Beijing Univ Technol Fac Informat Technol Beijing 100124 Peoples R China|Beijing Key Lab Comp Intelligence & Intelligent S Beijing 100124 Peoples R China;

    Chinese Acad Sci Inst Automat Beijing 100190 Peoples R China;

  • 收录信息 美国《科学引文索引》(SCI);美国《工程索引》(EI);
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

    Robot learning; Imitation learning; Reinforcement learning; GAN; DGAIL;

    机译:机器人学习;模仿学习;强化学习;甘;戴高乐;

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号