首页> 外文会议>International Conference on Autonomous Agents and Multiagent Systems >Learning Behaviors from a Single Video Demonstration Using Human Feedback: Extended Abstract
【24h】

Learning Behaviors from a Single Video Demonstration Using Human Feedback: Extended Abstract

机译:使用人体反馈的单一视频演示学习行为:扩展摘要

获取原文

摘要

In this paper we present a method for learning from video demonstrations by using human feedback to construct a mapping between the internal state representation of the agent and the visual representation from the video. In this way, we leverage the advantages of both these representations, i.e., we learn the policy using agent centered state representations, but are able to specify the expected behavior using video demonstrations. We show the effectiveness of our method by teaching a hopper agent in the MuJoCo simulator to perform a backflip using a single video demonstration generated in MuJoCo as well as from a real-world YouTube video of a person performing a backflip.
机译:在本文中,我们通过使用人的反馈来介绍一种用于从视频演示学习的方法,以构造代理的内部状态表示与来自视频的视觉表示之间的映射。 通过这种方式,我们利用这些表示的优点,即,我们使用代理中心的状态表示来学习策略,但能够使用视频演示指定预期的行为。 我们通过在Mujoco模拟器中教导料斗代理来表现出方法的有效性,以使用Mujoco生成的单个视频演示以及从执行Backflip的人的真实世界的YouTube视频来执行Backflip。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号