首页> 外文期刊>ACM Transactions on Graphics >Terrain-Adaptive Locomotion Skills Using Deep Reinforcement Learning
【24h】

Terrain-Adaptive Locomotion Skills Using Deep Reinforcement Learning

机译:使用深度强化学习的地形自适应运动技能

获取原文
获取原文并翻译 | 示例

摘要

Reinforcement learning offers a promising methodology for developingrnskills for simulated characters, but typically requires workingrnwith sparse hand-crafted features. Building on recent progress inrndeep reinforcement learning (DeepRL), we introduce a mixture ofrnactor-critic experts (MACE) approach that learns terrain-adaptiverndynamic locomotion skills using high-dimensional state and terrainrndescriptions as input, and parameterized leaps or steps as outputrnactions. MACE learns more quickly than a single actor-critic approachrnand results in actor-critic experts that exhibit specialization.rnAdditional elements of our solution that contribute towards efficientrnlearning include Boltzmann exploration and the use of initial actorrnbiases to encourage specialization. Results are demonstrated forrnmultiple planar characters and terrain classes.
机译:强化学习为开发模拟角色的技能提供了一种有前途的方法,但是通常需要使用稀疏的手工功能。在最近的深度强化学习(DeepRL)的基础上,我们引入了混合的批评者专家(MACE)方法,该方法使用高维状态和地形描述作为输入来学习适应地形的动态运动技能,并使用参数化的跳跃或台阶作为输出行为。 MACE的学习要比单一演员批评方法要快得多,并且可以使演员批评专家表现出专业化。我们解决方案中有助于有效学习的其他要素包括玻尔兹曼探索法和使用初始参与者偏见来鼓励专业化。结果证明了多个平面字符和地形类别。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号