首页> 外文会议> >Real time learning control of high d.o.f. robots: automatic generation of discrete states and learning transition models
【24h】

Real time learning control of high d.o.f. robots: automatic generation of discrete states and learning transition models

机译:高d.o.f.的实时学习控制机器人:自动生成离散状态和学习过渡模型

获取原文

摘要

We present a model-based RL approach to cope with continuous space of high D.O.F. robots, combining model learning and an actor-critic method. The model learner generates a discrete state-transition model that helps improvement of both the policy and state-representation. In general, model-based methods tends to fail in non-Markovian problems, but the proposed method, using actor-critic, can find good policies in such environments.
机译:我们提出了一种基于模型的RL方法来应对高D.O.F的连续空间。机器人,结合了模型学习和演员批评方法。模型学习器生成离散状态转换模型,该模型有助于改善策略和状态表示。通常,基于模型的方法往往会在非马尔可夫问题中失败,但是所提出的方法(使用行为批评家)可以在这种环境中找到良好的策略。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号