首页> 外文期刊>電子情報通信学会技術研究報告. 非線形問題. Nonlinear Problems >Composition of Feature Space and State Space Dynamics Models for Model-based Reinforcement Learning
【24h】

Composition of Feature Space and State Space Dynamics Models for Model-based Reinforcement Learning

机译:基于模型的强化学习的特征空间和状态空间动力学模型的组成

获取原文
获取原文并翻译 | 示例
       

摘要

Learning a dynamics model and a reward model during reinforcement learning is a useful way, since the agent can also update its value function by using the models. In this paper, we propose a general dynamics model that is a composition of the feature space dynamics model and the state space dynamics model. This way enables to obtain a good generalization from a small number of samples because of the linearity of the state space dynamics, while it does not lose the accuracy. We demonstrate the simulation comparison of some dynamics models used together with a Dyna algorithm.
机译:在强化学习期间学习动力学模型和奖励模型是一种有用的方法,因为代理也可以通过使用模型来更新其价值函数。在本文中,我们提出了一个通用动力学模型,该模型由特征空间动力学模型和状态空间动力学模型组成。由于状态空间动力学的线性,这种方式能够从少量样本中获得良好的概括性,同时又不会失去准确性。我们演示了与Dyna算法一起使用的一些动力学模型的仿真比较。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号