首页> 外文期刊>Neurocomputing >Epoch-incremental Dyna-learning and prioritized sweeping algorithms
【24h】

Epoch-incremental Dyna-learning and prioritized sweeping algorithms

机译:历时增量动态学习和优先扫描算法

获取原文
获取原文并翻译 | 示例
       

摘要

Dyna-learning and prioritized sweeping (PS in short) are the most commonly used reinforcement learning algorithms which use the model of the environment. In this paper, the modified versions of these algorithms are presented. The modification exploits the breadth-first search (BFS) to conduct additional modifications of the policy in the epoch mode. The experiments, which are performed in the dynamic grid world and in the ball-beam system, showed that the proposed modifications improved the efficiency of the reinforcement learning algorithms. (c) 2018 Elsevier B.V. All rights reserved.
机译:动态学习和优先清扫(简称PS)是使用环境模型的最常用的强化学习算法。在本文中,提出了这些算法的修改版本。该修改利用广度优先搜索(BFS)在时代模式下对策略进行其他修改。在动态网格世界和球梁系统中进行的实验表明,所提出的修改提高了强化学习算法的效率。 (c)2018 Elsevier B.V.保留所有权利。

著录项

  • 来源
    《Neurocomputing》 |2018年第30期|13-20|共8页
  • 作者

    Zajdel Roman;

  • 作者单位
  • 收录信息 美国《科学引文索引》(SCI);美国《工程索引》(EI);
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号