【24h】

Developing Committee of Explorers for Reinforcement Learning Agents

机译:强化学习代理商探险勘探商发展委员会

获取原文

摘要

In this paper, we describe an architecture and algorithms for reinforcement learning using a population of exploration control units. The control units, collectively known as committee of explorers, allow a reinforcement-learning agent to act while learning by choosing actions to perform through a combination of value predictions of the individual committee members. We discuss reasons for using committee of explorers and use results of an empirical study to provide insights to the performance of the committee approach.
机译:在本文中,我们描述了一种使用探索控制单元群体的强化学习建筑和算法。 控制单元,统称为探险家委员会,允许加强学习代理通过选择通过各个委员会成员的价值预测的组合来进行的行动来进行行动。 我们讨论使用探险委员会委员会和使用实证研究结果的原因,为委员会方法的表现提供见解。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号