首页> 外文期刊>journal of artificial general intelligence >Extending Environments to Measure Self-reflection in Reinforcement Learning
【24h】

Extending Environments to Measure Self-reflection in Reinforcement Learning

机译:扩展环境以衡量强化学习中的自我反思

获取原文
获取原文并翻译 | 示例
获取外文期刊封面目录资料

摘要

Abstract We consider an extended notion of reinforcement learning in which the environment can simulate the agent and base its outputs on the agent’s hypothetical behavior. Since good performance usually requires paying attention to whatever things the environment’s outputs are based on, we argue that for an agent to achieve on-average good performance across many such extended environments, it is necessary for the agent to self-reflect. Thus weighted-average performance over the space of all suitably well-behaved extended environments could be considered a way of measuring how self-reflective an agent is. We give examples of extended environments and introduce a simple transformation which experimentally seems to increase some standard RL agents’ performance in a certain type of extended environment.
机译:摘要 我们考虑了强化学习的扩展概念,其中环境可以模拟智能体,并将其输出基于智能体的假设行为。由于良好的性能通常需要关注环境输出所基于的任何内容,因此我们认为,对于智能体来说,要在许多此类扩展环境中实现平均良好的性能,智能体必须进行自我反思。因此,在所有适当表现良好的扩展环境中,加权平均性能可以被认为是衡量智能体自我反射程度的一种方式。我们给出了扩展环境的示例,并引入了一个简单的转换,该转换在实验上似乎提高了某些标准RL代理在某种类型的扩展环境中的性能。

著录项

  • 来源
    《journal of artificial general intelligence》 |2022年第1期|1-24|共24页
  • 作者

  • 作者单位

    The U.S. Securities and Exchange Commission;

    KX;

    InQTel;

  • 收录信息
  • 原文格式 PDF
  • 正文语种 英语
  • 中图分类
  • 关键词

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号