首页> 外文期刊>電子情報通信学会技術研究報告 >関係強化学習によるゴール指向性推論の学習
【24h】

関係強化学習によるゴール指向性推論の学習

机译:通过关系强化学习来学习目标导向的推理

获取原文
获取原文并翻译 | 示例
       

摘要

ゴール指向性推論とは,あるゴールへ到達したいがその方法が不明であるというときに,到達可能なサブゴールを経由することによってゴールへ到達する方法を導出する推論であり,単純であるが,様々な問題解決において有効である.本論文では,このゴール指向性推論を行う方法を学習するエージェントを述語論理と強化学習を組み合わせた関係強化学習という手法を用いて設計した試みについて報告する.特に,ある時点で得られた情報をメモリに記憶させておき,後にそれを使用するというような行動を学習させる際に,勾配法を使用すると困難が生じる場合があることを報告する.%Goal-directed reasoning is a type of reasoning in which an agent, who does not know how to achieve its goal, infers the way to achieve the goal by setting an achievable subgoal from which the ultimate goal can be achieved. This type of reasoning is simple yet useful in many problem-solving situations. In this paper, we use a relational reinforcement learning method, which is a combination of predicate logic and reinforcement learning, to make an agent who learns through experience the algorithm to perform the goal-directed reasoning. Especially, we report some difficulty in the use of gradient methods when learning an algorithm that involves storing some information into memory and using the stored information after a period of time.
机译:目标导向的推理是一种推理,它通过经过一个子目标来达到目标​​的方法,当需要达到目标但方法未知时,可以达到该目标。它对解决各种问题有效。在本文中,我们报告了尝试设计一种代理的尝试,该代理使用称为谓语的逻辑将强化逻辑与强化学习相结合,从而学习如何执行目标导向的推理。特别是,我们报告说,很难使用梯度方法将在特定点上获得的信息存储在内存中,并难以学习以后使用它的行为。目标导向的推理是一种推理,其中不知道如何实现其目标的主体通过设定可实现的最终目标来推断实现目标的方式。从该目标可以实现最终目标。这是否在很多问题解决情况下有用。在本文中,我们使用关系强化学习方法,将谓词逻辑和强化学习相结合,使一个通过经验学习的智能体执行目标导向的算法。特别是,当学习一种算法时,我们会报告使用梯度法的一些困难,该算法涉及将一些信息存储到内存中并在一段时间后使用所存储的信息。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号