関係強化学習によるゴール指向性推論の学習

伊藤　秀昭; 福本　尚生; 和久屋　寛; 古川　達也

首页> 外文期刊>電子情報通信学会技術研究報告 >関係強化学習によるゴール指向性推論の学習

【24h】

関係強化学習によるゴール指向性推論の学習

机译：通过关系强化学习来学习目标导向的推理

获取原文

获取原文并翻译 | 示例

掌桥外文数据库（机构版） >>

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

ゴール指向性推論とは，あるゴールへ到達したいがその方法が不明であるというときに，到達可能なサブゴールを経由することによってゴールへ到達する方法を導出する推論であり，単純であるが，様々な問題解決において有効である．本論文では，このゴール指向性推論を行う方法を学習するエージェントを述語論理と強化学習を組み合わせた関係強化学習という手法を用いて設計した試みについて報告する．特に，ある時点で得られた情報をメモリに記憶させておき，後にそれを使用するというような行動を学習させる際に，勾配法を使用すると困難が生じる場合があることを報告する．%Goal-directed reasoning is a type of reasoning in which an agent, who does not know how to achieve its goal, infers the way to achieve the goal by setting an achievable subgoal from which the ultimate goal can be achieved. This type of reasoning is simple yet useful in many problem-solving situations. In this paper, we use a relational reinforcement learning method, which is a combination of predicate logic and reinforcement learning, to make an agent who learns through experience the algorithm to perform the goal-directed reasoning. Especially, we report some difficulty in the use of gradient methods when learning an algorithm that involves storing some information into memory and using the stored information after a period of time.

机译：目标导向的推理是一种推理，它通过经过一个子目标来达到目标的方法，当需要达到目标但方法未知时，可以达到该目标。它对解决各种问题有效。在本文中，我们报告了尝试设计一种代理的尝试，该代理使用称为谓语的逻辑将强化逻辑与强化学习相结合，从而学习如何执行目标导向的推理。特别是，我们报告说，很难使用梯度方法将在特定点上获得的信息存储在内存中，并难以学习以后使用它的行为。目标导向的推理是一种推理，其中不知道如何实现其目标的主体通过设定可实现的最终目标来推断实现目标的方式。从该目标可以实现最终目标。这是否在很多问题解决情况下有用。在本文中，我们使用关系强化学习方法，将谓词逻辑和强化学习相结合，使一个通过经验学习的智能体执行目标导向的算法。特别是，当学习一种算法时，我们会报告使用梯度法的一些困难，该算法涉及将一些信息存储到内存中并在一段时间后使用所存储的信息。

著录项

来源
《電子情報通信学会技術研究報告》 |2010年第301期|p.1-6|共6页
作者
伊藤　秀昭; 福本　尚生; 和久屋　寛; 古川　達也;
展开▼
作者单位

佐賀大学大学院工学系研究科　〒840-8502　佐賀市本庄町1番地;

佐賀大学大学院工学系研究科　〒840-8502　佐賀市本庄町1番地;

佐賀大学大学院工学系研究科　〒840-8502　佐賀市本庄町1番地;

佐賀大学大学院工学系研究科　〒840-8502　佐賀市本庄町1番地;

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类
关键词
ゴール指向性推論; 関係強化学習; 述語論理;

机译：面向目标的推理;关系强化学习;谓词逻辑;
入库时间 2022-08-18 00:34:20

相似文献

外文文献
中文文献
专利

1. 関係強化学習によるゴール指向性推論の学習 [J] . 伊藤秀昭, 福本尚生, 和久屋寛, 電子情報通信学会技術研究報告. 人工知能と知識処理. Artificial Intelligence and Knowledge Based Processing . 2010,第301期

机译：通过关系加强学习来学习目标导向的推理
2. 関係強化学習によるゴール指向性推論の学習 [J] . 伊藤秀昭, 福本尚生, 和久屋寛, 電子情報通信学会技術研究報告. 人工知能と知識処理. Artificial Intelligence and Knowledge Based Processing . 2010,第301期

机译：通过关系强化学习学习面向目标的推理
3. 地域エネルギーシステムの最適化における学習的探索手法と機械学習の複合ァルゴリズムの開発第2報建物間熱融通システムの運用最適化における強化学習との比較 [J] . 池田伸太郎, 大岡龍三空気調和·衛生工学会論文集 . 2018,第254期

机译：研究搜索方法和机器学习相结合的算法在区域能源系统优化中的发展（第二次报告）与强化学习在建筑物之间换热系统运行优化中的比较。
4. 温度付き強化学習の学習パラメー夕における学習特性に関する研究: 学習の収束性、状態空間構成の特性 [C] . 澤田　務, 巿川　純章, 原　文雄日本ロボット学会学術講演会 . 2000

机译：热强化学习的学习参数中的学习特征研究：学习的收敛性，状态空间组成的特征
5. モデルベース深層強化学習におけるタスク依存の中間表現を用いた環境遷移モデルの学習利用統計を見る [D] . 水谷陽太 2019

机译：在基于模型的深度强化学习中查看使用任务相关中间表示的环境过渡模型的学习使用情况统计信息
6. 人間の挙動再現に向けた強化学習エージェントモデルによる学習時間短縮 [O] . 八町康世 2016

机译：通过强化学习代理模型减少学习时间以重现人类行为

関係強化学習によるゴール指向性推論の学習

摘要

著录项

相似文献

相关主题

期刊订阅