首页> 外文会议> >Trading off perception with internal state: reinforcement learning and analysis of Q-Elman networks in a Markovian task

【24h】

Trading off perception with internal state: reinforcement learning and analysis of Q-Elman networks in a Markovian task

机译：权衡内部状态的感知：在马尔可夫任务中强化学习和Q-Elman网络分析

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

A Markovian reinforcement learning task can be dealt with by learning a direct mapping from states to actions or values, or from state-action pairs to values. However, this may involve a difficult pattern recognition problem when the state space is large. This paper shows that using internal state, called "supportive state", may alleviate this problem presenting an argument against the tendency to almost automatically use a direct mapping when the task is Markovian. This point is demonstrated in simulation experiments of an agent controlled by a neural network capable of learning the strategy of direct mapping as well as internal state, combining Q(/spl lambda/) learning and recurrent neural networks in a new way. The trade-off between the two strategies is investigated in more detail, focusing particularly on border cases.

机译：马尔可夫强化学习任务可以通过学习从状态到动作或值或从状态-动作对到值的直接映射来处理。但是，当状态空间很大时，这可能会涉及一个困难的模式识别问题。本文显示，使用内部状态（称为“支持状态”）可以缓解此问题，并提出反对在任务为Markovian时几乎自动使用直接映射的趋势的论点。在由神经网络控制的代理的模拟实验中证明了这一点，该代理能够学习直接映射策略以及内部状态，并以新的方式结合了Q（/ spl lambda /）学习和递归神经网络。对两种策略之间的权衡进行了更详细的研究，特别是针对边境案件。

著录项

来源
《》|2000年|P.213-218|共6页
会议地点
作者
Bakker; B.; van der Voort van der Kleif; G.;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类无线电电子学、电信技术;
关键词

相似文献

外文文献
中文文献
专利

1. Task Learning Over Multi-Day Recording via Internally Rewarded Reinforcement Learning Based Brain Machine Interfaces [J] . Shen Xiang, Zhang Xiang, Huang Yifan, IEEE transactions on neural systems and rehabilitation engineering . 2020,第12期

机译：通过基于内部奖励加强学习的脑机接口，任务学习多日录制
2. Classic Hebbian learning endows feed-forward networks with sufficient adaptability in challenging reinforcement learning tasks. [J] . Thomas F Burns Journal of Neurophysiology . 2021,第6期

机译：经典的Hebbian学习在挑战加强学习任务中具有足够的适应性，赋予前锋网络。
3. Totally model-free actor-critic recurrent neural-network reinforcement learning in non-Markovian domains [J] . Mizutani Eiji, Dreyfus Stuart Annals of Operations Research . 2017,第1期

机译：非马尔可夫域中的完全无模型的actor-critic递归神经网络强化学习
4. Trading off perception with internal state: reinforcement learning and analysis of Q-Elman networks in a Markovian task [C] . Bram Bakker, Gwendid van der Voort van der Kleij IEEE-INNS-ENNS International Joint Conference on Neural Networks . 2000

机译：与内部国家的贸易看法：马尔瓦夫任务中Q-Elman网络的加固学习和分析
5. A Reinforcement Learning-based Framework for Resource Allocation and Task Assignment in Mobile Edge Computing Networks [D] . Hsieh, Li-Tse. 2021

机译：基于加强学习的移动边缘计算网络中的资源分配和任务分配框架
6. Multi-Timescale Memory Dynamics Extend Task Repertoire in a Reinforcement Learning Network With Attention-Gated Memory [O] . Marco Martinolli, Wulfram Gerstner, Aditya Gilra 2018

机译：多时标记忆动力学在具有注意力门控记忆的强化学习网络中扩展任务库
7. Trading off Perception with Internal State: Reinforcement Learning and Analysis of Q-Elman Networks in a Markovian Task [O] . Bram Bakker Gwendid, Bram Bakker 2000

机译：用内部状态换取感知：强化学习和马尔可夫任务中的Q-Elman网络分析

Trading off perception with internal state: reinforcement learning and analysis of Q-Elman networks in a Markovian task

摘要

著录项

相似文献

相关主题

期刊订阅