A pulse neural network reinforcement learning algorithm for partially observable Markov decision process

Koichiro Takita; Masafumi Hagiwara

首页> 外文期刊>電子情報通信学会技術研究報告. ニュ-ロコンピュ-ティング. Neurocomputing >A pulse neural network reinforcement learning algorithm for partially observable Markov decision process

【24h】

A pulse neural network reinforcement learning algorithm for partially observable Markov decision process

机译：一种脉冲神经网络加固学习算法，用于部分观察到的马尔可夫决策过程

获取原文

获取原文并翻译 | 示例

获取外文期刊封面封底 >>

开具论文收录证明 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

In this paper, we propose a new pulse neural network model and its reinforcement learning algorithm. The network is a feed-forward network with two hidden layers. The first hidden layer consists of pulse neurons with low decay rate of internal state, and the second layer consists of pulse neurons with high decay rate. The main purpose of this model is to utilize pulse neurons' ability for handling sequential input in partially observable Markov decision process. Its performance is confirmed by two kinds of computer simulations.

机译：在本文中，我们提出了一种新的脉冲神经网络模型及其加强学习算法。该网络是具有两个隐藏层的前馈网络。第一隐藏层由脉冲神经元组成，脉冲神经元具有低衰减率的内部状态，第二层由具有高衰减率高的脉冲神经元组成。该模型的主要目的是利用脉冲神经元对部分观察到的马尔可夫决策过程处理顺序输入的能力。其性能由两种计算机模拟确认。

著录项

来源
《電子情報通信学会技術研究報告. ニュ-ロコンピュ-ティング. Neurocomputing》 |2001年第735期|共8页
作者
Koichiro Takita; Masafumi Hagiwara;
展开▼
作者单位

展开▼
收录信息
原文格式 PDF
正文语种 jpn
中图分类人工智能理论;
关键词
Pulse neural network; Reinforcement learning; Partially observable Markov decision process;

机译：脉冲神经网络;钢筋学习;部分可观察的马尔可夫决策过程;

相似文献

外文文献
中文文献
专利

1. A Pulse Neural Network Reinforcement Learning Algorithm for Partially Observable Markov Decision Processes [J] . Koichiro Takita, Masafumi Hagiwara Systems and Computers in Japan . 2005,第3期

机译：部分可观察的马尔可夫决策过程的脉冲神经网络强化学习算法
2. A pulse neural network reinforcement learning algorithm for partially observable Markov decision process [J] . Koichiro Takita, Masafumi Hagiwara 電子情報通信学会技術研究報告. ニュ-ロコンピュ-ティング. Neurocomputing . 2001,第735期

机译：局部可观察马尔可夫决策过程的脉冲神经网络强化学习算法
3. A pulse neural network reinforcement learning algorithm for partially observable Markov decision process [J] . Koichiro Takita, Masafumi Hagiwara 電子情報通信学会技術研究報告. ニュ-ロコンピュ-ティング. Neurocomputing . 2001,第735期

机译：一种脉冲神经网络加固学习算法，用于部分观察到的马尔可夫决策过程
4. A Memory-based Reinforcement Learning Algorithm for Partially Observable Markovian Decision Processes [C] . Lei Zheng, Siu-Yeung Cho, Chai Quek IEEE International Joint Conference on Neural Networks . 2008

机译：基于存储基于存储器的钢筋互动学习算法，用于部分观察到的Markovian决策过程
5. Increasing scalability in algorithms for centralized and decentralized partially observable Markov decision processes: Efficient decision-making and coordination in uncertain environments. [D] . Amato, Christopher. 2010

机译：用于集中式和分散式部分可观察的马尔可夫决策过程的算法中的可伸缩性不断增强：在不确定的环境中进行有效的决策和协调。
6. Decision Making Under Uncertainty: A Neural Model Based on Partially Observable Markov Decision Processes [O] . Rajesh P. N. Rao 2010

机译：不确定性下的决策：基于部分可观察的马尔可夫决策过程的神经模型
7. A New Method for Reinforcement Learning with Position Vector in Partially Observable Markov Decision Process [O] . Moriaki KIYOMOTO, Katsuari KAMEI 2001

机译：利用部分观察到的马尔可夫决策过程中衡量载体的钢筋学习的一种新方法
8. Cooperation and Coordination Between Fuzzy Reinforcement Learning Agents in Continuous State Partially Observable Markov Decision Processes [R] . Berenji, Hamid R., Vengerov, David 1999

机译：连续状态部分可观测马尔可夫决策过程中模糊强化学习agent的协作与协调

A pulse neural network reinforcement learning algorithm for partially observable Markov decision process

摘要

著录项

相似文献

相关主题

期刊订阅