...
首页> 外文期刊>電子情報通信学会技術研究報告. ニュ-ロコンピュ-ティング. Neurocomputing >A pulse neural network reinforcement learning algorithm for partially observable Markov decision process
【24h】

A pulse neural network reinforcement learning algorithm for partially observable Markov decision process

机译:一种脉冲神经网络加固学习算法,用于部分观察到的马尔可夫决策过程

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

In this paper, we propose a new pulse neural network model and its reinforcement learning algorithm. The network is a feed-forward network with two hidden layers. The first hidden layer consists of pulse neurons with low decay rate of internal state, and the second layer consists of pulse neurons with high decay rate. The main purpose of this model is to utilize pulse neurons' ability for handling sequential input in partially observable Markov decision process. Its performance is confirmed by two kinds of computer simulations.
机译:在本文中,我们提出了一种新的脉冲神经网络模型及其加强学习算法。 该网络是具有两个隐藏层的前馈网络。 第一隐藏层由脉冲神经元组成,脉冲神经元具有低衰减率的内部状态,第二层由具有高衰减率高的脉冲神经元组成。 该模型的主要目的是利用脉冲神经元对部分观察到的马尔可夫决策过程处理顺序输入的能力。 其性能由两种计算机模拟确认。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号