首页> 外文期刊>電子情報通信学会技術研究報告. ニュ-ロコンピュ-ティング. Neurocomputing >A parameter control method inspired from neuromodulators in reinforcement learning
【24h】

A parameter control method inspired from neuromodulators in reinforcement learning

机译:一种参数控制方法,激励钢筋学习中的神经调节剂

获取原文
获取原文并翻译 | 示例
           

摘要

The brain gains appropriate behaviors which gets rewards and escapes punishments by trial and error. Reinforcement learning models such a nature's system by an engineering approach. Neuromodulators, which projects widely in brain and adjusts functions in each brain part, are matched with internal parameters of reinforcement learning. We propose a reinforcement learning algorithm which can follow sudden changes in environment by considering how neuromodulators affect behaviors. This method improves actions by controlling the internal parameters of reinforcement learning after the obtained reward decreased as compared with the past. We actually applied this algorithm to learning problems, with the result that it followed sudden changes in environment.
机译:大脑获得了适当的行为,通过审判和错误获得奖励并逃脱惩罚。 通过工程方法,加固学习模型如此自然的系统。 在大脑中广泛的突出的神经调节剂与强化学习的内部参数相匹配。 我们提出了一种钢筋学习算法,可以通过考虑神经调节者如何影响行为来遵循环境的突然变化。 在与过去相比,获得的奖励减少后,该方法通过控制增强学习的内部参数来提高动作。 我们实际将这种算法应用于学习问题,结果是突然变化环境。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号