Modular Neural Networks for Reinforcement Learning with Temporal Intrinsic Rewards

机译：带有时间内在奖励的强化学习的模块化神经网络

获取原文

页面导航

摘要
著录项
相似文献
相关主题

摘要

Inspired by intrinsic motivation that is thought to play a crucial role in animal development and learning, several artificial learning systems with built in intrinsic rewards were recently studied. Here we suggest an intrinsically rewarded learning syste

机译：受内在动机的启发，人们认为内在动机在动物的发展和学习中起着至关重要的作用，最近研究了几种具有内在奖励的人工学习系统。在这里，我们建议一个内在奖励的学习系统

著录项

来源
《Neural Networks, The 2007 IEEE International Joint Conference on》|2007年|P.1151-1156|共6页
会议地点
作者
Takeuchi; J.; Shouno; O.; Tsujino; H.;
展开▼
作者单位

展开▼
会议组织
原文格式 PDF
正文语种
中图分类工业技术;
关键词
learning (artificial intelligence); neural nets; intrinsically rewarded learning system; modular neural network; online learning; optimal sequence; reinforcement learning; temporal intrinsic reward;

机译：学习（人工智能）;神经网络;内在奖励学习系统;模块化神经网络;在线学习;最优序列;强化学习;时间内在奖励;
入库时间 2022-08-26 15:08:35

相似文献

外文文献
中文文献
专利

1. Multi-agent reinforcement learning using modular neural network Q-learning algorithms [J] . YANG Yin-xian, FANG Kai 重庆大学学报（英文版） . 2005,第001期

机译：使用模块化神经网络Q学习算法的多主体强化学习
2. A model to explain the emergence of reward expectancy neurons using reinforcement learning and neural network [J] . Shinya Ishii, Munetaka Shidara, Katsunari Shibata Neurocomputing . 2006,第10a12期

机译：使用强化学习和神经网络解释奖励期望神经元出现的模型
3. Integrating Temporal Difference Methods and Self-Organizing Neural Networks for Reinforcement Learning With Delayed Evaluative Feedback [J] . Tan A.-H., Lu N., Xiao D. IEEE Transactions on Neural Networks . 2008,第2期

机译：整合时差方法和自组织神经网络用于延迟评估反馈的强化学习
4. Modular Neural Networks for Reinforcement Learning with Temporal Intrinsic Rewards [C] . Takeuchi, J., Shouno, Neural Networks, The 2007 IEEE International Joint Conference on . 2007

机译：带有时间内在奖励的强化学习的模块化神经网络
5. Pain-Inspired Intrinsic Reward For Deep Reinforcement Learning [D] . Richardson, Trevor Woods 2018

机译：痛苦启发的深度强化学习的内在奖励
6. Unsupervised Learning and Clustered Connectivity Enhance Reinforcement Learning in Spiking Neural Networks [O] . Philipp Weidel, Renato Duarte, Abigail Morrison 2021

机译：无监督的学习和集群连接在尖峰神经网络中加强钢筋学习
7. Discovery of Pattern Meaning from Delayed Rewards by Reinforcement Learning with a Recurrent Neural Network [O] . Katsunari Shibata, Hiroki Utsunomiya 2012

机译：用递归神经网络强化学习从延迟奖励中发现模式意义

Modular Neural Networks for Reinforcement Learning with Temporal Intrinsic Rewards

摘要

著录项

相似文献

相关主题

期刊订阅