learning (artificial intelligence); neural nets; intrinsically rewarded learning system; modular neural network; online learning; optimal sequence; reinforcement learning; temporal intrinsic reward;
机译:使用模块化神经网络Q学习算法的多主体强化学习
机译:使用强化学习和神经网络解释奖励期望神经元出现的模型
机译:整合时差方法和自组织神经网络用于延迟评估反馈的强化学习
机译:带有时间内在奖励的强化学习的模块化神经网络
机译:痛苦启发的深度强化学习的内在奖励
机译:无监督的学习和集群连接在尖峰神经网络中加强钢筋学习
机译:用递归神经网络强化学习从延迟奖励中发现模式意义