decision-making dopamine genetics reinforcement learning;
机译:多巴胺基因的变异性会分离基于模型的和无模型的强化学习
机译:状态与回报:基于模型和无模型的强化学习背后的可分离的神经预测错误信号。
机译:“主动”学习模型:利用基于联合学习的主动脑概念进行无模型和基于模型的强化学习的集成框架
机译:基于脑电图的学习策略分类:基于模型和无模型的强化学习
机译:具有广义先验的基于模型的贝叶斯强化学习
机译:各种与奖励:可解离的神经预测误差信号底层模型和无模型加强学习
机译:状态与奖励:基于模型和免费模型的强化学习背后的可分离神经预测误差信号