机译:基于模型和无模型的Pavlovian奖励学习:重估,修订和启示
机译:在没有选择的情况下,在观察性奖励学习过程中涉及基于模型的学习信号,而不是没有模型的学习信号
机译:状态与回报:基于模型和无模型的强化学习背后的可分离的神经预测错误信号。
机译:无限地平线平均奖励马尔可夫决策过程的无模型加强学习
机译:多巴胺在学习与不同奖励大小相关的Pavlovian线索中的角色
机译:在没有选择的情况下基于模型的学习信号而不是非模型的学习信号在观察性奖励学习中的参与
机译:基于模型和模型的巴甫洛夫奖励学习:重估,修订和启示