机译:概率奖励消失中的价值学习和唤醒:多巴胺在修正的时间差异模型中的作用
机译:多巴胺神经元活性和时间差异模型提示了三方灭绝机制。
机译:人脑中的时间差异模型和与奖励相关的学习。
机译:强化学习的计算模型:多巴胺作为奖励信号的作用
机译:哪种时间差异学习算法最能在多项选择任务中重现多巴胺活动?
机译:多巴胺在学习与不同奖励大小相关的Pavlovian线索中的角色
机译:多巴胺神经元活性和时间差异模型表明灭绝的三方机制
机译:概率奖励消退中的价值学习和唤醒:多巴胺在修正的时间差异模型中的作用。