机译:主观和模型估计的奖励预测:与强化学习任务中与反馈相关的负性(FRN)和奖励预测错误相关联。
机译:从人的奖励中构筑强化学习:奖励积极性,暂时性打折,流行和表现
机译:单剂量的多巴胺激动剂损害了人类的强化学习:基于实验室的奖励响应能力的行为证据。
机译:基于模型的类人动物强化学习:使用iCub平台形成奖励的研究
机译:使用基于关注的采用模型:混合方法研究社区大学教师在学习社区教学团队中教师发展的研究。
机译:主观和模型估计奖励预测:与反馈相关的消极性(FRN)关联并在加固学习任务中奖励预测误差
机译:主观和模型估计奖励预测:与反馈相关的消极性(FRN)关联,并在加固学习任务中奖励预测误差
机译:从人类奖励中学习强化学习:奖励积极性,时间贴现,情节性和表现。