机译:通过概率图形模型使用任务成就奖励使用盖尔和强化学习的模仿学习
机译:整合多个皮层-纹状体环的分层强化学习模型:功能磁共振成像检查在刺激-行动-奖励关联学习中的应用。
机译:他人的行为充当伪奖励,以便在社会强化学习背景下驾驶模仿
机译:生成内部奖励的仿制学习和加强学习的有效整合
机译:使用分布式奖励制定学习基于模型的强化学习的政策
机译:扩展的基底神经节强化学习模型以了解5-羟色胺和多巴胺在基于风险的决策奖励预测和惩罚学习中的作用
机译:他人的行为充当伪奖励,以便在社会强化学习背景下驾驶模仿
机译:学习嘈杂和延迟奖励:强化学习对国防建模和仿真的价值。