机译:通过加固或感觉预测误差依赖于不同的生理机制学习类似的行动
Johns Hopkins Med Inst Dept Phys Med &
Rehabil 600 N Wolfe St Baltimore MD 21287 USA;
Johns Hopkins Med Inst Dept Phys Med &
Rehabil 600 N Wolfe St Baltimore MD 21287 USA;
Johns Hopkins Med Inst Dept Phys Med &
Rehabil 600 N Wolfe St Baltimore MD 21287 USA;
cerebellar inhibition (CBI); error-based learning; long-term potentiation (LTP)-like plasticity; primary motor cortex (M1); reinforcement learning;
机译:通过加固或感觉预测误差依赖于不同的生理机制学习类似的行动
机译:多维环境中的强化学习依赖于注意机制
机译:人脑中胚层回路中明显的预测误差介导了关于状态和动作的值的学习:高分辨率fMRI的证据
机译:避免行动重新训练机制的加强学习 - 提案及其在多链路机器人运动学习的应用
机译:奖励预测错误在加固学习期间形状内存
机译:通过强化或感官预测错误学习相似的动作依赖于不同的生理机制
机译:通过加固或感觉预测误差依赖于不同的生理机制学习类似的行动