机译:奖励价值编码不同于人类奖励系统中与风险态度相关的不确定性编码。
机译:眶额神经元对奖励风险的编码与奖励值的编码大体不同。
机译:奖励信息在人类中的不同统计特性的神经编码。
机译:基于策略梯度法的编解码数字识别系统的仅奖励训练
机译:遗传编码催产素传感器的发展,以确定催产素在预测社会奖励中的作用
机译:灵长类动物前房间隔区神经元对奖励不确定性的选择性和分级编码
机译:奖励价值编码不同于人类奖励系统中与风险态度相关的不确定性编码
机译:从人类奖励中学习强化学习:奖励积极性,时间贴现,情节性和表现。