Arizona State University.;
机译:状态与回报:基于模型和无模型的强化学习背后的可分离的神经预测错误信号。
机译:基于多目标模型的策略搜索以稀疏奖励实现数据有效学习
机译:“主动”学习模型:利用基于联合学习的主动脑概念进行无模型和基于模型的强化学习的集成框架
机译:申请:使用生成的对抗性反增强学习学习联合奖励政策选择
机译:了解基于模型的强化学习及其在安全强化学习中的应用
机译:各种与奖励:可解离的神经预测误差信号底层模型和无模型加强学习
机译:状态与奖励:基于模型和免费模型的强化学习背后的可分离神经预测误差信号