School of Computer Science Carnegie Mellon University Pittsburgh, Pennsylvania 15213;
机译:通过基于预测的强化学习来加速游戏学习-朝计划行为的方向发展
机译:基于预测的加强学习的游戏学习加速 - 朝向规划行为的出现
机译:以人类的方式自动治疗规划:由基于深度加强学习的虚拟治疗计划者操作治疗计划系统
机译:基于强化学习与教学方法的非完整自主水下航行器扰动运动规划算法
机译:基于模型的合作多智能经纪人规划的强化学习:利用层次结构,偏见和时间采样
机译:基于深度强化学习和双同步控制的面向多任务的机器人手臂运动计划方案
机译:基于强化学习,计划和教学的自我改善反应剂