Planning; Computational modeling; Predictive models; Task analysis; Manipulators; Inverse problems;
机译:使用多步返回和偏离策略异步优势Actor-Critic图算法的交通信号协同控制
机译:具有多步模拟经验的自适应Actor-Crit算法,用于控制非完整移动机器人
机译:具有多步模拟经验的自适应角色批评算法,用于控制非完整移动机器人
机译:混合习惯和使用仲裁预测性主演-批判性计划多目标达成
机译:了解媒体习惯:习惯在计划行为理论中的作用
机译:具有分层模型学习和计划的高效Actor-Critic算法
机译:具有多步模拟经验的自适应角色批评算法,用于控制非完整移动机器人