Imperial College London, UK;
Imperial College London, UK;
Imperial College London, UK;
机译:RoboCup足球禁区的强化学习
机译:多Agent连续任务中奖励设计的实验考虑-以RoboCup足球禁忌任务为例
机译:多售后持续任务 - Robocup足球昆虫淘场任务的补偿设计实验研究作为示例
机译:基于论点的强化钢筋儿童守门员
机译:针对RoboCup客户的场景学习和识别框架。
机译:延迟奖励的结构保留模仿学习:Robocup Soccer 2D模拟环境中的评估
机译:两步强化学习en robocup-soccer keepaway