Imitation; Reinforcement Learning; Policy Mapping;
机译:通过概率图形模型使用任务成就奖励使用盖尔和强化学习的模仿学习
机译:模仿或创新:利用竞争优势的剥削策略和创新策略在多大程度上?
机译:基于低级模仿策略与在线学习相结合的模仿学习对多机器人系统的影响
机译:使用基于成本的策略映射和任务奖励学习仿制策略
机译:用于模仿的基于成本的自适应策略映射。
机译:延迟奖励的结构保留模仿学习:Robocup Soccer 2D模拟环境中的评估
机译:概率图形模型使用盖爪和加固学习的仿制学习的集成