Task analysis; Robots; Containers; Planning; Object oriented modeling; Scalability; Grippers;
机译:马尔可夫决策过程中的情景任务学习
机译:马尔可夫决策过程中的情景任务学习
机译:机器人团队学习的并行马尔可夫决策过程
机译:用抽象的马尔可夫决策过程学习机器人操纵的顺序决策任务和演示引导探索
机译:使用抽象动作学习部分可观察的马尔可夫决策过程。
机译:动态模型学习在移动机器人导航任务中线性可解马尔可夫决策过程的评估
机译:使用表示学习和大规模马尔可夫决策过程的安全探索实践强化学习