Robot learning; human feedback in action domains; human teachers; interactive learning;
机译:使用策略搜索和人工纠正建议加强运动技能的学习
机译:基于纠正反馈的互动持续行动策略的交互式框架
机译:通过人类反馈在连续状态和动作空间中学习
机译:教练:从人类传达的纠正建议中学习持续行动
机译:指导:学习和使用环境和代理模型以获取建议。
机译:通过使用连续动作的基于受体场的函数逼近方法通过强化学习来学习达到
机译:人与工作,交流和学习技术的互动:进步
机译:辅导:学习和使用环境和代理模型的建议