机译:分层自动课程学习:将稀疏奖励导航任务转换为密集奖励
Tsinghua Univ THUAI Inst Artificial Intelligence Beijing Peoples R China|State Key Lab Intelligent Technol & Syst Beijing Peoples R China|Beijing Natl Res Ctr Informat Sci & Technol BNRis Beijing Peoples R China|Tsinghua Univ Dept Automat Beijing Peoples R China;
Hierarchical reinforcement learning; Automatic curriculum learning; Sparse reward reinforcement learning; Sample-efficient reinforcement learning;
机译:分层自动课程学习:将稀疏奖励导航任务转换为密集奖励
机译:使用具有稀疏奖励的机器人任务的演示高效的后敏感钢筋学习
机译:通过从头开始解决稀疏奖励任务来学习
机译:基于奖励稀疏性的课程学习,用于任务完成对话管理的深度强化学习
机译:奖励和非奖励条件下视觉和听觉反馈对视觉行为的不同影响
机译:从风险之后的损失中学习:在自然主义的觅食任务中分离奖励追求和奖励价值
机译:基于奖励稀疏的课程学习,以对对话管理的深度加固学习
机译:分层平均奖励强化学习