Visualization; Natural languages; Detectors; Grounding; Task analysis; Speech recognition; Microphones;
机译:使用具有稀疏奖励的机器人任务的演示高效的后敏感钢筋学习
机译:与基于时间不变的动态系统的演示和奖励的学习动作
机译:示范贝叶斯非参数奖励学习
机译:从叙述示威奖励学习
机译:尼古丁戒断对动机,奖励敏感性和奖励学习的影响。
机译:阿片类奖赏学习中的小鼠品系差异由焦虑非奖赏或学习中的差异解释
机译:学习使用基于潜在的奖励塑造和来自视频数据的演示