“reacher” task; spatial constraints; Robotic Scrub Nurse; Reinforcement Learning; Soft-Actor Critic; Hindsight Experiment Replay;
机译:基于路径 - 积分的蛇形机器人目标机动的加强学习算法
机译:SWIRL:顺序窗口逆强化学习算法,用于延迟奖励的机器人任务
机译:强化文艺复兴深度神经网络的力量激发了人们对强化学习及其在游戏,机器人技术及其他领域的应用的新兴趣。
机译:解决机器人到达任务的加固学习实验和基准
机译:加强学习算法,用于在机器人学中代表和管理不确定性
机译:强化学习在认知无线电网络中的应用:模型和算法
机译:RL_REACH:用于机器人到达任务的可重复加强学习实验