Manipulators; Neural networks; Task analysis; Machine learning; Trajectory; MIMICs;
机译:稳定的体验重播,以进行深度的多智能体强化学习
机译:基于深度Q学习,经验回放和启发式知识的智能机器人路径规划
机译:基于Deep Q-Learning的经验重播和启发式知识的智能机器人路径规划
机译:试验和错误体验基于重播的深度增强学习
机译:基于熵的体验重播在加固学习中
机译:使用深度加强学习的多臂操纵器的路径规划:软演员 - 与后敏感体验重播
机译:随着量子启发体验重放的深度增强学习
机译:增强深度强化学习的体验重播。