...
机译:体验回放,用于实时强化学习控制
Large Corporates and Merchant Banking Division, ABN AMRO Bank, The Netherlands;
Experience replay (ER); Q-learning; SARSA; real-time control; reinforcement learning (RL); robotics;
机译:通过连续的Actor-Critics进行实时强化学习,并体验回放。
机译:整体强化学习和经验重播,用于部分未知约束输入连续时间系统的自适应最优控制
机译:从专家演示中的分层强化学习中的健忘体验重播
机译:用于学习多目标,连续动作和状态空间控制器的连续值迭代(CVI)强化学习和虚幻体验重放(IER)
机译:基于熵的体验重播在加固学习中
机译:使用深度加强学习的多臂操纵器的路径规划:软演员 - 与后敏感体验重播
机译:Hindsight体验重播改善了控制人类手臂MIMO肌肉骨骼模型的加固学习
机译:增强深度强化学习的体验重播。