Lamar University - Beaumont.;
Entropy-based experience replay; Reinforcement learning;
机译:从专家演示中的分层强化学习中的健忘体验重播
机译:代理体验重放:分布式增强学习的联邦蒸馏
机译:软电演位批评机器人机器人与后勤体验重播的批评
机译:用于学习多目标,连续动作和状态空间控制器的连续值迭代(CVI)强化学习和虚幻体验重放(IER)
机译:节奏行动在强化学习期间同步内存重播
机译:使用深度加强学习的多臂操纵器的路径规划:软演员 - 与后敏感体验重播
机译:随着量子启发体验重放的深度增强学习
机译:增强深度强化学习的体验重播。