机译:一种通用的强化学习算法,可掌握国际象棋,将棋和自打法
DeepMind, 6 Pancras Sq, London N1C 4AG, England;
UCL, Gower St, London WC1E 6BT, England;
机译:通过规划学习模型来掌握Atari,De,Chess和Shogi
机译:通过学习自我玩法获得将棋的评估功能
机译:在电脑游戏中的综合评论家自助增强学习
机译:通过深度强化学习和自玩游戏掌握格斗游戏
机译:机器学习和加固学习中的采样高效的非透露算法
机译:从钢筋学习中停止时间决定的心肌梗死评估
机译:真棒:融合的一般多智能体学习算法 自我发挥并学习对抗固定对手的最佳反应