ECE Department Carnegie Mellon University Pittsburgh, PA 15213;
机译:一种获得多人矩阵游戏纳什均衡的强化学习算法
机译:从批处理数据学习通用和马尔可夫博弈的纳什均衡
机译:具有强化学习的多人混合零和游戏的近似Nash解决方案
机译:加强学习在马尔可夫游戏团队中发挥最佳的纳什均衡
机译:马尔可夫游戏中的多主体强化学习。
机译:躁动多臂强盗游戏中的社会学习代理人的纳什均衡
机译:用于求解多方代代理合作游戏系统的纳什均衡的增强的无模型加强学习算法