...
机译:从批处理数据学习通用和马尔可夫博弈的纳什均衡
机译:Nash Q-学习常规和随机游戏
机译:Markov跳跃正系统线性二次博弈中Nash平衡点的充分条件。
机译:计算马尔可夫链博弈的强大L_p- Nash均衡:收敛性和唯一性
机译:加强学习在马尔可夫游戏团队中发挥最佳的纳什均衡
机译:游戏中的学习:对具有稳定和不稳定纳什均衡的游戏中学习如何进行的实验分析。
机译:躁动多臂强盗游戏中的社会学习代理人的纳什均衡
机译:N-player中学习纳什均衡的演员批评算法 一般和游戏