Training; Monte Carlo methods; Sociology; Games; Reinforcement learning; Markov processes; Nash equilibrium;
机译:在电脑游戏中的综合评论家自助增强学习
机译:广播空间中骑自行车者行人互动的马尔可夫 - 游戏模型
机译:马尔可夫博弈的多主体强化学习方法:一种基于环境模型估计的方法
机译:在《奥赛罗》游戏中的强化学习:对固定对手的学习和自学的学习
机译:真实游戏:在学习环境中设计替代现实游戏。
机译:通过内在动机的自我博弈在多目标马尔可夫决策过程中发展稳健的政策覆盖范围
机译:近似的通用人工智能和游戏自学学习