Games; Robots; Machine learning; Indexes; Decision making; Heuristic algorithms; Learning (artificial intelligence);
机译:两人游戏中基于纳什均衡的基于峰值的决策学习
机译:在线并发强化学习算法,用于求解部分未知的非线性连续时间系统的两人零和游戏
机译:LL_2,一种用于两人零和马尔可夫游戏的简单强化学习方案
机译:基于深度加强学习智能决策与不确定的非理性球员的双人顺序游戏
机译:两人零和随机游戏中的欺骗:理论和在战争游戏中的应用。
机译:两人游戏中基于纳什均衡的基于峰值的决策学习
机译:两人游戏中基于纳什均衡的基于峰值的决策学习