...
机译:具有总奖励功能的随机游戏的NASH∈平衡:一种基于马尔可夫决策过程的方法
Univ Autonoma Metropolitana Iztapalapa, Dept Matemat, Ave San Rafael Atlixco 186, Mexico City 09340, DF, Mexico;
Univ Autonoma Metropolitana Iztapalapa, Dept Matemat, Ave San Rafael Atlixco 186, Mexico City 09340, DF, Mexico;
stochastic games; Nash equilibrium; Markov decision processes; total rewards;
机译:纳什∈平衡用于随机游戏的总奖励功能:通过马尔可夫决策过程的方法
机译:马尔可夫决策问题的博弈论方法和确定随机位置博弈的纳什均衡
机译:总有效收益的马尔可夫决策过程和随机博弈
机译:马尔可夫决策过程和确定随机位置游戏的纳什均衡
机译:博弈论中两个新的基于计算机的结果与组合博弈和纳什均衡有关。
机译:两人游戏中基于纳什均衡的基于峰值的决策学习
机译:在预期总奖励标准下的离散时间马尔可夫决策过程的凸编程方法
机译:具有无界收益的马尔可夫决策过程的移位函数方法