Game theory; Markov processes; Iteration; Equilibrium; Costs; Optimization; Algorithms; Convergence; Queueing theory;
机译:具有无穷奖励的可数状态Markov游戏中平均和alpha折扣最优的收缩条件
机译:受控马尔可夫链平均奖励的充要条件
机译:具有无限成本的平均马尔可夫决策链中最优平稳策略存在的弱条件
机译:具有无限奖励和平均收益的随机游戏的一些近似值
机译:具有无穷回报的可数马尔可夫决策链中的平均,敏感和布莱克韦尔最优策略
机译:具有Borel状态空间和无界奖励的马尔可夫决策链中所有策略类的Blackwell最优性