机译:有限随机性下无折扣随机博弈的折现近似和马尔可夫决策过程
Discounted stochastic games; Markov decision processes; Pseudo-polynomial algorithms; Saddle point; Zero-sum stochastic games;
机译:有限随机性下无折扣随机博弈的折现近似和马尔可夫决策过程
机译:有限模型近似的渐近最优折扣折扣判决过程的有限模型近似
机译:折扣和平均成本约束的马尔可夫决策过程的有限状态近似
机译:具有风险敏感标准的马尔可夫决策过程:动态编程算子和折扣随机博弈
机译:因子马尔可夫决策过程的线性近似。
机译:具有控制梯度近似误差的稀疏离散Markov随机场的随机学习
机译:可数状态无限时空折扣马尔可夫决策过程的有限状态逼近
机译:无马尔可夫决策过程的渐近值迭代研究