机译:用于有限马尔可夫决策过程的均匀特惠定理
机译:用于有限马尔可夫决策过程的均匀特惠定理(Vol 44,PG 1145,2019)
机译:无边界的BERGE最小定理及其在马尔可夫决策过程中的应用
机译:可变折扣因子的离散时间马尔可夫决策过程在第一阶段模型有限逼近中的应用
机译:半马尔可夫决策过程的固定探索新强化学习算法
机译:自反Banach空间中Bregman弱相对论非扩张映射的有限个族的公共不动点的强收敛定理
机译:可数状态无限时空折扣马尔可夫决策过程的有限状态逼近
机译:Brouwer不动点定理与有限状态空间马尔可夫决策理论。