机译:Markov决策过程的平均成本优化不等式与Borel空间和普遍可衡量的政策
Univ Alberta Dept Comp Sci Edmonton AB T6G 2N8 Canada;
Markov decision processes; Borel spaces; universally measurable policies; average cost; optimality inequality; majorization conditions;
机译:Markov决策过程的平均成本优化不等式与Borel空间和普遍可衡量的政策
机译:具有Borel空间和界限成本的平均成本马尔可夫决策过程近似值迭代的扰动方法
机译:Borel空间中的约束Markov决策过程:从折现到平均最优
机译:Borel空间中Markov决策过程的平均最优性:新条件和新方法
机译:具有信息流和可变交易成本的SEMI-MARKOV投资决策过程。
机译:通过内在动机的自我博弈在多目标马尔可夫决策过程中发展稳健的政策覆盖范围
机译:平均成本马尔可夫决策过程的最优性不等式和(s,S)策略的最优性
机译:具有Borel状态空间和无界奖励的马尔可夫决策链中所有策略类的Blackwell最优性