Constrained Markov decision processes; finite-state approximation; quantization; stochastic control;
机译:折扣和平均成本约束的马尔可夫决策过程的有限状态近似
机译:关于与Borel空间的有限近似的渐近最优性
机译:Borel空间上基于经验测度的连续时间马尔可夫决策过程的可计算近似
机译:有限状态近似与Borel空间的受限Markov决策过程
机译:因子马尔可夫决策过程的线性近似。
机译:数据驱动的个性化马尔可夫决策过程近似高血压治疗计划
机译:马尔可夫决策有限逼近的渐近最优性 具有Borel空间的过程
机译:具有Borel状态空间和无界奖励的马尔可夫决策链中所有策略类的Blackwell最优性