机译:可变折扣因子和历史相关策略的连续时间马尔可夫决策过程的第一遍最优性
School of Mathematics and Computational Science, Sun Yat-Sen University, Guangzhou, P.R. China|c|;
Continuous-time Markov decision process; first passage criterion; varying discount factor;
机译:具有多种折扣因素的马尔可夫决策过程的第一通道最优性和方差最小化
机译:具有无限制利率和依赖历史的随机策略的折扣连续时间马尔科夫决策过程:动态规划方法
机译:历史相关策略中一般连续时间马尔可夫决策过程的线性规划和约束平均最优性
机译:可变折扣因子的离散时间马尔可夫决策过程在第一阶段模型有限逼近中的应用
机译:因子马尔可夫决策过程的线性近似。
机译:设计评估研究以最佳地为政策提供信息:中国的决策者在制定医护人员培训计划的资源分配决策时会考虑哪些因素?
机译:贴现连续时间马尔可夫决策过程的第一遍$ g $-均值最优性