...
机译:具有折扣成本准则的半马尔可夫决策过程的性能优化
Department of Automation, University of Science and Technology of China, Hefei, Anhui 230026, P.R. China;
semi-markov decision processes; discounted poisson equation; a-potential; discounted-cost criteria; policy iteration; value iteration;
机译:风险敏感的半马尔可夫决策过程,具有一般实用程序和多个标准
机译:首次通过标准的半马尔可夫决策过程的均方差最优
机译:初次通过条件下半马尔可夫决策过程的均值方差最优
机译:贴现成本绩效标准下无限制转移率的马尔可夫决策问题
机译:半马尔可夫决策过程的固定探索新强化学习算法
机译:学习最大化奖励率:基于半马尔可夫决策过程的模型
机译:使用半马尔可夫决策过程的分层对话优化。