...
机译:对于折扣动态规划,修改后的策略迭代算法不是强多项式
Markov decision process; Modified policy iteration; Strongly polynomial; Policy; Algorithm;
机译:对于折扣动态规划,修改后的策略迭代算法不是强多项式
机译:对于折扣动态规划,值迭代算法不是强多项式
机译:使用改进的迭代动态规划算法获得更平滑的奇异弧策略
机译:折扣动态规划中的Q学习和增强的策略迭代
机译:利用折扣道路用户和机构成本的策略迭代算法的路面维护马尔瓦维亚优化模型
机译:使用迭代动态规划算法的有效的计算机辅助混合物结构解析策略
机译:修改的政策迭代算法对于折扣动态编程并不强烈的多项式
机译:折扣动态规划。第5部分。修改的策略迭代