机译:折扣马尔可夫决策过程的改进值迭代算法
Laboratory of Information Processing and Decision Support, University Sultan Moulay Slimane, Beni Mellal, Morocco;
Laboratory of Information Processing and Decision Support, University Sultan Moulay Slimane, Beni Mellal, Morocco;
Discounted Reward Criterion; Markov Decision Processes; Open MP; Parallelizing; Value Iteration Algorithm;
机译:马尔可夫决策过程的加速修改策略迭代算法
机译:马尔可夫决策过程的加速修改策略迭代算法
机译:折现和加权马尔可夫决策过程的层次算法
机译:对于折现马尔可夫决策过程,策略迭代的复杂性呈指数级增长
机译:利用折扣道路用户和机构成本的策略迭代算法的路面维护马尔瓦维亚优化模型
机译:不确定性下的决策:基于部分可观察的马尔可夫决策过程的神经模型
机译:Markov决策过程中的迭代算法,具有依赖折扣因子和无限性成本