Algorithms; Optimization; Adaptive systems; Markov processes; Decision making; Problem solving; Approximation(Mathematics); Convergence; Stochastic control; Sampling;
机译:求解马尔可夫决策过程的自适应采样算法
机译:大型马尔可夫决策过程中近最优规划的稀疏采样算法
机译:通过两阶段时间聚合算法求解平均成本马尔可夫决策过程
机译:varving Markov决策过程的差异减少了价值迭代和更快的算法
机译:用于集中式和分散式部分可观察的马尔可夫决策过程的算法中的可伸缩性不断增强:在不确定的环境中进行有效的决策和协调。
机译:通过多变量模式分析和隐马尔可夫模型算法追踪问题解决问题
机译:一种求解马尔可夫决策过程的自适应采样算法