机译:有限水平马尔可夫决策过程的基于仿真的优化算法
Department of Computer Science and Automation Indian Institute of Science Bangalore 560 012, India;
finite-horizon markov decision processes; simulation-based algorithms; two-timescale stochastic approximation; function approximation; actor-critic algorithms; normalized hadamard matrices;
机译:有限视野,部分观测的马尔可夫决策过程的混合遗传/优化算法
机译:有限视野,部分观测的马尔可夫决策过程的混合遗传/优化算法
机译:基于可变邻域搜索的有限水平马尔可夫决策过程算法
机译:基于模拟的马尔可夫决策过程的PAC界限
机译:基于模拟的马尔可夫决策过程算法。
机译:不确定性下的决策:基于部分可观察的马尔可夫决策过程的神经模型
机译:有限视野马尔可夫决策过程的基于仿真的优化算法