机译:一种求解马尔可夫决策过程的进化随机策略搜索算法
Department of Applied Mathematics and Statistics, State University of New York at Stony Brook, Stony Brook, New York 11794, USA;
dynamic programming; markov; finite state; analysis of algorithms; programming; nonlinear; queues;
机译:带有随机单调策略的约束Markov决策过程的$ {Q} $-学习算法:在MIMO传输控制中的应用
机译:解决马尔可夫决策过程的进化策略迭代
机译:随机搜索约束多策略改进的马尔可夫决策过程
机译:解决马尔可夫决策过程的政策空间中的基因搜索
机译:解决马尔可夫决策过程和全局优化的随机搜索方法。
机译:通过内在动机的自我博弈在多目标马尔可夫决策过程中发展稳健的政策覆盖范围
机译:一种求解马尔可夫决策过程的进化随机策略搜索算法