机译:不确定转移矩阵的无穷折扣马尔可夫决策过程的鲁棒最优性
Markov processes; decision theory; infinite horizon; matrix algebra; uncertain systems; deterministic policy space; discounted infinite-horizon Markov decision process; finite-state finite-action MDP; generalized robust optimality criterion; uncertain transition;
机译:不确定关联Markov决策过程的多层感知器神经网络的近似鲁棒策略迭代
机译:具有不确定转移矩阵的Markov决策过程的鲁棒控制
机译:具有独立于电流状态的转移概率的马尔可夫折扣决策过程中的单调最优策略:存在性和近似性
机译:不确定平稳转移矩阵的无穷折扣马尔可夫决策过程的鲁棒动态规划
机译:用于集中式和分散式部分可观察的马尔可夫决策过程的算法中的可伸缩性不断增强:在不确定的环境中进行有效的决策和协调。
机译:通过内在动机的自我博弈在多目标马尔可夫决策过程中发展稳健的政策覆盖范围
机译:具有不确定转移矩阵的Markov决策过程的鲁棒控制