...
机译:无穷Berge最小定理及其在折现Markov决策过程中的应用
机译:无边界的BERGE最小定理及其在马尔可夫决策过程中的应用
机译:包络定理及其在折扣马尔可夫决策过程中的一些应用
机译:包络定理及其在折扣马尔可夫决策过程中的一些应用
机译:贴现成本绩效标准下无限制转移率的马尔可夫决策问题
机译:一类马尔可夫过程的紧缩性和功能中心极限定理,适用于非线性自动回归模型(不变性,概率)。
机译:不确定性下的决策:基于部分可观察的马尔可夫决策过程的神经模型
机译:Markov决策过程中的迭代算法,具有依赖折扣因子和无限性成本
机译:具有无限奖励的可数州折现马尔可夫决策过程