机译:包络定理及其在折扣马尔可夫决策过程中的一些应用
envelope theorem; discounted Markov decision process; differentiability of the optimal value function; differentiability of the optimal policy; economic growth model; ECONOMIC-GROWTH; UNCERTAINTY; DYNAMICS; PLANS;
机译:包络定理及其在折扣马尔可夫决策过程中的一些应用
机译:无边界的BERGE最小定理及其在马尔可夫决策过程中的应用
机译:无穷Berge最小定理及其在折现Markov决策过程中的应用
机译:可变折扣因子的离散时间马尔可夫决策过程在第一阶段模型有限逼近中的应用
机译:一类马尔可夫过程的紧缩性和功能中心极限定理,适用于非线性自动回归模型(不变性,概率)。
机译:不确定性下的决策:基于部分可观察的马尔可夫决策过程的神经模型
机译:折扣有限马尔可夫决策过程的不动点定理