Markov processes; approximation theory; computational complexity; decision making; dynamic programming; least squares approximations; ADP methods; Bellman equation; LFA; MDP; Markov decision processes; approximate dynamic programming; linear function approximation; linear least squares projection; optimal action selection mechanism; optimal policy; optimal sequential decision making; optimal state-action value function; optimal value function; Convergence; Equations; Function approximation; Least squares approximations; Markov processes; Vectors;
机译:约束折扣马尔可夫决策过程的有限线性规划近似
机译:用于大规模无折扣马尔可夫决策过程的新的近似动态规划算法及其在优化生产和分销系统中的应用
机译:使用总预期折现报酬函数优化求解马尔可夫决策过程:重新考虑线性规划
机译:因子连续州马尔可夫决策过程的线性程序近似
机译:马尔可夫决策过程中的多阶段决策和风险:建立有效的近似动态编程体系结构。
机译:使用Markov决策过程和动态规划的Web服务组合
机译:使用$(\ min,+)$线性函数进行近似动态编程 马尔可夫决策过程的近似