机译:离散时间马尔可夫决策过程中最优方程和最优策略的性质
Discrete time; Markov decision processes; Optimality equation; Optimal policies; Expected discounted total rewards;
机译:离散时间马尔可夫决策过程中最优方程和最优策略的性质
机译:离散时间马尔可夫决策过程中最优方程的性质和最佳策略
机译:离散时间马尔可夫决策过程中最优方程的性质和最佳策略
机译:连续时间马尔可夫决策过程的马尔可夫策略的充分性以及跳跃马尔可夫过程的Kolmogorov正方程的解
机译:离散马尔可夫决策过程的次优策略的性能保证及其在机器人监视问题中的应用。
机译:马尔可夫决策过程框架中的最佳信息收集策略
机译:离散时间马尔可夫决策过程的最优性方程和最优策略的性质及其应用
机译:评离离散马尔可夫决策过程的最优成本敏感性和最优策略。