机译:波兰空间中连续时间马尔可夫决策过程的平均最优不等式
Department of Mathematics South China Normal University Guangzhou 510631 People’s Republic of China;
Continuous-time Markov decision process; Average optimality inequality; General state space; Unbounded cost; Optimal stationary policy; 90C40; 93E20;
机译:波兰空间中连续时间马尔可夫决策过程的平均最优性
机译:波兰空间中连续时间跳跃马尔可夫决策过程的偏差和超车最优
机译:波兰空间中连续时间平均奖励马尔可夫决策过程的策略迭代
机译:波兰空间中连续时间马尔可夫决策过程的折扣最优性
机译:马尔可夫决策过程和近似动态规划方法进行最优处理设计
机译:使用基于模型的建议对离散状态空间连续时间马尔可夫过程进行快速参数推断
机译:连续时间马尔可夫决策过程的平均最优性 抛光空间