...
机译:马尔可夫决策过程的偏最优性和强n(n = -1,0)折扣最优性
discrete-time Markov decision process; average reward; bias optiniality; strong 0-discount optimality; optimal stationary policy; STATIONARY POLICIES; UNBOUNDED COSTS; POTENTIALS; CRITERIA; CHAINS; SET;
机译:马尔可夫决策过程的偏最优性和强n(n = -1,0)折扣最优性
机译:具有无限成本的马尔可夫控制过程中的偏差最优与强0折扣最优
机译:连续马尔可夫决策过程的强N折扣和有限水平最优性
机译:波兰空间中连续时间马尔可夫决策过程的折扣最优性
机译:马尔可夫决策过程和近似动态规划方法进行最优处理设计
机译:马尔可夫决策过程框架中的最佳信息收集策略
机译:贴现连续时间马尔可夫决策过程的第一遍$ g $-均值最优性
机译:关于马尔可夫过程的两个简短说明:I。马尔可夫决策问题中次优最优行动的检验。 II。本质上确定的马尔可夫链