Optimization; Markov chains; Policies; Borel sets; Topology; Recurrence; Driftconditions; Markov processes; Decision theory; Geometry; Theorems;
机译:具有Borel状态空间和无穷大奖励的Markov决策链中所有策略类别的Blackwell最优性
机译:具有Borel状态空间和无穷大奖赏的马尔可夫决策链中文具政策类别的Blackwell最优性
机译:连续时间受控马尔可夫链的马尔可夫策略类中的Blackwell最优性
机译:具有Borel状态空间的Markov决策过程中的Blackwell最优性
机译:离散马尔可夫决策过程的次优策略的性能保证及其在机器人监视问题中的应用。
机译:马尔可夫决策过程框架中的最佳信息收集策略
机译:具有无穷回报的可数马尔可夫决策链中的平均,敏感和布莱克韦尔最优策略
机译:具有无界奖励的Countablestate markov游戏中平均和alpha折扣最优性的收缩条件