机译:折扣马尔可夫决策过程的最优策略唯一性的条件
discounted Markov decision processes; uniqueness of optimal policies; convexity; Stochastic order; PLANNING-HORIZONS; EXISTENCE; FORECAST;
机译:折扣马尔可夫决策过程的最优策略唯一性的条件
机译:最优政策作为折现马尔科夫决策过程的通用属性的唯一性:Ekeland的变分原理方法
机译:凸折扣马尔可夫决策过程中最优策略的非唯一性与唯一性
机译:波兰空间中连续时间马尔可夫决策过程的折扣最优性
机译:马尔可夫决策过程和近似动态规划方法进行最优处理设计
机译:通过内在动机的自我博弈在多目标马尔可夫决策过程中发展稳健的政策覆盖范围
机译:最佳政策的独特性作为折扣马尔可夫决策流程的通用财产:ekeland的变分原理方法
机译:具有无界奖励的Countablestate markov游戏中平均和alpha折扣最优性的收缩条件