...
机译:可分解的马尔可夫决策过程:一种流体优化方法
dynamic programming: optimal control; probability: Markov processes; programming: linear: applications;
机译:可分解的马尔可夫决策过程:一种流体优化方法
机译:具有Wasserstein距离的分布鲁棒Markov决策过程的凸优化方法。
机译:基于模拟的马尔可夫决策过程优化:一种经验过程理论方法
机译:马尔可夫决策过程的优先目标分解:朝着古典和决策理论规划的综合
机译:Pond-hindsight:将事后观察优化应用于部分可观察到的马尔可夫决策过程。
机译:隐参数马尔可夫决策过程:发现潜在任务参数化的半参数回归方法
机译:连续时间马尔可夫过程偏差矩阵的一种近似方法及其在马尔可夫决策理论中的应用