机译:具有无限制利率和依赖历史的随机策略的折扣连续时间马尔科夫决策过程:动态规划方法
机译:约束马尔可夫决策过程:动态规划方法
机译:马尔可夫决策过程的风险敏感控制:基于时刻的目标分布方法
机译:基于马尔可夫决策过程的合成变换动态选择的方法
机译:马尔可夫决策过程中的多阶段决策和风险:建立有效的近似动态编程体系结构。
机译:不确定性下的决策:基于部分可观察的马尔可夫决策过程的神经模型
机译:基于学习的方法来控制线性时间逻辑规范的马尔可夫决策过程的合成
机译:基于学习的线性时序逻辑规范马尔可夫决策过程综合控制方法。