机译:约束折扣马尔可夫决策过程的线性规划公式的可解性条件
机译:使用总预期折现报酬函数优化求解马尔可夫决策过程:重新考虑线性规划
机译:随机线性编程在几乎线性(有时载位)时间内解决了马尔可夫决策问题
机译:马尔可夫决策过程的线性编程求解器
机译:马尔可夫决策过程中的多阶段决策和风险:建立有效的近似动态编程体系结构。
机译:动态模型学习在移动机器人导航任务中线性可解马尔可夫决策过程的评估
机译:用数学规划求解具有不精确概率的因式马尔可夫决策过程
机译:求解马尔可夫决策过程和全局优化的随机搜索方法