机译:随机预测控制对部分观察到的马尔可夫决策过程,时间关节机会限制和应用于自主车辆控制
机译:使用部分可观察的马尔可夫决策过程和基于物理的随机模型对腐蚀结构进行最佳检查和维护,
机译:通过分散的部分可观察的马尔可夫决策过程优化无线网络的时空复用
机译:受控局部可观马尔可夫决策过程的随机优化
机译:Pond-hindsight:将事后观察优化应用于部分可观察到的马尔可夫决策过程。
机译:不确定性下的决策:基于部分可观察的马尔可夫决策过程的神经模型
机译:利用置信空间宏观行为对部分可观测马尔可夫决策过程的分散控制