机译:在具有较大或连续动作和观察空间的部分观察到的马尔可夫决策过程(POMDP)中基于MILP的价值备份
School of Chemical and Biomolecular Engineering, Georgia Institute of Technology, Atlanta, GA 30022, USA;
School of Chemical and Biomolecular Engineering, Georgia Institute of Technology, Atlanta, GA 30022, USA;
Department of Chemical and Biomolecular Engineering, Korea Advanced Institute of Science and Technology, Daejeon, Republic of Korea;
Markov decision processes; Dynamic programming; Mathematical programming; Partial observation; Network reliability;
机译:两个动作部分可观察到的Markov决策过程的单调性属性在部分有序空间上
机译:具有连续状态,观察空间和动作空间的POMDP的基于观察的优化
机译:具有连续状态,观察和动作空间的POMDP的基于观察优化
机译:基于手语的人机交互的部分可观察马尔可夫决策过程(POMDP)技术
机译:通过RFID改善动态决策:针对RFID增强的仓库搜索操作的部分可观察到的马尔可夫决策过程(POMDP)。
机译:不确定性下的决策:基于部分可观察的马尔可夫决策过程的神经模型
机译:两个动作部分可观察到的Markov决策过程的单调性属性在部分有序空间上