机译:大域中部分可观察到的马尔可夫决策过程的改进Q_(MDP)策略:嵌入勘探动力学
Intelligent Robotics and Automation Laboratory Department of Signals, Control and Robotics School of Electrical and Computer Engineering National Technical University of Athens Zografou 15773, Athens, Greece;
POMDP; Q_(MDP); action selection;
机译:使用部分可观察的马尔可夫决策过程和基于物理的随机模型对腐蚀结构进行最佳检查和维护,
机译:部分可观察的马尔可夫决策过程和周期性策略及其应用
机译:可部分观察的马尔可夫决策过程和周期性策略及其应用
机译:多奖励部分可观察的马尔可夫决策过程(MR-POMDP)的发展策略
机译:通过RFID改善动态决策:针对RFID增强的仓库搜索操作的部分可观察到的马尔可夫决策过程(POMDP)。
机译:不确定性下的决策:基于部分可观察的马尔可夫决策过程的神经模型
机译:部分可观察马尔可夫决策过程(pOmDp)