机译:具有连续状态,观察空间和动作空间的POMDP的基于观察的优化
Univ Sci & Technol China, Dept Automat, Hefei 230000, Anhui, Peoples R China;
Univ Sci & Technol China, Dept Automat, Hefei 230000, Anhui, Peoples R China;
Univ Sci & Technol China, Dept Automat, Hefei 230000, Anhui, Peoples R China;
Univ Sci & Technol China, Dept Automat, Hefei 230000, Anhui, Peoples R China;
Continuous spaces; none of the prior information; partially observable Markov decision process (POMDP); sensitivity analysis; simulation-based optimization;
机译:具有连续状态,观察和动作空间的POMDP的基于观察优化
机译:在具有较大或连续动作和观察空间的部分观察到的马尔可夫决策过程(POMDP)中基于MILP的价值备份
机译:在预期平均奖励标准下寻找约束POMDP的最佳基于观察的策略
机译:具有连续状态,动作和观察空间的POMDP的在线算法
机译:香港二次无机可溶性气溶胶:连续测量,形成机理的讨论和基于观测的模型研究控制策略的改进
机译:通过任务-动作熵最小化对连续状态和动作空间进行主动感知
机译:稀疏的树搜索最佳保证POMDPS,具有连续观察空间