Reinforcement Learning; POMDP; MDP; ITS;
机译:根据经验评估强化学习在诱导有效和适应性教学策略中的应用
机译:αPOMDP:基于POMDP的社交机器人用户自适应决策
机译:针对POMDP和分散式POMDP优化固定大小的随机控制器
机译:经验评估POMDP与MDP对教学策略诱导的效力
机译:利用网络分布式POMDP中交互的局部性:一项实证评估
机译:POMDP政策评估的方差分析
机译:通过POMDPS的PMDPS的参数无关策略
机译:先进电磁感应系统的实证评估 - 影响具有挑战性地质环境分类效果的因素。