Sustainable active surveillance; Resources allocation; Reinforcement learning; Neural networks;
机译:Palo界限为部分可观察到的随机游戏中的加固学习
机译:基于学习的强化推论的部分可观察环境估算
机译:在部分可观察条件下,加强基于学习的自主导航和USV的避免
机译:可持续积极监测的部分可观察的加强学习
机译:膀胱癌监测策略优化设计的部分可观察马尔可夫决策过程。
机译:通过有限的强化进行强化学习:使用Bayes风险在POMDP中进行主动学习
机译:处于混乱状态的学习:在部分可观察的世界中采用主动感知和强化学习