机译:基于学习的强化推论的部分可观察环境估算
Didi Chuxing AI Labs Beijing Peoples R China;
Didi Chuxing AI Labs Beijing Peoples R China;
Didi Chuxing AI Labs Beijing Peoples R China;
Nanjing Univ Natl Key Lab Novel Software Technol Nanjing 210023 Peoples R China;
Didi Chuxing AI Labs Beijing Peoples R China;
Didi Chuxing AI Labs Beijing Peoples R China;
Reinforcement learning; Environment estimation; Hidden state; Uplift modeling; Recommender system;
机译:具有基于采样状态估计的部分可观察游戏的基于模型的强化学习
机译:在部分可观察的环境中基于梯度的强化学习方法进行动态定价
机译:基于在线变分贝叶斯方法的部分可观测环境识别及其在强化学习中的应用
机译:在部分可观察到环境中使用贝叶斯学习的不可观察环境推理的有效性 - 它适用于Robocup救援模拟
机译:网络系统的攻击检测和部分可观察的网络环境中的概率状态估计。
机译:检测变化避免动态部分可观察环境中的灾难性遗忘
机译:基于采样的状态估计对部分可观察游戏的基于模型的强化学习