首页> 中文期刊> 《计算机科学》 >贝叶斯学习与强化学习结合技术的研究

贝叶斯学习与强化学习结合技术的研究

         

摘要

强化学习的研究需要解决的重要难点之一是:探索未知的动作和采用已知的最优动作之间的平衡.贝叶斯学习是一种基于已知的概率分布和观察到的数据进行推理,做出最优决策的概率手段.因此,把强化学习和贝叶斯学习相结合,使Agent可以根据已有的经验和新学到的知识来选择采用何种策略:探索未知的动作还是采用已知的最优动作.本文分别介绍了单Agent贝叶斯强化学习方法和多Agent贝叶斯强化学习方法:单Agent贝叶斯强化学习包括贝叶斯Q学习、贝叶斯模型学习以及贝叶斯动态规划等;多Agent贝叶斯强化学习包括贝叶斯模仿模型、贝叶斯协同方法以及在不确定下联合形成的贝叶斯学习等.最后,提出了贝叶斯在强化学习中进一步需要解决的问题.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号