一种基于模型的可分解贝叶斯在线强化学习

首页> 中文期刊> 《电子学报》 >一种基于模型的可分解贝叶斯在线强化学习

一种基于模型的可分解贝叶斯在线强化学习

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Due to the enormous number of parameters and slow convergence which are the major obstacles for online learn -ing in model-based Bayesian reinforcement learning ,the paper presents a model-based factored Bayesian reinforcement learning ap-proach .Firstly ,factored representations are made to represent the dynamics with fewer parameters .Then ,according to prior knowl-edge and observable data ,this paper exploits model-based reinforcement learning to provide an elegant solution to the optimal explo-ration-exploitation tradeoff .Finally ,a pointed-based Bayesian reinforcement learning approach is proposed to speed up the conver -gence to achieve online learning .The experimental results show that the proposed approach can approximate the underlying Bayesian reinforcement learning task well with guaranteed real-time performance .%针对贝叶斯强化学习中参数个数巨大，收敛速度慢，无法实现在线学习的问题，提出一种基于模型的可分解贝叶斯强化学习方法。首先，将学习参数进行可分解表示，降低学习参数的个数；然后，根据先验知识和观察数据采用贝叶斯方法来学习，最优化探索和利用二者之间的平衡关系；最后，采用基于点的贝叶斯强化学习方法实现学习过程的快速收敛，从而达到在线学习的目的。仿真结果表明该算法能够满足实时系统性能的要求。

著录项

来源
《电子学报》 |2014年第7期|1429-1434|共6页
作者

展开▼
作者单位

展开▼
原文格式 PDF
正文语种 chi
中图分类自动推理、机器学习;
关键词
马尔可夫决策过程; 贝叶斯强化学习; 动态贝叶斯网路;

相似文献

中文文献
外文文献
专利

1. 一种基于贝叶斯后验的异常值在线检测及置信度评估算法 [J] . 孙栓柱 ,宋蓓 ,李春岩 . 中国科学技术大学学报 . 2017,第008期
2. 一种可并行的贝叶斯集合在线学习算法 [J] . 古平 ,朱庆生 . 计算机科学 . 2006,第004期
3. 解决深度探索问题的贝叶斯深度强化学习算法 [J] . 杨珉 ,汪洁 . 计算机科学与探索 . 2020,第002期
4. 基于模型诊断的贝叶斯解释及应用 [J] . 邓勇 ,施文康 ,陈良州 . 上海交通大学学报 . 2003,第1期
5. 基于朴素贝叶斯的在线评论文本的情感分类研究 [J] . 袁月戎 . 内蒙古科技与经济 . 2021,第018期
6. 将贝叶斯统计及贝叶斯临床试验应用于中医药临床研究的思考 [C] . 刘云涛 . 全国中医药博士、博士后科技创新与成果转化学术会议暨全国中医“脑心同治”理论与临床应用学术交流会 . 2011
7. 贝叶斯强化学习中策略迭代算法研究 [A] . 尤树华 . 2016

一种基于模型的可分解贝叶斯在线强化学习

摘要

著录项

相似文献

相关主题

期刊订阅