基于概率模型的动态分层强化学习

戴朝晖; 袁姣红; 吴敏; 陈鑫

首页> 中文期刊> 《控制理论与应用》 >基于概率模型的动态分层强化学习

基于概率模型的动态分层强化学习

AI论文写作 >>

开具论文收录证明 >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

为解决大规模强化学习中的＂维度灾难＂问题,克服以往学习算法的性能高度依赖于先验知识的局限性,本文提出一种基于概率模型的动态分层强化学习方法.首先基于贝叶斯学习对状态转移概率进行建模,建立基于概率参数的关键状态识别方法,进而通过聚类动态生成若干状态子空间和学习分层结构下的最优策略.仿真结果表明该算法能显著提高复杂环境下智能体的学习效率,适用于未知环境中的大规模学习.%To deal with the overwhelming dimensionality in the large-scale reinforcement-learning and the strong depen-dence on prior knowledge in existing learning algorithms,we propose the method of dynamic hierarchical reinforcement learning based on the probability model（DHRL--model）.This method identifies some key states automatically based on probability parameters of the state-transition probability model established based on Bayesian learning,then generates some state-subspaces dynamically by clustering,and learns the optimal policy based on hierarchical structure.Simulation results show that DHRL--model algorithm improves the learning efficiency of the agent remarkably in the complex environment,and can be applied to learning in the unknown large-scale world.

著录项

来源
《控制理论与应用》 |2011年第11期|1595-1600,1606|共7页
作者
戴朝晖; 袁姣红; 吴敏; 陈鑫;
展开▼
作者单位

中南大学信息科学与工程学院;

湖南长沙410083;

中南大学信息科学与工程学院;

湖南长沙410083;

中南大学信息科学与工程学院;

湖南长沙410083;

中南大学信息科学与工程学院;

湖南长沙410083;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动控制、自动控制系统;
关键词
动态分层强化学习; 贝叶斯学习; 状态转移概率模型; 智能体;

相似文献

中文文献
外文文献
专利

1. 分层强化学习中的动态分层方法研究 [J] . 沈晶 ,顾国昌 ,刘海波 . 小型微型计算机系统 . 2007,第002期
2. 基于核密度估计的分层强化学习自动分层算法 [J] . 陆军 ,付成伟 . 自动化技术与应用 . 2008,第005期
3. 动态环境中的分层强化学习 [J] . 沈晶 ,程晓北 ,刘海波 . 控制理论与应用 . 2008,第001期
4. 基于分层强化学习的AUV路径跟踪技术研究 [J] . 潘昕 ,冯国利 ,侯新国 . 海军工程大学学报 . 2021,第003期
5. 基于分层强化学习的联合作战仿真作战决策算法 [J] . 于博文 ,吕明 ,张捷 . 火力与指挥控制 . 2021,第010期
6. 未知环境中基于概率模型的动态分层强化学习 [C] . 袁姣红 ,吴敏 . 湖南省第三届研究生创新论坛——信息与控制工程的新理论和新技术分论坛 . 2010
7. 基于混合抽象机制的多智能体系统动态分层强化学习算法研究 [A] . 戴朝晖 . 2011

基于概率模型的动态分层强化学习

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅