分阶Dyna强化学习算法

赵昀; 陈庆伟; 胡维礼

首页> 中文期刊> 《计算机仿真》 >分阶Dyna强化学习算法

分阶Dyna强化学习算法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

针对现有Dyna强化学习体系结构下,"规划"和"学习"在计算资源分配上的不合理问题,提出了一种分阶Dyna体系结构,随着经验知识的不断积累,将学习过程划分为探索阶段、变比重学习阶段和优化阶段,分别进行"规划"和"学习"的协调控制,大大减少了计算资源的浪费.结合传统的Q-学习算法,设计了分阶Dyna-Q强化学习算法,以适应动态不确定环境下的任务.在一个标准强化学习问题中,验证了所设计的分阶Dyna强化学习算法比基本Dyna强化学习算法具有更好的学习性能.

著录项

来源
《计算机仿真》 |2009年第7期|154-158|共5页
作者
赵昀; 陈庆伟; 胡维礼;
展开▼
作者单位

南京理工大学自动化学院;

江苏南京;

210094;

南京理工大学自动化学院;

江苏南京;

210094;

南京理工大学自动化学院;

江苏南京;

210094;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动推理、机器学习;
关键词
强化学习; 强化学习体系结构; 规划;

相似文献

中文文献
外文文献
专利

1. 基于平均奖赏强化学习算法的零阶分类元系统 [J] . 臧兆祥 ,李昭 ,王俊英 . 计算机工程与应用 . 2016,第021期
2. 强化学习算法 20分钟教会车辆车道保持 [J] . . 农业装备与车辆工程 . 2018,第7期
3. 基于1~2阶分数阶微分的图像增强算法 [J] . 李军成 . 计算机工程 . 2015,第002期
4. 基于二阶分段式的Apriori算法优化 [J] . 刘丽娜 ,吴新玲 . 计算机工程与设计 . 2021,第007期
5. 基于变步长分阶自适应匹配追踪算法的振动数据重构方法研究 [J] . 王朋飞 ,盛步云 . 机电工程 . 2020,第010期
6. 钢框架柱一阶分析设计和二阶分析设计的比较 [C] . 刘新春 ,惠宽堂 . 第五届全国土木工程研究生学术论坛 . 2007
7. 基于分烽阶延迟滤波器的TIADC校正算法的研究及实现 [A] . 邓民明 . 2013

分阶Dyna强化学习算法

摘要

著录项

相似文献

相关主题

期刊订阅