固定长度经验回放对Q学习效率的影响

林明; 朱纪洪; 孙增圻

首页> 中文期刊> 《计算机工程》 >固定长度经验回放对Q学习效率的影响

固定长度经验回放对Q学习效率的影响

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

提出了一种固定长度经验回放的思想,并将该思想与一步Q和Peng Q(λ)学习算法相结合,得到了相应的改进算法.该文采用不同的回放长度L将改进的算法应用在网格环境和汽车爬坡问题中进行了仿真.结果表明,改进的一步Q学习算法在两个例子中都比原算法具有更好的学习效率.改进的Peng Q(λ)学习在马尔可夫环境中对选择探索动作非常敏感,增大L几乎不能提高学习的效率,甚至会使学习效率变差;但是在具有非马尔可夫属性的环境中对选择探索动作比较不敏感,增大L能够显著提高算法的学习速度.实验结果对如何选择适当的L有着指导作用.

著录项

来源
《计算机工程》 |2006年第6期|7-10|共4页
作者
林明; 朱纪洪; 孙增圻;
展开▼
作者单位

清华大学计算机系智能技术与系统国家重点实验室;

北京;

100084;

清华大学计算机系智能技术与系统国家重点实验室;

北京;

100084;

清华大学计算机系智能技术与系统国家重点实验室;

北京;

100084;

展开▼
原文格式 PDF
正文语种 chi
中图分类自动推理、机器学习;
关键词
经验回放; 再励学习; Q学习;

相似文献

中文文献
外文文献
专利

1. 贸易开放对国内资源配置效率的影响分析--基于广义倾向匹配法的经验研究 [J] . 田荣华 ,李寒娜 . 现代管理科学 . 2015,第002期
2. 股骨型髓内分叉固定器尖端分叉长度与固定位置对股骨下段骨折固定效果影响的实验研究 [J] . 赵玉峰 ,李怀先 . 西藏医药杂志 . 1999,第0S1期
3. HFETR随堆辐照组件核素释放对一回路水质影响研究 [J] . 李海涛 ,周春林 ,邹德光 . 核科学与工程 . 2019,第001期
4. 平均排队长度差最小的单交叉口在线Q学习模型 [J] . 张术 ,韦钦平 . 湖南理工学院学报（自然科学版） . 2013,第004期
5. 固定汇率下资本账户开放对经济的影响——基于修正的Mundell模型的动态分析 [J] . 周克 . 世界经济研究 . 2007,第3期
6. 尾水管扩散段长度及出口宽度回能系数的影响 [C] . 陈柳 ,于纪幸 ,姜明利 . 第十七届中国水电设备学术讨论会 . 2009
7. 面向排队长度管理的单交叉口在线Q学习控制模型 [A] . 张术 . 2014

固定长度经验回放对Q学习效率的影响

摘要

著录项

相似文献

相关主题

期刊订阅