首页> 中文期刊> 《电脑知识与技术》 >几种agent强化学习方法的比较研究

几种agent强化学习方法的比较研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

强化学习使agent具有在线自主学习能力,该文介绍了MDP模型下的自适应动态规划、时序差分学习、Q-学习等几种典型agent强化学习方法,并从基本思想、学习内容、收敛速度、可扩展性等方面对它们进行了对比分析。

著录项

来源
《电脑知识与技术》 |2008年第13期|774-776|共3页
作者
吴元斌;
展开▼
作者单位

重庆三峡学院数学与计算机科学学院重庆404000;

展开▼
原文格式 PDF
正文语种 chi
中图分类人工智能理论;
关键词
MDP; 自适应动态规划; 时序差分学习; Q-学习;

相似文献

中文文献
外文文献
专利

1. 几种agent强化学习方法的比较研究 [J] . 吴元斌 . 电脑知识与技术 . 2008,第013期
2. 单agent强化学习与多agent强化学习比较研究 [J] . 吴元斌 . 电脑与信息技术 . 2009,第001期
3. 多Agent强化学习方法与应用 [J] . 郭凌云 . 福建电脑 . 2015,第005期
4. 利用聚类分析法改进的多Agent协作强化学习方法 [J] . 张媛 ,张广明 ,袁宇浩 . 计算机测量与控制 . 2010,第004期
5. 一种新颖的多agent强化学习方法 [J] . 周浦城 ,洪炳殚 ,黄庆成 . 电子学报 . 2006,第008期
6. 一种多agent协作的强化学习方法 [C] . . 中国人工智能学会第10届全国学术年会 . 2003
7. 面向决策仿真的Agent模型中强化学习方法的研究 [A] . 段庆领 . 2011

获取原文

客服邮箱：kefu@zhangqiaokeyan.com

京公网安备：11010802029741号 ICP备案号：京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有

客服微信
服务号