首页> 中文期刊> 《电子学报》 >一种新颖的多agent强化学习方法

一种新颖的多agent强化学习方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

提出了一种综合了模块化结构、利益分配学习以及对手建模技术的多agent强化学习方法,利用模块化学习结构来克服状态空间的维数灾问题,将Q-学习与利益分配学习相结合以加快学习速度,采用基于观察的对手建模来预测其他agent的动作分布.追捕问题的仿真结果验证了所提方法的有效性.

著录项

来源
《电子学报》 |2006年第8期|1488-1491|共4页
作者
周浦城; 洪炳殚; 黄庆成;
展开▼
作者单位

哈尔滨工业大学计算机科学与技术学院,黑龙江,哈尔滨,150001;

哈尔滨工业大学计算机科学与技术学院,黑龙江,哈尔滨,150001;

哈尔滨工业大学计算机科学与技术学院,黑龙江,哈尔滨,150001;

展开▼
原文格式 PDF
正文语种 chi
中图分类人工智能理论;
关键词
多agent学习; Q-学习; 利益分配学习; 模块化结构; 对手建模;

相似文献

中文文献
外文文献
专利

1. 多Agent强化学习方法与应用 [J] . 郭凌云 . 福建电脑 . 2015,第005期
2. 利用聚类分析法改进的多Agent协作强化学习方法 [J] . 张媛 ,张广明 ,袁宇浩 . 计算机测量与控制 . 2010,第004期
3. 几种agent强化学习方法的比较研究 [J] . 吴元斌 . 电脑知识与技术 . 2008,第013期
4. 几种agent强化学习方法的比较研究 [J] . 吴元斌 . 电脑知识与技术：学术交流 . 2008,第005期
5. 基于随机博弈的Agent协同强化学习方法 [J] . 王长缨 ,尹晓虎 ,鲍翊平 . 计算机工程与科学 . 2006,第002期
6. 一种多agent协作的强化学习方法 [C] . . 中国人工智能学会第10届全国学术年会 . 2003
7. 面向决策仿真的Agent模型中强化学习方法的研究 [A] . 段庆领 . 2011

获取原文

客服邮箱：kefu@zhangqiaokeyan.com

京公网安备：11010802029741号 ICP备案号：京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有

客服微信
服务号