基于Meta平衡的多Agent Q学习算法研究

王万良; 濮约庆; 赵燕伟

首页> 中文期刊>计算机科学 >基于Meta平衡的多Agent Q学习算法研究

基于Meta平衡的多Agent Q学习算法研究

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

多Agent强化学习算法的研究一直以来大多都是针对于合作策略,而NashQ算法的提出对非合作策略的研究无疑是一个重要贡献。针对在多Agent系统中,Nash平衡无法确保求得的解是Pareto最优解及其计算复杂度较高的问题,提出了基于Meta平衡的MetaQ算法。与NashQ算法不同,MetaQ算法通过对自身行为的预处理以及对其它Agent行为的预测来获取共同行为的最优策略。最后通过研究及气候合作策略游戏实验,证明了MetaQ算法在解决非合作策略的问题中有着很好的理论解释和实验性能。

著录项

来源
《计算机科学》|2012年第B06期|P.261-264|共4页
作者
王万良; 濮约庆; 赵燕伟;
展开▼
作者单位

展开▼
原文格式 PDF
正文语种 CHI
中图分类自动推理、机器学习;
关键词
强化学习; Meta平衡; NashQ; 多Agent系统;
入库时间 2022-08-18 04:38:03

相似文献

中文文献
外文文献
专利

1. 多Agent系统中Q学习算法研究 [J] . 战忠丽 ,王强 ,王佩霞 . 辽宁农业职业技术学院学报 . 2008,第005期
2. 基于博弈论及Q学习的多Agent协作追捕算法 [J] . 郑延斌 ,樊文鑫 ,韩梦云 . 计算机应用 . 2020,第006期
3. 基于Q学习的管制员Agent学习行为研究 [J] . 刘岳鹏 ,隋东 ,林颖达 . 哈尔滨商业大学学报（自然科学版） . 2016,第006期
4. 基于Q学习的Agent在交叉口航班排序中的应用 [J] . 朱承元 ,张璋 . 航空计算技术 . 2015,第006期
5. 基于多Agent Q学习的RoboCup局部配合策略 [J] . 赵发君 ,李龙澍 . 计算机工程与应用 . 2014,第023期
6. 基于Q学习的自主Agent模型 [C] . 杨善林 ,合肥工业大学计算机网络系统研究所 ,罗贺 . 2006年全国开放式分布与并行计算学术会议 . 2006
7. 基于多Agent Q学习算法的气候合作策略研究与仿真 [A] . 濮约庆 . 2011

基于Meta平衡的多Agent Q学习算法研究

摘要

著录项

相似文献

相关主题

期刊订阅