在多Agent环境中求帕累托效率解的方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

多Agent系统（MAS）及其相关技术近年来受到越来越多的研究者的关注。它不仅已经被广泛运用到了Internet、办公自动化、冲突协调、决策支持、开放式信息系统等众多领域。并且它还是博弈论和人工智能交叉领域研究的热门问题之一。
　　在一个竞争的环境中，一个令人满意的多Agent学习算法应该至少是理性的，它应该能保证自己的安全收益。在一个可合作的环境中，一个令人满意的多Agent学习算法应该是满足合作性的，在与公正对手博弈时，应尽可能的达到双赢的局面。目前，有很多算法都可以满足理性，而另一些算法能够在与公正对手的博弈中取得高额回报，但是却不能二者兼得。
　　在本文中，我们详细分析了MAS中的学习环境理论模型，简要介绍了多Agent环境中学习算法应具备的属性，并分析了当前一些学者提出的算法。然后分析了Q-学习算法，WoLF原理，并介绍了Roben Axelrod实验。根据以上三个方面，我们分析了一个优秀的算法应能从历史博弈中进行学习，并且应该兼顾理性与合作性。在此基础上我们提出了PESCO算法，它能从以往的收益和对手的动作中学习到对手的特点，并且具备善意的、宽容的、强硬的特点。它在自博弈时满足自兼容性，它对非合作对手满足理性，保证安全收益，对合作对手，寻求帕累托效率解，达到双赢局面。
　　我们以可合作的供零博弈、Stackelberg博弈和非合作的猜硬币博弈为背景，通过一系列的实验来验证PESCO算法的有效性，详细描述了实验过程的每一个细节，说明了该算法无论在可合作的博弈中，还是非合作的博弈中，无论对手是合作的，还是非合作的，其效果都是令人满意的。

著录项

作者
景慧敏;
展开▼
作者单位

郑州大学;

展开▼
授予单位郑州大学;
学科计算机软件与理论
授予学位硕士
导师姓名柴玉梅;
年度 2009
页码
总页数
原文格式 PDF
正文语种中文
中图分类人工智能理论;算法理论;
关键词
多Agent系统; 学习算法; 帕累托效率解; 人工智能;

相似文献

中文文献
外文文献
专利

1. 一种在多Agent系统中求帕累托效率解的方法 [J] . 柴玉梅 ,景慧敏 . 计算机工程与应用 . 2010,第022期
2. 帕累托最优在我国信息资源配置效率中应用研究 [J] . 房春英 ,黄微 ,夏秀营 . 情报科学 . 2006,第9期
3. 教育资源效率与公平的统一--论目前高校招生收费中的帕累托最优与达尔文最优 [J] . 温小郑 . 西安电子科技大学学报（社会科学版） . 2001,第004期
4. 环境群体性事件博弈中的地方政府策略研究--从纳什均衡到帕累托最优 [J] . 普胤杰 ,龙水秀 . 广西师范学院学报（哲学社会科学版） . 2015,第005期
5. 自然与社会环境中的幂律现象和双帕累托对数正态分布 [J] . 方正 ,王杰 . 山东科学 . 2011,第003期
6. 回归合理的审判工作量：探索司法体制改革下民事审判单元的“帕累托效率”——以A市10个基层法院民事审判单元配备为视角 [C] . 洪泉寿 . 第十二届中国法学青年论坛 . 2017
7. 可靠性交通网络均衡的帕累托效率研究 [A] . 林芬 . 2017

在多Agent环境中求帕累托效率解的方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅