文摘
英文文摘
声明
第一章 绪论
1.1研究背景
1.2研究现状
1.3研究内容
1.4论文结构及主要内容
第二章 多Agent学习理论综述
2.1 Agent的概念及特征
2.1.1 Agent的定义
2.1.2 Agent的特征
2.1.3多Agent系统
2.2 MAS学习框架理论模型
2.2.1马尔科夫决策过程(Markov Decision Processes,MDP)
2.2.2矩阵博弈(Matrix Games)
2.2.3随机博弈(Stochastic Games)
2.2.4 MAS学习框架小结
2.3学习算法相关定义
第三章 一种在多Agent系统中求帕累托高效率解的方法
3.1 Q-学习
3.1.1 Q-学习原理
3.1.2 Q-学习算法的描述
3.2 WoLF思想及其相关算法
3.2.1WoLF原理
3.2.2 Wnning的判定
3.3 Robert Axelrod实验
3.4 PESCO算法
3.4.1 PESCO算法的核心策略
3.4.2 PESCO算法的描述
第四章博弈实验与分析
4.1供零博弈
4.1.1供零博弈
4.1.2自博弈
4.1.3不同的对手
4.1.4各个Agent的博弈结果
4.1.5结论
4.2 Stackelberg博弈
4.2.1 Stackelberg
4.2.2自博弈
4.2.3各个Agent的博弈结果
4.3猜硬币博弈
4.3.1猜硬币博弈
4.3.2自博弈
4.3.3与WoLF-GIGA的博弈
4.3.4各个Agent博弈结果
4.4小结
第五章 总结与展望
5.1总结
5.2未来工作展望
参考文献
致谢
附录(攻读学位期间发表的论文)