文摘
英文文摘
声明
第一章绪论
1.1研究背景
1.2 RoboCup研究现状
1.3研究目的与意义
1.4 MAS主要研究内容
1.5本文结构组成
第二章RoboCup仿真比赛系统
2.1 RoboCup仿真环境介绍
2.2 SoccerServer仿真环境模型
2.2.1比赛场地和球员
2.2.2球员的动作
2.2.3球员的感知
2.3 RoboCup仿真环境的特点
2.4小结
第三章MAS协作与规划
3.1 MAS体系结构
3.1.1集中式结构
3.1.2分布式结构
3.1.3混合式结构
3.2分层结构模型
3.2.1通迅层
3.2.2基本动作层
3.2.3可选动作评价层
3.2.4决策层
3.2.5世界模型
3.3阵形规划研究
3.3.1角色的概念
3.3.2静态阵形
3.3.3动态阵形
3.4基于合作意愿矩阵的规划协作策略
3.4.1基于合作意愿矩阵的规划协作策略
3.4.2规划协作策略的应用
3.5小结
第四章强化学习理论及应用
4.1强化学习模型
4.2模糊Q学习
4.2.1 Q学习算法
4.2.2模糊Q学习算法
4.2.3模糊Q学习在RoboCup中的应用
4.3基于CA-FCMAC的Q学习算法
4.3.1传统的CMAC
4.3.2 CA-FCMAC
4.3.3 CA-FCMAC Q学习
4.3.4 CA-FCMAC Q学习的应用
4.4小结
第五章基于先验知识的内在激励强化学习
5.1基于先验知识的强化学习
5.2内在激励强化学习
5.2.1内在激励强化学习简述
5.2.2内在激励强化学习算法
5.3基于先验知识的内部激励强化学习算法
5.4算法在RoboCup协作中的应用
5.4.1二对一问题
5.4.2三对二问题
5.5小结
第六章结论与展望
6.1本文总结
6.2展望
致谢
参考文献
附录:作者在攻读硕士学位期间发表的论文