前言
摘要
ABSTRACT
第一章 绪论
1.1.研究背景
1.2.基于MAS计算的关键问题
1.3.本文工作及创新
1.4.本文组织与结构
参考文献
第二章 多AGENT合作与协调研究概况及现状
2.1.引言
2.2.AGENT与多AGENT系统基本理论
2.2.1.Agent概念和结构
2.2.2.多Agent系统概念和外延
2.3.多AGENT合作与协调的分析方法
2.4.多AGENT合作问题的研究现状
2.4.1.组织建立
2.4.2.联盟形成
2.4.3.任务分配
2.5.多AGENT协调问题的研究现状
2.5.1.群体思维状态模型
2.5.2.多Agent规划
2.5.3.Agent社会规范
2.6.小结
参考文献
第三章 适应分布异构环境的任务分配机制
3.1.引言
3.2.相关工作
3.3.静态任务分配模型
3.3.1.问题定义
3.3.2.最优分配算法
3.3.3.启发式分配算法
3.3.4.时间复杂度分析
3.3.5.案例学习及性能分析
3.4.多任务流动态分配模型
3.4.1.问题定义
3.4.2.单任务流Q学习模型
3.4.3.值函数共享机制
3.4.4.基于Q学习的分布式多任务流分配算法
3.4.5.实验及性能分析
3.5.小结
参考文献
第四章 基于强化学习的行为协调机制
4.1.引言
4.2.MARKOV对策及强化学习
4.3.多AGENT学习相关工作
4.4.冲突博弈强化学习模型
4.4.1.冲突博弈
4.4.2.最优策略
4.4.3.基于后悔值的Q学习模型
4.4.4.算法实现
4.4.5.实验与结果分析
4.5.一般和博弈动态策略强化学习模型
4.5.1.时变性策略
4.5.2.适应性策略
4.5.3.纯策略Q学习
4.5.4.混合策略Q学习
4.5.5.性能验证与分析
4.6.小结
参考支献
第五章 个性化行为选择机制
5.1.引言
5.2.离散个性空间的行为选择
5.2.1.定性决策理论
5.2.2.基于定性决策论的个性化决策模型
5.2.3.有效性验证
5.3.连续个性空间的行为选择
5.3.1.基于神经网络的个性化决策模型
5.3.2.个性神经网络学习算法
5.3.3.有效性验证
5.4.基于SWARM的多AGENT系统仿真
5.4.1.Swarm简介
5.4.2.仿真平台及实例解析
5.5.小结
参考文献
第六章 总结及展望
6.1.本文研究总结
6.2.下一步工作
致谢
附录A 攻读博士学位期间发表(录用)论文情况
附录B 攻读博士学位期间参加科研学术活动情况
复旦大学;