声明
目 录
1 绪论
1.1 研究背景
1.2 国内外研究现状
1.3 研究目的与意义
1.4 本文主要研究工作
1.5 本文基本组织结构
2 多智能体强化学习与协同图
2.1 强化学习
2.1.1 马尔可夫决策过程
2.1.2 Q-learning
2.2 协同图模型
2.2.1 协同图
2.2.2 变量消除算法
2.3 多智能体强化学习方法
2.3.1 多智能体马尔可夫决策过程
2.3.2 分布式独立学习方法
2.3.3 集中式学习方法
2.3.4 分布式协同学习方法
2.4 本章小结
3 多自主车分布式协同驾驶
3.1 单自主车自动驾驶
3.1.1 单自主车马尔可夫决策过程
3.1.2 实验方法与实验参数设置
3.1.3 实验结果及其分析
3.2 多自主车协同自动驾驶
3.2.1 多车马尔可夫决策过程与动态协同图
3.2.2 基于动态协同图的基本协同学习模型
3.2.3 基本协同学习模型实验设置及实验结果分析
3.2.4 复杂驾驶环境下的协同扩展机制
3.2.5 协同扩展机制实验设置及结果分析
3.3 本章小结
4 多移动机器人分布式协同侦搜
4.1 问题描述
4.2 协同MARL在MSRT问题中的应用
4.2.1 MSRT问题的多智能体马尔可夫决策过程
4.2.2 MSRT问题中的多智能体强化学习方法
4.2.3 实验设置及结果分析
4.3 MSRT问题中的知识迁移学习机制
4.3.1 知识提取过程
4.3.2 知识合成过程
4.3.3 实验设置及结果分析
4.4 协同学习在大规模MSRT问题中的应用
4.4.1 启发式方法
4.4.2 实验设置及结果分析
4.5 本章小结
5 多感知机器人分布式协同监测
5.1 问题描述
5.2 DSN问题的多智能体马尔可夫决策过程
5.3 基于协同图的多智能体强化学习
5.4 实验设置与结果分析
5.4.1 实验环境与参数设置
5.4.2 实验结果及其分析
5.5 本章小结
结论
参 考 文 献
攻读硕士学位期间发表学术论文情况
致谢
大连理工大学学位论文版权使用授权书
大连理工大学;