首页> 中文学位 >基于强化学习的多机器人分布式协同机制研究
【6h】

基于强化学习的多机器人分布式协同机制研究

代理获取

目录

声明

目 录

1 绪论

1.1 研究背景

1.2 国内外研究现状

1.3 研究目的与意义

1.4 本文主要研究工作

1.5 本文基本组织结构

2 多智能体强化学习与协同图

2.1 强化学习

2.1.1 马尔可夫决策过程

2.1.2 Q-learning

2.2 协同图模型

2.2.1 协同图

2.2.2 变量消除算法

2.3 多智能体强化学习方法

2.3.1 多智能体马尔可夫决策过程

2.3.2 分布式独立学习方法

2.3.3 集中式学习方法

2.3.4 分布式协同学习方法

2.4 本章小结

3 多自主车分布式协同驾驶

3.1 单自主车自动驾驶

3.1.1 单自主车马尔可夫决策过程

3.1.2 实验方法与实验参数设置

3.1.3 实验结果及其分析

3.2 多自主车协同自动驾驶

3.2.1 多车马尔可夫决策过程与动态协同图

3.2.2 基于动态协同图的基本协同学习模型

3.2.3 基本协同学习模型实验设置及实验结果分析

3.2.4 复杂驾驶环境下的协同扩展机制

3.2.5 协同扩展机制实验设置及结果分析

3.3 本章小结

4 多移动机器人分布式协同侦搜

4.1 问题描述

4.2 协同MARL在MSRT问题中的应用

4.2.1 MSRT问题的多智能体马尔可夫决策过程

4.2.2 MSRT问题中的多智能体强化学习方法

4.2.3 实验设置及结果分析

4.3 MSRT问题中的知识迁移学习机制

4.3.1 知识提取过程

4.3.2 知识合成过程

4.3.3 实验设置及结果分析

4.4 协同学习在大规模MSRT问题中的应用

4.4.1 启发式方法

4.4.2 实验设置及结果分析

4.5 本章小结

5 多感知机器人分布式协同监测

5.1 问题描述

5.2 DSN问题的多智能体马尔可夫决策过程

5.3 基于协同图的多智能体强化学习

5.4 实验设置与结果分析

5.4.1 实验环境与参数设置

5.4.2 实验结果及其分析

5.5 本章小结

结论

参 考 文 献

攻读硕士学位期间发表学术论文情况

致谢

大连理工大学学位论文版权使用授权书

展开▼

摘要

作为分布式人工智能领域(Distributed Artificial Intelligent,DAI)的一个重要研究分支,多智能体系统(Multi-Agent System,MAS)的分布式协同机制已经成为研究热点。多智能体系统由一群相互作用的自主实体组成,广泛应用于企业过程控制、多机器人系统、资源分配管理和自动交易等问题。在多智能体系统中,由于环境的复杂性、动态性和开放性,对智能体的行为进行预先设计通常面临巨大的挑战。作为一种面向环境交互的自主学习范式,强化学习(Reinforcement Learning,RL)是实现多智能体系统分布式协同的有效方法,通过每个智能体与环境交互,并根据交互的反馈值进行最优策略的自主学习,从而实现系统协同的目标。 本文面向多自主车协同驾驶、多移动机器人协同侦搜和多感知机器人协同监测等任务需求,深入研究了协同图(Coordination Graphs,CGs)框架下的多机器人分布式协同学习方法和模型,解决了动态环境下的CGs学习、协同机制单一等问题。具体而言: 1.研究了高速公路上多自主车辆分布式协同驾驶问题,将RL技术应用于多自主车辆在高速公路场景下协同超车、协同换道等智能决策。针对车辆移动导致的拓扑结构动态变化难题,本文提出了动态协同图(Dynamic Coordination Graphs,DCGs)模型,对车辆运动过程中的动态依赖关系进行建模,并实现了基于DCGs的多自主车辆的分布式协同学习。实验结果表明,与独立学习方法、基于专家规则的方法相比,基于DCGs的分布式协同学习方法在驾驶安全性和交通系统高效性等方面具有更好的性能。 2.研究了有限通信能力和观测视野下的移动感知机器人团队(Mobile Sensing Robot Team,MSRT)分布式协同侦搜问题,提出了一种在线迁移强化学习方法,实现了动态拓扑下个体交互经验和学习知识的智能迁移和分布式学习。实验结果表明,与独立学习方法相比,本文所提出的方法可以通过适当平衡每个智能体的局部个体利益和全局团队效益来实现更好的团队性能。 3.研究了多感知机器人分布式协同监测问题,根据协同机制作用的不同对象(时间差分误差、学习率和探索率),提出了多种基于CGs模型的分布式协同学习方法,并在分布式传感器网络(Distributed Sensor Network,DSN)环境中验证了所提出方法的有效性和可靠性。DSN问题的仿真实验结果表明,与独立学习方法相比,基于CGs的协同学习方法通过协同RL中的不同学习组件来获得不同的学习模式,具有更好的性能。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号