首页> 中文学位 >基于解耦社会强化学习的多智能体协同控制的研究
【6h】

基于解耦社会强化学习的多智能体协同控制的研究

代理获取

目录

声明

第1章 绪论

1.1 课题研究背景

1.2 本文研究目标和意义

1.3 本文研究内容

1.4 本文组织结构

第2章 相关工作和挑战

2.1 现有工作介绍

2.2 本文的创新之处

2.3 工作面临的挑战

第3章 背景知识

3.1 多智能体系统网络结构

3.1.1 随机网络

3.1.2 小世界网络

3.1.3 无标度网络

3.2 强化学习

3.2.1 马尔科夫决策过程

3.2.2 强化学习模型

3.2.3 Q Learning和Double Q Learning

3.2.4 马尔科夫博弈

第4章 基于解耦社会强化学习的多智能体协同控制算法

4.1 多智能体协调博弈

4.1.1 语言协调博弈模型

4.1.2 社会规范涌现问题

4.2 社会规范涌现框架

4.2.1 多Q学习策略

4.2.2 多R学习策略

4.2.3 师生机制

4.2.4 动态网络重连机制

第5章 实验与评估

5.1 实验设置

5.2 实验结果

5.2.1 基于强化学习的策略之间对比

5.2.2 基于强化学习的策略与最先进方法的对比

5.2.3 动态网络重连机制的实验结果

第6章 总结与展望

6.1 总结

6.2 展望

参考文献

发表论文和参加科研情况说明

致谢

展开▼

著录项

  • 作者

    王一茜;

  • 作者单位

    天津大学;

  • 授予单位 天津大学;
  • 学科 软件工程
  • 授予学位 硕士
  • 导师姓名 路文焕;
  • 年度 2019
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号