首页> 中文学位 >基于解耦社会强化学习的多智能体协同控制的研究

【6h】

基于解耦社会强化学习的多智能体协同控制的研究

代理获取

页面导航

目录
著录项
相似文献
相关主题

目录

声明

第1章绪论

1.1 课题研究背景

1.2 本文研究目标和意义

1.3 本文研究内容

1.4 本文组织结构

第2章相关工作和挑战

2.1 现有工作介绍

2.2 本文的创新之处

2.3 工作面临的挑战

第3章背景知识

3.1 多智能体系统网络结构

3.1.1 随机网络

3.1.2 小世界网络

3.1.3 无标度网络

3.2 强化学习

3.2.1 马尔科夫决策过程

3.2.2 强化学习模型

3.2.3 Q Learning和Double Q Learning

3.2.4 马尔科夫博弈

第4章基于解耦社会强化学习的多智能体协同控制算法

4.1 多智能体协调博弈

4.1.1 语言协调博弈模型

4.1.2 社会规范涌现问题

4.2 社会规范涌现框架

4.2.1 多Q学习策略

4.2.2 多R学习策略

4.2.3 师生机制

4.2.4 动态网络重连机制

第5章实验与评估

5.1 实验设置

5.2 实验结果

5.2.1 基于强化学习的策略之间对比

5.2.2 基于强化学习的策略与最先进方法的对比

5.2.3 动态网络重连机制的实验结果

第6章总结与展望

6.1 总结

6.2 展望

参考文献

发表论文和参加科研情况说明

致谢

展开▼

著录项

作者
王一茜;
展开▼
作者单位

天津大学;

展开▼
授予单位天津大学;
学科软件工程
授予学位硕士
导师姓名路文焕;
年度 2019
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词

相似文献

中文文献
外文文献
专利

1. 基于雾计算和强化学习的交通灯智能协同控制研究 [J] . 安萌萌 ,樊秀梅 ,蔡含宇 . 计算机应用研究 . 2020,第002期
2. 基于多智能体的风电并网协同控制研究 [J] . 韩西贵 ,王灵梅 ,郭红龙 . 可再生能源 . 2013,第003期
3. 基于多智能体强化学习的无人机集群攻防对抗策略研究 [J] . 轩书哲 ,柯良军 . 无线电工程 . 2021,第005期
4. 基于多智能体强化学习的多园区综合能源系统协同优化运行研究 [J] . 杨照 ,黄少伟 ,陈颖 . 电工电能新技术 . 2021,第008期
5. 基于GAED-MADDPG多智能体强化学习的协作策略研究 [J] . 邹长杰 ,郑皎凌 ,张中雷 . 计算机应用研究 . 2020,第012期
6. 基于强化学习的智能体避障研究 [C] . YING Xiao-kun ,应小昆 ,PANG Yi . 第九届中国多智能体系统与控制会议（MASC2013） . 2014
7. 社会困境下形成个体分工的多智能体深度强化学习模型 [A] . 张雷雷 . 2020

代理获取

客服邮箱：kefu@zhangqiaokeyan.com

京公网安备：11010802029741号 ICP备案号：京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有

客服微信
服务号