首页> 中文学位 >多智能体中的深度强化学习迁移方法研究

【6h】

多智能体中的深度强化学习迁移方法研究

代理获取

页面导航

目录
著录项
相似文献
相关主题

目录

声明

答辩决议书

第一章绪论

1.1 研究背景及意义

1.2 国内外研究现状

1.3 本文研究内容

1.4 本文组织结构

第二章相关理论及技术

2.1 深度强化学习

2.1.1 马尔科夫决策过程--MDP

2.1.2 贝尔曼(Bellman)方程式

2.1.3 深度强化学习

2.1.4 深度强化学习算法

2.2 多智能体深度强化学习迁移

第三章面向多智能体规模变化的序列强化学习算法

3.1 问题分析

3.2 序列多智能体强化学习算法

3.2.1 算法介绍

3.2.2 算法流程

3.3 实验

3.3.1 实验环境介绍

3.3.2 奖励函数设计

3.3.3 实验设计

3.3.4 实验结果以及分析

3.3.5 算法有效性分析

3.4 本章小结

第四章融合监督学习的深度强化学习算法

4.1 问题分析

4.2 融合监督学习的深度强化学习算法

4.2.1 算法介绍

4.2.2 算法流程

4.3 实验

4.3.1 实验设计

4.3.2 实验结果

4.4 本章小结

第五章一种模块化的深度强化学习模型

5.1 问题分析

5.2 一种模块化的深度强化学习模型

5.3 实验

5.3.1 实验环境介绍

5.3.2 实验奖励设置

5.3.3 实验设计

5.3.4 实验结果及分析

5.4 本章小结

第六章总结与展望

6.1 总结

6.2 展望

参考文献

攻读学位期间取得的研究成果

致谢

展开▼

著录项

作者
史腾飞;
展开▼
作者单位

太原理工大学;

展开▼
授予单位太原理工大学;
学科数据科学与技术
授予学位硕士
导师姓名王莉;
年度 2021
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词

相似文献

中文文献
外文文献
专利

1. 智能车辆深度强化学习的模型迁移轨迹规划方法 [J] . 余伶俐 ,邵玄雅 ,龙子威 . 控制理论与应用 . 2019,第009期
2. 基于深度强化学习的智能体在智慧消防中的应用研究 [J] . 牛浩玉 ,汤文兵 ,田锦 . 通信技术 . 2019,第010期
3. 多智能体深度强化学习研究综述 [J] . 孙彧 ,曹雷 ,陈希亮 . 计算机工程与应用 . 2020,第005期
4. 一种基于迁移深度强化学习的建筑能耗预测方法 [J] . 傅启明 ,吴少波 ,戴大东 . 计算机应用研究 . 2020,第S01期
5. 基于元深度强化学习方法的智能博弈决策模型研究 [J] . 徐志雄 ,曹雷 ,陈希亮 . 军事运筹与系统工程 . 2021,第003期
6. 深度多智能体强化学习 [C] . 郝建业 . 2018中国大数据技术大会(BDTC） . 2018
7. 多智能体深度强化学习的经验回放方法研究 [A] . 王艺深 . 2020

代理获取

客服邮箱：kefu@zhangqiaokeyan.com

京公网安备：11010802029741号 ICP备案号：京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有

客服微信
服务号