首页> 中文学位 >基于元学习和深度强化学习的智能体快速适应方法

【6h】

基于元学习和深度强化学习的智能体快速适应方法

代理获取

页面导航

目录
著录项
相似文献
相关主题

目录

声明

摘要

第一章绪论

1．1研究背景及意义

1．2国内外研究现状

1．2．1基于模型的元强化学习

1．2．2基于优化的元强化学习

1．3论文的主要内容及组织结构

1．3．1论文的主要内容

1．3．2论文的组织结构

1．4本章小结

第二章智能体快速适应方法的基础理论介绍

2．1引言

2．2强化学习

2．2．1强化学习模型

2．2．2强化学习经典算法

2．3深度强化学习

2．3．1深度强化学习概述

2．3．1深度强化学习经典算法

2．3元学习

2．3．1元学习概述

2．3．2元学习方法

第三章基于MAML算法和深度强化学习的智能体快速适应算法

3．1引言

3．2MAML算法

3．2．1模型无关的元学习方法

3．2．2MAML算法在监督学习中的应用

3．2．3MAML算法在强化学习中的应用

3．3探索与利用

3．4算法总体设计

3．5实验与结果分析

3．5．1离散环境实验结果与分析

3．5．2连续环境实验结果与分析

3．6本章小结

第四章基于LSTM网络和深度强化学习的智能体快速适应算法

4．1引言

4．2卷积神经网络

4．2．1卷积运算

4．2．2卷积神经网络的结构

4．3循环神经网络

4．3．1循环神经网络的基础结构

4．3．2长短时记忆网络

4．3．3门控循环单元

4．4算法总体设计

4．4实验与结果分析

4．5．1离散环境实验结果与分析

4．5．2连续环境实验结果与分析

4．6本章小结

第五章基于NEAT算法和深度强化学习的智能体快速适应算法

5．1引言

5．2进化算法

5．2．1遗传算法

5．2．2进化策略

5．2．3神经进化

5．3NEAT算法

5．4算法总体设计

5．5实验与结果分析

5．5．1离散环境实验结果与分析

5．5．2连续环境实验结果与分析

5．6本章小结

第六章总结与展望

6．1论文工作总结

6．2研究工作展望

参考文献

攻读学位期间发表论文及参加项目情况

致谢

展开▼

著录项

作者
黄宁馨;
展开▼
作者单位

扬州大学;

展开▼
授予单位扬州大学;
学科电子与通信工程
授予学位硕士
导师姓名尹翔,钱灿军;
年度 2021
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词
入库时间 2022-08-17 11:23:27

相似文献

中文文献
外文文献
专利

1. 基于值分布的多智能体分布式深度强化学习算法 [J] . 陈妙云 ,王雷 ,盛捷 . 计算机系统应用 . 2022,第1期
2. 基于分区缓存区重放与多线程交互的多智能体深度强化学习算法 [J] . 柴来 ,张婷婷 ,董会 . 计算机学报 . 2021,第006期
3. 基于多智能体深度强化学习的空战博弈对抗策略训练模型 [J] . 孙彧 ,李清伟 ,徐志雄 . 指挥信息系统与技术 . 2021,第002期
4. 基于SAC的多智能体深度强化学习算法 [J] . 肖硕 ,黄珍珍 ,张国鹏 . 电子学报 . 2021,第009期
5. 基于多智能体深度强化学习的空战博弈对抗策略训练模型 [J] . 孙彧 ,李清伟 ,徐志雄 . 指挥信息系统与技术 . 2021,第002期
6. 基于元学习的加工过程智能协作控制 [C] . 温度 ,陈统坚 ,彭永红 . 第十三届中国过程控制年会 . 2002
7. 基于深度强化学习和元学习的目标跟踪 [A] . 白义东 . 2020

代理获取

客服邮箱：kefu@zhangqiaokeyan.com

京公网安备：11010802029741号 ICP备案号：京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有

客服微信
服务号