声明
摘要
第一章绪论
1.1研究背景及意义
1.2国内外研究现状
1.2.1基于模型的元强化学习
1.2.2基于优化的元强化学习
1.3论文的主要内容及组织结构
1.3.1论文的主要内容
1.3.2论文的组织结构
1.4本章小结
第二章智能体快速适应方法的基础理论介绍
2.1引言
2.2强化学习
2.2.1强化学习模型
2.2.2强化学习经典算法
2.3深度强化学习
2.3.1深度强化学习概述
2.3.1深度强化学习经典算法
2.3元学习
2.3.1元学习概述
2.3.2元学习方法
第三章基于MAML算法和深度强化学习的智能体快速适应算法
3.1引言
3.2MAML算法
3.2.1模型无关的元学习方法
3.2.2MAML算法在监督学习中的应用
3.2.3MAML算法在强化学习中的应用
3.3探索与利用
3.4算法总体设计
3.5实验与结果分析
3.5.1离散环境实验结果与分析
3.5.2连续环境实验结果与分析
3.6本章小结
第四章基于LSTM网络和深度强化学习的智能体快速适应算法
4.1引言
4.2卷积神经网络
4.2.1卷积运算
4.2.2卷积神经网络的结构
4.3循环神经网络
4.3.1循环神经网络的基础结构
4.3.2长短时记忆网络
4.3.3门控循环单元
4.4算法总体设计
4.4实验与结果分析
4.5.1离散环境实验结果与分析
4.5.2连续环境实验结果与分析
4.6本章小结
第五章基于NEAT算法和深度强化学习的智能体快速适应算法
5.1引言
5.2进化算法
5.2.1遗传算法
5.2.2进化策略
5.2.3神经进化
5.3NEAT算法
5.4算法总体设计
5.5实验与结果分析
5.5.1离散环境实验结果与分析
5.5.2连续环境实验结果与分析
5.6本章小结
第六章总结与展望
6.1论文工作总结
6.2研究工作展望
参考文献
攻读学位期间发表论文及参加项目情况
致谢
扬州大学;