声明
致谢
1 引言
1.1 研究背景与意义
1.2 研究现状
1.2.1 舰载机着舰系统研究现状
1.2.2 深度强化学习研究现状
1.3 研究内容
1.4 论文组织结构
2 相关理论基础
2.1 强化学习理论基础
2.1.1 强化学习基本原理
2.1.2 马尔科夫决策过程
2.1.3 基于策略的强化学习算法
2.1.4 基于模型的强化学习算法
2.2 迁移学习理论基础
2.2.1 迁移学习概念
2.2.2 迁移学习算法
2.2.3 迁移强化学习
2.3 本章小结
3 基于深度强化学习的自动着舰算法
3.1 舰载机着舰影响因素分析
3.1.1 舰载机着舰问题分析
3.1.2 影响着舰的环境因素分析
3.2 基于 DDPG 的舰载机自动着舰算法
3.1.1 MDP建模
3.1.2 分层经验采样
3.1.3 算法流程
3.3 仿真实验环境
3.4 实验设置及结果分析
3.4.1 实验设置
3.4.2 实验结果及分析
3.5 适应性分析
3.6 本章小结
4 基于迁移强化学习的自动着舰算法
4.1 总体研究思路
4.2 基于模型的迁移强化学习算法
4.2.1 环境模型的表示及迁移
4.2.2 策略模型的表示及迁移
4.2.3 算法流程
4.3 实验设置与结果分析
4.3.1 实验环境
4.3.2 实验设置
4.3.3 实验结果及分析
4.4 在舰载机着舰问题中的应用
4.5 本章小结
5 总结与展望
5.1 总结
5.2 展望
参考文献
作者简历及攻读硕士学位期间取得的研究成果
独创性声明
学位论文数据集
北京交通大学;