声明
摘要
第1章绪论
1.1课题研究背景和研究意义
1.2 AUV路径规划研究现状
1.2.1全局路径规划方法研究现状
1.2.2局部路径规划方法研究现状
1.3强化学习研究现状
1.3.1强化学习方法研究现状
1.3.2强化学习应用研究现状
1.4基于强化学习的路径规划研究现状
1.5本文主要内容
第2章基于双神经网络的DQN强化学习
2.1强化学习基本理论
2.1.1有模型强化学习
2.1.2无模型强化学习
2.2 Q_learning学习算法
2.2.1 Q_learning算法原理
2.2.2 Q_learning算法流程
2.2.3 Q学习算法收敛性分析
2.3基于双神经网络的DQN强化学习算法
2.3.1神经网络拟合Q值表
2.3.2非稳定函数拟合问题
2.3.3目标网络
2.3.4基于“吃惊度”的经验回放方法
2.4本章小结
第3章基于DQN算法的AUV智能规划方法
3.1基于DQN算法的AUV智能规划框架
3.2 AUV规划系统设计
3.2.1规划系统结构
3.2.2 AUV单步决策位置计算
3.2.3环境状态表示
3.3评价函数设计
3.3.1避障模型评价函数设计
3.3.2绕行模型评价函数设计
3.4本章小结
第4章避障仿真实验与分析
4.1仿真环境与TensorFlow介绍
4.2避障仿真实验
4.2.1模型训练过程分析
4.2.2模型效果分析
4.2.3单神经网络DQN对比实验
4.2.4基于“吃惊度”的经验优先回放对比实验
4.3本章小结
第5章障碍物边界绕行仿真实验与分析
5.1模型训练过程分析
5.2模型效果分析
5.3基于Vega视景的巡航仿真实验
5.3.1仿真系统结构
5.3.2仿真视景搭建
5.3.3仿真实验结果及分析
5.4本章总结
结论
参考文献
攻读硕士学位期间发表的文章和取得的科研成果
致谢