声明
致谢
摘要
1.1选题的研究背景及目的
1.2国内外研究现状
1.3 JZJ站位间转运活动分析
1.4研究目标和内容
1.5论文组织结构
2相关理论知识介绍
2.1强化学习方法概述
2.2 JZJ模型
2.3甲板环境场景
2.4本章小结
3 基于深度强化学习的站位间转运策略算法
3.1问题建模
3.1.1场景建模
3.1.2运动学模型
3.2概念介绍
3.3解决思路
3.3.1动态栅格先直后曲法
3.3.2基于贝塞尔曲线的随机游走
3.3.3角度区间内的随机游走
3.4转运策略评价
3.4.1 评价因素
3.4.2归一化
3.4.3评价函数
3.5本章小结
4系统设计与实现
4.1 实验环境
4.2系统结构
4.3强化学习环境
4.3.1二维场景建模工具
4.3.2路径可视化评价工具
4.4仿真演示环境
4.5研究方法实现
4.5.1动态栅格先直后曲法
4.5.2基于贝塞尔曲线的随机游走
4.5.3角度区间内随机游走
4.6实验过程与数据
4.6.1算法训练效率
4.6.2算法结果展示与评价
4.7本章小结
5.1论文总结
5.2研究展望
参考文献
作者简历及攻读硕士/博士学位期间取得的研究成果
学位论文数据集