声明
致谢
摘要
插图
表格
第1章绪论
1.1研究背景及意义
1.2国内外研究现状
1.2.1基于传统方法的导航策略
1.2.2基于人工智能方法的导航策略
1.3本论文研究内容
第2章强化学习基础
2.1 马尔可夫决策过程与值函数
2.2模型巳知的算法
2.2.1策略迭代算法
2.2.2值函数迭代算法
2.3模型未知的算法
2.3.1基于值函数的算法
2.3.2基于直接策略搜索的算法
2.4本章小结
第3章基于DDPG的无入驾驶汽车低成本导航
3.1问题描述
3.2车辆运动学模型
3.3输入数据预处理
3.3.1障碍物信息归一化
3.3.2 全局参考路点的坐标变换
3.4运动规划器的网络结构
3.4.1 Actor网络
3.4.2 Critic网络
3.5奖励函数设计
3.6本章小结
第4章仿真分析
4.1模型训练
4.2模型评估
4.3算法实时性
4.4本章小结
第5章实车实验
5.1实验平合简介
5.2基于激光点云的局部障碍物地图感知
5.2.1激光点云感知算法
5.2.2障碍物膨胀
5.3实验结果
5.4本章小结
第6章总结与展望
6.1全文总结
6.2工作展望
参考文献
攻读学位期间发表的论文
浙江大学;