声明
第一章 绪论
1.1 研究背景
1.1.1 无人机的发展趋势与任务需求
1.1.2 无人机路径规划问题
1.2 国内外研究现状与发展趋势
1.2.1 无人机通信相关研究
1.2.2 无人机路径规划相关研究
1.3 论文主要研究内容与结构安排
第二章 路径规划算法基础
2.1 引言
2.2 马尔可夫决策过程的建模与运算过程
2.2.1 马尔可夫模型的子模型
2.2.2 马尔可夫决策过程
2.2.3 值函数
2.2.4 值函数计算的例子
2.3 动态规划算法概述
2.3.1 基本定义
2.3.2 建模过程
2.4 小结
第三章 基于动态规划的无人机路径规划算法
3.1 引言
3.2 问题的提出与建模
3.2.1 场景描述
3.2.2 场景建模
3.3 基于方向判定的动态规划(DDP)算法
3.3.1 传统DP算法的缺陷
3.3.2 Directional Dynamic Programming算法设计
3.3.3 DDP算法实验验证
3.4 小结
第四章 基于强化学习的无人机路径规划算法
4.1 引言
4.2 问题的提出与建模
4.2.1 场景描述
4.2.2 场景建模
4.3 强化学习算法描述
4.3.1 基本定义
4.3.2 建模过程
4.4 基于强化学习的无人机路径规划算法
4.4.1 Directional Q-Learning算法设计
4.4.2 Directional Q-learning算法实验验证
4.5 小结
第五章 总结与展望
5.1 研究工作总结与主要创新点
5.2 基于深度强化学习的无人机路径规划设计
5.3 课题研究展望
致谢
参考文献
作者在学期间取得的学术成果
国防科学技术大学国防科技大学;