声明
1 绪论
1.1 研究背景及意义
1.2 AGV路径规划概念及目标
1.3 AGV路径规划国内外研究现状
1.3.1 全局路径规划方法
1.3.2 局部路径规划方法
1.4 AGV路径规划存在的挑战
1.5 本文主要研究内容及安排
2 强化学习及神经网络相关理论
2.1 引言
2.2 强化学习概念
2.3 马尔科夫决策过程
2.4 强化学习基本模型及算法
2.4.1 TD算法
2.4.2 Sarsa算法
2.5 人工神经网络
2.5.1 多层感知机
2.5.2 BP神经网络
2.6 本章小结
3 基于模拟退火Sarsa算法的AGV路径规划
3.1 引言
3.2 Metropolis准则和模拟退火算法
3.2.1 Metropolis算法
3.2.2 模拟退火算法
3.3 AGV仿真环境搭建
3.3.1 环境模型
3.3.2 状态动作集
3.3.3 奖赏函数
3.3.4 动作策略函数
3.2.5 Sarsa算法的Q表设置
3.3 基于SA_Sarsa算法的AGV路径规划设计
3.3.1 算法流程
3.3.2 仿真分析
3.4 本章小结
4 基于深度Q网络的AGV路径规划
4.1 引言
4.2 DQN算法
4.3 基于深度Q网络的AGV路径规划设计
4.3.1 优先记忆库
4.3.2 势场法的奖赏函数
4.3.3 环境模型
4.3.4 神经网络训练
4.3.5 算法流程
4.3.6 仿真分析
4.4 本章小结
5 AGV路径规划的系统设计
5.1 引言
5.2 系统设计方案
5.2.1 上位机软件系统架构
5.2.2 AGV硬件平台
5.3 数据库设计
5.4 系统界面显示
5.5 AGV路径规划实验
5.6 章节小结
6 总结与展望
6.1 总结
6.2 展望
参考文献
作者在攻读硕士学位期间发表的成果和参与的项目
致谢
东华大学;