文摘
英文文摘
声明
第一章 绪论
1.1引言
1.1.1环境探索
1.1.2路径规划
1.1.3多机器人协作
1.1.4移动机器人的学习方法
1.2移动机器人路径规划的发展及研究现状
1.2.1移动机器人环境探索的发展及研究现状
1.2.2移动机器人路径规划的研究现状
1.2.3多移动机器人协作系统的发展与研究现状
1.3本文的主要研究工作及结构
第二章 移动机器人环境探索及路径规划研究
2.1引言
2.2移动机器人环境探索
2.2.1环境地图的创建及表示方式
2.2.2目标点的定义
2.2.3代价值计算
2.2.4效用值的计算
2.2.5基于迭代运算的目标点分配策略
2.3移动机器人的路径规划
2.3.1移动机器人的路径规划方法
2.3.2移动机器人的传感器系统
2.3.3多移动机器人在路径规划中的冲突消解
2.4小结
第三章 基于强化学习的移动机器人在静态未知环境中的路径规划
3.1引言
3.2 强化学习
3.2.1强化学习的概念
3.2.2强化学习的原理
3.2.3强化学习的基本方法
3.2.4强化学习算法
3.3基于强化学习的移动机器人在静态未知环境中的路径规划
3.3.1环境模型及初始状态设置
3.3.2传感器模型
3.3.3机器人模型及相关定义
3.3.4障碍物模型
3.3.5路径规划策略
3.3.6基本状态和基本行为的分解与表示
3.3.7强化函数设计
3.3.8强化学习算法描述
3.4仿真实验结果与分析
3.5小结
第四章基于强化学习的移动机器人在动态未知环境中的路径规划
4.1引言
4.2资格迹(Eligibility trace)技术简介
4.2.1资格迹的基本原理
4.2.2资格迹在Q强化学习算法中的应用
4.3基于强化学习的移动机器人在规则运动动态障碍物环境中的路径规划
4.3.1运动障碍物的预测与模型
4.3.2路径规划策略
4.3.3状态空间和动作空间的划分
4.3.4强化函数的设计
4.3.5算法描述
4.4移动机器人在动态环境下的路径规划
4.4.1路径规划策略
4.4.2强化函数的设计
4.5仿真实验结果与分析
4.6小结
第五章 基于状态预测强化学习在多移动机器人环境探索中的路径规划
5.1引言
5.2状态预测
5.2.1状态预测的概念
5.2.2状态预测的原理
5.2.3基于状态预测的强化学习模型
5.3基于状态预测的强化学习在多移动机器人协作环境探索中的路径规划
5.3.1路径规划策略
5.3.2状态预测的动作选择概率及动作选择策略
5.3.3状态空间与动作空间
5.3.4强化函数的设计
5.3.5基于状态预测的强化学习算法描述
5.4仿真试验结果与分析
5.5小结
结论
参考文献
致谢