第一个书签之前
声明
1 绪论
1.1 研究背景及意义
1.2 国内外研究现状
1.2.1 国内外服务机器人
1.2.2 目标检测
1.2.3 物体抓取与操纵
1.3 本文主要工作
1.4 本文内容安排
2 目标检测与强化学习
2.1 引言
2.2 目标检测
2.2.1 Yolov3
2.2.2 单目测距
2.3 强化学习
2.3.1 Markov决策过程
2.3.2 Q-Learning
2.3.3 SARSA
2.3.4 Deep Q Network
2.3.5 Actor-Critic Systems
2.3.6 深度确定性策略梯度算法
2.3.7 HER
2.4 深度强化学习中存在的问题
2.5 现实中存在的差距
2.6 本章小结
3 实验平台与运动学建模
3.1 软硬件介绍
3.1.1 硬件介绍
3.1.2 软件介绍
3.2 运动学建模
3.2.1 正向运动学
3.2.2 逆向运动学
3.3 本章小结
4 实验结果与分析
4.1 二维仿真
4.1.1 二维仿真的实验设计
4.1.2 仿真环境的更新设计
4.1.3 奖励函数的更新设计
4.1.4 经验回放池的更新设计
4.1.5 实验结果与分析
4.2 三维仿真
4.2.1 三维仿真实验设计
4.2.2 仿真环境的更新设计
4.2.3 算法更新设计
4.2.4 实验结果与分析
4.3 实物仿真验证
4.3.1 实验结果与分析
4.4 本章小结
5 总结与展望
5.1 总结
5.2 展望
附录
参考文献
攻读硕士期间发表的论文及所取得的研究成果
致谢
中北大学;