第1 章绪 论
1.1 课题背景及研究的目的和意义
1.2 国内外研究现状
1.2.1 深度学习研究现状
1.2.2 抓取检测算法研究现状
1.2.3 抓取检测数据集研究现状
1.2.4 深度强化学习研究现状
1.2.5 深度强化学习训练机械臂抓取研究现状
1.3 本文的主要研究内容及章节安排
第2 章神经网络与学习算法
2.1 引言
2.2.1 卷积层与池化层
2.2.2 优化算法:Adam
2.2.3 参数初始化方法:Xavier初始化
2.3.1 随机策略与确定性策略
2.3.2 DPG与DDPG
2.3.3 DDPG的原理
2.3.4 DDPG的算法流程
2.4 本章小结
第3 章基于生成抓取卷积神经网络的抓取检测方法
3.1 引言
3.2.1 深度图像及其获取方式
3.2.2 数据集的组成
3.2.3 数据集的分配
3.3.1 抓取表示
3.3.2 训练数据生成
3.3.3 网络体系结构
3.3.4 网络训练过程
3.3.5 网络性能验证
3.4 本章小结
第4 章六自由度机械臂抓取检测仿真实验
4.1 引言
4.2 仿真环境实验平台搭建
4.2.1 ROS
4.2.2 Gazebo
4.2.3 MoveIt!
4.3.1 物理组成部分
4.3.2 测试物体集
4.3.3 抓取点定义
4.3.4 抓取检测管道
4.3.5 执行抓取方式
4.4 仿真实验测试
4.4.1 静态物体抓取
4.4.2 动态物体抓取
4.5 本章小结
第5 章基于DDPG算法的机械臂末端控制研究
5.1 引言
5.2.1 仿真实验环境设计
5.2.2 状态空间与动作空间设计
5.2.3 奖励函数设计
5.2.4 算法网络结构设计
5.3 奖励函数改进
5.4 回放经验采样策略改进
5.5 本章小结
第6 章基于DDPG算法的机械臂抓取物块仿真实验
6.1 引言
6.2 机械臂仿真实验平台
6.3 DDPG算法体系结构设计
6.4 改进奖励函数前后训练效果对比
6.5 本章小结
结 论
参考文献
声明
致 谢
哈尔滨工业大学;