声明
摘要
插图
表格
1.1研究背景与意义
1.2国内外研究现状
1.2.1二维人体姿态估计
1.2.2相对于根节点的三维人体姿态估计
1.2.3深度估计
1.2.4相机坐标系下绝对三维人体姿态估计
1.3论文的主要工作及结构安排
1.3.1论文的主要工作
1.3.2论文结构安排
2.1任务描述
2.2基础理论介绍
2.2.1卷积层
2.2.2池化(Pooling)层
2.2.3批量归一化(Batch Normalization,BN)
2.2.4激活函数
2.2.5非相邻特征层的信患传输方式
2.3数据集介绍
2.3.1 CMU Panoptic
2.3.2 MuPoTS-3D
2.3.3 Microsoft COCO
2.3.4评价指标
2.4本章小结
3.1问题定义
3.1.1多人场景二维关键点检测
3.1.2相机坐标系下人体绝对深度估计
3.1.3人体骨骼相对深度估计
3.2单步多任务迭代式网络设计
3.2.1图像特征提取(下采样)模块
3.2.2输出语义抽取(上采样)模块
3.2.3上采样与下采样模块之间的信息共享
3.2.4任务专属卷积模块
3.2.5迭代式优化
3.3由网络输出得到最终的人体绝对值坐标方法
3.3.1二维关键点检测与关联
3.3.2人体根节点绝对深度值获取
3.3.3人体其他关键点绝对深度值获取
3.3.4关键点三维坐标恢复
3.4实验结果与分析
3.4.1多任务网络的训练方法
3.4.2实验结果
3.5本章小结
4.1引言
4.2基于微型网络的三维姿态补全与再优化
4.2.1输入与输出
4.2.2微型网络结构设计
4.3深度已知的关键点匹配算法
4.3.1按序匹配算法
4.3.2自适应骨长距离约束
4.4实验结果与分析
4.5本章小结
5.1引言
5.2多人场景深度图训练集制作
5.2.1运动重构(SFM)开源工具COLMAP简介
5.2.2深度图滤波与补全
5.3深度估计网络训练
5.3.1深度估计任务中常用的损失函数
5.3.2随机向量损失函数
5.4深度图在人体姿态估计框架中的使用方法与实验结果分析
5.5本章小结
6.1工作总结
6.2展望
参考文献
附录
攻读硕士学位期间主要的研究成果
浙江大学;