声明
致谢
摘要
1 绪论
1.1 研究背景和意义
1.2 国内外研究概况
1.2.1 输入设备
1.2.2 手势模型
1.2.3 动态手势识别方法
1.2.4 手势识别应用
1.2.5 国内外研究机构和常用手势库
1.3 本文工作
1.4 本文结构安排
2 RGB-D数据采集及视觉词袋模型框架
2.1 Kinect构造和深度图像成像原理介绍
2.2 视觉词袋模型
2.2.1 词袋模型和视觉词袋模型的关系
2.2.2 常见时空特征提取算法
2.2.3 字典学习和编码
2.2.4 视频表示
2.2.5 训练分类器和识别
3 基于RGB-D的一次学习手势识别
3.1 引言
3.2 三维增强运动尺度不变特征转换
3.2.1 构建高斯和差分高斯金字塔
3.2.2 构建光流金字塔
3.2.3 关键点检测
3.2.4 计算特征描绘子
3.2.5 3D EMoSIFT算法小结
3.3 字典学习和特征编码
3.4 分类器
3.5 基于DTW的连续手势分割
3.6 一次学习手势识别总结
3.7 实验结果
3.7.1 数据库
3.7.2 度量准则
3.7.3 参数讨论
3.7.4 实验比较
3.8 本章小结
4 三维稀疏运动尺度不变特征转换
4.1 引言
4.2 构建RGB-D金字塔
4.3 关键点检测
4.3.1 初始点检测
4.3.2 关键点跟踪和检测
4.4 计算特征描绘子
4.4.1 构建三维梯度空间
4.4.2 构建三维运动空间
4.5 3D SMoSIFT算法总结
4.6 实验结果
4.6.1 属性设置
4.6.2 时间复杂度分析
4.6.3 实验比较
4.7 本章小结
5 特定类互信息最大化
5.1 引言
5.2 三变量条件熵引理推导
5.3 特定类互信息最大化(CSMMI)
5.3.1 初始化字典
5.3.2 CSMMI算法的提出及求解过程
5.3.3 分类
5.4 CSMMI子模块法(Submodularity)
5.5 实验结果
5.5.1 CSMMI直接法与子模块方法比较
5.5.2 稀疏系数直方图
5.5.3 剑桥大学手势库
5.5.4 Chalearn手势库
5.5.5 Keck手势库
5.5.6 讨论
5.6 本章小结
6 基于Kinect的手势识别系统平台
6.1 引言
6.2 手势识别系统平台
6.2.1 数据采集模块
6.2.2 训练模块
6.2.3 在线识别模块
6.3 动态手语识别系统
6.3.1 动态手语介绍
6.3.2 动态手语在线识别
6.3.3 识别性能测试
6.4 交通警察手势识别系统
6.4.1 交通警察手势介绍
6.4.2 交通警察手势在线识别
6.4.3 识别性能测试
6.5 本章小结
7 结论
7.1 工作总结
7.2 未来展望
参考文献
作者简历及攻读博士学位期间取得的研究成果
学位论文数据集