首页> 中文学位 >基于时空特征提取的视频动作识别技术研究
【6h】

基于时空特征提取的视频动作识别技术研究

代理获取

目录

声明

摘要

1引言

1.1研究背景

1.2国内外研究现状

1.3主要问题

1.4主要研究内容

1.5论文组织结构

2相关技术研究

2.1密度轨迹法

2.2视觉特征词袋模型

2.2.1词袋模型

2.2.2词袋模型在计算机视觉中的应用

2.3空间金字塔模型

2.4排序池化应用于视频特征提取

2.4.1构建有序视觉特征对

2.4.2排序池化原理

2.5本章小结

3基于多通道时空金字塔的视频时空特征提取

3.1概述

3.2基本视觉特征提取

3.2.1方向梯度直方图

3.2.2光流直方图

3.3视觉字典学习

3.4多通道时空金字塔模型构建

3.5算法流程

3.6视频分类及实验结果分析

3.6.1 KTH数据集

3.6.2分类器

3.6.3实验结果与分析

3.7本章小结

4基于排序池化融合空间特征的视频时空特征提取

4.1概述

4.2基本视觉特征序列预处理

4.2.1基本视觉特征提取

4.2.2二维图像空间金字塔构建

4.2.3有序基本特征向量集smooth操作

4.3排序函数优化

4.4算法流程

4.5视频分类与实验结果分析

4.5.1数据集

4.5.2分类器

4.5.3实验结果分析

4.6本章小结

5本文总结与未来展望

5.1本文工作总结

5.2未来工作展望

致谢

参考文献

附录

展开▼

摘要

视频动作识别通常是指从一段视频序列中识别出人体动作类别的过程,该项技术广泛应用于多媒体内容分析、人机交互、智能实时监控等领域,可以通过对视频进行特征提取生成特征向量,用分类器对特征向量进行分类来实现。 本文主要针对视频的时空特征提取问题展开研究,传统方法中通常将视频三维时空域作为一个整体来捕捉视频动态变化特征,这种做法存在片面性,会导致丢失大量属于二维图像空间域或一维时序域特有的变化特性,因此,视频动作识别技术需要对视频时间、空间结构分开处理以便更加全面地捕捉视频动态变化中的时空特征信息,本文针对以上问题提出了两种视频时空特征提取算法,主要研究内容如下: 1)本文提出了一种基于多通道时空金字塔的视频时空特征提取方法。该方法的核心内容是多通道时空金字塔模型的构建,该模型摒弃了传统时空金字塔将视频三维时空域整体多尺度子分割的方式,而对视频分别进行三维时空域、二维图像空间域、一维时间域三个通道单独进行多尺度分割,结合词袋模型计算每个子空间词频直方图,最后串联所有子空间词频直方图作为视频最终特征向量,用分类器对特征向量进行分类。该方法可以更加全面的捕捉视频分别在三维时空域、二维图像空间域、一维时间域上的特有的动态变化特征,丰富了视频特征的时空结构信息。 2)本文提出了一种基于排序池化融合空间特征的视频时空特征提取方法。该方法对视频每帧图像的二维空间域进行多尺度分割,单独对每个子空间内按照时序排列的局部特征向量序列用排序函数进行监督学习,捕捉子空间特征序列的时序变化信息,将模型参数作为该子空间的特征描述子,最后串联各个子空间描述子获得视频最终特征向量,使用分类器对特征向量进行分类。该方法将二维图像空间特征融入排序池化算法中,既继承了排序池化算法可以捕捉丰富的视频时序变化特征的优点,又弥补了其缺乏二维图像空间结构特征的缺点,可以有效地提高动作识别的准确性。

著录项

  • 作者

    赵恒颖;

  • 作者单位

    南京理工大学;

  • 授予单位 南京理工大学;
  • 学科 软件工程方法
  • 授予学位 硕士
  • 导师姓名 项欣光;
  • 年度 2017
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类
  • 关键词

    时空; 特征提取; 视频; 动作;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号