首页> 中文学位 >基于时间分割网络的视频行为识别研究
【6h】

基于时间分割网络的视频行为识别研究

代理获取

目录

第一个书签之前

摘 要

Abstract

绪论

研究背景及意义

行为识别研究综述

问题定义和描述

研究难点

公开数据集

国内外研究现状

人工特征表示与深度学习特征表示

时序结构建模与时间分割网络

本文研究内容与结构

基于视频的行为特征表示

引言

基于人工的行为特征表示

时空兴趣点

密集轨迹

词袋编码

基于深度学习的行为特征表示

3DCNN

双流CNN及其改进TSN

LRCN

本章小结

针对非修剪视频的时间分割网络行为识别方法研究

引言

时间分割网络的原理

基于分割稀疏采样的动机

TSN框架描述

聚合函数与分析

时间分割网络的学习

TSN的搭建

TSN的训练

TSN的测试

多尺度滑动窗口集成方法

实验结果与分析

训练策略有效性验证

针对修剪视频的仿真研究

针对非修剪视频的仿真研究

本章小结

基于动态图像的四流时间分割网络研究

引言

动态图像

动态图像的原理

动态图像的快速生成算法

Rank-pooling层

四流时间分割网络

实验结果与分析

动态图像的仿真分析

四流TSN的仿真分析

本章小结

基于光流学习的实时时间分割网络研究

引言

无监督光流学习

光流网络的结构

光流网络的有监督初始化

光流网络的无监督学习

实时时间分割网络

实验结果与分析

光流网络的仿真分析

RT-TSN的仿真分析

本章小结

总结与展望

总结

展望

致 谢

参考文献

攻读硕士学位期间发表的论文和成果

展开▼

摘要

由于视频行为识别在视频监控、行为分析等领域的广泛应用,最近几年引起了学术界的广泛关注。面对视频的尺度变化、视角变化和相机移动等问题,如何设计出能够描述行为信息的有效特征显得至关重要。随着深度学习技术在图像领域的成功应用,很多深度学习方法被扩展到视频行为识别中。但是相对于图像,视频中包含的时序结构信息对于行为识别至关重要。针对长时时序建模,本文着重研究了时间分割网络(Temperal Segment Network,TSN)的非修剪视频处理、时序信息补充以及光流实时构造三个方面的问题。本文主要工作如下: 1.对视频行为识别任务的相关工作进行了综述和回顾,分别介绍了几种典型的人工行为特征表示和深度学习行为特征表示方法,着重分析了其视频时序结构建模的思路。 2.介绍了行为识别著名的深度学习框架TSN并针对非修剪视频的预测提出了一种多尺度滑动窗口集成方法。在原始双流卷积神经网络(Convolutional Neural Network,CNN)的基础上,TSN通过分割稀疏采样和信息聚合对视频长时时序结构进行建模,可以很好地表达长时时序结构信息。针对非修剪视频的预测,本文提出了多尺度滑动窗口集成方法,通过多尺度覆盖和Top-K池化可以很好定位行为以及抑制背景的影响。实验结果表明,本文提出的多尺度滑动窗口集成方法可以有效对非修剪视频进行预测。 3.提出了四流TSN网络。为了进一步刻画视频动态变化信息,本文基于动态图像对时序变化的表达能力,构造了四流TSN网络。动态图像将包含于视频所有帧间的运动信息表示为单个RGB图像,是一个高效且简单的视频表示,对于深度学习算法特别有效。因此本文在原有的静态图像和光流基础上,通过动态图像分别对其处理生成动态图像和动态光流两个新的流。实验结果表明,新增的两个流与原来的两个流性能上相互补,可以带来准确率的提升。 4.提出了实时TSN网络(Real Time TSN,RT-TSN)。针对原始TSN光流计算时间长以及存储需求大的缺陷,本文首先基于无监督光流学习法构造光流网络,然后将光流网络叠加到TSN框架的时间流网络,由此形成的RT-TSN不仅可以端到端训练,还可以实现实时预测。实验结果表明,RT-TSN在损失极小精确度的同时提升了TSN的速度。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号