首页> 中文学位 >基于深度学习的视频预测及视频行人检测方法研究
【6h】

基于深度学习的视频预测及视频行人检测方法研究

代理获取

目录

声明

1绪论

1.1研究背景与意义

1.2视频预测任务的研究现状与趋势

1.3行人检测任务的发展现状

1.4技术路线

1.5本文贡献

2 深度学习的相关理论及应用

2.1深度学习的物体建模方法

2.2深度学习的时序建模方法

2.3深度网络在实际问题中的应用

2.4小结

3基于光流的视频预测研究

3.1算法动机

3.2模型介绍

3.3实验结果

3.4小结

4基于长短时记忆网络的视频人体检测研究

4.1背景介绍

4.2模型简介

4.3实验分析

4.4小结

5总结与展望

参考文献

攻读硕士期间主要成果

致谢

展开▼

摘要

随着科技进步和社会的发展,计算机的存储和运算性能得到了极大的提升,大量的监控视频进入计算机视觉领域,给视频分析提供丰富的实验数据,但同时也带来巨大的挑战。视频分析在现实中有着广泛的应用,比如车辆导航,交通流控制以及智能侦查等方面。本文主要关注视频分析中的视频预测以及视频行人检测,具体开展以下工作:
  首先,目前视频预测研究中通常采用传统人工特征。但由于存在各种干扰因素,导致手工生成和设计的特征很难完成对于视频序列的整体描述,不能够很好的表示真实图片。深度学习方法加强了特征对于视频序列的表达能力,但并不足以描述复杂的运动过程。而且,目前深度学习方法的特征和传统学习方法的特征通常是独立进行建模,鲜有算法尝试将两种特征进行融合。为此,本文提出了双流卷积LSTM自动编码机。将深度学习和传统学习方法相结合,通过卷积的LSTM模型对视频序列进行建模提取特征,并通过线性串联的方式将图片特征和光流特征相融合,最终通过卷积LSTM模型生成预测视频序列。该方法提高了视频预测算法的性能。
  其次,目前视频行人检测研究中存在以下问题:传统的检测方法是将视频分割成单张图片,利用行人检测算法从监控图像中得到行人检测框,忽略了视频序列特有的时序信息。真实场景下,背景较为复杂,利用视频序列中的时序信息尤为重要。为此,本文提出了改进的faster R-CNN算法,这个网络通过较大规模的特征提取网络学习到强有力的视觉特征,再通过LSTM模型对时序信息的建模,从而对最终结果进行修正。同时最终的残差连接方式保证了算法准确度,并有效地防止过拟合情况的出现。最后,通过在公开数据集Caltech行人检测数据库上的对比实验和分析,验证了本文所提模型的有效性。

著录项

  • 作者

    蒋宇豪;

  • 作者单位

    山东科技大学;

  • 授予单位 山东科技大学;
  • 学科 计算机技术
  • 授予学位 硕士
  • 导师姓名 赵华;
  • 年度 2017
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP391.41;
  • 关键词

    视频预测; 行人检测; 深度学习; 视觉特征;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号