基于深度学习的视频运动目标检测与搜索

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

检测和搜索视频中的目标是计算机视觉领域的重要任务之一，其主要难点在于如何运用深度学习等算法来分析出视频中目标的位置以及如何根据查询条件搜索到视频中准确的目标。近年来传统的深度学习算法对于单张静态图片的识别以及文本描述生成取得了较大的进展，但仍然不能满足视频中目标的检索要求。本学位论文以检测与搜索出视频中的目标物体为研究目标，首先提出一种基于边界概率卷积神经网络模型的目标定位检测算法来识别与定位视频中的目标，再通过一种基于时空双流特征融合的3D卷积神经网络完成视频中人物的动作检测，最后通过一种基于循环神经网络（GRU）模型的自然语言目标搜索算法来完成视频中的目标搜索。此外，本文在图像的目标检测数据集PASCAL VOC上完成目标的定位检测实验，在人物动作数据集UCF-101和HMDB51上完成视频人物动作检测实验，在目标标注数据集ReferIt上完成视频目标的自然语言搜索实验。实验结果证明，本文提出的基于深度学习的目标检测与搜索算法在一定的程度上改进了已有的方法。本文的工作创新主要体现在以下三个方面：（1）利用一种基于目标候选框边界概率的卷积神经网络模型，计算出目标候选边界框的四条边在一定搜索区域上的概率，获得更加接近人工标注边框的候选，通过迭代的方式与目标识别模型进行融合。（2）将预先训练好的空间流与时间流动作检测网络在深度卷积层进行融合，利用融合后的时空双流动作检测模型提取中层时空特征提取，之后利用3D卷积神经网络模型完成视频人物动作检测。（3）利用卷积神经网络并行的抽取局部目标区域和全局的特征，通过两层的门循环神经网络融合这两方面的特征以及自然语言搜索语句的特征来完成自然语言目标搜索。

著录项

作者
杨天明;
展开▼
作者单位

南京邮电大学;

展开▼
授予单位南京邮电大学;
学科软件工程
授予学位硕士
导师姓名陈志;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TN9;
关键词
深度学习; 视频运动目标检测;

相似文献

中文文献
外文文献
专利

1. 基于深度学习的竞赛系统中机器人运动目标检测 [J] . 阳永清 . 电子设计工程 . 2021,第012期
2. 基于倾向流和深度学习的机场运动目标检测 [J] . 詹昭焕 ,韩松臣 ,李炜 . 交通信息与安全 . 2019,第001期
3. 基于快速搜索的运动目标检测算法 [J] . 苏晓星 ,申金缓 ,戴志强 . 光电子．激光 . 2003,第3期
4. 城市智慧公安综合视频系统关键技术研究——基于集成服务总线、视频结构化、深度学习的视角 [J] . 贾志城 . 中国安全防范认证 . 2021,第001期
5. 城市智慧公安综合视频系统关键技术研究——基于集成服务总线、视频结构化、深度学习的视角 [J] . 贾志城 . 中国安全防范技术与应用 . 2021,第001期
6. 基于内容的视频搜索技术--非结构化视频搜索 [C] . 郭彤 ,马丽贤 . 第八届全国互联网与音视频广播发展研讨会 . 2008
7. 基于深度学习的监控视频运动目标检测及行人结构化描述关键技术 [A] . 许建中 . 2018

基于深度学习的视频运动目标检测与搜索

目录

摘要

著录项

相似文献

相关主题

期刊订阅