基于深度残差学习的视觉物体跟踪算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

视觉物体跟踪是对生物视觉系统能够追踪某一运动物体的一种模拟，是计算机视觉研究中的一个关键任务，研究的核心问题是在连续视频图像序列中精确地估计目标物体的位置和尺度等状态信息。虽然视觉物体跟踪已经取得了阶段性的研究进展，但是目前视觉物体跟踪仍然是一项具有挑战性的任务，主要是因为由遮挡、形变、突然运动、光照变化、低分辨率以及复杂背景等引起的物体外观的显著变化，视觉物体跟踪算法必须能够准确识别这些变化，并在每个视频帧的图像中精确定位目标物体。本文将围绕视觉物体跟踪任务进行分析、讨论，基于深度残差学习模型建立有效的视觉物体跟踪算法，并对所建立的视觉物体跟踪算法在公开基准测试集上进行各项性能度量和评估，本文的主要研究内容及创新总结如下：　　（1）基于深度时空残差学习和相关滤波器的视觉物体跟踪算法　　近年来，越来越多的视觉物体跟踪算法在物体表观模型中将空间特征与时序特征进行有效结合，在视频图像序列中使物体的表观模型能够适应目标物体随时间和空间变化而产生的各种变化，从而有效提升视觉物体的跟踪性能。为了能够适应物体表观的变化，本文提出一种基于深度时空残差网络结构（Spatial-Temporal Residual Network）和相关滤波器（Correlation Filter）的视觉物体跟踪算法，将其命名为STResNet_CF视觉物体跟踪算法。建立基于原始残差网络结构并融合时空特征的物体表观模型，利用两个独立的残差网络结构分别获取空间特征和时序特征，并在每个残差单元增加一条从时域子网到空域子网的连接。这样就可以对空域残差子网和时域残差子网并行训练、相互融合，既能够获取单张图像中与目标物体表观相关的静态空间特征，又能够捕获视频连续图像序列之间的动态视觉特征，使得时空特征互为补充、相互受益。最后将从深度时空残差网络中输出的融合时空特征的特征图与相关滤波器结合，以在视频中实现对视觉物体精确而健壮地跟踪。实验结果表明：与其它现有的基于卷积神经网络或相关滤波器的视觉物体跟踪算法相比，我们提出的STResNet_CF视觉物体跟踪算法具有类似或更好的跟踪性能。　　（2）基于深度多尺度时空残差学习的鲁棒性视觉物体跟踪算法　　对于视觉物体跟踪任务而言，除了视频序列中的时空特征能够用于描述物体表观的变化外，多尺度特征对于视频中目标物体的准确描述也是非常重要的。因为物体在运动过程中，随着距离相机远近的不同，物体的尺度也会发生变化。当距离相机近时，物体变大；远离相机时，物体变小。准确识别物体尺度的变化，有助于提升跟踪算法的性能。为了能够有效识别视频场景中物体尺度的变化，我们除了在原始残差网络中增加识别时空特征的子网之外，我们还在每个残差单元的输出添加一条到下一个残差单元的跳跃连接，并在每个残差单元增加多尺度因子，以增强残差网络对多尺度特征的表达能力，从而提高视觉物体跟踪算法的准确率、精度、鲁棒性和成功率。我们将改进的残差网络命名为多尺度时空残差网络（Multi-Scale Spatial-Temporal Resdiual Network），基于该网络模型的视觉物体跟踪算法命名为 MSST-ResNet。在连续的视频图像序列中，我们提出的视觉物体跟踪算法MSST-ResNet可以鲁棒地识别目标物体的尺度、形状等各种表观变化，并能够充分有效地利用与物体运动有关的时序信息。最后，将网络输出的多尺度时空特征与核相关滤波器有效结合，以精确地定位目标物体在每一帧图像中的位置和尺度等状态信息。实验结果表明：我们提出的视觉物体跟踪算法 MSST-ResNet即使在物体的表观发生显著变化的情况下，也能够精确而稳定地对目标物体进行实时跟踪，而且我们的跟踪算法MSST-ResNet的各项性能优于现有的视觉物体跟踪算法。　　（3）基于深度多尺度时空残差学习和“跟踪-学习-检测”框架的视觉物体跟踪算法　　我们重点研究了视觉物体跟踪算法三个方面的问题，即：深度多尺度时空特征的在线学习、检测器的动态更新、以及视觉物体的在线跟踪。我们基于深度多尺度时空残差网络结构（Multi-Scale Spatial-Temporal ResNet）和“跟踪-学习-检测”（Tracking-Learning-Detection）框架开发了一种新的视觉物体跟踪算法，将其命名为MSSTResNet-TLD视觉物体跟踪算法。我们的目标是：在视频图像序列中，对在初始视频帧的图像中指定的目标物体实时地进行在线“跟踪-学习-检测”，建立一种有效的方法连续评估并更新基于深度多尺度时空残差学习的跟踪器、分类器和检测器。根据历史图像序列，学习深度多尺度时空特征，在每一帧的图像中，对物体及其周围背景进行有效区分，以精确地对目标物体进行检测和跟踪。实验结果表明：我们提出的MSSTResNet-TLD视觉物体跟踪算法不仅在精度、成功率、准确度和鲁棒性方面超越了现有的视觉物体跟踪算法，而且在CPU上的执行速度也可以达到实时跟踪的性能要求。

著录项

作者
刘冰;
展开▼
作者单位

重庆大学;

展开▼
授予单位重庆大学;
学科软件工程
授予学位博士
导师姓名朱征宇;
年度 2019
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词
视觉物体跟踪,卷积神经网络,深度残差学习,相关滤波器;

相似文献

中文文献
外文文献
专利

1. 基于深度学习的多目标视觉实时跟踪算法研究 [J] . 田彬 ,田寅 ,杨杰 . 现代电子技术 . 2021,第022期
2. 基于深度学习的视觉跟踪算法研究综述 [J] . 薛霞 ,贾静平 . 福建质量管理 . 2019,第023期
3. 基于深度学习的视觉跟踪算法研究综述 [J] . 贾静平 ,覃亦华 . 计算机科学 . 2017,第0z1期
4. 基于深度特征表达与学习的视觉跟踪算法研究 [J] . . 电子与信息学报 . 2015,第009期
5. 基于外观和深度信息的视觉跟踪算法研究 [J] . 刘学 ,戚文静 . 山东建筑大学学报 . 2016,第002期
6. 基于残差直方图与直方图残差的LSB匹配检测 [C] . WANG Ping ,王平 ,LIU Fenlin . 第十三届全国信息隐藏暨多媒体信息安全学术大会 . 2016
7. 基于深度学习的机器人视觉跟踪算法研究与实现 [A] . 余静 . 2019

基于深度残差学习的视觉物体跟踪算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅