复杂场景下的基于双流网络的视频目标分割算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着信息技术的迅猛发展，信息的载体也在不断升级，各种新兴的领域飞速发展，像自动驾驶，人工智能等等。视觉是机器理解世界的主要手段，在人机交互，医疗以及交通等领域扮演着越来越重要的角色。视频作为机器视觉中信息的主要载体，蕴含了丰富的信息，视频目标分割的任务是在大量的冗余信息中提取出对当前任务有帮助的信息，让机器具有理解分辨能力，是近年来研究的热点。
　　现有的无监督视频目标分割算法，在实际复杂多样的场景下往往表现不佳，容易受到遮挡，光照变化，画面模糊，画面剧烈变化等影响，出现目标无法识别或者目标分割轮廓不完整等问题，大大减弱了自动视频目标分割算法在实际场景下的鲁棒性和精确度。本文为了解决上述问题，提出了一种基于多帧特征融合的时空双流无监督视频目标分割算法，具体工作和文章的创新点如下:
　　1、针对相似目标干扰，光照变化等场景，基于现有的FCN网络，设计了一种基于时间空间双流全卷积网络用于视频目标分割任务，加入了多尺度统合，带孔卷积等思想，根据时空网络的实际分割结果，创新性的提出了基于外观模型的融合策略，采用CRF将结果精细化。该网络综合利用了基于空间的外观模型以及基于时域的运动模型，融入了视频帧的连续性特征，经试验结果表明可以很好地应对一般场景下的视频目标分割任务，表现出良好的鲁棒性和精确度。
　　2、针对连续遮挡，模糊等更为复杂的场景，创新性的提出了多帧特征融合的思想，提出了一种光流的双向传递误差的概念，并给出量化手段，并以此为权重计算方式，分别将多帧信息的聚合融入到空间流网络和时间流网络中去。提出双流网络的优化方案，引入分割成功率评价标准。优化网络在原有网络基础上改善了复杂场景下分割的鲁棒性和精准度。在与同类算法的比较中，在复杂场景下具有良好的抗干扰能力，在复杂场景下表现出了比同类算法更好的精准度和鲁棒性，大大提高了视频目标分割的成功率，增加了视频目标分割算法的可实用性。

著录项

作者
邓志新;
展开▼
作者单位

中国科学技术大学;

展开▼
授予单位中国科学技术大学;
学科精密仪器及机械
授予学位硕士
导师姓名竺长安;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP391.41;
关键词
机器视觉; 视频目标分割; 多帧特征融合; 双流网络;

相似文献

中文文献
外文文献
专利

1. 基于时空双流全卷积网络的视频目标分割算法研究及改进 [J] . 邓志新 ,洪泓 ,金一 . 工业控制计算机 . 2018,第008期
2. 复杂场景下基于YOLOv5的口罩佩戴实时检测算法研究 [J] . 于硕 ,李慧 ,桂方俊 . 计算机测量与控制 . 2021,第012期
3. 复杂场景下基于Radon校正与MSER的文本定位算法研究 [J] . 刘杨 . 微型机与应用 . 2016,第021期
4. 基于孪生网络的快速视频目标分割 [J] . 付利华 ,赵宇 ,孙晓威 . 电子学报 . 2020,第004期
5. 基于孪生网络视频烟雾目标分割方法 [J] . 刘方涛 ,杨剑 ,白瑞君 . 计算机工程与设计 . 2020,第009期
6. 基于改进Kirsch边缘算子的视频运动目标分割算法 [C] . 杨文佳 ,窦丽华 ,张娟 . 2009年全国模式识别学术会议暨首届中日韩模式识别学术研讨会 . 2009
7. 复杂场景下基于视频的行人流量统计算法研究 [A] . 张惊州 . 2014

复杂场景下的基于双流网络的视频目标分割算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅