实时视觉目标跟踪与视频对象分割多任务框架

李瀚; 刘坤华; 刘嘉杰; 张晓晔

首页> 中文期刊>中国图象图形学报 >实时视觉目标跟踪与视频对象分割多任务框架

实时视觉目标跟踪与视频对象分割多任务框架

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

目的针对视觉目标跟踪(video object tracking,VOT)和视频对象分割(video object segmentation,VOS)问题,研究人员提出了多个多任务处理框架,但是该类框架的精确度和鲁棒性较差.针对此问题,本文提出一个融合多尺度上下文信息和视频帧间信息的实时视觉目标跟踪与视频对象分割多任务的端到端框架.方法文中提出的架构使用了由空洞深度可分离卷积组成的更加多尺度的空洞空间金字塔池化模块,以及具备帧间信息的帧间掩模传播模块,使得网络对多尺度目标对象分割能力更强,同时具备更好的鲁棒性.结果本文方法在视觉目标跟踪VOT-2016和VOT-2018数据集上的期望平均重叠率(expected average overlap,EAO)分别达到了0.462和0.408,分别比SiamMask高了0.029和0.028,达到了最先进的结果,并且表现出更好的鲁棒性.在视频对象分割DAVIS(densely annotated video segmentation)-2016和DAVIS-2017数据集上也取得了有竞争力的结果.其中,在多目标对象分割DAVIS-2017数据集上,本文方法比SiamMask有更好的性能表现,区域相似度的杰卡德系数的平均值JM和轮廓精确度的F度量的平均值FM分别达到了56.0和59.0,并且区域和轮廓的衰变值JD和FD都比SiamMask中的低,分别为17.9和19.8.同时运行速度为45帧/s,达到了实时的运行速度.结论文中提出的融合多尺度上下文信息和视频帧间信息的实时视觉目标跟踪与视频对象分割多任务的端到端框架,充分捕捉了多尺度上下文信息并且利用了视频帧间的信息,使得网络对多尺度目标对象分割能力更强的同时具备更好的鲁棒性.

著录项

来源
《中国图象图形学报》|2021年第1期|101-112|共12页
作者
李瀚; 刘坤华; 刘嘉杰; 张晓晔;
展开▼
作者单位

中山大学数据科学与计算机学院广州510006;

中山大学数据科学与计算机学院广州510006;

中山大学数据科学与计算机学院广州510006;

广东电科院能源技术有限责任公司广州510080;

展开▼
原文格式 PDF
正文语种 chi
中图分类模式识别与装置;
关键词
视觉目标跟踪; 视频对象分割; 全卷积网络; 空洞空间金字塔池化; 帧间掩模传播;
入库时间 2024-01-26 21:30:30

相似文献

中文文献
外文文献
专利

1. 基于类人视觉的多任务交通目标实时检测模型 [J] . 刘军 ,陈岚磊 ,李汉冰 . 汽车工程 . 2021,第001期
2. 基于VxWorks的实时多任务软件框架设计 [J] . 周俊杰 ,何攀峰 . 国外电子测量技术 . 2012,第4期
3. 基于实时多目标跟踪的足球机器人视觉系统设计 [J] . 臧笛 ,李欣 . 机电工程 . 2001,第006期
4. 融合TLD框架的DSST实时目标跟踪改进算法 [J] . 黄浩淼 ,张江 ,张晶 . 计算机工程与科学 . 2020,第009期
5. 基于DSP+FPGA框架的实时目标跟踪系统设计 [J] . 高文 ,朱明 ,刘剑 . 液晶与显示 . 2014,第004期
6. 如何提高嵌入式实时多任务操作系统的实时性和可靠性 [C] . 雷杰 . 第四届全国信号和智能信息处理与应用学术会议 . 2010
7. 基于OXF框架构建微机保护嵌入式实时多任务软件平台 [A] . 侯志光 . 2007

实时视觉目标跟踪与视频对象分割多任务框架

摘要

著录项

相似文献

相关主题

期刊订阅