首页> 中国专利> 一种基于超像素的协同跟踪算法和系统

一种基于超像素的协同跟踪算法和系统

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明涉及一种基于超像素的协同跟踪算法和系统。本发明提供的方法将结合全局判断和局部判断来确定候选图像内是否包含有目标区域，因此能解决目标区域被遮挡的跟踪问题，同时，通过引入更新策略，使得该方法可以适应目标区域在跟踪过程中各种外观变化，其准确性、适用性大大提高。

著录项

公开/公告号CN105654505A

专利类型发明专利
公开/公告日2016-06-08

原文格式PDF
申请/专利权人中山大学;广州智海纵横信息科技有限公司;广州中大南沙科技创新产业园有限公司;
展开▼

申请/专利号CN201510971312.1
发明设计人纪庆革;袁大龙;韩非凡;杜景洪;印鉴;
展开▼

申请日2015-12-18
分类号G06T7/20;
代理机构广州粤高专利商标代理有限公司;
代理人林丽明
地址 510275 广东省广州市海珠区新港西路135号
入库时间 2023-12-18 15:46:39

法律信息

法律状态公告日

法律状态信息

法律状态
2018-06-26

授权

授权
2016-07-06

实质审查的生效 IPC(主分类):G06T7/20 申请日:20151218

实质审查的生效
2016-06-08

公开

公开

说明书

技术领域

本发明涉及计算机视觉目标跟踪领域，更具体地，涉及一种基于超像素的协同跟踪算法和系统。

背景技术

随着计算机的发展和普及，人们越来越期待计算机能具有像人类一样的感知和识别能力，其中一个努力的方向就是类似人类的视觉感知系统。计算机视觉是通过计算机对输入的图像信息进行处理，模拟人眼对视觉信息的感知和识别，完成诸如目标识别、跟踪等任务。随着计算机性能的提高以及摄像头的普及，我们每天都能够获取到海量的视频图像信息，而且还在不断增长，使得人们对于视觉信息自动化处理的需求日益增加。

目标跟踪是在一组图像序列中对预先选定的感兴趣目标进行检测，逐帧地跟踪目标。按照跟踪目标的个数，目标跟踪算法可以简单地分成单目标跟踪算法和多目标跟踪算法；按照跟踪过程中使用的摄像头个数，目标跟踪算法可以分成单摄像头跟踪和多摄像头跟踪。本发明主要针对单摄像头单目标的跟踪问题。目标跟踪本身就是计算机视觉中的一个应用技术，同时它又是其他高级应用的基础。目标跟踪的一些典型应用包括：人机交互、安全监控、交通检测、智能机器人导航等。然而，目标跟踪是一个复杂的过程，该领域还存在许多挑战，例如目标跟踪过程中的局部遮挡、外观变化、光线变化、剧烈运动、目标在视野中消失后再现、背景影响等。

发明内容

本发明为解决以上现有技术的缺陷，提供了一种基于超像素的协同跟踪算法，该方法能够处理遮挡、外观变化等目标跟踪中的常见问题，并且具有很好的稳定性和鲁棒性。

为实现以上发明目的，采用的技术方案是：

一种基于超像素分割的协同跟踪算法，用于解决单摄像头单目标的跟踪问题，包括以下步骤：

一、训练阶段

S1.构建全局判别模型，所述全局判别模型用于提取目标区域的Haar_Like 特征，然后根据提取的Haar_Like特征构建全局分类器GC，并确定全局分类器 GC的参数；

S2.使用基于重叠滑动窗口的分片方法对目标区域进行分片，获得N个子区域，然后分别构建N个全局判别模型，所述N个局部判别模型用于对N个子区域分别提取Haar_Like特征，然后根据提取Haar_Like特征分别构建局部分类器，并确定局部分类器的参数；

S3.构建适应生成模型，并确认适应生成模型的模型参数，其具体步骤如下：

对目标区域进行超像素分割，并分别提取每个超像素的特征向量，然后使用 K-means算法对目标区域的所有超像素进行聚类，从而确定适应生成模型的模型参数；

二、跟踪阶段

S4.将候选图像p_i输入至全局判别模型，全局判别模型对候选图像p_i的 Haar_Like特征进行提取，然后使用全局分类器GC对候选图像p_i的Haar_Like 特征进行分类，GC(p_i)表示候选图像p_i的分类结果；

S5.使用步骤S2的方法将候选图像p_i划分N个子区域，然后使N个局部判别模型对N个子区域分别提取Haar_Like特征，然后使用N个局部分类器分别对N个子区域的Haar_Like特征进行分类，LC_j(p_i)表示第j个局部分类器对子区域的分类结果；

S6.结合全局分类模型、局部分类模型的分类结果，对候选图像是否包含目标区域进行判断：

thr_GC、thr_LC分别表示全局分类、局部分类的两个阈值，当y(p_i)＝1时，表示候选图像p_i包含有目标区域；

S7.将所有的候选图像进行步骤S4～S6的操作从而判断其内是否包含有目标区域，然后将所有判定其内包含有目标区域的候选图像输入至适应生成模型；

S8.对于每一张候选图像，适应生成模型对其进行超像素分割，然后提取每个超像素的特征向量，然后使用K-means算法对所有超像素的特征向量进行聚类，并计算候选图像的聚类置信度；然后选取置信度最高的候选图像作为跟踪结果进行输出，输出数据包括当前跟踪结果的置信度conf_T与目标区域的匹配面积area_T，其中其中A_i为每个超像素的面积，N表示候选图像片中包含超像素的个数，

上述公式表明当超像素与聚类中心在特征空间中相近，与聚类中模板超像素在目标区域相对位置也相近，且所属聚类的目标/背景置信度高时，本专利认为该类超像素可以更加充分地描述当前目标的外观信息且判别能力强，其中g_i′表示候选图像片包含的超像素，k_i′表示超像素所属聚类，S_i′表示超像素所属聚类的距离，表示每个聚类的目标/背景置信度，R_j′表示聚类半径，conf_i′表示g_i′的置信度，L_i表示候选图像片中每个超像素与所属聚类中的模板超像数间的最小空间距离，a_s是控制空间距离权重的权重因子，表示g_i′与所属聚类的模板超像素在目标区域中的空间距离；

${conf}_{c l s} = \frac{A_{t \arg e t}}{A_{t \arg e t} + A_{b a c k g o u n d}},$

其中A_target表示每个聚类中所有类成员属于目标区域的像素点个数的和， A_background表示背景区域的像素点个数的和；

其中 ${area}_{T} = \frac{Σ_{j = 1}^{M} F (g_{i})}{A}, F (g_{j}) = (\begin{matrix} A_{j}^{'} A_{j}^{'} \leq A_{t \arg et}^{j} \\ A_{t \arg e t}^{j} A_{j}^{'} > A_{t \arg e t}^{j} \end{matrix})$

A_j′表示当前跟踪结果中每个超像素的像素点个数，表示每个超像素聚类包含的目标区域像素点个数，M表示超像素的总数；

三、检测阶段

S9.构建模板库生成模型，并使模板库生成模型在当前帧内检测目标区域，返回检测结果的置信度conf_D，然后根据适应生成模型和模板库生成模型的输出结果估计目标区域的当前位置：

1)当area_T≥thr_PL且conf_T≥thr_TH时

其中thr_TH、thr_PL分别表示置信度阈值和匹配面积阈值，此时适应生成模型的跟踪结果具有较高的置信度和匹配面积，适应生成模型正常工作而且适应了目标区域外观，所以把适应生成模型的输出结果作为目标位置输出；然后按照更新策略根据area_T、conf_T对全局分类器GC、局部分类器、适应生成模型的参数进行更新；

2)当area_T＜thr_PL且conf_T≥thr_TH时

此时适应生成模型的跟踪结果的匹配面积较低，但跟踪结果的置信度仍然高于阈值，所以仍把适应生成模型的输出结果作为目标位置输出；然后按照更新策略根据area_T、conf_T对全局分类器GC、局部分类器、适应生成模型的参数进行更新；

3)当area_T≥thr_PL且conf_T＜thr_TH时

此时适应生成模型的跟踪结果具有较低的置信度，但具有较高的匹配面积，所以仍把适应生成模型的输出结果作为目标位置输出；然后按照更新策略根据 area_T、conf_T对全局分类器GC、局部分类器、适应生成模型的参数进行更新；

4)当area_T＜thr_PL，conf_T≥thr_TH且conf_D≥thr_DH时

thr_DH表示检测结果置信度的阈值，此时适应生成模型的跟踪结果的置信度和匹配面积都低于预设的阈值，而模板库生成模型检测到一个置信度较高的目标位置，则把模板库生成模型的检测结果当作目标位置输出，然后对全局分类器 GC、局部分类器、适应生成模型进行重初始化。

模型更新是使跟踪算法能够适应目标外观变化的关键，判别模型采用了类似 RealTimeCompressiveTracking文献中增量更新方法(注与本专利无关，所以不赘述)，生成模型中采用了一种基于滑动窗口的更新方法。在跟踪过程中，每隔 U帧图像，我们就把一帧图像加入到模型中并进行超像素分割、特征提取、聚类。为了保证算法的实时性，我们采用了一个固定大小的窗口，并在每次更新时，如果窗口的图像帧数大于预定大小，则按一定的策略丢弃对生成模型影响最小的图像。

同时，本发明还提供了一种应用所述协同跟踪算法的系统，其具体方案如下：包括跟踪模块、检测模块和位置估计模块，其中所述跟踪模块包括全局判别模型、局部判别模型和适应性生成模型，所述检测模型包括模板库生成模型，位置估计模块用于根据适应生成模型和模板库生成模型的输出结果估计目标区域的当前位置。

与现有技术相比，本发明的有益效果是：

本发明提供的基于超像素的协同跟踪算法，该方法能够处理遮挡、外观变化等目标跟踪中的常见问题，具有很好的稳定性和鲁棒性。

附图说明

图1为本方法的框架图。

图2为判别模型的训练示意图。

图3为适应生成模型的训练示意图。

具体实施方式

附图仅用于示例性说明，不能理解为对本专利的限制；

以下结合附图和实施例对本发明做进一步的阐述。

实施例1

一种基于超像素分割的协同跟踪算法，用于解决单摄像头单目标的跟踪问题，包括以下步骤：

一、训练阶段

S1.构建全局判别模型，所述全局判别模型用于提取目标区域的Haar_Like 特征，然后根据提取全局压缩Haar_Like特征构建全局分类器GC，并确定全局分类器GC的参数，具体如如图2所示；

S2.使用基于重叠滑动窗口的分片方法对目标区域进行分片，获得N个子区域，然后分别构建N个全局判别模型，所述N个局部判别模型用于对N个子区域分别提取Haar_Like特征，然后根据提取局部压缩Haar_Like特征分别构建局部分类器，并确定局部分类器的参数，具体如如图2所示；

S3.构建适应生成模型，并确认适应生成模型的模型参数，其具体步骤如下：

对目标区域进行超像素分割，并分别提取每个超像素的特征向量，然后使用 K-means算法对目标区域的所有超像素进行聚类，从而确定适应生成模型的模型参数，具体如如图3所示；

二、跟踪阶段

S4.将候选图像p_i输入至全局判别模型，全局判别模型对候选图像p_i的 Haar_Like特征进行提取，然后使用全局分类器GC对候选图像p_i的全局压缩 Haar_Like特征进行分类，GC(p_i)表示候选图像p_i的分类结果；

S5.使用步骤S2的方法将候选图像p_i划分N个子区域，然后使N个局部判别模型对N个子区域分别提取Haar_Like特征，然后使用N个局部分类器分别对N个子区域的局部压缩Haar_Like特征进行分类，LC_j(p_i)表示第j个局部分类器对子区域的分类结果。目标发生遮挡时，全局判别模型可能无法对目标区域进行正确判别，但N个局部判别模型中通常仍然有一个或者多个对应区域未被遮挡的局部分类器能够正确判别目标区域。

S6.结合全局分类模型、局部分类模型的分类结果，对候选图像是否包含目标区域进行判断：

thr_GC、thr_LC分别表示全局分类、局部分类的两个阈值，当y(p_i)＝1时，表示候选图像p_i包含有目标区域；

上述方案中，当目标区域被阻挡时，全局判别模型无法正常工作，为了避免此种缺陷，本发明提供的方法将结合全局判断和局部判断来确定候选图像内是否包含有目标区域，其准确性、适用性大大提高。

S7.将所有的候选图像进行步骤S4～S6的操作从而判断其内是否包含有目标区域，然后将所有判定其内包含有目标区域的候选图像输入至适应生成模型；

${conf}_{c l s} = \frac{A_{t \arg e t}}{A_{t \arg e t} + A_{b a c k g o u n d}},$

其中A_target表示每个聚类中所有类成员属于目标区域的像素点个数的和， A_background表示背景区域的像素点个数的和；

其中 ${area}_{T} = \frac{Σ_{j = 1}^{M} F (g_{j})}{A}, F (g_{j}) = (\begin{matrix} A_{j}^{'} A_{j}^{'} \leq A_{t \arg e t}^{j} \\ A_{t \arg e t}^{j} A_{j}^{'} > A_{t \arg e t}^{j} \end{matrix})$

A_j′表示当前跟踪结果中每个超像素的像素点个数，表示每个超像素聚类包含的目标区域像素点个数，M表示超像素的总数；

三、检测阶段

1)当area_T≥thr_PL且conf_T≥thr_TH时

2)当area_T＜thr_PL且conf_T≥thr_TH时

3)当area_T≥thr_PL且conf_T＜thr_TH时

4)当area_T＜thr_PL，conf_T≥thr_TH且conf_D≥thr_DH时

上述方案中，模板库生成模型根据一定的策略来确定当前各模型的工作状态和目标位置并输出，同时反馈到全局分类器GC、局部分类器、适应生成模型中，并对全局分类器GC、局部分类器、适应生成模型中进行更新，从而使得该方法可以适应目标区域在跟踪过程中各种外观变化。

实施例2

本发明还提供了一种应用所述协同跟踪算法的系统，如图3所示，其具体方案如下：

包括跟踪模块、检测模块和位置估计模块，其中所述跟踪模块包括全局判别模型、局部判别模型和适应性生成模型，所述检测模型包括模板库生成模型，位置估计模块用于根据适应生成模型和模板库生成模型的输出结果估计目标区域的当前位置。

显然，本发明的上述实施例仅仅是为清楚地说明本发明所作的举例，而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说，在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等，均应包含在本发明权利要求的保护范围之内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种基于超像素的协同跟踪算法和系统 [P] . 中国专利： CN105654505B . 2018.06.26
2. 一种基于超像素和结构化约束的图像多目标协同分割方法 [P] . 中国专利： CN105809672B . 2019.09.13
3. System and method of video Telecommunication to compress and decompress The Video Data of color digitalThe present Invention relates to a method for compressing a digital color Video Data in a Telecommunication System Video that has a means for generating a video signal that is uN means for generating a video signal to a Plurality of color video framerate,With Every Frame Image consisting of a Plurality of Scanning Lines composed of a Plurality of pixelsAnd each pixel in the image Frame consists of the components of color digitalThe Method comprises the steps of determining a function); Luminance pixel based on at least one of the three components of color digital(b) identify at least one parameter decision for at least a significant portion of pixels in the scanlines of a Table of current image based on the difference ofThe role in Luminance between the pixels at a Predetermined distance from at least one pixel in each Scan line and at least a (c) comparison of decision parameter with [P] . MX166516B . 1993-01-11

机译：用于压缩和解压缩彩色数字视频数据的视频电信系统和方法技术领域本发明涉及一种用于压缩电信系统视频中数字彩色视频数据的方法，该方法具有用于生成视频信号的装置，该装置是用于生成视频信号的装置。将视频信号转换为多个彩色视频帧速率，每个帧图像由多个扫描线组成，扫描线由多个像素组成，图像中的每个像素由彩色数字分量组成（该方法包括确定功能的步骤）;基于彩色数字（b）的三个分量中的至少一个的亮度像素，基于两个像素之间的亮度差异，针对当前图像表的扫描线中的至少大部分像素，确定至少一个参数决策。与每条扫描线中至少一个像素相距预定距离的像素，以及至少（c）比较决策参数与
4. SUPER-PIXEL LEVEL INFORMATION FUSION-BASED HYPERSPECTRAL IMAGE CLASSIFICATION METHOD AND SYSTEM [P] . 世界知识产权组织专利： WO2018045626A1 . 2018-03-15

机译：基于超像素水平信息融合的超光谱图像分类方法和系统
5. SUPERPIXEL-BASED IMAGE SEGMENTATION USING SHADING AND ALBEDO DECOMPOSITION [P] . IN2015KO00518A . 2016-07-01

机译：基于阴影和像素分解的基于超像素的图像分割