首页> 中国专利> 一种基于粒子滤波和感知哈希的视频目标跟踪方法

一种基于粒子滤波和感知哈希的视频目标跟踪方法

摘要

本发明公开了一种基于粒子滤波和感知哈希的视频目标跟踪方法,包括以下步骤:1)在原始图像中选定待跟踪目标作为目标区域,提取目标区域的感知哈希特征作为模板特征,并对权重粒子集进行初始化定位;2)对权重粒子集进行状态坐标预测,标注预测区域;3)对每一个预测粒子区域提取感知哈希特征,并计算预测粒子区域与目标区域的相似度;4)根据离目标远近的位置贡献以及感知哈希特征相似度大小更新粒子权重,采用最小方差估计得到新的目标区域;5)根据权重大小和重采样估计值得到下一帧的权重粒子集,重复步骤2)~步骤4)直至所有视频序列结束。本发明计算效率高,能够在光照变化剧烈和目标尺度发生变化的情况下实现快速有效的跟踪。

著录项

  • 公开/公告号CN105139420A

    专利类型发明专利

  • 公开/公告日2015-12-09

    原文格式PDF

  • 申请/专利权人 山东大学;

    申请/专利号CN201510481662.X

  • 申请日2015-08-03

  • 分类号G06T7/20;G06K9/00;

  • 代理机构济南圣达知识产权代理有限公司;

  • 代理人张勇

  • 地址 250061 山东省济南市历下区经十路17923号

  • 入库时间 2023-12-18 12:45:22

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-08-29

    授权

    授权

  • 2016-01-06

    实质审查的生效 IPC(主分类):G06T7/20 申请日:20150803

    实质审查的生效

  • 2015-12-09

    公开

    公开

说明书

技术领域

本发明涉及一种基于粒子滤波和感知哈希的视频目标跟踪方法。

背景技术

视频目标跟踪是计算机视觉领域中的核心内容之一,它是对视频帧序列中的运动目标进 行特征检测、识别和跟踪的过程,在获得运动目标的运动特征以后,通过进一步的分析处理, 达到对运动目标的轨迹等参数的描述。运动目标跟踪在技术上涉及视频处理、模式识别以及 人工智能等多个领域。且在很多方面都具有广泛的应用,例如公共场景监控、智能交通、医 学气象、机器人视觉导航、军事视觉制导等。但由于受到光照变化、实时性等诸多因素的影 响,如何实现有效的目标跟踪,提高目标跟踪的准确性和稳定性,是视频目标跟踪领域的一 大难题。因此,研究实时性好、稳定性高的视频目标跟踪算法具有极其重要的意义。

粒子滤波是基于蒙特卡洛仿真的近似贝叶斯滤波算法,其主要思想是通过重要性函数产 生带权重的离散随机采样粒子来近似系统随机变量的后验概率分布,可以适用于任何分布的 状态估计问题。但当目标所处环境受到强烈的光照变化或者在目标尺度发生变化时,传统的 粒子滤波算法中新出现的目标特征与模板特征无法吻合,从而不能有效的跟踪到运动目标。

发明内容

本发明为了解决上述问题,提出了一种基于粒子滤波和感知哈希的视频目标跟踪方法, 本方法在光照变化剧烈和目标尺度发生变化时依然能够有效跟踪到运动目标。

为了实现上述目的,本发明采用如下技术方案:

一种基于粒子滤波和感知哈希的视频目标跟踪方法,包括以下步骤:

(1)在原始图像中选定待跟踪目标作为目标区域,提取目标区域的感知哈希特征作为 模板特征,并对权重粒子集进行初始化定位;

(2)对权重粒子集进行状态坐标预测,对预测的粒子位置处标注预测区域;

(3)对每一个预测粒子区域提取感知哈希特征,并计算预测粒子区域与目标区域的相 似度;

(4)根据离目标远近的位置贡献以及感知哈希特征相似度大小更新粒子权重,确定估 计目标的位置,得到新的目标区域;

(5)根据权重大小和重采样估计值得到下一帧的权重粒子集,重复步骤(2)~步骤(4) 直至所有视频序列结束。

所述步骤(1)中,计算目标区域的感知哈希特征,感知哈希算法的具体方法包括:

(1-1)将所在帧图像转换成灰度图像,将选定的待跟踪目标缩小到32*32的正方形;

(1-2)计算待跟踪目标的DCT变换,得到32*32的DCT系数矩阵,最终仅保留系数矩 阵左上角的8*8系数矩阵,待跟踪目标的能量基本全部集中在此8*8大小的低频系数矩阵上;

(1-3)计算DCT系数平均值,每个DCT系数与此平均值进行比较,大于均值的记为1, 小于均值的记为0;

(1-4)将上一步比较结果按矩阵形式构造成64位感知哈希指纹,此64位感知哈希指 纹即是待跟踪目标的感知哈希特征。

所述步骤(1-2)中,其中DCT变换公式为:

F=AfAT

A(i+1,j+1)=c(i)cos[(j+0.5)πNi]

c(i)=1N,i=02N,i0

在本发明中i=0,1,2…,31;j=0,1,2…,31;N=32。

所述步骤(1)中,在待跟踪目标附近按照标准正态分布进行权重粒子的初始化定位,初 始化粒子样本的个数为N,每个粒子权重为1/N。

所述步骤(2)的具体方法为:按照标准正态分布对权重粒子集进行状态坐标预测,同时 对预测的粒子位置处画出同截取跟踪目标矩形框等长等宽的矩形框预测区域;

其中状态坐标预测公式为:

X(k|k-1)=X(k-1|k-1)+U(k)

U(k)~N(0,1)

上式中,X(k|k-1)是利用上一状态预测的结果,X(k-1|k-1)是上一状态最优的结果 (或者是待跟踪目标的初始化状态),U(k)为现在状态的控制量并服从标准正态分布。

所述步骤(3)中,计算预测粒子区域与目标区域的相似度方法如下:

计算预测粒子区域感知哈希指纹与目标区域感知哈希指纹的汉明距离,即计算两者哈希 指纹中相同位置不同位的个数。

所述步骤(4)中,包括:

(4-1)得到每个预测粒子区域与目标区域的相似度后,结合离目标远近的位置贡献更新 粒子的权重;

(4-2)更新完成预测粒子的权重后,计算出在当前帧图像中跟踪目标的最优预测位置作 为估计目标的位置,即为新的目标区域。

所述步骤(4-1)中,更新权重方法为:为减少非目标位置的粒子权重,根据离目标远近 的位置贡献以及计算的感知哈希相似度大小两种线索共同实现自适应的调整粒子权重:

wti=exp(-(1-(xti-x0)2+(yti-y0)2W2+H2)βti)

其中,是指t时刻第i个粒子的粒子权重,是指t时刻第i个粒子的相似度,xti是指 t时刻第i个粒子的坐标位置横坐标,yti是指t时刻第i个粒子的坐标位置纵坐标,W、H是 指目标区域的半宽高;

wnormi=wti/Σi=1Nwti

其中wnormi是指t时刻第i个粒子的归一化权重。

所述步骤(4-2)中,利用最小方差估计确定估计目标的位置,具体方法包括:最小方差 估计确定估计目标位置的计算公式如下:

xnew=Σi=1Nxtiwnormi

其中xnew是指新的目标位置横坐标;

ynew=Σi=1Nytiwnormi

其中ynew是指新的目标位置纵坐标。

所述步骤(5)中,包括:得到当前帧图像中估计目标的位置后,需要增加权重大的粒子 数,抛弃权重小的粒子,更新得到下一帧的权重粒子集,为防止多次迭代后出现权值退化现 象,采用粒子重抽样法来解决权值退化问题,该方法为:

首先计算目标的重采样估计值:

N^eff=1Σi=1N(wti)2

指t时刻第i个粒子的权重,由上式判断是否重采样当前跟踪目标权重粒子集,设置 阀值NT,当时,需要重采样权重粒子集,则在规定区域内采用随机算法重新生成新 的粒子。

本发明的有益效果为:

(1)本视频目标跟踪方法采用感知哈希来描述跟踪目标特征,目标尺度的变化不会引 起感知哈希值的变化,因此对尺度变化具有很强的鲁棒性;为减少非目标位置的粒子权重, 根据离目标远近的位置贡献以及计算的感知哈希相似度大小两种线索共同实现自适应的调整 粒子权重,从而可以更有效的描述目标信息,提高了跟踪的稳定性;

(2)本视频目标跟踪方法对光照变化剧烈或对比度的改变具有很强的鲁棒性,在增加 或减少亮度或对比度,甚至在改变颜色的情况下,本方法的感知哈希值都不会显著改变,能 够避免伽马校正或颜色直方图被调整带来的影响,继而可以实现对目标持续,准确的跟踪;

(3)本视频目标跟踪方法可以去除目标特征向量中的冗余信息,对目标感知特征进行 压缩生成简短感知哈希值和基于感知哈希值的匹配,大幅度提高了跟踪速度,可实现实时跟 踪效果。

附图说明

图1是本发明方法的流程图。

图2是提取感知哈希特征的算法流程图。

具体实施方式:

下面结合附图与实施例对本发明作进一步说明。

本发明所述方法以粒子滤波为框架,采用感知哈希值描述跟踪目标的观测信息,根据离 目标远近的位置贡献以及计算的感知哈希相似度大小两种线索更新粒子权重,最后通过最小 方差估计确定估计目标的位置。具体流程如图1所示,包括如下步骤:

步骤1:在原始图像中选定待跟踪目标作为目标区域,提取目标区域的感知哈希特征作 为模板特征,并对权重粒子集进行初始化定位;

人工选取待跟踪目标作为目标区域,计算目标区域的感知哈希特征,感知哈希算法流程 图如2所示,包括:

1)将所在帧图像转换成灰度图像,将选定的待跟踪目标缩小到32*32的正方形;

2)计算待跟踪目标的DCT变换,得到32*32的DCT系数矩阵,最终仅保留系数矩阵左 上角的8*8系数矩阵,待跟踪目标的能量基本全部集中在此8*8大小的低频系数矩阵上;

其中DCT变换公式为:

F=AfAT

A(i+1,j+1)=c(i)cos[(j+0.5)πNi]

c(i)=1N,i=02N,i0

在本发明中i=0,1,2…..31;j=0,1,2…..31;N=32。

3)计算DCT系数平均值,每个DCT系数与此平均值进行比较,大于均值的记为1,小 于均值的记为0;

4)将上一步比较结果按矩阵形式构造成64位感知哈希指纹,此64位感知哈希指纹即 是待跟踪目标的感知哈希特征。

在待跟踪目标附近按照标准正态分布进行权重粒子的初始化定位,本发明中初始化粒子 样本的个数N取100,每个粒子权重为1/100;

步骤2:按照标准正态分布对权重粒子集进行状态坐标预测,同时对预测的粒子位置处 画出同截取跟踪目标矩形框等长等宽的矩形框预测区域;

其中状态坐标预测公式为:

X(k|k-1)=X(k-1|k-1)+U(k)

U(k)~N(0,1)

上式中,X(k|k-1)是利用上一状态预测的结果,X(k-1|k-1)是上一状态最优的结果 (或者是待跟踪目标的初始化状态),U(k)为现在状态的控制量并服从标准正态分布。

步骤3:对每一个预测粒子的矩形框区域内提取感知哈希特征,感知哈希算法流程如图2 所示,并计算预测粒子区域与目标区域的相似度,计算相似度的方法如下:

计算预测粒子区域感知哈希指纹与目标区域感知哈希指纹的汉明距离,即计算两者哈希 指纹中相同位置不同位的个数;

步骤4:得到每个预测粒子区域与目标区域的相似度后,结合离目标远近的位置贡献更 新粒子的权重;更新权重方法如下:

为减少非目标位置的粒子权重,根据离目标远近的位置贡献以及计算的感知哈希相似度 大小两种线索共同实现自适应的调整粒子权重:

wti=exp(-(1-(xti-x0)2+(yti-y0)2W2+H2)βti)

其中是指t时刻第i个粒子的粒子权重,是指t时刻第i个粒子的相似度,xti是指t 时刻第i个粒子的坐标位置横坐标,yti是指t时刻第i个粒子的坐标位置纵坐标,W、H是指 目标区域的半宽高。

wnormi=wti/Σi=1Nwti

其中wnormi是指t时刻第i个粒子的归一化权重;

更新完成预测粒子的权重后,计算出在当前帧图像中跟踪目标的最优预测位置作为估计 目标的位置(即新的目标区域),本发明是经最小方差估计确定估计目标的位置;

最小方差估计确定估计目标位置的计算公式如下:

xnew=Σi=1Nxtiwnormi

其中xnew是指新的目标位置横坐标;

ynew=Σi=1Nytiwnormi

其中ynew是指新的目标位置纵坐标;

步骤5:得到当前帧图像中估计目标的位置后,需要增加权重大的粒子数,抛弃权重小 的粒子,更新得到下一帧的权重粒子集,为防止多次迭代后出现权值退化现象(即多次迭代 后,除了一个粒子,其余粒子的权值都减小到可以忽略不计的程度,大量计算被浪费在许多 无用的粒子上),采用粒子重抽样法来解决权值退化问题,该方法为:

首先计算目标的重采样估计值:

N^eff=1Σi=1N(wti)2

指t时刻第i个粒子的权重,由上式判断是否重采样当前跟踪目标权重粒子集,设置 阀值NT,当时,需要重采样权重粒子集,则在规定区域内采用随机算法重新生成新 的粒子,得到下一帧更新的权重粒子集后,循环步骤2~步骤4,直至所有视频序列结束。

上述虽然结合附图对本发明的具体实施方式进行了描述,但并非对本发明保护范围的限 制,所属领域技术人员应该明白,在本发明的技术方案的基础上,本领域技术人员不需要付 出创造性劳动即可做出的各种修改或变形仍在本发明的保护范围以内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号