首页> 中国专利> 一种基于2DPCA的运动目标跟踪方法

一种基于2DPCA的运动目标跟踪方法

摘要

本发明在粒子滤波理论框架下提出了一种新的基于2DPCA的运动目标跟踪方法。首先,利用2DPCA建立运动目标特征模型;其次,获得运动目标跟踪所需要的后验概率;最后,实现运动目标的跟踪。本发明方法克服了传统PCA方法提取协方差矩阵困难、计算量大的问题,提高了运动目标特征提取的精度,减少了运动目标跟踪时间,提高了跟踪的准确性,具有较强的鲁棒性。

著录项

  • 公开/公告号CN106327515A

    专利类型发明专利

  • 公开/公告日2017-01-11

    原文格式PDF

  • 申请/专利权人 南京理工大学;

    申请/专利号CN201510338687.4

  • 申请日2015-06-17

  • 分类号G06T7/20;

  • 代理机构南京理工大学专利中心;

  • 代理人唐代盛

  • 地址 210094 江苏省南京市玄武区孝陵卫200号

  • 入库时间 2023-06-19 01:20:05

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-06-03

    未缴年费专利权终止 IPC(主分类):G06T 7/246 专利号:ZL2015103386874 申请日:20150617 授权公告日:20190412

    专利权的终止

  • 2019-04-12

    授权

    授权

  • 2017-02-08

    实质审查的生效 IPC(主分类):G06T7/20 申请日:20150617

    实质审查的生效

  • 2017-01-11

    公开

    公开

说明书

技术领域

本发明属于计算机视觉处理技术领域,具体涉及一种基于2DPCA的运动目标跟踪方法。

背景技术

运动目标跟踪技术在计算机视觉领域具有广泛的实际应用,例如在视觉监控、实时交通流量监测、人机交互等方面,运动目标跟踪技术都起着至关重要的作用。运动目标跟踪技术的关键在于解决两个问题:目标特征模型的建立和目标的稳定跟踪。PCA(Principal Component Analysis,主成分分析)方法作为一种特征提取和分析方法,经常被用于目标特征模型的建立。采用PCA方法对运动目标特征进行建模,虽然能够较完整的保留运动目标的主要成分特征,但是PCA方法基于一维向量,在提取主成分之前需要先将输入的二维图像序列转换成一维行向量或者一维列向量。由于输入的图像分辨率一般较大而且视频序列帧数较多,在将二维图像转换为一维向量时,通常需要一个巨大的向量空间,因此往往会占用目标跟踪系统较多的存储空间。此外,由于该矩阵的秩较大,而可供训练的样本数量却很少,因此计算PCA特征提取时所需的协方差矩阵十分困难,在得到协方差矩阵后进行特征向量和特征值运算时也需要花费大量的时间,从而增加了运动目标跟踪时间。

为了克服PCA方法出现的这些问题,2DPCA(Two-dimensional Principal Component Analysis,二维主成分分析)方法被提出。该方法的运算直接基于二维图像矩阵,在提取特征向量时不需要将二维图像转化为一维向量,因此图像的协方差矩阵大小与图像的宽度相同。与PCA方法相比,协方差矩阵减小了很多,最终获得的特征向量也比PCA方法得到的更加准确,运算时间也大大减少。将2DPCA应用于运动目标跟踪,能够减少计算量,提高跟踪的准确性。

发明内容

本发明的目的在于提出一种基于2DPCA的运动目标跟踪方法,克服了传统PCA方法提取协方差矩阵困难、计算量大的问题,提高了运动目标特征提取的 精度,减少了运动目标跟踪时间,提高了跟踪的准确性,具有较强的鲁棒性。

为了解决上述技术问题,本发明提供一种基于2DPCA的运动目标跟踪方法,使用如公式(1)所示的方法计算运动目标跟踪过程中所需的运动目标后验概率,从而实现运动目标跟踪,

式(1)中,p(At|Zt)是在粒子滤波理论框架下计算获得的运动目标后验概率;At为t时刻的子图像矩阵;Zt=(xt,yt,st,rttt)是用于表示t时刻的目标状态的二维仿射参数,其中xt为x方向偏移量,yt为y方向偏移量,st为目标缩放尺度,rt为目标纵横比,θt为目标旋转角度,λt为目标倾斜角度;为权重因子;||·||F表示Frobenius范数;

式(1)中,Xt={Xi,i=1,...,d}是一个在t时刻大小为w×d的图像矩阵,Xi表示一个w维的列向量;At为t时刻大小为h×w的子图像矩阵,该子图像矩阵由Xt图像矩阵获得;(·)T表示矩阵的转置;为投影中心,其中为子图像序列的平均值,其定义如公式(2)所示:

A=1mΣi=1mAi---(2)

式(2)中,Ai为子图像序列中的任意帧图像,m为子图像序列帧数;

式(1)中,部分可以用dt代表,用于表示子空间距离。对于距离dt,子图像At关于dt的后验概率服从高斯分布模型,其定义如公式(3)所示:

pdt(At|Zt)=N(At;uXtT,XtXtT+ϵI)---(3)

式(3)中,I为一个单位矩阵,ε为高斯噪声;N(·)表示高斯分布模型;

式(1)中,部分可以用dw代表,用于表示子空间的投影 到子空间中心的距离。对于距离dw,子图像At关于dw的后验概率服从高斯分布模型,其定义如公式(4)所示:

pdw(At|Zt)=N(At;uXtT,XtΣ-1XtT)---(4)

式(4)中,N(·)表示高斯分布模型;Σ表示Xt的特征矩阵;矩阵Σ中的对角元素是矩阵Xt的特征值;

进一步,在目标跟踪过程中,跟踪到的子图像累计到一定数量时,需要对子图像进行更新。设原始的子图像集合为Ut={Ai,i=1,...,m},累积的子图像集合为Ot={Bi,i=1,...,5},则更新后的子图像集合

本发明与现有技术相比,其显著优点在于:(1)本发明采用2DPCA方法对图像的子空间特征向量进行提取,由于2DPCA基于二维图像矩阵,因而在提取特征向量时不需要预先将图像转化为一个向量,而是直接使用原始图像矩阵来构建图像协方差矩阵,原始图像矩阵的特征向量用来提取特征,从而减少了运算量;此外,采用2DPCA获取协方差矩阵比PCA方法更加准确,提取特征向量的时间也大大减少;(2)本发明采用粒子滤波方法获得运动目标的动态模型,运动目标的后验概率通过2DPCA方法获得,基于2DPCA的运动目标特征模型定义的每个时刻目标的二维仿射参数,能够较好的克服目标形变等问题,确保了目标跟踪的准确性。

附图说明

图1是本发明基于2DPCA的运动目标跟踪方法流程简图。

图2是本发明基于2DPCA的运动目标跟踪方法流程详细图。。

图3是本发明方法与IVT方法、L1T方法以及VTD方法的比较结果图。

具体实施方式

一、本发明基本思想

本发明在粒子滤波理论框架下提出了一种基于2DPCA的运动目标跟踪方法,其基本原理是:

首先,利用2DPCA建立运动目标特征模型;

然后,获得运动目标跟踪所需要的后验概率;

最后,根据获得的运动目标后验概率实现对运动目标的跟踪。

二、2DPCA(二维主成分分析)的概念

定义Xt={Xi,i=1,...,d}为一个在时刻t的w×d图像矩阵,w为矩阵的行数,d为矩阵的列数,该矩阵中Xi表示一个w维的列向量;定义At为一个在时刻t的h×w子图像矩阵,h为矩阵的行数,d为矩阵的列数;定义Yt表示子图像矩阵At的投影特征矩阵,则关于Xt的线性变换如公式(1)所示:

Yt=AtXt>

定义Yt的协方差矩阵Sx的迹为总散度J(Xt),通过最大化这个总散度准则,就能够找到最优的投影方向Xt使得投影后的向量Yt分开。总散度J(Xt)如公式(2)所示:

J(Xt)=tr(Sx)(2)

式(2)中,Sx为Yt的协方差矩阵,其定义如公式(3)所示:

Sx=E[(Yt-E(Yt))(Yt-E(Yt))T]

=E[(AtXt-E(AtXt))(AtXt-E(AtXt))T](3)

=E[[(At-E(At))Xt][(At-E(At))Xt]T]

式(3)中,E(·)表示期望,(·)T表示矩阵的转置;

式(2)中,tr(Sx)表示矩阵Sx的迹,其定义如公式(4)所示:

tr(Sx)=XtT[E[(At-E(At))T(At-E(At))]]Xt---(4)

定义Ut={Ai,i=1,...,m}为m帧子图像Ai组成的序列,则子图像的协方差矩阵Gt如公式(5)所示:

Gt=E[(At-E(At))T(At-E(At))](5)

式(5)中,Gt是一个w×w的非负矩阵。

定义子图像序列Ut={Ai,i=1,...,m}的平均值A如公式(6)所示:

A=1mΣi=1mAi---(6)

根据公式(5)和公式(6),得到子图像的协方差矩阵Gt的等价表示如公式(7)所示:

Gt=1mΣi=1m(Ai-A)T(Ai-A)---(7)

准则化公式(7),得到公式(8)和公式(9):

J(Xt)=XtTGtXt---(8)

XtTXt=1---(9)

根据公式(8)和公式(9),令:

F=XtTGtXt-λ(XtTX-1)---(10)

对公式(10)中的Xt求偏导数,得到公式(11):

FXt=2GtXt-2λXt=0---(11)

式(11)中,表示F对Xt的偏导;解式(11)得到公式(12):

GtXt=λXt(12)

式(12)中,Xt表示最优投影轴,λ表示特征值。

由式(12)可知,最优投影轴是协方差矩阵Gt的最大特征值λ对应的特征向量。通常,一个最优投影轴是不够的,因此,选择对应着特征值最大的前d个相互正交的单位特征向量作为最优投影轴,其表示如公式(13)所示:

{{X1,...,Xd}=argmaxJ(Xt)XiTXj=0,ij,i,j=1,...,d---(13)

式(13)中,max(·)表示取最大值;arg(·)表示正交。

三、基于IVT算法的运动目标跟踪的相关概念

对于目标在t时刻的运动状态,可以采用二维仿射参数Ζt=(xt,yt,st,rttt)表示;其中xt为x方向偏移量,yt为y方向偏移量,st为目标缩放尺度,rt为目标纵横比,θt为目标旋转角度,λt为目标倾斜角度。所述二维仿射参数Xt=(xt,yt,st,rttt)详见文献(R.Szeliski:Computer>

采用IVT算法(Incremental Learning for Robust Visual Tracking Algorithm,基于增量学习的鲁棒性视觉跟踪算法)跟踪运动目标,其所需的运动目标后验概率如公式(14)所示:

p(At|Zt)=exp(-1σ2||At-At-1||2)---(14)

式(14)中,为权重因子;||·||F表示Frobenius范数;At为在时刻t子图像矩阵。所述IVT算法(Incremental>

四、基于粒子滤波的2DPCA运动目标跟踪的相关概念

目标跟踪问题可以认为是一个隐式马尔科夫链问题,对于子图像序列Ut={Ai,i=1,...,m},目标在t时刻的运动状态Zt通过贝叶斯理论有以下结论:

p(Zt|At)∝p(At|Zt)∫p(Zt|Zt-1)p(Zt-1|At-1)dZt-1>

式(15)中,p(At|Zt)为观测模型,p(Zt|Zt-1)为动态模型。

1、动态模型p(Zt|Zt-1)

动态模型p(Zt|Zt-1)在空间上采用布朗运动模型,目标在t时刻的运动状态Zt通过目标在t-1时刻的运动状态Zt-1的高斯分布得到,其表示如式(16)所示:

式(16)中,N(·)表示高斯分布模型;为一个对角 协方差矩阵,其对角元素为各二维仿射参数Ζt=(xt,yt,st,rttt)的方差。

2、观测模型p(At|Zt)

定义子图像序列Ut={Ai,i=1,...,m}的平均值A如公式(17)所示:

A=1mΣi=1mAi---(17)

对于根据目标在t时刻的运动状态Zt确定的一个子图像At,定义其通过投影向量矩阵Xt投影后的投影中心为其中

子图像At的后验概率p(At|Zt)可以表示为该子图像At到子图像空间参考点的距离,该距离可以分解为子空间距离dt和子空间的投影到子空间中心的距离dw

对于子空间距离dt,子图像At关于dt的后验概率服从高斯分布模型,其定义如公式(18)所示:

pdt(At|Zt)=N(At;uXtT,XtXtT+ϵI)---(18)

式(18)中,I为一个单位矩阵,ε为高斯噪声;N(·)表示高斯分布模型;

对于距离dw,子图像At关于dw的后验概率服从高斯分布模型,其定义如公式(19)所示:

pdw(At|Zt)=N(At;uXtT,XtΣ-1XtT)---(19)

式(19)中,N(·)表示高斯分布模型;Σ表示Xt的特征矩阵;矩阵Σ中的对角元素是矩阵Xt的特征值。

结合式(18)和式(19),得到子图像At的后验概率p(At|Zt),其表示如公式(20)所示:

p(At|Zt)=pdt(At|Zt)pdw(At|Zt)=N(At;uXtT,XtXtT+ϵI)N(At;uXtT,XtΣ-1XtT)---(20)

五、运动目标特征模型的概念

定义yt=AtXt表示子图像At通过Xt映射得到yt,且yt服从高斯分布,即yt~N(u,L),其中,L为对角矩阵。则子空间图像At可以表示为:

式(21)中,为高斯噪声,满足I为一个单位矩阵。结合式(20)和式(21),则子图像At的运动目标特征模型p(At)可以表示为:

p(At)=N(At;uXtT,XtLXtT+σ2I)---(22)

六、基于粒子滤波的2DPCA运动目标跟踪的后验概率的概念

对式(22)等号两边同时取对数得到式(23):

式(23)中,多项式部分用c表示,多项式部分用l表示,多项式c是一个常数,因此log[p(At)]的值由多项式l决定。式(23)等价为式(24):

log(p(At))(At-uXtT)T(At-uXtT)(XtLXtT+σ2I)-1---(24)

Sherman-Morrison-Woodbury公式如式(25)所示:

(A-uvT)-1=A-1+A-1u(1-vTA-1u)-1vTA-1>

根据式(25),式(24)中的可以等价表示为:

又因为:

(L-1+1σ2I)-1=σ2(I-D-1σ2)---(27)

式(27)中,D为一个对角矩阵,Dii=Lii2,则式(26)可等价为:

(XtLXtT+σ2I)-1=1σ2I-1σ2Xtσ2(I-D-1σ2)XtT1σ2=1σ2I-1σ2(XtXtT)+(XtD-1XtT)=1σ2(I-XtXtT)+(XtD-1XtT)---(28)

将式(28)代入式(23),可以得到:

式(29)中,多项式c是一个常数,因此log[p(At)]由多项式l1决定,则:

log[p(At)](At-uXtT)T(At-uXtT)(1σ2(I-XtXtT)+(XtD-1XtT))---(30)

因此得到运动目标特征模型p(At)的后验概率p(At|Zt)为:

七、执行本发明方法的一个流程

步骤一,手动选取图像序列中第一帧图像中的运动目标,并用表示符号标识出来,例如用红色长方形框将第一帧图像中的运动目标框出,作为参考目标。

步骤二,初始化并且置空子图像序列Ut={Ai,i=1,...,m}。

步骤三,对于输入的第n帧图像,判断n>nth(nth为设定的帧数阈值)。若满足n>nth,则执行步骤五,否则执行步骤四。

步骤四,采用IVT方法(Incremental Learning for Robust Visual Tracking Algorithm,基于增量学习的鲁棒性视觉跟踪算法)跟踪运动目标[Ross D A,Lim J,Lin R S,et al.:Incremental learning for robust visual tracking[J].International Journal of Computer Vision.(2008)77(1-3):125-141.]。

步骤五,使用公式(31)所示的方法计算运动目标跟踪过程中所需要的运动目标后验概率,从而实现运动目标的跟踪。

步骤六,返回步骤三。

本发明的有益效果可以通过以下实验进一步说明:

本发明实施例以Matlab2012b为实验平台,输入图像序列为“dudek”,每帧图像大小为480×720,共计150帧。选取人脸为运动目标进行跟踪,从第100帧到第110帧,运动目标被遮挡,第110帧后对运动目标的遮挡消失。

本实验将本发明方法与现有的IVT方法、L1T方法和VTD方法进行了比较。采用均方根误差(RMS)作为比较依据,其计算公式如公式(32)所示:

RMS=|RD-TD|TD×100%---(32)

其中,RD表示跟踪结果像素值,TD表示真实像素值。比较结果如图3所示。从图3中可以看出,在跟踪初始阶段,IVT方法,L1T方法和本发明所述方法跟踪得到的实际值与真实值的均方根误差小于5个像素,但是局部遮挡后,本发明所述方法的均方根误差要小于现有的其他算法,可见采用本方法进行运动目标跟踪具有一定的优势。

所述L1T方法详见文献(Mei X,and Ling H:Robust visual tracking using L1 minimization[C].Computer Vision,2009IEEE 12th International Conference on.IEEE.(2009):1436-1443.)。

所述VTD方法详见文献(J.Kwon and K.Lee.Visual tracking decomposition.In CVPR,pages 1269–1276,2010.)。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号