首页> 中国专利> 基于多尺度码本模型的红外运动目标检测方法

基于多尺度码本模型的红外运动目标检测方法

摘要

本发明公开了一种基于多尺度码本模型的红外运动目标检测方法,该方法先对红外视频图像进行高斯金字塔分层,然后分别对各层图像建立背景码本模型,根据背景码本模型,检测视频图像中的运动目标,最后将各层图像检测结果进行融合,得到最终视频检测结果。实验结果表明,本发明中所得到的红外运动目标检测结果相对于传统检测算法结果来说,具有检测效果较好、目标信息丰富,误检率低的特点。它不但可以应用在当前图像融合领域中,以提高融合效果,还可以单独应用在安防监控,夜视侦查等民事和军事领域。

著录项

  • 公开/公告号CN103778644A

    专利类型发明专利

  • 公开/公告日2014-05-07

    原文格式PDF

  • 申请/专利权人 南京理工大学;

    申请/专利号CN201410017823.5

  • 发明设计人 刘磊;周亚运;夏琪;崔民杰;黄伟;

    申请日2014-01-15

  • 分类号G06T7/20(20060101);

  • 代理机构32203 南京理工大学专利中心;

  • 代理人朱显国

  • 地址 210094 江苏省南京市孝陵卫200号

  • 入库时间 2024-02-19 23:58:24

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-08-29

    授权

    授权

  • 2014-06-11

    实质审查的生效 IPC(主分类):G06T7/20 申请日:20140115

    实质审查的生效

  • 2014-05-07

    公开

    公开

说明书

技术领域

本发明涉及一种目标检测领域的方法,特别是一种基于红外运动目标检测的 检测方法。

背景技术

红外运动目标检测具有红外成像技术抗干扰能力较强、隐蔽性良好和全天候 工作等特点,在军事和民用领域都有着广泛的应用。但是通常在实际应用中,红 外目标的背景是复杂多变的,这使得红外运动目标检测算法的实现成为红外系统 研究过程中的一项至关重要的技术,不仅在理论方面有着极其重要的意义,在实 用方面也有相当大的价值。就目前在军事体系中的应用而言,红外运动目标检测 系统可以在空中(包括空-地、空-空、空-海)超远距离目标检测、军事空中导弹 防御、军事目标跟踪与攻击、港口情况监视、海洋环境监视、卫星姿态监控等项 目中得到应用。同时,红外运动目标检测系统还广泛应用于现代民用领域,在遥 感、红外大气云图分析、红外医疗图像病理分析、航拍地面红外图像地质分析、 城市红外污染分析和高速公路的车流量检测以及海面人员搜救等领域中,红外目 标检测技术也充分展示出了它的强大作用。

目前,比较成熟的运动目标检测算法可以分为以下三类:

(1)帧差法等简单的运动目标检测算法。帧差法一般指的是前后两帧图像 相减,得到的结果按一定阈值做分割,得到运动目标图像,其又可扩展为三帧差 分、隔帧差分等算法。它的优点是算法原理简单,计算量小,速度快,占用系统 内存较小,适合实时处理。

(2)基于光流的运动目标检测算法,按照其理论基础的不同,又可分为: 基于梯度的方法、基于匹配的方法、基于能量的方法和基于相位的方法。光流表 达了人眼中的图像变化,其中包含了目标运动的信息,利用像素点数值大小的时 域变化和相关性可以确定各个像素点位置的“相对运动”,从而确定目标的实际 运动状况。它的优点是能检测独立运动对象,可用于摄像头运动场景。

(3)基于背景差分法的运动目标检测算法,如多帧平均法,IIR滤波法,高 斯建模法等都是侧重于背景差分法中背景的建立或背景的更新机制。在这类目标 检测算法中,首先根据一定的原理建立背景模型,然后利用输入一帧图像和背景 模型比较,不同的则是运动目标,得到运动目标像素,反之则是背景像素,得到 检测结果。这类算法根据背景模型建立的复杂程度,其算法复杂程度相应增加, 但总体检测效果较好,多帧平均法检测速度快,IIR滤波法自动更新背景模型, 高斯建模法检测准确率高。

传统的码本模型也是一种建立背景模型方法,是一种基于背景差分法的运动 目标检测算法。基于码本模型的运动目标检测算法基本思路是:首先建立初始码 本,然后对一段视频进行训练得到初始背景码本,其次利用背景模型检测当前视 频图像中的运动目标,最终得到基于码本模型的运动目标检测结果,传统的码本 模型同大部分运动目标检测算法相似,只利用了视频图像的像素信息,而忽略了 图像的空间尺度信息,其检测结果中目标整体特征不明显,误检点较多。

以上的运动目标检测算法应用在简单的背景中,其检测效果较好。但应用在 复杂的背景中,各个算法都有其各自的缺点,检测效果较差,误检率高。帧差法 检测目标有难以解决的空洞问题,光流法检测轮廓不明显,多帧平均法检测误差 大,IIR滤波法检测结果部分有拖影,高斯建模法计算量大、检测速度缓慢,传 统的码本模型目标整体特征不明显、误检点较多。

发明内容

本发明的目的在于提供一种基于红外运动目标检测的检测方法,从而实现红 外视频中的运动目标的检测。

实现本发明的目的的技术解决方案为:一种基于多尺度码本模型的红外运动 目标检测方法,步骤如下:

(1)利用红外摄像头采集视频,输入到计算机中,得到红外视频;

(2)采用高斯金字塔图像分层模型对红外视频图像进行多尺度分析处理, 将视频图像分为三层:原始层、中间层和高斯层;

(3)如果当前视频图像是视频的前50帧图像,对步骤(2)中的三层视频 图像分别建立初始背景码本模型,前50帧视频的检测结果为视频图像本身,如 果当前视频图像不是视频的前50帧图像,则转到步骤(4):

如果当前视频图像是视频的第1帧图像,则先建立空的主码本M和缓存码 本H,然后将第一帧图像像素值放入初始的主码本M中,得到初始码本,随后 转到步骤(6);

如果当前视频图像是视频的第2-49帧图像中的一帧,对三层视频图像分别 进行初始码本训练,得到训练后的初始码本,随后转到步骤(6);

如果当前视频图像是视频的第50帧图像,则对训练后的初始码本进行精炼 得到初始背景码本,随后转到步骤(6);

(4)根据步骤(3)建好的背景码本模型,采用背景相减法,进行红外运动 目标检测,得到当前视频图像的红外运动目标检测结果;

(5)根据更新理论更新主码本M和缓存码本H,得到更新后的主码本M 和缓存码本H;

(6)对当前视频图像的三层图像中的中间层和高斯顶层的红外运动目标检 测结果进行高斯金字塔EXPAND运算,得到当前视频图像的三层还原检测图像;

(7)对步骤(6)中三层还原检测图像进行融合运算,得到去除背景的红外 运动目标检测视频图像;

(8)如果当前视频图像不是视频的最后一帧图像,则对下一帧图像从步骤 (2)开始处理;

如果当前视频图像是视频的最后一帧图像,则该视频的红外运动目标检测处 理结束,得到红外视频的运动目标检测结果。

本发明与现有技术相比,其显著优点:(1)通过对视频图像做三层高斯金字 塔分解,再分别对分解后的视频图像建立码本模型,进行运动目标检测,将得到 不同尺度下的运动目标检测结果,最后将不同尺度下的运动目标检测结果融合得 到总体的运动目标检测结果,同时利用了视频图像的像素信息和空间尺度信息。 (2)在码本模型中的更新中,建立了缓存码本,通过对缓存码本和主码本的更 新来实现背景模型的更新,使得背景模型具有抗扰动性、自适应更新特性。

附图说明

图1是本发明基于多尺度码本模型的红外运动目标检测方法的流程图。

图2是本发明高斯图像金字塔示意图。

图3是本发明初始码本训练流程图。

图4是本发明运动目标检测及码本更新流程图。

图5是本发明方法的仿真模型。

图6是本发明方法仿真输入视频原始图像。

图7是本发明方法仿真结果图像。

图8是本发明方法包含图像背景的仿真结果。

图9是本发明所对比其它算法的仿真结果图像。

具体实施方式

下面结合附图对本发明作进一步详细描述。

结合图1,本发明基于多尺度码本模型的红外运动目标检测方法包括以下步 骤:

步骤1、利用红外焦平面及其控制模块采集红外视频,摄像头输出为PAL 制720×576像素的视频源,将该视频输入到计算机中,作为红外视频。

步骤2、采用高斯金字塔图像分层模型对红外视频进行多尺度分析处理,对 于红外视频,记为{Fig1,Fig2,…,FigN},表示N帧视频序列,将每一帧图像采用 5×5的高斯模板进行高斯金字塔分解,分为3层,原始层为G0,中间层为G1, 高斯顶层为G2。

每一层的高斯塔形分解可以表示为:

Gk=Σm=-22Σn=-12w(m,n)Gk-1(2i+m,2j+n),其中k=0,1,2   (32)

5×5的高斯模板w(m,n)应满足以下性质:

①可分离性:w(m,n)=w(m)w(n)

②对称性:w(m)=w(-m)

③归一化性:Σm=-22w(m)=1,Σm=-22w(n)=1

计算得到5×5的高斯模板w(m,n)如下所示:

w5=12561464141624164624362464162416414641---(33)

图像金字塔的示意图如图2所示。

步骤3、如果当前视频图像是视频的第一帧,则首先建立空的主码本M和 缓存码本H,缓存码本H和主码本M的结构完全一样。由于视频图像是灰度图 像,检测过程中利用其像素信息,有别于RGB空间的码字描述方法,码本用集 合C表示,码字采用VL和auxL=(Imin,Imax,f,λ,p,Tlast)来描述,V表示码字的灰 度值,aux表示码字的六元结构体,其中Imin、Imax分别表示码字最小、最大亮度 值;f表示码字出现的频率;λ表示码字相邻两次访问的最大时间间隔;p,Tlast分别表示码字在视频中第一次和最后一次出现的时间。建立的码本初始化各个参 数均为0,码字个数L也为0。然后将第一帧图像的像素创建码字到码本中去, 建立初始码字,建立规则为:

L=1

vL=I1aux1=(Imin,Imax,1,0,1,1)

此时,上式中Imin=Ii,Imax=Ii

如果当前视频图像是视频中的第2-49帧中的一帧图像,对视频图像的G0、 G1、G2三层分别进行初始码本训练,假设X={x1,x2,…,xN}表示N帧视频中某 一个像素点的连续采样值;C={c1,c2,…,cL}表示与该像素对应的码本,包含L个 码字ci(1≤i≤L)。结合图3,训练过程如下:

①对于视频图像中每个像素的序列采样值xi=Ii,其中i=1,2,···N。根据式(34) 在码本M中寻找匹配码字。Ii表示当前像素值。

Imin-mod≤Ii≤Imax+mod

           (34)

其中mod为像素扰动范围,经多次验证,mod取10左右模型效果较好。

②如果不存在匹配码字,则在码本M中创建新的码字。

L=L+1

            (35)

vL=IiauxL=(Imin,Imax,1,t-1,t,t)---(36)

此时,上式中Imin=Ii,Imax=Ii,时间t用当前视频图像帧数表示。

③如果存在匹配码字cm,cm的描述形式如式(37)所示。

vm=Imauxm=(Imin,Imax,fm,λm,pm,Tlast)---(37)

对码字按照下式进行更新:

vm=(fmIm+Ii)/(1+fm)      (38)

Imin=(1-β)(Ii-α)+βImin

                  (39)

Imax=(1-β)(It+α)+βImax

(40)fm=fm+1         (41)

λm=max{λm,t-Tlast}          (42)

Tlast=t              (43)

其中,α的实验最佳值为10,β是一个必须小于1的数,其实验最佳值为 0.95。

如果当前视频图像是视频中的第50帧图像,对初始码本根据式(44)进行 精炼得到初始背景码本。由于训练的视频长度仅为50帧,对于25帧/秒的视频 来说就是2秒钟,在这段视频图像中如果存在静止目标或者运动缓慢目标,精炼 背景如果采用f和λ的准则,则将产生误检,影响后面目标检测结果。此处采用 f和Tlast判断标准,如式(44)所示:

M={cm|cm∈(C-C∩f≤ξf∩Tlast≤40)}   (44)

此判断的基本思路是用初始训练码本减去噪声和部分前景目标码本,噪声和 部分前景目标码本认为是其最后一次出现在前40帧中且出现频率较少的码字, 此处的频率阈值ξf实验结果取值为10时效果较好。该判断中保留了训练视频阶 段最后10帧的全部信息,主要为了避免这段时间新出现的背景被错误的删除。

步骤4、如果当前视频图像不是视频中的前50帧图像,那么根据建好的背 景码本,进行红外运动目标检测。对于常见的背景消除法提取运动目标,最直接 的方法是将输入帧与背景模型相减。大部分背景模型所建立的模型都是固定的, 可以采用背景相减的方法,然后设定阈值得到前景目标。但由于码本模型每一个 码本码字的不确定性,所以码本模型采用像素采样值与码本是否匹配的方法来判 断。结合图4,具体如下:

①视频图像某位置像素为x=Ii

②从对应主码本M中寻找匹配码字cm,匹配条件如式(45)所示。

Imin-mod≤Ii≤Imax+mod       (45)

其中,Imin、Imax表示已训练好的背景码本中码字的最小和最大边界,在训练 过程中,分别赋予训练码本中最小、最大码字值。考虑到像素值的波动性,即视 频图像中同一位置代表同一事物像素值也具有轻微变动,所以在二者基础上分别 加上一定的偏移量mod。如果存在匹配码字,则matched=1,否则matched=0。

③通过寻找当前视频图像像素点在其对应码本中是否存在匹配码字,区分前 景点和背景点,具体公式如下:

BGS(x)=foreground,matched=0background,matched=1---(46)

BGS(x)是当前视频图像的红外运动目标检测结果,如果判断为前景点 background,则该位置像素点值为0,反之如果判断为背景点foreground,则该 位置像素点的值为255。

步骤5、更新主码本M和缓存码本H,结合图4,具体如下:

①在当前视频图像的对应像素点主码本M中寻找是否存在码字与其匹配, 如果存在,则对匹配的码字进行更新,更新公式如下:

vm=(fmIm+Ii)/(1+fm)       (47)

Imin=(1-β)(Ii-α)+βImin         (48)

Imax=(1-β)(It+α)+βImax          (49)

fm=fm+1          (50)

λm=max{λm,t-Tlast}        (51)

Tlast=t(52)

其中,α的实验最佳值为10,β的实验最佳值为0.95。

如果在主码本M中没有匹配的码字,则在缓存码本H中进行查找是否有匹 配的码字,如果有匹配的码字,则按照式(47)-(52)的规则更新缓存码本中 的码字。如果没有匹配码字,则创建一个新的码字c′到缓存码本H中。创建码 字规则如下式所示:

L=L+1         (53)

vL=IiauxL=(Imin,Imax,1,t-1,t,t)---(54)

此时,上式中Imin=Ii,Imax=Ii

②精炼缓存码本H。由于每一帧视频图像都在同时更新主码本M和缓存码本, 如果采用传统的时限TH,根据规则H=H-{c′k|c′k∈H,λk>TH}来进行缓存码本H 的精炼,那么第一次出现的背景刚存入缓存码本中,就会由更新规则删除掉。而 且该时限不能真正反应缓存码本H的特点。根据实验结果,提出了以下更新规 则:

首先每隔50帧进行缓存码本H的更新,更新时去除2方面码字,一是去除 离当前帧超过长达50帧没有出现过的码字,二是去除频率较小且最后一次出现 地方离当前帧地方超过10帧的码字,公式如下:

H=H-{c′k|(Tlast<t-100)∪(f<ξf∩Tlast<t-10)}   (55)

根据实验结果,当ξf=10时,缓存码本精炼效果较好。

③将在缓存码本H中停留足够长时间的码字从H码本中移到主码本M中。此 处的更新是实时更新,将在缓存码本H中停留足够时间的码字移到M中,公式如 下:

M=M+{c′k|c′k∈H,fk>Tadd}       (56)

其中Tadd为停留时间阈值,根据实验,当Tadd=40时,实验结果较好。

④更新主码本M。从M中删除超过一定时间未被匹配的码字,公式如下:

M=M-{c′k|c′k∈M,Tlast<t-100}   (57)

此处删除主码本M中距当前视频图像超过100帧未被匹配的码字。

步骤6、对中间层和高斯顶层进行高斯金字塔EXPAND运算。EXPAND运 算基本原理是通过内插的方法可以把一个(M+1)×(N+1)的数组扩 (2M+1)×(2N+1)为。对高斯金字塔中的第k级图像Gk应用一次EXPAND运算 得到Gk,1与高斯金字塔中的第k-1级图像有相同的大小。设Gk,n是对Gk进行n次 EXPAND运算的结果,那么,

Gk,0=Gk         (58)

Gk,n=EXPAND(Gk,n-1)        (59)

对所有k(0<k<2),0≤n≤k,对所有像素点(i,j),0≤i≤Ck-n,0≤j≤Rk-n, 有:

Gk,n(i,j)=4Σm=-22Σn=-22w(m,n)Gk,n-1(i-m2,j-n2)---(60)

仅当(i-m)/2和(j-n)/2都是整数时进行上面的求和运算。

经过以上的EXPAND运算,得到像素大小相同的三层还原检测图像分别为: G′0,G′1,G′2,三层图像像素大小都为720×576。

步骤7、对三层还原检测图像进行融合运算,由于高斯金字塔三层模型各层 的细节特征不一样,我们对三层还原图像采用以下方法进行像素融合,然后根据 阈值判定像素点是否属于运动目标。

融合的方法为:对比对应高斯金字塔三层还原图像像素的灰度值,然后取灰 度值大的的像素作为融合图像像素点的值,得到融合后的图像G′。公式如下:

G′(i,j)=max{G′0(i,j),G′1(i,j),G′2(i,j)}    (61)

然后对融合后的图像G′进行自适应阈值分割处理,以达到优化边界,去除 虚假目标的效果。自适应阈值分割处理后的图像为g(i,j),令门限为Th(k),则 有:

g(i,j)=1G(i,j)Th(k)0G(i,j)<Th(k)---(62)

式中,Th(k)是随序列图像的变化而自适应改变的。即:

Th(k)=mean(k)+λ×var(k)(63)

其中,λ为加权值,λ的选择范围为3一5,本算法中取值为4。mean(k)、 var(k)分别表示第k帧经处理后的图像灰度均值和方差,设输入图像的大小为 C×R,则图像均值和方差可表示为:

mean(k)=1C×RΣi=0C-1Σj=0R-1[G(i,j,k)]---(64)

var(k)=1C×RΣi=0C-1Σj=0R-1[G(i,j,k)-mean(k)]2---(65)

该过程最后得到为检测到的红外运动目标图像。

步骤8、如果当前视频图像不是视频的最后一帧图像,则对下一帧图像从步 骤(2)开始处理;

如果当前视频图像是视频的最后一帧图像,则该视频的红外运动目标检测处 理结束,得到红外视频的运动目标检测结果。

最后显示结果设计了2种模式:一是直接输出红外视频的运动目标检测结 果,该结果中是没有背景的;二是输出含有背景的红外视频的运动目标检测结果, 检测到的运动目标区域被增强。

模式二的输出需要结合输入图像,其合成规则如下:

Fig(i,j)=g(i,j),if(g(i,j)=1)Fig(i,j),else---(66)

其中Fig(i,j)为原始图像,g(i,j)为运动目标检测结果。

下面结合算法仿真实例对本发明做进一步的说明:

如图1所示,利用红外焦平面及其控制模块采集红外视频,输出为PAL制 720×576像素的视频源,将视频输入到计算机中得到红外视频;采用高斯金字 塔图像分层模型对红外视频进行多尺度分析处理,高斯金字塔图像分解示意图如 图2所示;对视频图像的G0、G1、G2三层分别进行初始码本训练,即建立主码 本,初始码本训练流程如图3所示,然后对初始训练结果进行精炼得到初始背景 码本;根据建好的背景码本,先进行红外运动目标检测,得到各层检测结果,然 后更新主码本和缓存码本,其流程图如图4所示;对中间层和高斯顶层进行高斯 金字塔EXPAND运算;对三层还原检测结果进行融合运算得到融合后的检测结 果;最后对检测结果进行阈值分割得到二值化的红外运动目标检测结果。

本算法利用MATLAB/SIMULINK工具箱构建算法仿真模型,MATLAB版本 是7.9(R2009b),首先需要建立空白的模型界面,然后选择需要的模块搭建算 法模型,SIMULINK中已自带部分算法模型,如简单的自适应阈值分割,中值 滤波,增益等等。但复杂的算法并不能完全利用自带的模型实现,利用SIMULINK 中用户可编程的函数模块,编程实现所需要的算法功能。该算法的SIMULINK 模型如图5所示,图5.1-5.3分别为模型从外到里的模块嵌套图。

图5.1中主要利用的是From Multimedia File、Color Space Conversions、To  Video Display、To Multimedia File以及嵌套模块Codebook。其中各项的主要功 能分别是从文件中读取视频、颜色空间转换(RGB→YCbCr、YCbCr→RGB等)、 显示视频、保存视频以及算法模块。图5.2是codebook嵌套模块,主要利用的 是Image Data Type Conversion、Autothreshold、Product、Median Filter模块,其 功能分别为图像数据类型转换(某一类型→double、single、boolean等等)、 自适应阈值分割处理、相与运算、中值滤波。图中的codebook detection、codebook  detection1、codebook detection2都为结构一致的嵌套模块,codebook detection中 是原始层视频序列检测结果,codebook detection1是高斯分解第一层检测结果, codebook detection2是高斯分解第二层检测结果。Fusion是可编程的函数模块, 是三层检测结果融合的检测结果。图5.3是codebook detection的嵌套模块,其中 Display1、Display2和Display3是显示模块,Maximum和Maximum1是取最大 值模块,Memory1→8都是延时模块,Codebook Function是可编程的码本函数 模块。

图6分别是红外视频原始图像第200、400、600帧图像,红外视频图像大小 为144×176,总共时间为42秒,总共帧数为631帧,其视频为固定摄像头、有 多人走动的红外视频,视频序列中人数从3人左右到10人左右不等。

图7分别是是基于多尺度码本模型的红外运动目标检测方法仿真结果第 200、400、600帧图像,其中方框内部为检测结果中真实的运动目标。

图8是将检测结果反馈到原图像中去,即检测出的运动目标在原图中用255 像素表示,其它背景像素值不变,即可看到检测后的检测效果,其中方框内部为 检测结果中真实的运动目标。

为了将本发明所提出的方法和其它算法对比,分别设计了多帧平均模型、IIR 滤波模型、光流模型、两帧差分模型、混合高斯模型以及传统的码本模型。其仿 真结果图分别如图9(a)-(f)所示:(a)为两帧差分模型仿真结果,(b)为多帧平均 模型仿真结果,(c)为IIR滤波模型仿真结果,(d)为光流模型仿真结果,(e)为混 合高斯模型仿真结果,(f)为传统的码本模型仿真结果。图9中第一列图都为仿真 结果第200帧图像,第二列图都为仿真结果第400帧图像,第三列图都为仿真结 果第600帧图像。

根据图6、7、8以及图9(a)-(f),可以看出,本发明所提出的方法检测结果 明显优于其它各类运动目标检测算法,其可以完整的检测出视频中的运动目标。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号