首页> 中国专利> 基于dpLVSVM模型的雷达HRRP的目标识别方法

基于dpLVSVM模型的雷达HRRP的目标识别方法

摘要

本发明公开了一种基于dpLVSVM模型的雷达HRRP的目标识别方法,其步骤为:步骤1,对雷达HRRP数据进行特征提取得到功率谱特征集X;步骤2,构建dpLVSVM模型并得出功率谱特征的概率密度函数及各个参数的联合条件后验分布;步骤3,推导各个参数的条件后验分布;步骤4,对各个参数进行循环采样I次;步骤5,保存T0次测试阶段所需参数的采样结果;步骤6,判断测试雷达HRRP是否为库外样本,若为库外样本则拒判;否则步骤7;步骤7,采样得到测试雷达HRRP的功率谱特征的聚类标号;步骤8,输出测试雷达HRRP的目标类别标号本发明具有分类器设计复杂度小,识别性能高以及拒判性能好的优点,可用于对雷达目标的识别。

著录项

  • 公开/公告号CN104007431A

    专利类型发明专利

  • 公开/公告日2014-08-27

    原文格式PDF

  • 申请/专利权人 西安电子科技大学;

    申请/专利号CN201410234677.1

  • 申请日2014-05-29

  • 分类号G01S7/41(20060101);

  • 代理机构西安睿通知识产权代理事务所(特殊普通合伙);

  • 代理人惠文轩

  • 地址 710071 陕西省西安市太白南路2号

  • 入库时间 2023-12-17 00:40:32

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-03-29

    授权

    授权

  • 2014-10-22

    实质审查的生效 IPC(主分类):G01S7/41 申请日:20140529

    实质审查的生效

  • 2014-08-27

    公开

    公开

说明书

技术领域

本发明属于雷达技术领域,涉及雷达目标识别方法,尤其涉及一种基于dpLVSVM (Dirichlet process latent variable support vector machine,Dirichlet过程隐变量支撑向量机) 模型的雷达高分辨距离像HRRP的目标识别方法,用于对飞机,车辆等目标进行识别。

背景技术

雷达目标识别就是利用目标的雷达回波信号,实现对目标类型的判定。宽带雷达通常 工作在光学区,此时目标可以看作是由大量强度不同的散射点构成。高分辨距离像 (High-resolution range profile,HRRP)是用宽带雷达信号获取的目标体上各散射点回波的 矢量和。它反映了目标体上散射点沿雷达视线的分布情况,包含了目标重要的结构特征, 被广泛应用于雷达目标识别领域。由于目标具有姿态敏感性,同一目标的HRRP具有多模 分布特性,尤其是随着目标库的增大,训练样本个数也会随之增加,数据分布也变得更加 复杂。多模分布数据的分类界面往往是高度非线性的,需要采用非线性分类器对其分类。

作为一种常用的非线性分类器,核方法分类器是将原始空间线性不可分的数据映射成 为高维空间中线性可分的数据,然后进行线性分类。然而核方法分类器面临核函数选择以 及核参数选择的问题,且当训练样本数过大时,核方法分类器计算困难。另外,若使用所 有雷达高分辨距离像数据来训练一个分类器会增加分类器的训练复杂度,而且容易忽视样 本的内在结构,不利于分类。混合专家模型提出后,避免了复杂分类器设计,从而大大简 化分类器设计的复杂度。

混合专家模型将数据集划分成若干子集,然后在各个子集上分别训练简单的分类器, 最终构造全局非线性的复杂分类器,称为有限混合专家模型模型。这类模型存在两个缺点: 一是模型选择问题,即如何选择样本子集(聚类)个数;二是样本集的聚类过程是无监督的, 独立于后端的分类器任务,因此较难保证每个聚类中数据的可分性,从而影响全局的分类 性能。

发明内容

为了克服以上困难,本发明提出一种基于dpLVSVM模型的雷达HRRP的目标识别方 法,用于提高分类性能,降低模型求解复杂度。

为达到上述目的,本发明采用以下技术方案予以实现:

一种基于dpLVSVM模型的雷达HRRP的目标识别方法,其特征在于,包括以下步骤:

步骤1,雷达接收M个类别的目标的高分辨距离像HRRP;再对每个高分辨距离像进 行特征提取,得到雷达高分辨距离像的功率谱特征xn,将M个类别的目标的高分辨距离 像的功率谱特征组成功率谱特征集X;不属于该M个类别的目标的雷达高分辨距离像为库 外样本;属于该M个类别的目标的雷达高分辨距离像为库内样本;

步骤2,利用功率谱特征集X,将LVSVM分类器和TSB-DPM模型结合构建dpLVSVM 模型;根据dpLVSVM模型推导出雷达高分辨距离像的功率谱特征的概率密度函数,以及 dpLVSVM模型各个参数的联合条件后验分布;

dpLVSVM模型各个参数的联合条件后验分布即:TSB-DPM模型中聚类的高斯分布参 数雷达高分辨距离像的功率谱特征的聚类标号Z、TSB-DPM模型的截棍参数 υ、LVSVM分类器系数雷达高分辨距离像的功率谱特征对应的LVSVM分类器的 隐变量λ的联合条件后验分布;

步骤3,通过步骤2的dpLVSVM模型各个参数的联合条件后验分布,推导各个参数 的条件后验分布,即聚类的高斯分布参数的条件后验分布、雷达高分辨距离像的 功率谱特征的聚类标号Z的条件后验分布、TSB-DPM模型截棍参数υ的条件后验分布,以 及LVSVM分类器系数的条件后验分布、雷达高分辨距离像的功率谱特征对应的 LVSVM分类器的隐变量λ的条件后验分布;

步骤4,设定聚类高斯分布参数的初始值、雷达高分辨距离像的功率谱特征 的聚类标号Z的初始值、TSB-DPM模型的截棍参数υ的初始值、LVSVM分类器系数的初始值以及雷达高分辨距离像的功率谱特征对应的LVSVM分类器的隐变量λ的初始 值;

在设定初始值之后,根据设定初始值的参数在步骤3中对应的条件后验分布,按照 Gibbs采样技术对设定初始值的参数依次进行采样,总共对设定初始值的参数循环采样I0次,I0为自然数;

步骤5,在对设定初始值的参数循环采样I0次之后,从第I0+1次开始每间隔Sp次保存 聚类的高斯分布参数雷达高分辨距离像的功率谱特征的聚类标号Z、TSB-DPM 模型的截棍参数υ,以及LVSVM分类器系数总共保存T0次参数的采样结果;

在保存T0次参数的采样结果后完成高分辨距离像数据HRRP的样本训练阶段,同时得 到训练的LVSVM分类器和训练的TSB-DPM模型;

步骤6,对测试雷达高分辨距离像进行特征提取得到测试雷达高分辨距离像的功率谱 特征计算测试雷达高分辨距离像的功率谱特征的概率密度函数值,并预先设定拒判 门限Th,再与预先设定的拒判门限Th比较,根据比较结果判断测试雷达高分辨距离像是否 为库外样本;否则继续步骤7;

步骤7,将保存的T0次参数的采样结果中的聚类的高斯分布参数截棍参数 υ代入测试雷达高分辨距离像的功率谱特征的聚类标号的条件后验分布,得到测试雷 达高分辨距离像的功率谱特征的聚类标号的条件后验分布;

在得到测试雷达高分辨距离像的功率谱特征的聚类标号的条件后验分布之后, 从测试雷达高分辨距离像的功率谱特征的聚类标号的条件后验分布中采样得到测 试雷达高分辨距离像的功率谱特征的聚类标号

步骤8,根据测试雷达高分辨距离像的功率谱特征所属的聚类标号将测试雷 达高分辨距离像的功率谱特征依次输入其所属聚类对应的M个训练的LVSVM分类器 中,即,将步骤7得到的测试雷达高分辨距离像的功率谱特征所属的聚类标号以及 步骤5中保存的LVSVM分类器的系数代入到训练的LVSVM分类器的判别公式中, 输出测试雷达高分辨距离像的目标类别标号

上述技术方案的特点和进一步改进在于:

(1)步骤2包括以下子步骤:

2a)利用TSB-DPM模型将功率谱特征集X进行聚类,包括以下2a1)、2a2)和2a3):

2a1)在TSB-DPM模型中设定功率谱特征集X的最大聚类个数为C,每个聚类中雷 达高分辨距离像的功率谱特征服从高斯分布;

2a2)设定TSB-DPM模型中的基分布G0采用Normal-Wishart分布 其中,μ表示高斯分布的均值,Σ表示高斯分布的协方差矩阵, μ0为Normal-Wishart分布的均值,W0为尺度矩阵,β0、υ0为两个尺度因子;

2a3)将以上2a1)和2a2)中的设定代入TSB-DPM模型得到下式(1-a);

2b)利用LVSVM分类器对每个聚类中的雷达高分辨距离像的功率谱特征进行分类, 包括以下2b1)、2b2)和2b3):

2b1)设定每个LVSVM分类器系数先验分布为高斯分布表示高 斯分布,I表示单位矩阵;

2b2)根据TSB-DPM模型中的功率谱特征集X的最大聚类个数为C个聚类且目标类 别个数为M,采用一对多策略,即分别将M个类别中的一类目标看作正类目标,其它类 别看作负类目标,分别训练LVSVM分类器,则需训练C×M个LVSVM分类器;

2b3)将LVSVM分类器系数ωcm的先验分布代入到训练的C×M个 LVSVM分类器,得到以下式(1-b);

2c)通过公式(1-a)和(1-b)共同构建dpLVSVM模型;

ωcm,{λnm}c|{xn,yn}n=1,zn=cN~φ(ωcm,λcm|ym)---(1-b)

其中,υ=[v1,v2,...,vc,...,vC]表示TSB-DPM模型的截棍参数,c=1,2,...,C,C为TSB-DPM 模型设定的功率谱特征集X的最大聚类个数;Beta(·)表示Beta分布;α表示TSB-DPM模 型的截棍参数υ的先验分布的参数;表示Normal-Wishart分布;{μcc}表示第c个 聚类的高斯分布参数,μc表示第c个聚类的均值,Σc表示第c个聚类的协方差矩阵;G0表 示基分布;μ0为Normal-Wishart分布的均值,W0为尺度矩阵,β0、υ0为两个尺度因子; zn表示第n个雷达高分辨距离像的功率谱特征所属的聚类标号,n=1,2,...,N,N表示功 率谱特征集X中雷达高分辨距离像的功率谱特征个数;π=[π12,...,πc...,πC]表示每个聚类 的权系数且有j=1,2,...,c-1;Mult(·)表示多项分布;ωc表示第c个聚 类中所有M个LVSVM分类器的系数m=1,2,...,M,M表示目标类别个数;ωcm表示第c个聚类中第m个LVSVM分类器的系数;λcm表示第c个聚类中的雷达高分辨距离 像的功率谱特征对应的第m个LVSVM分类器的隐变量,λnm表示第n个雷达高分辨距离像 功率谱特征对应的第m个LVSVM分类器的隐变量且有ym表示雷达高分 辨距离像的功率谱特征对应于第m个LVSVM的类别标号;ynm表示第n个雷达高分辨距离 像的功率谱特征对应于第m个LVSVM分类器的类别标号,且有:若雷达高分辨距离像的 功率谱特征xn属于第m类目标则ynm=+1,否则ynm=-1;

x~n=[xn;1]表示 第n个雷达高分辨距离像的功率谱特征的增广向量;γ表示调和系数;I表示单位矩阵; 表示高斯分布;(·)T表示转置操作;

2d)由dpLVSVM模型推导出雷达高分辨距离像的功率谱特征的概率密度函数和 dpLVSVM模型各个参数的联合后验分布;dpLVSVM模型各个参数即TSB-DPM模型中聚 类的高斯分布参数雷达高分辨距离像的功率谱特征的聚类标号Z、TSB-DPM 模型的截棍参数υ、LVSVM分类器系数雷达高分辨距离像的功率谱特征对应的 LVSVM分类器的隐变量λ的联合条件后验分布;

雷达高分辨距离像的功率谱特征的概率密度函数见以下公式(2):

其中,π=[π12,...,πc,...,πC]表示每个聚类的权系数;表示均值为μc协方差 矩阵为Σc的高斯分布,c=1,2,...,C,C为TSB-DPM模型设定的功率谱特征集X的最大聚 类个数;

dpLVSVM模型各个参数的联合后验分布见以下公式(3):

其中,表示第c个聚类的高斯分布参数,μc表示第c个聚类的均值,Σc表示第c 个聚类的协方差矩阵,c=1,2,...,C,C为TSB-DPM模型设定的功率谱特征集X的最大聚 类个数;表示雷达高分辨距离像的功率谱特征的聚类标号,zn表示第n个雷达高 分辨距离像的功率谱特征的聚类标号,n=1,2,...,N,N表示功率谱特征集X中功率谱特 征个数;υ=[v1,v2,...,vc,...,vC]表示TSB-DPM模型的截棍参数;π=[π12,...,πc,...,πC]表示 每个聚类的权系数且有j=1,2,...,c-1;表示LVSVM分类器系数, ωc表示第c个聚类中所有M个LVSVM分类器的系数m=1,2,...,M,M表示目 标类别个数;λ表示雷达高分辨距离像的功率谱特征对应的LVSVM分类器的隐变量,λnm表示第n个雷达高分辨距离像的功率谱特征对应的第m个LVSVM分类器的隐变量;y表 示雷达高分辨距离像的类别标号,ynm表示第n个雷达高分辨距离像的功率谱特征对应于第 m个LVSVM分类器的标号;Beta(·)表示Beta分布;α表示TSB-DPM模型的截棍参数υ 的先验分布的参数;γ表示调和系数;μ0为Normal-Wishart分布的均值,W0为尺度矩阵, β0、υ0为两个尺度因子;I表示单位矩阵。

(2)步骤3包括以下子步骤:

3a)根据贝叶斯公式和dpLVSVM模型各个参数的联合条件后验分布,得到第c个聚 类的高斯分布参数{μcc}条件后验分布为:

其中,c=1,2,...,C,C为TSB-DPM模型设定的功率谱特征集X的最大聚类个数;X表示 功率谱特征集;μ0为第c个聚类的高斯分布参数{μcc}的先验分布的均值,W0为尺度矩 阵,β0、υ0为两个尺度因子;第c个聚类的高斯分布参数{μcc}的条件后验分布为 Normal-Wishart分布,其均值为尺度矩阵W为 W=(W0-1+NcΣc+Ncβ0(μ0-xc)(μ0-xc)T/β)-1,尺度因子β=β0+Nc,尺度因子 υ=υ0+Nc,Nc表示功率谱特征集X中属于第c个聚类的雷达高分辨距离像的功率谱特征 的个数;xc=1NcΣn=1,zn=cNxn,Σc==1NcΣn=1,zn=cN(xn-xc)(xn-xn)T,zn表示第n个雷达高分辨距离 像的功率谱特征的聚类标号,n=1,2,...,N,N表示功率谱特征集X中功率谱特征个数;

3b)根据贝叶斯公式和dpLVSVM模型各个参数的联合条件后验分布,得到第n个雷 达高分辨距离像的功率谱特征的聚类标号zn的条件后验分布为:

zn~Mult(κn),κn=[κn1,...,κnC];

其中,c=1,2,...,C,C为TSB-DPM模型设定的功率谱特征集X的最大聚类个数; n=1,2,...,N,N表示功率谱特征集X中功率谱特征个数;κnc表示第n个雷达高分辨距离 像的功率谱特征属于第c个聚类的概率;π=[π12,...,πc,...,πC]表示每个聚类的权系数且有 j=1,2,...,c-1;μc表示第c个聚类的均值,Σc表示第c个聚类的协方差 矩阵;γ表示调和系数;ωcm表示第c个聚类中第m个LVSVM分类器的系数;λnm表示第n 个雷达高分辨距离像的功率谱特征对应的第m个LVSVM分类器的隐变量,ynm表示第n个 雷达高分辨距离像的功率谱特征对应于第m个LVSVM分类器的类别标号,m=1,2,...,M, M表示目标类别个数;表示第n个雷达高分辨距离像的功率谱特征的增广向量, (·)T表示转置操作;Mult(·)表示多项分布;

3c)根据贝叶斯公式和dpLVSVM模型各个参数的联合条件后验分布,得到第c个聚 类中第m个LVSVM分类器的系数ωcm条件后验分布为:

其中,c=1,2,...,C,C为TSB-DPM模型设定的功率谱特征集X的最大聚类个数; m=1,2,...,M,M表示目标类别个数;n=1,2,...,N,N表示功率谱特征集X中功率谱特 征个数;Z表示雷功率谱特征集X中雷达高分辨距离像的功率谱特征的聚类标号;zn表示 第n个雷达高分辨距离像的功率谱特征所属的聚类标号;λnm表示第n个雷达高分辨距离像 的功率谱特征对应的第m个LVSVM分类器的隐变量,ynm表示第n个雷达高分辨距离像的 功率谱特征对应于第m个LVSVM分类器的类别标号;高斯分布的均值 μw=ΛwΣn=1,zn=cNγynm(λnm+γ)λnmx~n,协方差矩阵为Λw=(I+Σn=1,zn=cNγ2λnmx~nx~nT)-1;γ表示调和系数; 表示第n个雷达高分辨距离像的功率谱特征的增广向量;(·)T表示转置操作;

3d)根据贝叶斯公式和dpLVSVM模型各个参数的联合条件后验分布,得到第n个雷 达高分辨距离像的功率谱特征对应的第m个LVSVM分类器的隐变量λnm条件后验分布为:

其中,m=1,2,...,M,M表示目标类别个数;n=1,2,...,N,N表示功率谱特征集X中功 率谱特征个数;表示第zn个聚类中第m个LVSVM分类器的系数,zn表示第n个雷达 高分辨距离像的功率谱特征的聚类标号;ynm表示第n个雷达高分辨距离像的功率谱特征 xn对应于第m个LVSVM分类器的标号;表示第n个雷达高分辨距离像的功率谱 特征的增广向量;表示逆高斯分布;

3e)根据贝叶斯公式和dpLVSVM模型各个参数的联合条件后验分布,得到STB-DPM 模型的截棍参数υ中第c个变量vc的条件后验分布为:

p(vc|Z,α)=Beta(vc;a,b)  (7)

其中,c=1,2,...,C,C为TSB-DPM模型设定的功率谱特征集X的最大聚类个数;Z 表示功率谱特征集X中雷达高分辨距离像的功率谱特征的聚类标号;a=1+Nc, Nc表示属于第c个聚类的雷达高分辨距离像的功率谱特征的个数,Nk表 示属于第k个聚类的雷达高分辨距离像的功率谱特征的个数,k=c+1,c+2,...,C,α表示 TSB-DPM模型的截棍参数υ的先验分布的参数。

(3)步骤6包括以下子步骤:

6a)将保存的采样结果中的聚类的高斯分布参数{μcc}和截棍参数υ代入步骤2得到 的雷达高分辨距离像的功率谱特征的概率密度函数公式(2)计算测试雷达高分辨距离像 的功率谱特征的概率密度函数值;

6b)给定预先设定的拒判门限Th;将测试雷达高分辨距离像的功率谱特征x·的概率密 度函数值与拒判门限Th比较,判断测试雷达高分辨距离像是否为库外样本;

6c)根据保存T0次参数的采样结果得到测试雷达高分辨距离像的T0个判断结果;对T0个判断结果采用投票法则,即采用出现比例大于等于50%的判断结果,判断测试雷达高分 辨距离像是否为库外样本;若为库外样本则将测试雷达高分辨距离像拒判,即不给定目标 类别号并结束测试阶段;否则继续步骤7。

(4)步骤7中测试雷达高分辨距离像的功率谱特征的聚类标号的条件后验分布公 式见公式(9):

其中,t表示保存的第t次采样,t=1,2,...,T0,T0表示步骤5中设定的保存参数采样的 个数;表示根据保存的第t次采样参数所确定的测试雷达高分辨距离像的功率谱特征属 于第c个聚类的概率;υ=[v1,v2,...,vc,...,vC]表示TSB-DPM模型的截棍参数;表示根据 保存的第t次采样参数所确定的第c个聚类的权系数,j=1,2,...,c-1; {μcc}t表示保存的第t次采样的第c个聚类的均值和协方差矩阵;c=1,2,...,C,C为 TSB-DPM模型设定的功率谱特征集X的最大聚类个数;(·)T表示转置操作;Mult(·)表示多 项分布。

(5)步骤8中LVSVM分类器的判别公式为下式(10):

ρm=1T0Σt=1T0(ωztmt)Txy^=argmaxm(ρ),ρ=[ρ1,ρ2,...,ρm,...,ρM]---(9)

其中,表示第zt个聚类所对应的第m个LVSVM分类器的系数,m=1,2,...,M,M 表示目标类别个数,zt表示步骤5中得到的测试雷达高分辨距离像的功率谱特征的聚类 标号,t=1,2,...,T0,T0表示步骤5中设定的保存参数采样的个数;表示测试雷达 高分辨距离像的功率谱特征的增广向量;ρm表示第m个LVSVM分类器的平均输出; 表示求解最大值对应的m的值,(·)T表示转置操作。

本发明中提出dpLVSVM是一种无限混合专家模型,它是通过LVSVM(Latent variable  SVM,将隐变量SVM)分类器,见[Polson N.G.,Scott S.L..Data augmentation for support  vector machines[J].Bayesian Analysis,2011,vol.6(1),1-24],引入TSB-DPM模型(截断 Stick-breaking构造的Dirichlet process mixture model),见[Blei D.M.and Jordan M.I.. Variational inference for Dirichlet process mixtures[J].Bayesian Analysis,2006,vol. 1(1),121-144],来实现。

本发明与现有方法相比具有以下优点:

(1)与单分类器方法相比,本发明将数据划分为若干个聚类,可以通过多个简单的分 类器实现复杂的全局分类,由于每个聚类中样本个数较少从而降分类器设计复杂度。

(2)与有限混合专家模型相比,本发明采用TSB-DPM模型可以自动选择数据的聚类 个数并能将TSB-DPM模型与LVSVM分类器联合求解,能够保证每个聚类中的样本都具 有良好的可分性,从而取得了更好的识别性能。

(3)本发明采用TSB-DPM模型,可以得到雷达高分辨距离像的功率谱特征的概率密 度函数,由此可以描述数据的整体分布。而且通过根据雷达高分辨距离像的功率谱特征的 概率密度值与预先设定的拒判门限进行比较从而实现对库外目标的拒判。

(4)与现有方法相比,本发明采用LVSVM作为分类器,可以通过Gibbs采样算法对 参数进行估计,大大简化了求解复杂度。

本发明dpLVSVM模型利用TSB-DPM模型来自动将数据划分为多个具有高斯分布的 聚类且不需事先确定样本聚类个数;同时在每个子集上训练一个形式简单的线性LVSVM 分类器。由于该模型将聚类过程和分类器的训练过程进行联合优化,在一定程度上保证了 各个聚类在分布上一致而且有一定可分性。dpLVSVM模型通过对数据潜在结构的挖掘, 将非线性分类问题分解为多个线性可分的子问题,从而实现对整个数据的非线性分类并提 高识别性能。本发明将LVSVM与DPM模型统一在一个框架下,可以采用Gibbs采样技术 对参数进行简单有效的估计。另外,当观测目标不属于模板库内的任一目标类别时,需要 能够对该库外目标进行拒判。dpLVSVM通过采用TSB-DPM模型对对数据进行描述,可 以实现对库外样本的拒判。可用于处理大规模多模分布数据,将非线性分类问题分解为多 个线性可分的子问题,从而实现对整个数据的非线性分类。

附图说明

下面结合附图和具体实施方式对本发明做进一步说明。

图1是基于本发明的目标识别算法流程图;

图2是本发明与现有技术的三种方法在不同特征维数下三类飞机的识别结果图;

图3是本发明与现有技术的三种方法的ROC曲线对比图。

具体实施方式

参照图1,说明本发明的一种基于dpLVSVM模型的雷达HRRP的目标识别方法,其 具体步骤如下:

图1给出了整个识别系统的流程,可以看出整个系统包括两部分:训练阶段(左边部分) 和测试阶段(右边部分)。其中,训练阶段的任务是对dpLVSVM模型进行参数估计,在训 练阶段之后,测试阶段的任务是先执行拒判任务,然后根据训练得到参数计算样本所属聚 类,最后输出目标的类别标号从而完成识别任务。

步骤1,雷达接收M个类别的目标的高分辨距离像HRRP;再对每个高分辨距离像进 行特征提取,得到雷达高分辨距离像的功率谱特征xn,将M个类别的目标的高分辨距离 像的功率谱特征组成功率谱特征集X;不属于该M个类别的目标的雷达高分辨距离像为库 外样本;属于该M个类别的目标的雷达高分辨距离像为库内样本。

步骤2,利用功率谱特征集X,将LVSVM分类器和TSB-DPM模型结合构建dpLVSVM 模型;根据dpLVSVM模型推导出雷达高分辨距离像的功率谱特征的概率密度函数,以及 dpLVSVM模型各个参数的联合条件后验分布;

dpLVSVM模型各个参数的联合条件后验分布即:TSB-DPM模型中聚类的高斯分布参 数雷达高分辨距离像的功率谱特征的聚类标号Z、TSB-DPM模型的截棍参数 υ、LVSVM分类器系数雷达高分辨距离像的功率谱特征对应的LVSVM分类器的 隐变量λ的联合条件后验分布。

步骤2包括以下子步骤:

2a)利用TSB-DPM模型将功率谱特征集X进行聚类,包括以下2a1)、2a2)和2a3):

2a1)在TSB-DPM模型中设定功率谱特征集X的最大聚类个数为C,每个聚类中雷 达高分辨距离像的功率谱特征服从高斯分布;

2a2)设定TSB-DPM模型中的基分布G0采用Normal-Wishart分布 其中,μ表示高斯分布的均值,Σ表示高斯分布的协方差矩阵, μ0为Normal-Wishart分布的均值,W0为尺度矩阵,β0、υ0为两个尺度因子;

2a3)将以上2a1)和2a2)中的设定代入TSB-DPM模型得到下式(1-a);

2b)利用LVSVM分类器对每个聚类中的雷达高分辨距离像的功率谱特征进行分类, 包括以下2b1)、2b2)和2b3):

2b1)设定每个LVSVM分类器系数先验分布为高斯分布表示高 斯分布,I表示单位矩阵;

2b2)根据TSB-DPM模型中的功率谱特征集X的最大聚类个数为C个聚类且目标类 别个数为M,采用一对多策略,即分别将M个类别中的一类目标看作正类目标,其它类 别看作负类目标,分别训练LVSVM分类器,则需训练C×M个LVSVM分类器;

2b3)将LVSVM分类器系数ωcm的先验分布代入到训练的C×M个 LVSVM分类器,得到以下式(1-b);

2c)通过公式(1-a)和(1-b)共同构建dpLVSVM模型;

ωcm,{λnm}c|{xn,yn}n=1,zn=cN~φ(ωcm,λcm|ym)---(1-b)

其中,υ=[v1,v2,...,vc,...,vC]表示TSB-DPM模型的截棍参数,c=1,2,...,C,C为TSB-DPM 模型设定的功率谱特征集X的最大聚类个数;Beta(·)表示Beta分布;α表示TSB-DPM模 型的截棍参数υ的先验分布的参数;表示Normal-Wishart分布;{μcc}表示第c个 聚类的高斯分布参数,μc表示第c个聚类的均值,Σc表示第c个聚类的协方差矩阵;G0表 示基分布;μ0为Normal-Wishart分布的均值,W0为尺度矩阵,β0、υ0为两个尺度因子; zn表示第n个雷达高分辨距离像的功率谱特征所属的聚类标号,n=1,2,...,N,N表示功 率谱特征集X中雷达高分辨距离像的功率谱特征个数;π=[π12,...,πc...,πC]表示每个聚类 的权系数且有j=1,2,...,c-1;Mult(·)表示多项分布;ωc表示第c个聚 类中所有M个LVSVM分类器的系数m=1,2,...,M,M表示目标类别个数;ωcm 表示第c个聚类中第m个LVSVM分类器的系数;λcm表示第c个聚类中的雷达高分辨距离 像的功率谱特征对应的第m个LVSVM分类器的隐变量,λnm表示第n个雷达高分辨距离像 功率谱特征对应的第m个LVSVM分类器的隐变量且有ym表示雷达高分 辨距离像的功率谱特征对应于第m个LVSVM的类别标号;ynm表示第n个雷达高分辨距离 像的功率谱特征对应于第m个LVSVM分类器的类别标号,且有:若雷达高分辨距离像的 功率谱特征xn属于第m类目标则ynm=+1,否则ynm=-1;

x~n=[xn;1]表示 第n个雷达高分辨距离像的功率谱特征的增广向量;γ表示调和系数;I表示单位矩阵; 表示高斯分布;(·)T表示转置操作。

2d)由dpLVSVM模型推导出雷达高分辨距离像的功率谱特征的概率密度函数和 dpLVSVM模型各个参数的联合后验分布;dpLVSVM模型各个参数即TSB-DPM模型中聚 类的高斯分布参数雷达高分辨距离像的功率谱特征的聚类标号Z、TSB-DPM 模型的截棍参数υ、LVSVM分类器系数雷达高分辨距离像的功率谱特征对应的 LVSVM分类器的隐变量λ的联合条件后验分布;

雷达高分辨距离像的功率谱特征的概率密度函数见以下公式(2):

其中,π=[π12,...,πc,...,πC]表示每个聚类的权系数;表示均值为μc协方差 矩阵为Σc的高斯分布,c=1,2,...,C,C为TSB-DPM模型设定的功率谱特征集X的最大聚 类个数。

dpLVSVM模型各个参数的联合后验分布见以下公式(3):

其中,表示第c个聚类的高斯分布参数,μc表示第c个聚类的均值,Σc表示第c 个聚类的协方差矩阵,c=1,2,...,C,C为TSB-DPM模型设定的功率谱特征集X的最大聚 类个数;表示雷达高分辨距离像的功率谱特征的聚类标号,zn表示第n个雷达高 分辨距离像的功率谱特征的聚类标号,n=1,2,...,N,N表示功率谱特征集X中功率谱特 征个数;υ=[v1,v2,...,vc,...,vC]表示TSB-DPM模型的截棍参数;π=[π12,...,πc,...,πC]表示 每个聚类的权系数且有j=1,2,...,c-1;表示LVSVM分类器系数, ωc表示第c个聚类中所有M个LVSVM分类器的系数m=1,2,...,M,M表示目 标类别个数;λ表示雷达高分辨距离像的功率谱特征对应的LVSVM分类器的隐变量,λnm表示第n个雷达高分辨距离像的功率谱特征对应的第m个LVSVM分类器的隐变量;y表 示雷达高分辨距离像的类别标号,ynm表示第n个雷达高分辨距离像的功率谱特征对应于第 m个LVSVM分类器的标号;Beta(·)表示Beta分布;α表示TSB-DPM模型的截棍参数υ 的先验分布的参数;γ表示调和系数;μ0为Normal-Wishart分布的均值,W0为尺度矩阵, β0、υ0为两个尺度因子;I表示单位矩阵。

步骤3,通过步骤2的dpLVSVM模型各个参数的联合条件后验分布,推导各个参数 的条件后验分布,即聚类的高斯分布参数的条件后验分布、雷达高分辨距离像的 功率谱特征的聚类标号Z的条件后验分布、TSB-DPM模型截棍参数υ的条件后验分布,以 及LVSVM分类器系数的条件后验分布、雷达高分辨距离像的功率谱特征对应的 LVSVM分类器的隐变量λ的条件后验分布。

步骤3包括以下子步骤:

3a)根据贝叶斯公式和dpLVSVM模型各个参数的联合条件后验分布,得到第c个聚 类的高斯分布参数{μcc}条件后验分布为:

其中,c=1,2,...,C,C为TSB-DPM模型设定的功率谱特征集X的最大聚类个数;X表示 功率谱特征集;μ0为第c个聚类的高斯分布参数{μcc}的先验分布的均值,W0为尺度矩 阵,β0、υ0为两个尺度因子;第c个聚类的高斯分布参数{μcc}的条件后验分布为 Normal-Wishart分布,其均值为尺度矩阵W为 W=(W0-1+NcΣc+Ncβ0(μ0-xc)(μ0-xc)T/β)-1,尺度因子β=β0+Nc,尺度因子 υ=υ0+Nc,Nc表示功率谱特征集X中属于第c个聚类的雷达高分辨距离像的功率谱特征 的个数;xc=1NcΣn=1,zn=cNxn,Σc==1NcΣn=1,zn=cN(xn-xc)(xn-xn)T,zn表示第n个雷达高分辨距离 像的功率谱特征的聚类标号,n=1,2,...,N,N表示功率谱特征集X中功率谱特征个数。

3b)根据贝叶斯公式和dpLVSVM模型各个参数的联合条件后验分布,得到第n个雷 达高分辨距离像的功率谱特征的聚类标号zn的条件后验分布为:

zn~Mult(κn),κn=[κn1,...,κnC];

其中,c=1,2,...,C,C为TSB-DPM模型设定的功率谱特征集X的最大聚类个数; n=1,2,...,N,N表示功率谱特征集X中功率谱特征个数;κnc表示第n个雷达高分辨距离 像的功率谱特征属于第c个聚类的概率;π=[π12,...,πc,...,πC]表示每个聚类的权系数且有 j=1,2,...,c-1;μc表示第c个聚类的均值,Σc表示第c个聚类的协方差 矩阵;γ表示调和系数;ωcm表示第c个聚类中第m个LVSVM分类器的系数;λnm表示第n 个雷达高分辨距离像的功率谱特征对应的第m个LVSVM分类器的隐变量,ynm表示第n个 雷达高分辨距离像的功率谱特征对应于第m个LVSVM分类器的类别标号,m=1,2,...,M, M表示目标类别个数;表示第n个雷达高分辨距离像的功率谱特征的增广向量, (·)T表示转置操作;Mult(·)表示多项分布。

3c)根据贝叶斯公式和dpLVSVM模型各个参数的联合条件后验分布,得到第c个聚 类中第m个LVSVM分类器的系数ωcm条件后验分布为:

其中,c=1,...,C,C为TSB-DPM模型设定的功率谱特征集X的最大聚类个数; m=1,2,...,M,M表示目标类别个数;n=1,2,...,N,N表示功率谱特征集X中功率谱特 征个数;Z表示雷功率谱特征集X中雷达高分辨距离像的功率谱特征的聚类标号;zn表示 第n个雷达高分辨距离像的功率谱特征所属的聚类标号;λnm表示第n个雷达高分辨距离像 的功率谱特征对应的第m个LVSVM分类器的隐变量,ynm表示第n个雷达高分辨距离像的 功率谱特征对应于第m个LVSVM分类器的类别标号;高斯分布的均值 μw=ΛwΣn=1,zn=cNγynm(λnm+γ)λnmx~n,协方差矩阵为Λw=(I+Σn=1,zn=cNγ2λnmx~nx~nT)-1;γ表示调和系数; 表示第n个雷达高分辨距离像的功率谱特征的增广向量;(·)T表示转置操作。

3d)根据贝叶斯公式和dpLVSVM模型各个参数的联合条件后验分布,得到第n个雷 达高分辨距离像的功率谱特征对应的第m个LVSVM分类器的隐变量λnm条件后验分布为:

其中,m=1,2,...,M,M表示目标类别个数;n=1,2,...,N,N表示功率谱特征集X中功 率谱特征个数;表示第zn个聚类中第m个LVSVM分类器的系数,zn表示第n个雷达 高分辨距离像的功率谱特征的聚类标号;ynm表示第n个雷达高分辨距离像的功率谱特征 xn对应于第m个LVSVM分类器的标号;表示第n个雷达高分辨距离像的功率谱 特征的增广向量;表示逆高斯分布。

3e)根据贝叶斯公式和dpLVSVM模型各个参数的联合条件后验分布,得到STB-DPM 模型的截棍参数υ中第c个变量vc的条件后验分布为:

p(vc|Z,α)=Beta(vc;a,b)  (16)

其中c=1,2,...,C,C为TSB-DPM模型设定的功率谱特征集X的最大聚类个数;Z表示功 率谱特征集X中雷达高分辨距离像的功率谱特征的聚类标号; a=1+Nc,Nc表示属于第c个聚类的雷达高分辨距离像的功率谱特征的个 数,Nk表示属于第k个聚类的雷达高分辨距离像的功率谱特征的个数,k=c+1,c+2,...,C, α表示TSB-DPM模型的截棍参数υ的先验分布的参数。

步骤4,设定聚类高斯分布参数的初始值、雷达高分辨距离像的功率谱特征 的聚类标号Z的初始值、TSB-DPM模型的截棍参数υ的初始值、LVSVM分类器系数的初始值以及雷达高分辨距离像的功率谱特征对应的LVSVM分类器的隐变量λ的初始 值;

在设定初始值之后,根据设定初始值的参数在步骤3中对应的条件后验分布,按照 Gibbs采样技术对设定初始值的参数依次进行采样,总共对设定初始值的参数循环采样I0次,I0为自然数。

Gibbs采样技术可见于[Casella G.,George E.I..Explaining the Gibbs sampler[J].The  American Statisticain,1992,vol.46(3),167-174.]。

本发明中,使用Gibbs采样技术的原因为:dpLVSVM模型采用LVSVM作为分类器, 整个模型可以用概率框架进行描述,见公式(1-a)和(1-b),因而可以通过Gibbs采样算 法对参数进行估计,可以大大简化求解复杂度。

步骤5,在对设定初始值的参数循环采样I0次之后,从第I0+1次开始每间隔Sp次保存 聚类的高斯分布参数雷达高分辨距离像的功率谱特征的聚类标号Z、TSB-DPM 模型的截棍参数υ,以及LVSVM分类器系数总共保存T0次参数的采样结果;

在保存T0次参数的采样结果后完成高分辨距离像数据HRRP的样本训练阶段,同时得 到训练的LVSVM分类器和训练的TSB-DPM模型。

本发明中步骤1到步骤5完成训练阶段。在执行完成步骤5之后,进入以下的测试阶 段(目标识别阶段)即判断测试雷达高分辨距离像的功率谱特征的功率谱特征的目标类别 号

步骤6,对测试雷达高分辨距离像进行特征提取得到测试雷达高分辨距离像的功率谱 特征计算测试雷达高分辨距离像的功率谱特征的概率密度函数值,并预先设定拒判 门限Th,再与预先设定的拒判门限Th比较,根据比较结果判断测试雷达高分辨距离像是否 为库外样本;否则继续步骤7。

步骤6包括以下子步骤:

6a)将保存的采样结果中的聚类的高斯分布参数{μcc}和截棍参数υ代入步骤2得到 的雷达高分辨距离像的功率谱特征的概率密度函数公式(2)计算测试雷达高分辨距离像 的功率谱特征的概率密度函数值;

6b)给定预先设定的拒判门限Th;将测试雷达高分辨距离像的功率谱特征的概率密 度函数值与拒判门限Th比较,判断测试雷达高分辨距离像是否为库外样本;

6c)根据保存T0次参数的采样结果得到测试雷达高分辨距离像的T0个判断结果;对T0个判断结果采用投票法则,即采用出现比例大于等于50%的判断结果,判断测试雷达高分 辨距离像是否为库外样本;若为库外样本则将测试雷达高分辨距离像拒判,即不给定目标 类别号并结束测试阶段;否则继续步骤7。

步骤7,将保存的T0次参数的采样结果中的聚类的高斯分布参数截棍参数 υ代入测试雷达高分辨距离像的功率谱特征的聚类标号的条件后验分布,得到测试雷 达高分辨距离像的功率谱特征的聚类标号的条件后验分布;

在得到测试雷达高分辨距离像的功率谱特征的聚类标号的条件后验分布之后, 从测试雷达高分辨距离像的功率谱特征的聚类标号的条件后验分布中采样得到测 试雷达高分辨距离像的功率谱特征的聚类标号

具体的,测试雷达高分辨距离像的功率谱特征的聚类标号的条件后验分布公式见 公式(9):

其中,t表示保存的第t次采样,t=1,2,...,T0,T0表示步骤5中设定的保存参数采样的个数; 表示根据保存的第t次采样参数所确定的测试雷达高分辨距离像的功率谱特征属于第c 个聚类的概率;υ=[v1,v2,...,vc,...,vC]表示TSB-DPM模型的截棍参数;表示根据保存的 第t次采样参数所确定的第c个聚类的权系数,j=1,2,...,c-1;{μcc}t表示保存的第t次采样的第c个聚类的均值和协方差矩阵;c=1,2,...,C,C为TSB-DPM模 型设定的功率谱特征集X的最大聚类个数;(·)T表示转置操作;Mult(·)表示多项分布。

步骤8,根据测试雷达高分辨距离像的功率谱特征所属的聚类标号将测试雷 达高分辨距离像的功率谱特征依次输入其所属聚类对应的M个训练的LVSVM分类器 中,即,将步骤7得到的测试雷达高分辨距离像的功率谱特征所属的聚类标号以及 步骤5中保存的LVSVM分类器的系数代入到训练的LVSVM分类器的判别公式中, 输出测试雷达高分辨距离像的目标类别标号

具体的,LVSVM分类器的判别公式为下式(10):

ρm=1T0Σt=1T0(ωztmt)Txy^=argmaxm(ρ),ρ=[ρ1,ρ2,...,ρm,...,ρM]---(18)

其中,表示第zt个聚类所对应的第m个LVSVM分类器的系数,m=1,2,...,M,M 表示目标类别个数,zt表示步骤5中得到的测试雷达高分辨距离像的功率谱特征的聚类 标号,t=1,2,...,T0,T0表示步骤5中设定的保存参数采样的个数;表示测试雷达 高分辨距离像的功率谱特征的增广向量;ρm表示第m个LVSVM分类器的平均输出; 表示求解最大值对应的m的值,(·)T表示转置操作。

本发明中,dpLVSVM模型中采用TSB-DPM模型将功率谱特征集划分为至多C个聚类, 同时在每个聚类上训练LVSVM分类器,可以通过多个简单的分类器实现复杂的全局分类。 由于每个聚类中的样本数远小于总体样本数(也就是,功率谱特征集X中属于第c个聚类 的功率谱特征的个数Nc远小于功率谱特征集X中功率谱特征个数N),从而降底了 LVSVM分类器的设计复杂度。

与有限混合专家模型相比,dpLVSVM由于采用了TSB-DPM模型,因而可以自动选择 数据的聚类个数。C为最大的聚类个数,在实际中,dpLVSVM模型根据雷达高分辨距离 像的实际分布自动确定聚类的个数,最终聚类个数要小于C。

不同于现有技术中的聚类和分类相互独立的方法,dpLVSVM构建了TSB-DPM模型聚 类与LVSVM分类器分类的相关性,见公式(1-a)和(1-b),即在对功率谱特征集进行聚 类的同时,在每个聚类上训练分类器。将整个模型联合求解,从而能够保证每个聚类中的 样本都具有良好的可分性。

根据dpLVSVM模型,推导出了雷达高分辨距离像的功率谱特征的概率密度函数,通 过比较雷达高分辨距离像的概率密度值与预先设定的拒判门限实现对库外目标的拒判。

下面结合仿真实验对本发明的效果做进一步说明。

(1)实验条件

本实验采用维数较高且分布相对复杂的实测雷达HRRP数据。该数据为某院的C波段 雷达实测飞机的一维HRRP数据。数据中包含三类飞机目标(雅-42、奖状、安-26)。雷达参 数和三类飞机目标的参数如表1所示。

表1

三类飞机的HRRP数据均被划分成了若干段。分别选择“雅-42”的第2、5段,“奖状” 的第6、7段以及“安-26”的第5、6段共600个样本作为训练数据集,选择其余段中2400 个雷达高分辨距离像样本作为测试数据集。

预处理:采用幅度2范数归一的方法,对HRRP信号进行归一。然后提取功率谱特征。 原始HRRP维数为256,由于功率谱具有称性,只需取128维作为特征。为了提高计算效 率,采用PCA算法对数据进行降维,并比较了不同维数下各个分类器的识别性能。

dpLVSVM模型参数设置如下:γ=1,W0=1e-6Iq,β0=0.01,υ0=q,其中q为样本 维数,α=0.1,I=1000,Sp=10,T=100。

(2)实验内容

(2a)为了进一步说明本发明dpLVSVM模型在识别性能上的优势,与下面现有技术 中的三种模型进行对比:线性SVM(LSVM),Km+SVM,dp+SVM。其中Km+SVM表示 先采用K-means算法将训练样本进行聚类,然后每个聚类分别训练一个SVM分类器,两 个过程是分离的而且其聚类个数同过交叉验证的方法确定;dp+SVM表示先采用DPM模 型对样本进行聚类,然后每个聚类分别训练一个SVM分类器,两个过程是分离的,其聚 类个数不用事先确定。

(2b)选取了4类其它飞机目标作为库外目标,每个目标等间隔抽取200个样本(共800 个样本)作为库外目标样本。实验中比较了现有技术中的SVDD、Km+SVM、dp+SVM以 及本发明dpLVSVM模型四种方法的拒判性能。

(3)实验结果分析

图2给出了不同方法在不同特征维数下的识别结果,其中图2横坐标为雷达高分辨距 离像功率谱特征的维数,纵坐标为识别率。参照图2,本发明dpLVSVM模型在各个特征 维度下的性能优于现有技术中的三种模型(LSVM,Km+SVM,dp+SVM),特别是当特 征维数为15时平均正确识别率达到了最高的0.930。图2同时表明维数对识别率产生一定 的影响:当特征维数较小时由于损失了较多的信息,识别率较低;特征维数较大时,特征 中会包含一定的冗余信息,对识别有一定干扰作用,识别率有所降低。

分类器的拒判性能通常由接收机工作特性(Receiver operating characteristic,ROC)曲 线来衡量。ROC曲线的横轴为虚警概率,纵轴为检测概率。ROC曲线下的面积AUC(Area  under an ROC curve)越大,说明分类器的拒判性能越好。表2示出本发明dpLVSVM模型 和现有技术中的SVDD、Km+SVM、dp+SVM方法的AUC值比较结果。图3为本发明 dpLVSVM模型和现有技术中的SVDD、Km+SVM、dp+SVM方法的ROC曲线图,其中横 坐标为虚警概率纵坐标为检测概率。由图3和表2可知,采用DPM模型的分类模型 (dp+SVM以及dpLVSVM)均可以对数据的分布进行较好的描述,其拒判性能要强于现有技 术的SVDD方法以及K-means方法。

表2

方法 SVDD Km+SVM dp+SVM dpLVSVM AUC值 0.630 0.648 0.881 0.882

综合识别和拒判结果可见,本发明dpLVSVM模型既能提高分类性能又有良好的拒判 性能。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号