首页> 中国专利> 基于条件随机场和最小距离法的超光谱图像分类方法

基于条件随机场和最小距离法的超光谱图像分类方法

摘要

本发明公开了一种基于条件随机场和最小距离法的超光谱图像分类方法,其实现步骤为:(1)初始化;(2)输入与待分类超光谱图像地物类别分别对应的训练样本集;(3)训练一元势团信息量的参数;(4)训练二元势团信息量的参数;(5)确定每一类训练样本的平均值;(6)输入待分类的测试数据,进行预分类;(7)判断欲分类结果是否一致,若一致,确定类标,若不一致,进行以下操作;(8)确定二元势团信息量的后验概率;(9)信息更新;(10)确定类标。本发明避免了对观测数据的明确建模;利用空间邻域信息,避免对空间邻域信息的复杂建模;引入最小距离法,判定是否利用空间邻域信息进行修正,尽可能避免不必要的空间邻域信息修正。

著录项

  • 公开/公告号CN102521602A

    专利类型发明专利

  • 公开/公告日2012-06-27

    原文格式PDF

  • 申请/专利权人 西安电子科技大学;

    申请/专利号CN201110366472.5

  • 申请日2011-11-17

  • 分类号G06K9/62;

  • 代理机构陕西电子工业专利中心;

  • 代理人田文英

  • 地址 710071 陕西省西安市太白南路2号

  • 入库时间 2023-12-18 05:43:00

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2013-09-25

    授权

    授权

  • 2012-09-05

    实质审查的生效 IPC(主分类):G06K9/62 申请日:20111117

    实质审查的生效

  • 2012-06-27

    公开

    公开

说明书

技术领域

本发明属于图像处理技术领域,更进一步涉及目标识别领域中的超光谱图像分类 方法。该方法结合条件随机场模型和最小距离法,利用超光谱图像的谱矢量信息和空 间邻域信息,用最小距离法选出需要进行信息更新的像元,对选出的像元进行信息修 正,其余像元则不用进行信息修正,直接确定类标,可应用于对超光谱图像的不同区 域进行分类,进而用于目标识别。

背景技术

超光谱图像信息通过较窄的波段区间,较多的波段数量而提供,包含丰富的光谱 信息,且表现出非常强的谱相关性和空间相关性,这为特征提取、目标识别和分类提 供了可能,使得地物分类具有更高的精度和鲁棒性。

目前,有很多超光谱数据分类的方法被提出。将统计的方法应用于超光谱图像的 分类成为一个主要方向。部分现有的理论中存在一些显著问题,如忽略超光谱图像的 空间相关性、利用超光谱图像空间相关性做出信息更新的条件不明确。

西安电子科技大学在其专利申请“一种基于高斯过程分类器协同训练算法的高光 谱图像分类方法”(专利申请号:201110155654.8,公开号:CN102208037A)中提 出了一种基于高斯过程分类器协同训练算法的高光谱图像分类方法。这种方法首先将 样本的特征向量随机划分成两个子特征向量,作为训练样本的两个视角,进行高斯过 程分类器协同训练,得到两个最终高斯过程分类器,将概率较大的类别作为分类结果。 但其仍存在的不足是忽略了信息的相关性,分类正确率较低。

武汉大学在其专利申请“一种基于条件随机场模型的SAR图像监督分类方法” (专利申请号:201010256689.6,公开号:CN101950363A)中提出了一种基于条件 随机场模型的SAR图像分类方法。这种方法将图像过分割成多个区域并将其描述成 一个区域邻接图,建立条件随机场模型,自用max-margin算法进行参数学习和 GraphCut算法进行优化推理。但其仍存在的不足是盲目对所有信息进行更新,忽略了 进行信息修正的条件限制,分类正确率较低。

发明内容

本发明的目的在于克服上述已有技术的不足,提出了一种基于基于条件随机场和 最小距离法的超光谱图像分类方法。本发明简化了超光谱图像的分类过程,充分利用 了超光谱图像的谱相关性及空间相关性,且避免了对观测数据的建模;引入最小距离 法,对何时需进行信息更新做出判断,避免不必要的信息修正,且具有广泛的适用性。

本发明实现上述目的的思路是:采用条件随机场模型,结合谱矢量信息(一元势 团信息)和空间邻域信息(二元势团信息),引入最小距离法,对何时利用空间邻域 信息进行信息更新作出判断,直接对分类的后验概率进行建模,通过计算后验概率来 确定分类结果。

本发明实现的具体步骤如下:

(1)初始化,对原始数据所有像素值进行初始化,使其满足均值为0、方差为1;

(2)输入与待分类超光谱图像地物类别分别对应的训练样本集;

(3)采用多项式对数归一(MLR)法训练一元势团信息量的参数

3a)确定一元势团信息量的黑塞矩阵(Hessian matrix)边界;

3b)确定一元势团信息量的梯度矢量(Gradient vector);

3c)确定一元势团信息量的参数;

(4)采用多项式对数归一(MLR)法训练二元势团信息量的参数

4a)确定二元势团信息量的黑塞矩阵(Hessian matrix)边界;

4b)确定二元势团信息量的梯度矢量(Gradient vector);

4c)确定二元势团信息量的参数;

(5)确定每一类训练样本的平均值;

(6)输入待分类的测试数据,进行预分类:

6a)确定一元势团信息量的后验概率,选取一元势团后验概率的最大值,并确 定最大值对应的类标;

6b)确定待分类数据与每一类训练样本平均值的欧氏距离,选取欧氏距离的最 小值,并确定最小距离对应的类标;

(7)判断一元势团后验概率最大值对应的类标和欧氏距离最小值对应的类标是 否一致,若一致,将此类标记为对应像元的最终类标,若不一致,进行以下操作;

(8)确定二元势团信息量的后验概率;

(9)信息更新,求一元势团信息量后验概率矢量和二元势团信息量后验概率矢 量的平均矢量,一元势团信息量的后验概率,表示为L维概率矢量,L为超光谱图像 的类别数,二元势团信息量的后验概率,取两相邻像元同属于每一类的概率,表示为 L维概率矢量;

(10)从后验概率平均矢量中选取最大值,将最大值对应的类标作为最终类标。

本发明与现有技术相比具有以下优点:

第一,由于本发明采用条件随机场模型,将超光谱图像中谱相关性和空间相关 性结合使用,克服了现有技术仅利用到超光谱图像谱相关性的缺点,使得本发明进行 图像分类正确率较高。

第二,由于本发明引入了最小距离法,对何时利用空间邻域信息进行更新作出 判断,克服了现有技术盲目地对所有信息进行更新的缺点,提高了本发明进行图像分 类的正确率。

附图说明

图1是本发明的流程图。

具体实施方式

参照图1,本发明的具体实施步骤如下。

步骤1.初始化,按如下步骤操作:

第一步,按照下式求原始数据对应矩阵RHSI所有像素的平均值:

k=ΣiΣjΣh(RHSI)/N

其中,k为所有像素的平均值,∑表示叠加,i表示矩阵行数,j表示矩阵列数, h表示波段数,为所有行叠加,为所有列叠加,为所有波段叠加,RHSI 为原始数据对应的矩阵,N=i*j*h表示像素点总个数;

第二步,对像素点总个数N开平方;

第三步,对每一个像素点,减去像素平均值k,再除以像素点总个数开平方所得 的值,得到新的数据矩阵,此矩阵的值应当满足均值为0、方差为1。

步骤2.输入分别与所有需求的地物类别对应的待分类超光谱图像训练样本集。

步骤3.采用多项式对数归一(MLR)法训练一元势团信息量的参数

首先按照下式确定一元势团信息量的黑塞矩阵(Hessian matrix)边界:

B-(1/2)[I-11T/L]Σy~iy~iT

其中,B为一元势团信息量的黑塞矩阵边界,符号≡表示定义为,I为L-1维单 位矩阵,L为超光谱图像的类别数,1=[1,1,...,1]T是L-1维矢量,上标T表示转置,表 示Kronecker矩阵乘积,∑表示叠加,为像元i对应的谱矢量;

其次按照下式确定一元势团信息量的梯度矢量(Gradient vector):

g(w)=Σ(x~i-pi(w))y~i

其中,g(w)为一元势团信息量的梯度矢量,w为一元势团信息量的参数,∑表 示叠加,中第l维元素为1,l为像元i的类标,其余元素为0,共L-1维,L为超 光谱图像的类别数,表示像元i的类标为l的概率, 为像元i对应的谱矢量;

最后按照下式确定一元势团信息量的参数:

w(t+1)=w(t)-B-1g(w(t))

其中,w为一元势团信息量的参数,上标(·)表示迭代次数,t即迭代次数,本发 明实施例中,迭代次数为300次。B-1表示一元势团信息量的黑塞矩阵边界B的逆矩 阵,g(w)表示一元势团信息量的梯度矢量。

步骤4.采用多项式对数归一(MLR)法训练二元势团信息量的参数

首先按照下式确定二元势团信息量的黑塞矩阵(Hessian matrix)边界:

B-(1/2)[I-11T/L]ΣμijμijT

其中,B为二元势团信息量的黑塞矩阵的边界,符号≡表示定义为,I为L维单 位矩阵,L为超光谱图像的类别数,1=[1,1,...,1]T是L维矢量,上标T表示转置,表 示Kronecker矩阵乘积,∑表示叠加,μij为像元组(i,j)的谱特征矢量,本发明实施 例中,μij(y)为连接像元i与像元j的谱矢量所得,像元j为像元i的四邻域像元;

其次按照下式确定二元势团信息量的梯度矢量(Gradient vector):

g(v)=Σ(x~ij-pij(v))μij

其中,g(v)为二元势团信息量的梯度矢量,v为二元势团信息量的参数,∑表 示叠加,中第l维元素为1,l为像元i与像元j共同的类标,其余元素为0,共L维, L为超光谱图像的类别数,其中为像元组(i,j)类标 为(li,lj)的概率,μij为像元组(i,j)的谱特征矢量,本发明实施例中,μij(y)为连接像 元i与像元j的谱矢量所得,像元j为像元i的四邻域像元;

最后按照下式确定二元势团信息量的参数:

v(t+1)=v(t)-B-1g(v(t))

其中,v为二元势团信息量的参数,上标(·)表示迭代次数,t即迭代次数,本发 明实施例中,迭代次数为300次,B-1表示二元势团信息量的黑塞矩阵的边界B的逆 矩阵,g(v)为二元势团信息量的梯度矢量。

步骤5.确定每一类训练样本的平均值;

步骤6.输入待分类的测试数据,进行预分类:

首先,确定一元势团信息量的后验概率,按照下式求得:

P(xi=l|y,w)=exp(wlTyi)1+Σk=1L-1exp(wkTyi)l<L11+Σk=1L-1exp(wkTyi)l=L

其中,P(xi=l|y,w)表示像元i类标为l的后验概率,y为待分类谱矢量,w为 一元势团信息量的参数,exp为指数函数,wl为第l类对应的参数,l∈{1,2,...,L},L为 超光谱图像所需分为的类别数,上标T表示转置,yi为像元i对应的谱矢量,∑表示 叠加,wk为第k类对应的参数,选取一元势团后验概率的最大值,并确定一元势团后 验概率最大值对应的类标;

其次,确定待分类数据与每一类训练样本平均值的欧氏距离,按照下式求得:

d=Σ(xi-yi)2

其中,d为两个谱矢量的欧氏距离,∑表示叠加,xi和yi分别为两个谱矢量相 同波段的值,下标i表示第i波段,选取欧氏距离的最小值,并确定最小距离对应的类 标。

步骤7.判断一元势团后验概率最大值对应的类标和欧氏距离最小值对应的类 标是否一致,若一致,将此类标记为对应像元的最终类标,若不一致,进行以下操作。

步骤8.确定二元势团信息量的后验概率,按照下式求得:

P((xi,xj)k|μij(y),v)=exp(vkkTμij(y))1+Σn=1Lexp(vnnTμij(y))kL11+Σn=1Lexp(vnnTμij(y))k=L+1

其中,P((xi,xj)≡k|μij(y),v)表示像元组(i,j)类标为k的后验概率, k∈{1,2,...,L+1},L为超光谱图像的类别数,L+1表示像元组(i,j)中两个像元类别 不同,μij(y)为像元组(i,j)的谱特征矢量,本发明实施例中,μij(y)为连接像元i与 像元j的谱矢量所得,像元j为像元i的四邻域像元,v为二元势团信息量的参数,exp 为指数函数,vkk为第k类对应参数,上标T表示转置,∑表示叠加,vnn为第n类 对应参数。

步骤9.信息更新,一元势团信息量的后验概率,表示为L维概率矢量,L为超 光谱图像的类别数,二元势团信息量的后验概率,取两相邻像元同属于每一类的概率, 表示为L维概率矢量,求一元势团信息量后验概率矢量和二元势团信息量后验概率的 平均矢量。

步骤10.从后验概率平均矢量中选取最大值,将最大值对应的类标作为最终类 标。

本发明的效果可通过以下仿真进一步说明。

1、仿真条件

本发明的仿真试验是在主频2.27GHZ的intel Core i5 CPU、内存3.06GB的硬件 环境和MATLAB 7.0的软件环境下进行的。

2、仿真内容

本发明仿真试验的数据来源为KSC(Kennedy Space Center)数据,它是由NASA AVIRIS在1996年3月对KSC区域在大约20km高空采集到的,空间分辨率约为18m, AVIRIS的带宽范围为400-2500nm,间隔10nm,原始数据有220个波段。对KSC数据, 去除低信噪比的波段之后共有176个波段,训练数据由KSC的红外成像和Landsat的 TM成像得出。

下表为本发明仿真实验中选用的数据类别、数目及其所占比例。

  类别   数目(比例)   1   灌木   761(14.6%)   2   柳木沼泽   243(4.66%)   3   棕榈   256(4.92%)   4   棕榈/橡树   252(4.84%)   5   松木   161(3.07%)   6   橡树/阔叶林   229(4.38%)   7   硬木沼泽   105(2.00%)   8   禾草沼泽   431(8.27%)   9   虎尾草沼泽   520(9.99%)   10   香蒲沼泽   404(7.76%)   11   盐碱沼泽   419(8.04%)   12   泥泞地   503(9.66%)   13   水域   927(17.8%)   总数   5211

本发明仿真内容为,从上表的每一类数据中随机选取一部分做训练样本,构成 训练样本集,剩余部分构成测试数据集,对测试数据集进行分类。

3、仿真效果分析

下表为本发明仿真中对测试数据进行分类,并通过与已知信息的比对得到的分类 正确率如下:

  正确率   15%   30%   45%   60%   75%   1   0.88545   0.89118   0.94511   0.92459   0.97382   2   0.89855   0.91813   0.95556   0.9596   0.98361   3   0.81651   0.87778   0.86525   0.77885   0.89063   4   0.36444   0.45699   0.46853   0.68627   0.71429   5   0.70073   0.70536   0.86517   0.78125   0.65854   6   0.56923   0.52795   0.55906   0.59574   0.74138   7   0.52222   0.67123   0.63158   0.66667   0.85185   8   0.6376   0.98993   0.86638   0.93491   0.98148   9   0.92534   0.81593   0.92308   0.98077   0.98462   10   0.78779   0.87324   0.87946   0.93293   0.9703   11   0.90476   0.91126   0.86087   0.97605   1   12   0.86449   0.86969   0.92446   0.97044   0.97619   13   0.91371   0.98767   0.96471   0.95957   1   Total   0.80986   0.85945   0.87321   0.90318   0.94338

上表中第一行表示随机选取的训练样本占数据总量(训练数据和测试数据)的百 分比,第一列为类标,最后一行为总的正确率。可以看出,本发明方法引入最小距离 算法对结合空间邻域信息的条件加以限定,使得本发明方法的分类精度有了一定的提 高。训练样本较少时,绝大多数类别都能取得较为满意的效果,如第2、11、13类。 随着训练样本所占比例的增加,本发明方法的正确率也随之增加,如训练样本量占 75%时,对第8、11、13类完全正确的判断,总的分类正确率也达到了0.94338。总 体来说,本发明方法对超光谱图像进行分类能得到较为满意的效果。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号