首页> 中国专利> 基于非局部相似性和稀疏编码的高光谱图像分类方法

基于非局部相似性和稀疏编码的高光谱图像分类方法

摘要

本发明属于图像处理技术领域,具体涉及一种基于非局部相似性和稀疏编码的高光谱图像分类方法,实现过程如下:(1)输入高光谱图像;(2)非局部均值滤波;(3)确定训练样本集C与测试样本集C';(4)字典学习;(5)求测试样本集稀疏系数;(6)高光谱图像分类;(7)输出分类图像。本发明采用非局部均值滤波的方法,克服了现有技术只利用高光谱图像的光谱信息,对高光谱图像分类会导致边缘部分错分的缺点,使得本发明具有在边缘部分分类更加精确的优点,同时克服了现有技术中不能有效利用高光谱图像邻域信息的缺点,使得本发明具有在同质区域分类效果更好的优点。

著录项

  • 公开/公告号CN104239902A

    专利类型发明专利

  • 公开/公告日2014-12-24

    原文格式PDF

  • 申请/专利权人 西安电子科技大学;

    申请/专利号CN201410464823.X

  • 申请日2014-09-12

  • 分类号G06K9/62;G06K9/66;

  • 代理机构西安吉盛专利代理有限责任公司;

  • 代理人张恒阳

  • 地址 710071 陕西省西安市太白南路2号西安电子科技大学

  • 入库时间 2023-12-17 04:48:46

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-04-24

    授权

    授权

  • 2015-01-14

    实质审查的生效 IPC(主分类):G06K9/62 申请日:20140912

    实质审查的生效

  • 2014-12-24

    公开

    公开

说明书

技术领域

本发明属于图像处理技术领域,具体涉及高光谱图像分类技术领域中 的一种基于非局部相似性和稀疏编码的高光谱图像分类方法。本发明可用 于对高光谱图像进行地物分类。

背景技术

高光谱图像空域和谱域分辨率的提高,为分类提供了更加丰富信息的同 时,也带来了巨大的挑战。传统的分类方法包括最大似然分类法、决策树 分类法、人工神经网络分类方法、支撑向量机分类方法都仅仅从光谱域层 面对地物特征进行分类。然而,高光谱遥感数据不仅包含丰富的地物光谱 信息,而且在图像空间维、光谱维两个不同的维度都会对地物特征有具体 的描述和表达。传统的高光谱图像分类方法,往往只着重于数据光谱维上 的特性,而忽视了空间维的信息,从而使分类精度受到一定的限制。

西安电子科技大学在其专利申请“基于均值漂移和组稀疏编码的高光谱 图像空谱域分类方法”(专利申请号:201310161280.X,公开号: CN103208011A)中提出了一种基于均值漂移和组稀疏编码的高光谱图像空 谱域分类方法。该方法的具体步骤是:首先,使用均值漂移算法mean-shift 对高光谱图像作过分割,根据分割结果对高光谱样本进行分组;其次,利 用组稀疏编码对分组后的高光谱样本进行稀疏编码;最后,利用支撑向量 机和构造的样本集对高光谱样本进行分类。该方法虽然能够很好的利用高 光谱图像的空域上下文信息,但是仍然存在的不足是,mean-shift分割方法 易产生过分割问题,在边缘地区的分类效果不是很好。

西安电子科技大学在其专利申请“基于局部协同表示和邻域信息约束的 高光谱图像分类方法”(专利申请号:201310025247.4,公开号: CN103065160A)中提出了一种基于局部协同表示和邻域信息约束的高光谱 图像分类方法。该方法的具体步骤是:首先,利用高光谱图像的邻域相似 性来约束测试样本和训练样本之间的线性相关性,求解测试样本通过字典 协同表示的系数;然后,结合该系数的能量大小,选择N个贡献程度最大 的原子构成新的字典,利用新的字典对测试样本进行第二次协同表示。通 过计算测试样本和第二次协同表示重构各部分之间的残差,得到最后的分 类结果。该方法虽然能够快速地对高光谱图像进行分类,但是仍然存在的 不足是,通过比较欧式距离获取邻域样本矩阵,不能很好的获取样本的邻 域信息,导致在同质区域的分类效果不好。

发明内容

本发明的目的在于克服上述已有技术的不足,提出了一种基于非局部相 似性和稀疏编码的高光谱图像分类方法,本发明采用非局部均值滤波的方 法,能够充分利用高光谱图像中地物的光谱信息和邻域信息,在边缘和同 质区域都能达到理想的分类效果。

本发明提供的技术方案:基于非局部相似性和稀疏编码的高光谱图像 分类方法,包括步骤如下:

(1)输入高光谱图像:

输入待分类的高光谱图像,共包含n个像素点,将输入的高光谱图像中 的每一个像素点设定为一个样本,得到高光谱图像的样本 X=[x1,x2,…,xp,…,xn]∈Rd,1≤p≤n,其中d为高光谱图像的波段数,xp表示高 光谱图像的第p个样本,Rd表示d维实数向量空间;

(2)非局部均值滤波:

设定一个7×7大小的邻域窗口,对高光谱图像的样本进行非局部均值滤 波;

(3)确定训练样本集C与测试样本集C':

采用等概率采样的方法,在高光谱图像的样本中,依次随机选取10%的 样本,作为高光谱图像的训练样本集C,将剩余90%的样本,作为高光谱 图像的测试样本集C';

(4)字典学习:

对高光谱图像的训练样本集C,采用字典学习方法,得到高光谱图像样 本的字典D;

(5)求测试样本集稀疏系数Y':

对高光谱图像的测试样本集C',采用更新稀疏编码系数的优化公式,得 到高光谱图像测试样本集的稀疏系数Y';

(6)高光谱图像分类:

利用线性支撑向量机分类器,对高光谱图像测试样本集的稀疏系数Y'进 行分类,得到分类的高光谱图像;

(7)输出分类图像。

步骤(2)所述的对高光谱图像的样本进行非局部均值滤波,按如下步骤进 行:

第一步,选定一个测试样本xi,以xi为中心,设定一个7×7大小的邻域 窗口;

第二步,设定一个3×3大小的滤波窗口,对邻域窗口内的样本进行均值 滤波;

第三步,按照下式,计算测试样本xi和邻域样本xj的光谱角:

θij=arccosΣi=1dxixjΣi=1dxi2Σi=1dxj2

其中,θij表示测试样本xi和邻域样本xj的光谱角,arccos表示取反余弦 操作,∑表示求和操作,i表示高光谱图像的第i个波段,d表示高光谱图 像的波段数,xi表示测试样本,xj表示xi的一个邻域样本,表示开平方 操作,表示对xi的平方操作,表示对xj的平方操作;

第四步,按照下式,计算测试样本xi和邻域样本xj的权值:

w(xi,xj)=1,ifxi=xjexp(-θij),otherwise

其中,w(xi,xj)表示测试样本xi和邻域样本xj的权值,xi表示测试样本, xj表示xi的一个邻域样本,if xi=xj表示如果xj是xi本身,exp(·)表示指数操 作,θij表示xi和xj的光谱角,otherwise表示其他;

第五步,按照第三步与第四步依次可以求出测试样本xi和邻域样本的权 值矩阵如下:

其中,W表示测试样本xi和邻域样本的权值矩阵,[·]表示矩阵,w(xi,xj) 表示测试样本xi和邻域样本xj的权值,w(xi,x2)表示测试样本xi和邻域样本x2的权值,w(xi,x49)表示测试样本xi和邻域样本x49的权值;

第六步:按照下式,重新计算测试样本xi的像素值:

ci=Σj=149w(xi,xj)xjΣj=149w(xi,xj)

其中,ci表示重新计算得到的测试样本xi的像素值,∑表示求和操作, j表示邻域样本个数,w(xi,xj)表示测试样本xi和邻域样本xj的权值,xi表 示测试样本,xj表示xi的一个邻域样本;

第七步,重复执行第一步到第六步的步骤,直到对高光谱图像的所有样 本完成非局部均值滤波。

步骤(4)所述的字典学习方法,按如下步骤进行:

第一步,输入高光谱图像的训练样本集C,高光谱图像样本的正则化参 数γ,字典学习方法要求解的高光谱图像样本的字典D的原子个数k,高光 谱图像训练样本集的总列数N;

第二步,初始化高光谱图像样本的字典D为d×k的实数矩阵,初始化高 光谱图像训练样本集的稀疏系数为k×N的全零矩阵;

第三步,利用Lasso算法求解如下更新稀疏编码系数的优化公式的最优 解

Y^=argmin12||C-DY||F2+γΣs=1N||Ys||1

其中,表示更新稀疏编码系数的优化公式的最优解,arg min表示最小 值操作,C表示高光谱图像的训练样本集,D表示高光谱图像样本的字典, Y表示高光谱图像训练样本集的稀疏系数,表示求Frobenius范数的平 方和操作,γ表示正则化参数,∑表示求和操作,N表示高光谱图像训练 样本集的总列数,s表示高光谱图像训练样本集稀疏系数Y的列数,||·||1表 示取1范数操作,Ys表示高光谱图像训练样本集的稀疏系数Y的第s列;

第四步,将高光谱图像训练样本集的稀疏系数Y更新为第三步得到的更 新稀疏编码系数的优化公式的最优解

第五步,利用块坐标下降算法求解如下更新字典的优化公式的最优解

D^=argmin12||C-DY||F2s.t.||Di||21i1,···,k

其中,表示更新字典的优化公式的最优解,arg min表示最小值操作, C表示高光谱图像的训练样本集,D表示高光谱图像样本的字典,Y表示高 光谱图像训练样本集的稀疏系数,表示求Frobenius范数的平方和操作, s.t.表示约束操作,||·||2表示取2范数操作,i表示高光谱图像样本字典D的 列数,Di表示高光谱图像样本字典D的第i列原子,表示取任意的i操作, i的取值范围为:{1,…,k},k表示高光谱图像样本字典D的原子个数;

第六步,将高光谱图像样本的字典D更新为第五步得到的更新字典的优 化公式的最优解

第七步,重复执行第三步到第六步20次。

步骤(5)所述的求高光谱图像测试样本集的稀疏系数Y'按如下步骤进行:

第一步,初始化的高光谱图像测试样本集的稀疏系数Y'为k×A的全零矩 阵,其中A表示高光谱图像测试样本集的总列数;

第二步,利用Lasso算法求解如下更新稀疏编码系数的优化公式的最优 解

Y^=argmin12||C-DY||F2+γΣa=1A||Ya||1

其中,表示在求解测试样本集稀疏系数中更新稀疏编码系数的优化公 式的最优解,arg min表示最小值操作,C'表示高光谱图像的测试样本集,D 表示高光谱图像样本的字典,Y'表示高光谱图像测试样本集的稀疏系数, 表示求Frobenius范数的平方和操作,γ表示正则化参数,∑表示求和 操作,A表示高光谱图像测试样本集的总列数,a表示高光谱图像测试样本 集稀疏系数Y'的列数,||·||1表示取1范数操作,Ya'表示高光谱图像测试样本 集稀疏系数Y'的第a列。

第三步,将高光谱图像测试样本集的稀疏系数Y'更新为第二步得到的在 求解测试样本集稀疏系数中更新稀疏编码系数的优化公式的最优解

本发明与现有的技术相比具有以下优点:

(1)本发明采用光谱角填图来确定权值的方法,克服了现有技术利用欧式 距离来确定相似性,对高光谱图像分类会导致边缘部分错分的缺点,使得 本发明具有在边缘部分分类更加精确的优点。

(2)本发明采用非局部均值滤波获取高光谱图像的邻域信息,克服了现有 技术中不能有效利用高光谱图像邻域信息的缺点,使得本发明具有在同质 区域分类效果更好的优点。

附图说明

图1是本发明的流程图;

图2(a)为输入的高光谱图像印第安松树IndianPines的真实地物分布图;

图2(b)为采用支撑向量机SVM方法对高光谱图像印第安松树Indian  Pines进行分类的结果图;

图2(c)为采用光谱字典学习SDL方法对高光谱图像印第安松树Indian  Pines进行分类的结果图;

图2(d)为采用同时正交匹配追踪算法SOMP对高光谱图像印第安松树 Indian Pines进行分类的结果图;

图2(e)为本发明方法对高光谱图像印第安松树Indian Pines进行分类的 结果图。

下面结合附图对本发明做进一步的描述。

具体实施方式

实施例1:

如图1所示,基于非局部相似性和稀疏编码的高光谱图像分类方法, 包括步骤如下:

(1)输入高光谱图像:

输入待分类的高光谱图像,共包含n个像素点,将输入的高光谱图像中 的每一个像素点设定为一个样本,得到高光谱图像的样本 X=[x1,x2,…,xp,…,xn]∈Rd,1≤p≤n,其中d为高光谱图像的波段数,xp表示高 光谱图像的第p个样本,Rd表示d维实数向量空间;

(2)非局部均值滤波:

第一步,选定一个测试样本xi,以xi为中心,设定一个7×7大小的邻域 窗口;

第二步,设定一个3×3大小的滤波窗口,对邻域窗口内的样本进行均值 滤波;

第三步,按照下式,计算测试样本xi和邻域样本xj的光谱角:

θij=arccosΣi=1dxixjΣi=1dxi2Σi=1dxj2

其中,θij表示测试样本xi和邻域样本xj的光谱角,arccos表示取反余弦 操作,∑表示求和操作,i表示高光谱图像的第i个波段,d表示高光谱图 像的波段数,xi表示测试样本,xj表示xi的一个邻域样本,表示开平方 操作,表示对xi的平方操作,表示对xj的平方操作;

第四步,按照下式,计算测试样本xi和邻域样本xj的权值:

w(xi,xj)=1,ifxi=xjexp(-θij),otherwise

其中,w(xi,xj)表示测试样本xi和邻域样本xj的权值,xi表示测试样本, xj表示xi的一个邻域样本,if xi=xj表示如果xj是xi本身,exp(·)表示指数操 作,θij表示xi和xj的光谱角,otherwise表示其他;

第五步,按照第三步与第四步依次可以求出测试样本xi和邻域样本的权 值矩阵如下:

其中,W表示测试样本xi和邻域样本的权值矩阵,[·]表示矩阵,w(xi,xj) 表示测试样本xi和邻域样本xj的权值,w(xi,x2)表示测试样本xi和邻域样本x2的权值,w(xi,x49)表示测试样本xi和邻域样本x49的权值;

第六步:按照下式,重新计算测试样本xi的像素值:

ci=Σj=149w(xi,xj)xjΣj=149w(xi,xj)

其中,ci表示重新计算得到的测试样本xi的像素值,∑表示求和操作, j表示邻域样本个数,w(xi,xj)表示测试样本xi和邻域样本xj的权值,xi表 示测试样本,xj表示xi的一个邻域样本;

第七步,重复执行第一步到第六步的步骤,直到对高光谱图像的所有样 本完成非局部均值滤波。

(3)确定训练样本集C与测试样本集C':

采用等概率采样的方法,在高光谱图像的样本中,依次随机选取10%的 样本,作为高光谱图像的训练样本集C,将剩余90%的样本,作为高光谱 图像的测试样本集C';

(4)字典学习:

对高光谱图像的训练样本集C,采用字典学习方法,得到高光谱图像样 本的字典D,步骤如下:

第一步,输入高光谱图像的训练样本集C,高光谱图像样本的正则化参 数γ,字典学习方法要求解的高光谱图像样本的字典D的原子个数k,高光 谱图像训练样本集的总列数N;

第二步,初始化高光谱图像样本的字典D为d×k的实数矩阵,初始化高 光谱图像训练样本集的稀疏系数为k×N的全零矩阵;

第三步,利用Lasso算法求解如下更新稀疏编码系数的优化公式的最优 解

Y^=argmin12||C-DY||F2+γΣs=1N||Ys||1

其中,表示更新稀疏编码系数的优化公式的最优解,arg min表示最小 值操作,C表示高光谱图像的训练样本集,D表示高光谱图像样本的字典, Y表示高光谱图像训练样本集的稀疏系数,表示求Frobenius范数的平 方和操作,γ表示正则化参数,∑表示求和操作,N表示高光谱图像训练 样本集的总列数,s表示高光谱图像训练样本集稀疏系数Y的列数,||·||1表 示取1范数操作,Ys表示高光谱图像训练样本集的稀疏系数Y的第s列;

第四步,将高光谱图像训练样本集的稀疏系数Y更新为第三步得到的更 新稀疏编码系数的优化公式的最优解

第五步,利用块坐标下降算法求解如下更新字典的优化公式的最优解

D^=argmin12||C-DY||F2s.t.||Di||21i1,···,k

其中,表示更新字典的优化公式的最优解,arg min表示最小值操作, C表示高光谱图像的训练样本集,D表示高光谱图像样本的字典,Y表示高 光谱图像训练样本集的稀疏系数,表示求Frobenius范数的平方和操作, s.t.表示约束操作,||·||2表示取2范数操作,i表示高光谱图像样本字典D的 列数,Di表示高光谱图像样本字典D的第i列原子,表示取任意的i操作, i的取值范围为:{1,…,k},k表示高光谱图像样本字典D的原子个数;

第六步,将高光谱图像样本的字典D更新为第五步得到的更新字典的优 化公式的最优解

第七步,重复执行第三步到第六步20次。

(5)求测试样本集稀疏系数Y':

对高光谱图像的测试样本集C',采用更新稀疏编码系数的优化公式,得 到高光谱图像测试样本集的稀疏系数Y',步骤如下:

第一步,初始化的高光谱图像测试样本集的稀疏系数Y'为k×A的全零矩 阵,其中A表示高光谱图像测试样本集的总列数;

第二步,利用Lasso算法求解如下更新稀疏编码系数的优化公式的最优 解

Y^=argmin12||C-DY||F2+γΣa=1A||Ya||1

其中,表示在求解测试样本集稀疏系数中更新稀疏编码系数的优化公 式的最优解,arg min表示最小值操作,C'表示高光谱图像的测试样本集,D 表示高光谱图像样本的字典,Y'表示高光谱图像测试样本集的稀疏系数, 表示求Frobenius范数的平方和操作,γ表示正则化参数,∑表示求和 操作,A表示高光谱图像测试样本集的总列数,a表示高光谱图像测试样本 集稀疏系数Y'的列数,||·||1表示取1范数操作,Ya'表示高光谱图像测试样本 集稀疏系数Y'的第a列。

第三步,将高光谱图像测试样本集的稀疏系数Y'更新为第二步得到的 在求解测试样本集稀疏系数中更新稀疏编码系数的优化公式的最优解

(6)高光谱图像分类:

利用线性支撑向量机分类器,对高光谱图像测试样本集的稀疏系数Y'进 行分类,得到分类的高光谱图像;

(7)输出分类图像。

实施例2:

本实施例在实施例1的基础上,结合仿真图对本发明的效果做进一步说 明。

1.仿真实验条件:

本实验的硬件测试平台是:处理器为Intel Core2 CPU,主频为2.33GHz, 内存2GB,软件平台为:Windows XP操作系统和Matlab R2012a。本发明 的输入图像为高光谱图像印第安松树Indian Pines,图像大小为145×145×220, 图像共包含220个波段和16类地物,图像格式为TIF。

2.仿真内容:

本发明用到的三个现有技术对比分类方法分别如下:

Melgani等人在“Classification of hyperspectral remote sensing images with  support vector machines,IEEE Trans.Geosci.Remote Sens.,vol.42,no.8,pp. 1778–1790,Aug.2004”中提出的高光谱图像分类方法,简称支撑向量机 SVM分类方法;

Charles等人在“Learning sparse codes for hyperspectral imagery,”IEEE J. Sel.Topics Signal Process.,vol.5,no.5,pp.963–978,2011”中提出的高光谱 图像分类方法,简称光谱字典学习SDL分类方法;

Chen等人在“Hyperspectral image classification using dictionary-based  sparse representation,”IEEE Trans.Geosci.Remote Sens.,vol.49,no.10,pp. 3973–3985,oct2011”中提出的高光谱图像分类方法,简称同时正交匹配追 踪SOMP方法。

在仿真实验中,采用以下三个现有指标来评价本发明方法的性能:

第一个评价指标是总精度(OA),表示正确分类的样本占所有样本的比 例,值越大,说明分类效果越好。

第二个评价指标是平均精度(AA),表示每一类分类精度的平均值,值越 大,说明分类效果越好。

第三个评价指标是卡方系数(Kappa),表示混淆矩阵中不同的权值,值 越大,说明分类效果越好。

如图所示,图2(a)为输入的高光谱图像印第安松树Indian Pines的真实 地物分布图,其大小为145×145,图2(b)为采用支撑向量机SVM方法对高光 谱图像印第安松树Indian Pines进行分类的结果图,图2(c)为采用光谱字典 学习SDL方法对高光谱图像印第安松树Indian Pines进行分类的结果图,图 2(d)为采用同时正交匹配追踪算法SOMP对高光谱图像印第安松树Indian  Pines进行分类的结果图,图2(e)为本发明方法对高光谱图像印第安松树 Indian Pines进行分类的结果图。

3.仿真结果分析:

表1为从客观评价指标上对附图2中各方法的分类结果进行评价。

表1.附图2中各方法分类结果的定量分析

结合表1和附图2(a)、2(b)、2(c)、2(d)、2(e)可以看出,支撑 向量机SVM和光谱字典学习SDL方法的分类结果比较差,主要因为这两 种方法都只利用了高光谱图像的光谱信息,忽略了邻域信息,使得分类结 果在边缘和同质区域都很差;同时正交匹配追踪SOMP方法的分类结果有 很大改善,错分率有所下降,但是同时正交匹配追踪SOMP方法认为邻域 样本对测试样本的贡献大小一样,而处在同一邻域窗口内的样本可能属于 不同的类,所以依然存在图像边缘和同质区域错分的现象;本发明在视觉 和定量分析方面均优于前三种现有技术分类方法,在边缘和同质区域都能 达到理想的分类效果。

以上仿真实验表明:本发明方法能够充分利用高光谱图像的光谱域和邻 域信息,在图像边缘和同质区域都能取得很好的分类结果,能够解决现有 技术方法中存在的忽略高光谱图像的邻域信息、分类精度低等问题,是一 种非常实用的高光谱图像分类方法。

本实施例没有详细叙述的计算方法属本行业的公知技术和常用方法, 这里不一一叙述。

以上例举仅仅是对本发明的举例说明,并不构成对本发明的保护范围 的限制,凡是与本发明相同或相似的设计均属于本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号