首页> 中国专利> 基于边界点重分类的高光谱图像分类方法

基于边界点重分类的高光谱图像分类方法

摘要

本发明提出了一种基于边界点重分类的高光谱图像分类方法,克服了现有的融合空间信息和谱信息分类方法分类时对边界点的误分类。本发明具体实现的步骤为:(1)输入数据;(2)获取聚类图;(3)获取基于光谱信息的分类图;(4)获取空域-谱域分类图;(5)修正空域-谱域分类图中的分类错误;(6)选取边界点;(7)边界点进行分类;(8)更正边界点的分类类标(9)输出最终分类图。本发明有效地纠正在现有技术中导致的边界点分类错误,提高高光谱图像分类的精确度。

著录项

  • 公开/公告号CN104680185A

    专利类型发明专利

  • 公开/公告日2015-06-03

    原文格式PDF

  • 申请/专利权人 西安电子科技大学;

    申请/专利号CN201510112666.0

  • 申请日2015-03-15

  • 分类号G06K9/62(20060101);

  • 代理机构61205 陕西电子工业专利中心;

  • 代理人田文英;王品华

  • 地址 710071 陕西省西安市太白南路2号

  • 入库时间 2023-12-18 09:13:55

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-04-17

    授权

    授权

  • 2015-07-01

    实质审查的生效 IPC(主分类):G06K9/62 申请日:20150315

    实质审查的生效

  • 2015-06-03

    公开

    公开

说明书

技术领域

本发明属于图像处理技术领域,更进一步涉及高光谱影像(Hyperspectral  Imagery)分类技术领域中的一种基于边界点重分类的高光谱分类方法。本发明针对 高光谱影像处理中图像标记样本稀少的特点,提出的一种分类的方法,提高了分类 的精确度。

背景技术

高光谱技术是一种新型的对地观测技术,通过获取大量地物反射的窄带电磁波 波段,革命性地结合了地物的光谱信息、空间信息和几何信息,进而可以分析出感 兴趣地物的相关信息。随着光谱获取技术和高光谱数据分析技术的发展,高光谱技 术在军事和民用领域得到广泛的应用。由于高光谱数据的庞大和复杂性,对于图像 中的每个象元代表的物质类别不能靠人工一一识别,因此,高光谱图像的分类技术 就成为高光谱图像处理技术中重要的一环。

高光谱图像分类的关键在于依靠少量的样本数据,结合光谱信息和空间信息对 数据进精准的分类识别。在分类技术发展的初期,主要是依靠光谱信息进行分类, 随着传感器技术的进步,图像的分辨率得到很大的提高,由此图像中的空间信息也 纳入到分类技术中。

香港理工大学申请的专利“融合空间信息及光谱信息的高光谱图像的分类方法 及装置”(专利申请号:CN201210003388.1,公开号:CN102708373A)中提出了 一种融合空间信息及光谱信息的高光谱图像的分类方法。该方法采用联合分割图和 基于光谱信息的分类图,对分割块区域进行多数表决的形式对区域进行统一分类, 该技术依靠同一区域为同一地物的性质,极大地提高了分类的精准度,减少了误分 类的可能性。但是该方法仍然存在的不足是,由于该方法准确的前提是分割的精准 性,而分割技术在区域内点和边界的无差别对待导致的区域划分错误,所以导致后 续的分类结果在分割边缘处的分类精度较差。

西安电子科技大学申请的专利“基于压缩谱聚类集成的高光谱图像分类方法” (专利申请号:CN201410077182.2,公开号:CN103996047A)提出了一种压缩谱聚 类的高光谱分类方法。该方法对图像数据先进行降维处理,然后联合图像分割图和 光谱信息进行分类。该方法克服了K-mean聚类方法对初始化敏感的缺点,提高了分 类的精确度。但是该方法仍然存在的不足是,图像信息的的使用不充分,对于各个 目标的内部区域点和边界区域点没有进行区分,导致分类存在较大的错误,使得图 像分类的整体精度降低。

发明内容

本发明的目的在于克服上述现有技术的不足,提出了一种基于边界点重分类的 高光谱分类方法。本发明优化了高光谱图像的分类过程;充分利用的边界点的独特 信息,避免了区域边界的划分错误;引入了主动学习算法对边界点单独分类处理, 提高了分类结果的精准性。

本发明实现上述目的的思路是:采用划分聚类的分割方式引入信息,结合谱域 信息,依据多数投票的原理,融合空域-谱域信息进行分类;依据聚类的结果,提取 边界点,引入主动学习算法充分利用少量的标记样本和边界点的信息,获得较好的 分类效果。

本发明实现的具体步骤如下:

(1)输入数据:

(1a)输入一幅待分类的高光谱图像;

(1b)输入与待分类的高光谱图像对应的人工标记的样本集;

(2)获取聚类图:

采用迭代自组织数据分析法IOSDATA,对待分类的高光谱图像进行聚类操作, 由待分类的高光谱图像的空域信息,得到待分类的高光谱图像的空域聚类图;

(3)获取基于光谱信息的分类图:

采用有监督的支撑向量机SVM,对待分类的高光谱图像进行分类,得到待分类 的高光谱图像的谱域分类图;

(4)获取空域-谱域分类图:

采用多数投票Majority-Voting方法,整合空域聚类图和谱域分类图的信息,得 到空域-谱域分类图;

(5)修正空域-谱域分类图中的分类错误:

采用后期归整Post-Regulation方法,对空域-谱域分类图进行修正,修正因噪声 引起的分类错误,得到修正后的分类图;

(6)选取边界点:

比较修正后的分类图中各个像素点的类标与各自8邻域像素点类标的异同,将 类标与8邻域中的各个类标均不相同的像素点定义为边界点;

(7)边界点分类:

采用多类别不确定性MCLU方式的主动学习方法,对边界点进行分类,得到边 界点分类的类标;

(8)更正边界点的分类类标:

用边界点分类的类标替代修正后的分类图中的边界点的类标,得到最终的分类 图;

(9)输出最终的分类图。

本发明与现有技术相比具有以下优点:

第一,由于本发明采用选取图像各区域边界点的方式,克服了现有技术对于区 域内点和边界的无差别对待导致的区域划分错误的问题,使得本发明能够纠正区域 边界的划分错误,获取了更加精准的空域信息。

第二,由于本发明使用了对图像各区域边界点分类的方法,充分利用边界点的 独特信息,克服了现有技术对于图像信息的的使用不充分的问题,使得本发明在标 记样本较少时也能取得比较好的分类效果。

附图说明

图1是本发明的流程图。

具体实施方式

参照附图1,本发明的具体步骤如下:

步骤1,输入数据。

分别输入一幅待分类的高光谱图像以及与待分类的高光谱图像对应的人工标记 的样本集。

在本发明实施例中,输入一幅待分类的高光谱图像ROSIS-03光学传感器所记录 的帕维亚大学的图像,以及通过机载可见光成像光谱仪AVIRIS获取的印第安纳州高 光谱图像。

步骤2,获取聚类图。

采用迭代自组织数据分析法IOSDATA,对待分类的高光谱图像进行聚类操作, 由待分类的高光谱图像的空域信息,得到待分类的高光谱图像的空域聚类图。

在本发明实施例中,采用软件ENVI中的迭代自组织数据分析法ISODATA对图 像进行聚类操作,迭代自组织数据分析法IOSDATA是基于K均值算法对样本进行 自动聚类分析,而且可以自动地进行类别的“合并”和“分裂”,从而可以得到合 理的聚类结果。

分裂的规则如下:

如果聚类集合P中δcmax>δmax,同时满足时,则对该类进行分 裂;其中:δcmax为聚类内的标准差最大值,δmax为预设定的类内最大标准差,为 像元距离类内中心的平均距离,为全图所有像元距离其相应聚类中心的距离平均 值,C为当前图像的聚类数,K为预设的期望得到的聚类最大数。两个新的聚类中心 分别为其中γc=t*δcmax,t为预设的常数。

合并规则如下:

如果C≥2K,则执行合并操作;将聚类中心间的距离从大到小进行排序,提取 两者距离小于预设值的聚类中心,将其中没有被合并过的中心进行合并处理,以此 得到新的聚类。

在本发明实施例中,采用Matlab R2013b对聚类图进行分割标记,依靠像素点的 四邻域判断区域块是否连接,若区域块有像素点处于另一区域某像素点的四邻域 中,则判定两者连接,反之,则判定不相邻。不相邻的的同一聚类采用不同标号标 记,以达到分块的目的。

步骤3,获取基于光谱信息的分类图。

采用有监督的支撑向量机SVM,对待分类的高光谱图像进行分类,得到待分类 的高光谱图像的谱域分类图。

在本发明的实施例中,使用LIBSVM工具箱执行分类任务,采用有监督的支撑 向量机SVM,对待分类高光谱图进行分类,得到谱域分类图。

步骤4,获取空域-谱域分类图。

采用多数投票Majority-Voting方法,整合空域聚类图和谱域分类图的信息,得 到空域-谱域分类图。

多数投票Majority-Voting方法的具体步骤如下:

第一步:统计谱域分类图的各类别在空域聚类图所形成的各个区域中的像素 数;

第二步:从各区域中选取的像素数最多的类别的类别标号;

第三步:用所选取的类别标号,替换本区域内所有的谱域分类图的类标,得到 空域-谱域分类图。

步骤5,修正空域-谱域分类图中的分类错误。

采用后期归整Post-Regulation方法,对空域-谱域分类图进行修正,修正因噪声 引起的分类错误,得到修正后的分类图。

后期归整Post-Regulation方法的步骤是:判断空域-谱域分类图各个像素点的类 别与其周围4邻域中拥有相同类标的像素数最多的类别标号是否相同;若相同,则 该像素点的类标不变;若不同,则将该像素点的类标修正为其4邻域中拥有相同类 标的像素数最多的类别标号,得到修正后的分类图。

步骤6,选取边界点。

比较修正后的分类图中各个像素点的类标与各自8邻域像素点类标的异同,将 类标与8邻域中的各个类标均不相同的像素点定义为边界点。提取边界点的坐标及 其与该坐标对应的图像信息。

步骤7,边界点进行分类。

采用多类别不确定性MCLU方式的主动学习方法,对边界点进行分类,得到边 界点分类的类标。

在本发明的实施例中,分类使用的是ALToolbox_v0.5.2工具箱,选择多类别不 确定性MCLU(Multiclass-level Uncertainty)的主动学习算法处理。所述的主动学习 算法,步骤如下:

第一步:用待分类的高光谱图像对应的人工标记的样本集,训练支撑向量机 SVM;

第二步:用训练后的支撑向量机SVM对选取的边界点进行分类;

第三步:用多类别不确定性MCLU方式,计算边界点分类后的信息量,人工标 记信息量大的边界点;

第四步:将人工标记的边界点加入到人工标记样本集中,更新人工标记样本 集;

第五步:判断人工标记样本集中的样本数目是否达到边界点数的十分之一,若 是,则执行第一步;否则,执行第六步;

第六步:用完成更新后的人工标记样本集训练支撑向量机SVM,用训练后的支 撑向量机SVM对边界点进行分类。

多类别不确定性MCLU技术的主动学习算法与一般主动学习算法对待判定样本 逐一处理方式不同,多类别不确定性MCLU技术采用的是”批处理”模式,每次对 多个待判定样本同时进行处理、判定。

在主动学习算法中采用的多类别不确定性MCLU方式,其结构如下:

其中,U表示选取的边界点集合,fi(x)表示在支撑向量机SVM中像素点x 与第i个判决边界的距离,表示选取的第i个待标记的样本点。

多类别不确定性MCLU方式采用的是”批处理”模式,每次对多个边界点同时 进行处理、判定。

多类别不确定性MCLU方式采用的查询函数有两种:一是,取最小距离函数 cmin(x),即:

cmin(x)=mini=1,2,...n{abs[fi(x)]}

二是,取前两个最大距离函数r1max和r2max的差值cdiff(x),即:

r1max=argmaxj=1,2,...n{fj(x)}

r2max=argmaxj=1,2,...n;jr1max{fj(x)}

cdiff(x)=fr1max(x)-fr2max(x)

本发明实施例中采用的是判定cdiff(x)数值方式,若cdiff(x)数值小于预限定值, 则说明x样本点信息量大,判定此点为新的样本点。

步骤8,更正边界点的分类类标。

用边界点分类的类标替代修正后的分类图边界点的类标,得到最终的分类图。

步骤9,输出分类图。

输出最终的分类图。

下面结合实仿真实验对本发明做进一步的描述。

1.仿真实验条件:

本发明的仿真实验采用的硬件测试平台是:处理器为Inter Core i3-2350M,主频 为2.30GHz,内存2GB;软件平台为:Windows 7旗舰版32位操作系统、ENVI和 Matlab R2013b进行仿真测试。

2.仿真实验内容:

对采用的是ROSIS-03光学传感器所记录的帕维亚大学的图像,以及通过机载可 见光成像光谱仪AVIRIS获取的印第安纳州高光谱图像进行分类算法仿真;两幅图像 数据均来自:

http://www.ehu.es/ccwintco/index.php?title=Hyperspectral_Remote_Sensing_Scenes.

3.仿真结果分析:

仿真实验1:

分割图采用的是软件ENVI中的迭代自组织数据分析法ISODATA聚类算法,其 参数设置:聚类数参数cmin=9,cmax=10,最大迭代次数Iterations=10。

逐像素分类采用的是LIBSVM工具箱,其参数设置:使用高斯径向基函数 (RBF)核,并通过2重的交叉验证,确定优化参数C=64和g=0.0625。

结合分割图和逐像素分类图,采用多数表决的形式融合空间信息和谱信息进行 分类。

依照本发明中所提出的边界点判定规则,分别计算融合空间信息和谱信息分类 图的边界点和非边界点的整体精确度,结果分别为:0.729和0.980,由此可以得出 本发明对边界点进行分类的理论正确性,针对边界点进行重分类具有可提高分类效 果的可行性。

表1 现有技术与本发明在分类的整体精确度及卡帕系数的对比表

表1所示是的帕维亚大学区域图在各种算法下分类的整体精确度及卡帕系数, 表1中SVM表示现有技术中的支持向量机方法,IOSDATA表示现有技术中的迭代 自组织数据分析方法,PR表示现有技术中的后期规整方法,BOUNDARYRECLASS -FICATION表示本发明的边界点重分类方法。

表2 现有技术与本发明在各个类别的分类效果对比表

表2所示的是各种算法下的各个类别的精确度,表2中SVM表示现有技术中的 支持向量机方法,IOSDATA表示现有技术中的迭代自组织数据分析方法,PR表示 现有技术中的后期规整方法,BOUNDARYRECLASSFICATION表示本发明的边界 点重分类方法。

仿真实验2:

与仿真实验1处理方法类似,只是在图像聚类时参数设置略有不同,其参数设 置为:聚类数参数cmin=16,cmax=19,最大迭代次数Iterations=10。其他的参数设置 均与仿真实验1相同。依照本发明中所提出的边界点判定规则,分别计算融合空间 信息和谱信息分类图的边界点和非边界点的整体精确度,结果分别为:0.601和 0.944。经过对边界点的二次分类,最终分类结果如下:

表3 现有技术与本发明在分类的整体精确度及卡帕系数的对比表

表3所示的印第安纳州高光谱图在各种算法下分类的整体精确度及卡帕系数, 表3中SVM表示现有技术中的支持向量机方法,IOSDATA表示现有技术中的迭代 自组织数据分析方法,PR表示现有技术中的后期规整方法,BOUNDARYRECLASS -FICATION表示本发明的边界点重分类方法。

表4 现有技术与本发明在各个类别的分类效果对比表

表4所示的是各种算法下的各个类别的精确度,表4中SVM表示现有技术中的 支持向量机方法,IOSDATA表示现有技术中的迭代自组织数据分析方法,PR表示 现有技术中的后期规整方法,BOUNDARYRECLASSFICATION表示本发明的边界 点重分类方法。

由表1、表3的结果可以看出,仿真实验1中,OA由95.1%提升到97.0%,而 kappa系数由0.934提升到0.960。仿真实验2中,OA由85.9%提升到87.0%,kappa 系数由0.838提升到0.852,由此可以看出重分类后的整体分类效果优于原分类的效 果。从表2、表4可以看出,除了极个别的类别经过本发明处理后分类精度略有下降 外,对于大部分类别的分类精度都有较大的提升效果。由此可以得出,本发明对于 融合空间信息和谱信息分类方法具有提升分类精度的效果。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号