首页> 中国专利> 一种解决遥感影像多分类场景分割算法数据不均衡的方法

一种解决遥感影像多分类场景分割算法数据不均衡的方法

摘要

本发明公开了一种解决遥感影像多分类场景分割算法数据不均衡的方法,该方法包括以下步骤:A.将遥感影像与标签按固定大小切割,输出样本数据集;B.遍历样本数据,按样本类别归类到样本数据子集中;C.从数据子集中采样得到batch数据组;D.batch数据组提供给算法训练;E.重复C、D步骤。本发明通过将遥感影像与标签按固定大小切割,输出样本数据集,然后遍历样本数据,按样本类别归类到样本数据子集中,从数据子集中采样得到batch数据组,batch数据组提供给算法训练,重复采样得到batch数据组和算法训练,解决了实际场景中样本数据不均衡导致算法失效的问题,而且提高了算法的精准度。

著录项

  • 公开/公告号CN112529033A

    专利类型发明专利

  • 公开/公告日2021-03-19

    原文格式PDF

  • 申请/专利权人 陕西土豆数据科技有限公司;

    申请/专利号CN202011011808.1

  • 发明设计人 冯喆;王江安;

    申请日2020-09-22

  • 分类号G06K9/62(20060101);

  • 代理机构

  • 代理人

  • 地址 710075 陕西省西安市雁塔区高新天谷八路211号环普科技产业园E座504

  • 入库时间 2023-06-19 10:19:37

说明书

技术领域

本发明属于深度学习技术技术领域,具体为一种解决遥感影像多分类场景分割算法数据不均衡的方法。

背景技术

遥感影像(简称:RS,英文:Remote Sensing Image)是指记录各种地物电磁波大小的胶片或照片,主要分为航空像片和卫星相片。

用计算机处理的遥感图像必须是数字图像。以摄影方式获取的模拟图像必须用图像扫描仪等进行模/数(A/D)转换;以扫描方式获取的数字数据必须转存到一般数字计算机都可以读出的CCT等通用载体上。计算机图像处理要在图像处理系统中进行。图像处理系统是由硬件(计算机、显示器、数字化仪、磁带机等等)和软件(具有数据输入,输出,校正,变换,分类等功能)构成。图像处理内容主要包括校正、变换和分类。

基于深度学习技术的多分类场景分割算法近来不断完善,在很多领域得到了广泛的应用。基于深度学习的多分类场景分割算法的效果与训练数据样本的质量密不可分,通常情况下,公开数据集中样本会得到妥善的筛选处理,多类别数据样本均衡,因此一般算法并没有针对不合理的数据样本做出解决方案。

在实际应用中,遥感影像多类别数据会不可避免地出现类别样本数量不均衡的状况,算法难以学习小样本类别的特征,最终的算法分割效果因此也会异常糟糕。由于样本分布的不均衡,造成算法只学习到部分样本的特征,其余类别的准确度都相对很低甚至接近于零。即由于样本数据不均衡导致算法失效。

针对相关技术中的问题,目前尚未提出有效的解决方案,为此,我们提出一种解决遥感影像多分类场景分割算法数据不均衡的方法。

发明内容

(一)解决的技术问题

针对现有技术的不足,本发明提供一种解决遥感影像多分类场景分割算法数据不均衡的方法,解决了背景技术中提到的问题。

(二)技术方案

为实现上述目的,本发明提供如下技术方案:一种解决遥感影像多分类场景分割算法数据不均衡的方法,该方法包括以下步骤:

A.将遥感影像与标签按固定大小切割,输出样本数据集;

B.遍历样本数据,按样本类别归类到样本数据子集中;

C.从数据子集中采样得到batch数据组;

D.batch数据组提供给算法训练;

E.重复C、D步骤。

优选的,步骤C具体包括如下:

S1统计各个子集的样本数量,并得到样本数量最多的子集的样本数量x;

S2在单次训练epoch中,从样本数量最多的子集中随机取出第i个非重复样本;

S3 x除以i取整后分别乘以其余子集的样本数量得到其余子集的样本索引,通过样本索引获得其余子集中的样本;

S4将子集采样到的样本组合作为一个batch数据提供给算法。

优选的,所述batch数据组中的batch指批处理(Batch),也称为批处理脚本,顾名思义,批处理就是对某对象进行批量的处理,通常被认为是一种简化的脚本语言,它应用于DOS和Windows系统中,批处理文件的扩展名为 bat,目前比较常见的批处理包含两类:DOS批处理和PS批处理,PS批处理是基于强大的图片编辑软件Photoshop的,用来批量处理图片的脚本;而DOS 批处理则是基于DOS命令的,用来自动地批量地执行DOS命令以实现特定操作的脚本,更复杂的情况,需要使用if、for、goto等命令控制程式的运行过程,如同C、Basic等高级语言一样,如果需要实现更复杂的应用,利用外部程式是必要的,这包括系统本身提供的外部命令和第三方提供的工具或者软件,批处理程序虽然是在命令行环境中运行,但不仅仅能使用命令行软件,任何当前系统下可运行的程序都可以放在批处理文件中运行。

优选的,所述batch数据组中的batch数据语言还包括许多软件自带的批处理语言,如Microsoft Office、Visual Studio、Adobe Photoshop所内置的批处理语言的功能,用户可通过它们让相应的软件执行自动化操作(例如调整某个资料夹所有PSD图档的解析度),而这类批处理语言也大多提供把一系列操作录制为批处理文件的功能,这样用户不必写程式就能得到批处理程序。

(三)有益效果

与现有技术相比,本发明提供了一种解决遥感影像多分类场景分割算法数据不均衡的方法,具备以下有益效果:

本发明通过将遥感影像与标签按固定大小切割,输出样本数据集,然后遍历样本数据,按样本类别归类到样本数据子集中,从数据子集中采样得到batch数据组,batch数据组提供给算法训练,重复采样得到batch数据组和算法训练,解决了实际场景中样本数据不均衡导致算法失效的问题,而且提高了算法的精准度。

附图说明

图1为本发明工作流程图;

图2为本发明采样的流程图;

图3为本发明采样的具体成果图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参考图1-3所示,本发明提出一种解决遥感影像多分类场景分割算法数据不均衡的方法,该方法包括以下步骤:

A.将遥感影像与标签按固定大小切割,输出样本数据集;

B.遍历样本数据,按样本类别归类到样本数据子集中;

C.从数据子集中采样得到batch数据组;

D.batch数据组提供给算法训练;

E.重复C、D步骤。

其中,步骤C具体是:

S1统计各个子集的样本数量,并得到样本数量最多的子集的样本数量x;

S2在单次训练epoch中,从样本数量最多的子集中随机取出第i个非重复样本;

S3 x除以i取整后分别乘以其余子集的样本数量得到其余子集的样本索引,通过样本索引获得其余子集中的样本;

S4将子集采样到的样本组合作为一个batch数据提供给算法。

在应用本次解决遥感影像多分类场景分割算法数据不均衡的方法后,算法对于各个类别的准确度皆有提升,准确度平均指标为0.8631。。

其中,所述batch数据组中的batch指批处理(Batch),也称为批处理脚本,顾名思义,批处理就是对某对象进行批量的处理,通常被认为是一种简化的脚本语言,它应用于DOS和Windows系统中,批处理文件的扩展名为bat,目前比较常见的批处理包含两类:DOS批处理和PS批处理,PS批处理是基于强大的图片编辑软件Photoshop的,用来批量处理图片的脚本;而DOS批处理则是基于DOS命令的,用来自动地批量地执行DOS命令以实现特定操作的脚本,更复杂的情况,需要使用if、for、goto等命令控制程式的运行过程,如同C、Basic等高级语言一样,如果需要实现更复杂的应用,利用外部程式是必要的,这包括系统本身提供的外部命令和第三方提供的工具或者软件,批处理程序虽然是在命令行环境中运行,但不仅仅能使用命令行软件,任何当前系统下可运行的程序都可以放在批处理文件中运行。

其中,所述batch数据组中的batch数据语言还包括许多软件自带的批处理语言,如Microsoft Office、Visual Studio、Adobe Photoshop所内置的批处理语言的功能,用户可通过它们让相应的软件执行自动化操作(例如调整某个资料夹所有PSD图档的解析度),而这类批处理语言也大多提供把一系列操作录制为批处理文件的功能,这样用户不必写程式就能得到批处理程序。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。

在本发明的描述中,需要说明的是,术语“上”、“下”、“内”、“外”“前端”、“后端”、“两端”、“一端”、“另一端”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本发明的限制。

尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号