首页> 中国专利> 一种基于CycleGAN的输变电设备图像缺陷样本增广方法

一种基于CycleGAN的输变电设备图像缺陷样本增广方法

页面导航

摘要
著录项
说明书
相似文献

摘要

基于CycleGAN的输变电设备图像缺陷样本增广方法，包括以下步骤：1、对无人机巡检获取的影像进行标注，根据标注文件将原始影像大图切分出正常部件图片以及缺陷部件图片，并且记录相关的文件信息；2、将正常部件图片以及缺陷部件图片作为训练集输入到CycleGAN进行模型训练，训练得到的CycleGAN模型用来将正常部件图片风格迁移为人工缺陷部件图片；3、根据记录的相关文件信息，将人工缺陷部件图片采用不同的方法融合到原始正常影像大图中；4、依据记录的信息更新标注文件，从而得到了扩充后的带标注文件的数据集。相对常规方法增广和本本方法在缺陷样本数量不足的情况下，增广的缺陷样本集能够将目标检测模型的精度提升2～3％，优于常规数据增强方法。

著录项

公开/公告号CN112906769A

专利类型发明专利
公开/公告日2021-06-04

原文格式PDF
申请/专利权人国网河南省电力公司电力科学研究院;国网河南省电力公司;
展开▼

申请/专利号CN202110154390.8
发明设计人田杨阳;万迪明;袁少光;耿俊成;毛万登;王超;高小伟;郭志民;杨晓辉;张小斐;刘昊;李鸣岩;吕卓;陈岑;
展开▼

申请日2021-02-04
分类号G06K9/62(20060101);G06K9/32(20060101);G06K9/46(20060101);
代理机构11689 北京智绘未来专利代理事务所(普通合伙);
代理人王萍;肖继军
地址 450000 河南省郑州市二七区嵩山南路85号
入库时间 2023-06-19 11:14:36

说明书

技术领域

本发明属于输变电设备图像检测、模拟领域，更具体地，涉及一种基于 CycleGAN(环形生成对抗网络)深度学习网络的输变电设备图像缺陷样本增广方法。

背景技术

随着人工智能的发展，输变电设备视频、图像数据的逐渐增加，输变电设备的状态评估可逐渐被深度学习与计算机视觉等智能化体系所代替，以减轻线路巡检人员的人工工作强度。然而，深度学习实际上是以数据为导向的一种机器学习方法，数据集类别不平衡的问题非常常见，这直接影响了数据集质量的好坏，也决定了深度学习训练的效果。

以无人机电力设备自动巡检的应用为例，无人机对输电线路进行拍照摄像，获取大量的图片及视频资料，以通过目标检测的方法从这些资料中定位锈蚀、损坏、异物等设备异常状态。在收集的资料中，大部分为正常样本的图片，有缺陷部件的图片样本只占少部分，在此情况下，各种类型的缺陷部件的样本在整个有缺陷部件的图片样本中的比例又是各不相同的，甚至相差悬殊。也就是说，不仅正常样本图片数据集与缺陷样本图片数据集之间存在类别不平衡问题，缺陷样本数据集本身内部缺陷样本部件的分布也存在着差异，即类间不平衡与类内不平衡。类间不平衡导致模型无法从少数样本类中学习到足够多的特征，从而根本无法对少数类进行预测，故这样的模型没有意义，深度学习的效果也差，因此各种数据增广方法应运而生。

现有技术中，有利用StarGAN多领域的图像迁移学习对人脸表情数据增强方法的应用，也有利用基于卷积神经网络的DCGAN对医学图像数据增强技术研究。但上述增强技术过于复杂，训练时间长，且容易出现数据过拟合问题。本专利所涉及的方法相对常规方法增广和本方法在缺陷样本数量不足的情况下，增广的缺陷样本集能够将目标检测模型的精度提升2～3％，优于常规数据增强方法。

发明内容

为解决现有技术中存在的不足，本发明的目的在于，提供一种基于 CycleGAN的输变电设备图像缺陷样本增广方法，利用CycleGAN对从正常样本切分下来的部件图片进行风格迁移并采用多种方法融合到原图，扩充缺陷样本数据集。-

本发明采用如下的技术方案

一种基于CycleGAN的输变电设备图像缺陷样本增广方法，其特征在于，输变电设备图像缺陷样本增广方法包含如下步骤：

步骤1：采集输变电设备影像，对影像进行标注并生成标注文件，根据标注文件将所采集输变电设备影像即原始图片切分出正常部件图片以及缺陷部件图片，并且记录相关的标注文件信息；

步骤2：将切分出正常部件图片以及缺陷部件图片作为训练集输入到 CycleGAN网络模型进行训练，得到训练后的CycleGAN模型，用来将正常部件图片风格迁移为人工缺陷部件图片；

步骤3：根据记录的标注文件信息，将步骤2得到的人工缺陷部件图片融合到原始图片即步骤1所采集的输变电设备影像中；

步骤4：更新标注文件，得到扩充后的带标注文件的数据集。

本发明进一步包括以下优选方案：

步骤1中，通过无人机采集输变电设备影像，采用人工标注缺陷样本和正常样本，然后裁剪得到缺陷部件样本集和正常部件样本集。

根据标注文件从原始影像切分出正常部件图片以及缺陷部件图片的同时，所记录的相关的标注文件信息是指每一切分后的部件图片所属原始图片名及其位置信息。

步骤2中的CycleGAN的损失函数根据以下公式计算：

式中，

其中，

λ的值为10。

在步骤3中，先将人工缺陷部件图片的色彩空间从RGB空间转到HSV空间，然后提取亮度通道V进行直方图规定化，最后将图像还原到RGB空间后再将原始图片中的对应的缺陷部件图片进行替换。

在步骤3中，将人工缺陷部件图片融合到原始图片后，合成后的图像在目标区域Ω里的像素值和像素位置关系函数f应符合：

其中，Ω为将缺陷部件图片融合至原始图片中的目标区域，

在计算融合后的图片在融合区域里的像素值和像素位置关系函数f时，将人工缺陷部件图片图像梯度与原始图片在目标区域的图像梯度中的较大值作为引导向量场。

在步骤3中，人工缺陷部件图片融合到原始图片的目标区域后，重叠区域左右边界分别为L和R，在重叠区域，每j列像素点以角度表示为：

人工缺陷部件图片A与原始图片B的权重分别为：

ω＝cos

κ＝sin

水平方向上融合后的图像C

同理，其重叠区域上下边界分别为U和D，在重叠区域，第i行像素点以角度表示为：

图像A与图像B的权重分别为：

δ＝cos

γ＝sin

垂直方向上融合后的图像C

将两个方向上融合结果C

在步骤4中，更新标注文件，更新后的标注文件信息包括融合后的图片名、缺陷目标的种类、缺陷目标在图片上的位置信息。

本发明与现有技术相比具有以下有益的技术效果：

电力系统中检查线路是否正常运行是一项十分重要的工作，然而实际电力线路中缺陷发生率低而造成训练样本难以收集，影响了缺陷检测模型的训练效果。针对电力行业目标检测模型训练样本不足的情况，与现有技术相比，本专利利用 CycleGAN对从正常样本切分下来的部件图片进行风格迁移并采用多种方法融合到原图，扩充了缺陷样本数据集。相对常规方法增广和本方法在缺陷样本数量不足的情况下，增广的缺陷样本集能够将目标检测模型的精度提升2～3％，优于常规数据增强方法。

附图说明

图1为基于CycleGAN的输变电设备缺陷图像样本增强方法过程；

图2为人工缺陷部件图片及其与原始正常图片的关系示例。

具体实施方式

下面结合附图对本申请作进一步描述。以下实施例仅用于更加清楚地说明本发明的技术方案，而不能以此来限制本申请的保护范围。

步骤1：对巡检获取的影像进行标注，以此根据标注后的影像将原始图片切分出正常部件图片以及缺陷部件图片，并且记录相关的文件信息。

数据集包括缺陷部件样本集和正常部件样本集：通过无人机采集输变电设备影像，采用人工标注缺陷样本和正常样本，然后裁剪得到缺陷部件样本集和正常部件样本集。为方便后续进行图片融合，根据缺陷部件样本集与正常部件样本集切分出缺陷部件图片，并记录该部件图片的原始图片名及其位置信息。以防震锤为例，缺陷和正常部件样本集示例如图2所示。

步骤2：将正常部件图片以及缺陷部件图片作为训练集输入到CycleGAN网络模型进行训练，训练得到的CycleGAN模型用来将正常部件图片风格迁移为人工缺陷部件图片。

整个CycleGAN网络的损失函数值可以描述如下：对于来自于正常部件样本集X域的样本x，输入生成网络G后，得到人工缺陷部件图片G(x)，G(x)和来自于缺陷部件样本集Y域的样本y同时输入缺陷部件样本集的判别网络D

接下来将人工缺陷部件图片G(x)输入到生成网络F中得到重构样本

对于来自于缺陷部件样本集Y域的样本y，同样可以得到两个损失函数值

该式中，D

使用训练好的CycleGAN模型，将正常部件样本数据作为输入得到对应输变电设备不同故障的人工缺陷部件图片数据。

步骤3：根据记录的标注文件信息，将步骤2得到的人工缺陷部件图片融合到原始图片即步骤1所采集的输变电设备影像中。

图像融合是指将两张或者两张以上的图像信息融合在一张图像上。在本发明中，特指将使用CycleGAN生成的人工缺陷部件图片信息融合到原始图片上。

考虑到粗暴地直接使用剪切粘贴技术(cut-and-paste)将原始正常部件图片替换为人工缺陷部件图片，会使得图片上产生明显的“截断”，从而造成人工样本数据集与原始样本数据集的分布发生偏差。本发明中考虑了三种融合方法。对于单张原始图片中需要融合多个人工缺陷部件图片的情况，本发明中采取的策略是将多个人工缺陷部件图片融合到同一张原始图片上。

方法1：通过一个灰度映像函数将人工缺陷部件图片的灰度直方图调整到与原始图片灰度直方图近似。在本发明中，采用的是先将图像的色彩空间从RGB 空间转到HSV空间，然后提取亮度通道V进行直方图规定化，最后将图像还原到RGB空间后，再将缺陷部件替换至原始图片中。

方法2：可以达到无缝融合并且最大程度的保留目标区域的纹理信息。合成后的图像在目标区域Ω里的像素值和像素位置关系函数f，可以表示如下:

其中，Ω为将缺陷部件图片融合至原始图片中的目标区域，

一般情况下v是指人工缺陷部件图的梯度，但是有时完全采用人工缺陷部件图的梯度作为引导向量场并不能得到很好的结果，可利用一个混合梯度的解决方案：

对于所有的x∈Ω，

其中，x为人工缺陷部件图和目标图像的像素位置，v(x)为引导向量场在像素x处的取值，

即在计算融合后的图片在融合区域里的像素值和像素位置关系函数f时，将人工缺陷部件图片图像梯度与原始图片在目标区域的图像梯度中的较大值作为引导向量场。

方法3：运用了三角函数权重融合，考虑到需要融合的图片为完全重叠而不是在一个方向上的部分重合，本发明对三角函数权重融合进行了一定的调整：以水平方向为例，需要融合的图像分别为图像A和图像B，其重叠区域左右边界分别为L和R，在重叠区域，第j列像素点以角度表示为：

图像A与图像B的权重分别为：

ω＝cos

κ＝sin

因此水平方向上融合后的图像C

同理，其重叠区域上下边界分别为U和D，在重叠区域，第i行像素点以角度表示为：

图像A与图像B的权重分别为：

δ＝cos

γ＝sin

垂直方向上融合后的图像C

由于需要融合的图片为完全重叠，而并不仅仅水平方向是的部分重叠，为此，本发明中采取了在水平方向和垂直方向上同时进行图像融合，并采用两个方向上融合结果C

步骤4：更新标注文件，得到扩充后的带标注文件的数据集。依据记录的信息更新标注文件，从而得到了扩充后的带标注文件的数据集。标注文件中，记录的主要关键信息为图片名、缺陷目标的种类、缺陷目标在图片上的位置信息。本发明中采用的标注文件格式为xml，对目标进行矩形标注，以目标在图片中左上角和右下角的横纵坐标进行表示。因此便可以在进行图片融合的同时，根据这些保留的信息更新标注文件中目标的类别信息。

本发明的有益效果在于，与现有技术相比，该方法针对于电力行业缺陷样本图像不足的情况，能够将正常样本图像大批量的转换缺陷样本图像，从而用于缺陷目标检测模型的训练。

本发明申请人结合说明书附图对本发明的实施示例做了详细的说明与描述，但是本领域技术人员应该理解，以上实施示例仅为本发明的优选实施方案，详尽的说明只是为了帮助读者更好地理解本发明精神，而并非对本发明保护范围的限制，相反，任何基于本发明的发明精神所作的任何改进或修饰都应当落在本发明的保护范围之内。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种基于CycleGAN的输变电设备图像缺陷样本增广方法 [P] . 中国专利： CN112906769A . 2021-06-04
2. 一种基于循环生成对抗网络的绝缘子雷击图像样本增广方法 [P] . 中国专利： CN114140662A . 2022-03-04
3. IMAGE-BASED LARGE-AREA SAMPLE ANALYSIS DEVICE, AND IMAGE-BASED SAMPLE ANALYSIS DEVICE USING MEDIUM CHARACTERISTIC DIFFERENCE AND METHOD FOR MEASURING AND ANALYZING SAMPLE BY USING SAME [P] . 世界知识产权组织专利： WO2019231298A1 . 2019-12-05

机译：基于图像的大面积样本分析设备，以及具有中等特征差异的基于图像的样本分析设备以及使用该方法测量和分析样本的方法
4. A method for acquiring a sample image for label acceptance among auto-labeled images used for neural network learning, and a sample image acquisition device using the sample image. [P] . JP6855091B2 . 2021-04-07

机译：一种用于获取用于标签接受的样本图像的方法，用于用于神经网络学习的自动标记图像，以及使用样本图像的示例图像获取设备。
5. METHOD FOR ANALYZING AT LEAST ONE TYPE OF DEFECT AMONG A PLURALITY OF TYPES OF DEFECT BETWEEN AT LEAST TWO SAMPLES AND ASSOCIATED DEVICE [P] . 法国专利： FR3084768A1 . 2020-02-07

机译：分析至少两个样本和相关设备中的多个缺陷类型中的至少一种缺陷的方法