公开/公告号CN112508073A
专利类型发明专利
公开/公告日2021-03-16
原文格式PDF
申请/专利权人 杭州天铂云科光电科技有限公司;
申请/专利号CN202011386688.3
申请日2020-12-01
分类号G06K9/62(20060101);G06N3/04(20060101);
代理机构33334 杭州广奥专利代理事务所(特殊普通合伙);
代理人尹建民
地址 311113 浙江省杭州市余杭区良渚街道纳贤街2号(8幢)4楼南侧204室
入库时间 2023-06-19 10:16:30
技术领域
本发明涉及一种深度学习结合传统算法的电力设备红外热图识别方法。
背景技术
电力设备红外图像是通过探测电力设备发出的红外辐射能量,并转化为相应的电信号,经过电信号处理后获得电力设备表面热图像的红外检测技术;红外检测技术具有远距离、不接触、不取样、不解体、准确、快速、直观等特点,广泛应用于电力设备检测诊断,对提高电力系统的稳定性具有重要意义。
在现有的输变电线路中,为了确保输变电线路中各种电力设备的正常运行,需要对电力设备进行定时巡检,传统的人工巡检模式需要工作人员通过监控系统,人工对设备状态进行判断,存在人力成本高、实时性差、误判率大等问题;然而使用传统计算机视觉算法的电力设备智能巡检系统,在对电力设备红外热图的处理上存在许多不足之处,对电力设备的识别率较低。同时现有基于深度学习的电力设备智能巡检方案,使用目标检测算法(如Faster R-CNN、YOLO、SSD)对红外热图进行处理,这些算法首先要对图像中的电力设备进行定位,然后再进行识别操作,识别效率低,不能满足现有的需要;因此需要发明一种新的的电力设备红外热图识别方法,来解决目前所遇到的问题。
发明内容
本发明要解决的技术问题是提供一种通过传统算法突出了数据集的有效特征,减少相似像素之间的依赖性,使得特征更加明显,使得Faster RCNN网络能够有效的训练出具有更高精准度的模型,具有实用性和使用广泛性的深度学习结合传统算法的电力设备红外热图识别方法。
为解决上述问题,本发明采用如下技术方案:
一种深度学习结合传统算法的电力设备红外热图识别方法,包括以下步骤:
1)、获得50种电力设备的红外热图数据集,每个分类1000张,提取图像中的温度信息,以浮点类型的数据进行存储;
2)、对数据集进行归一化操作,将图像大小置为256*256,使值分布在0到1之间;
3)、对图像进行直方图均衡操作,提高对比度;
4)、使用高斯-拉普拉斯算子进行滤波,增强细节的同时保证原数据中的噪声得到一定程度的抑制,得到锐化图像后,将其与原图叠加;
5)、随机打乱数据集顺序后随机以6:2:2的比例划分训练集、验证集、测试集,送入Faster RCNN网络中进行训练;
6)、调整网络参数,使得模型达到最佳。
优选的,步骤2)包括对温度数据进行线性变换,数据经过处理后转化为(0,1)之间的小数,使得原数据的数值排序和特征不改变,而且能加快后续神经网络的训练和收敛速度。
优选的,步骤3)通过直方均衡处理改变图像中的灰度像素分布,延展灰度像素密度较大的区域,缩小灰度像素密度较小的范围,使得能够充分有效的利用各个图像中的灰度级,提高了图像对比度,对于灰度级为离散的数字图像,用频率来代替概率,则变换函数T(r{k})的离散形式可以表示为:
其中s{k}为均衡化后各像素的灰度级,也是归一化后的灰度级,其值在0到1之间,rk是原始的像素值,Pr是rj在在原始图像中的概率函数,nj即原始图像中,像素为j的像素点个数。
优选的,步骤4)中高斯滤波是一种线性平滑滤波,是用离散化窗口滑窗卷积的形式对整幅图像进行加权平均,其模板系数服从高斯分布。
优选的,步骤5)构建Faster RCNN网络,选择ResNet作为其特征抽取部分,网络通过一个卷积层和一个池化层对输入图像进行预处理,然后通过由48个卷积层构成的残差网络进行特征提取,
优选的,第一个卷积层的输入为224*224*3,通过resize程序将图像较长边进行缩放,最后在较长边两侧进行0值均匀填充,使得较短边达到标准长度。
优选的,ResNet采用三层的残差学习网络,由于3个卷积层构成一个残差块,ResNet的残差网络分为四个Block块,每个Block块分别包含3个、4个、6个、3个残差块,实现四个Block块,确定Block块中各个残差块的输入参数,包括第三层输出通道数depth、前两层输出通道数bottleneck、中间层步长stride。
优选的,以6:2:2的比例将数据集划分为训练集、验证集、测试集,通过网络进行测试,打印其loss和acc信息,分析训练结果并对学习率等参数进行调整,最终生成适用的模型。
本发明的有益效果是:通过传统算法突出了数据集的有效特征,减少相似像素之间的依赖性,使得特征更加明显,使得Faster RCNN网络能够有效的训练出具有更高精准度的模型,同时通过对数据集的预处理步骤,对样本数据进行了特征增强,使得在训练过程中模型更容易收敛,并取得一个较高的精确度,具有实用性和使用的广泛性。
具体实施方式
一种深度学习结合传统算法的电力设备红外热图识别方法,包括以下步骤:
1)、获得50种电力设备的红外热图数据集,每个分类1000张,提取图像中的温度信息,以浮点类型的数据进行存储;
2)、对数据集进行归一化操作,将图像大小置为256*256,使值分布在0到1之间;
3)、对图像进行直方图均衡操作,提高对比度;
4)、使用高斯-拉普拉斯算子进行滤波,增强细节的同时保证原数据中的噪声得到一定程度的抑制,得到锐化图像后,将其与原图叠加;
5)、随机打乱数据集顺序后随机以6:2:2的比例划分训练集、验证集、测试集,送入Faster RCNN网络中进行训练;
6)、调整网络参数,使得模型达到最佳。
步骤2)包括对温度数据进行线性变换,数据经过处理后转化为(0,1)或者(-1,1)之间的小数,使得原数据的数值排序和特征不改变,而且能加快后续神经网络的训练和收敛速度,
x'=(x-X_min)/(X_max-X_min);x'=(x-X_mean)/σ。
步骤3)通过直方均衡处理改变图像中的灰度像素分布,延展灰度像素密度较大的区域,缩小灰度像素密度较小的范围,使得能够充分有效的利用各个图像中的灰度级,提高了图像对比度,对于灰度级为离散的数字图像,用频率来代替概率,则变换函数T(r{k})的离散形式可以表示为:
其中s{k}为均衡化后各像素的灰度级,也是归一化后的灰度级,其值在0到1之间,rk是原始的像素值,Pr是rj在在原始图像中的概率函数,nj即原始图像中,像素为j的像素点个数。
步骤4)中高斯滤波是一种线性平滑滤波,是用离散化窗口滑窗卷积的形式对整幅图像进行加权平均,其模板系数是服从高斯分布的,高斯分布函数指的是正态分布的概率密度函数,当均值μ=0时的一维形式和二维形式如下:
其中σ代表了正态分布的标准差,标准差代表着数据的离散程度,σ越大,模板的各个系数相差就不是很大,平滑程度就越好,具体操作的形式是用预设的卷积模板逐个扫描原图像中的像素,并用卷积模板计算确定目标像素邻域的加权灰度值最后替换目标像素点的值,二维的高斯函数具有旋转对称性,滤波器在各个方向上拥有相同的平滑程度,这个特性使得滤波操作不会改变原图像的边缘方向信息,因此不会给后续的边缘检测造成误差影响。
图像的平滑滤波是对图像高频灰度跳变的一种抑制,图像的锐化则相反,它是对图像的高频跳变部分的一种增强,突出图像的边缘细节变化等信息,然而锐化也在一定程度上增强了图像的噪声,所以在本次发明中,我们使用了两种手段相结合,分别用于抑制噪声和增强细节,当原始图像本身就有很明显的噪声,先平滑滤波再锐化处理,若锐化处理后图像有了噪声,后续可再进一步进行降噪处理,锐化滤波器中使用了拉普拉斯算子,拉普拉斯算子是一种微分算子,主要的用途是增强图像中灰度像素突变的部分,减弱灰度缓慢变化的区域,算子定义为:
在离散情况下可近似为:
V
可以看出,拉普拉斯算子是一个卷积模板,计算得出4倍或8倍中心元素值与其领域值和之差的绝对值,也可理解为中心元素与其领域内元素和均值负5倍的绝对值;在本次锐化处理中首先使用拉普拉斯滤波器对图像进行处理,产生突出灰度突变细节的图像,再将拉普拉斯图像和原图像叠加以产生锐化图像;这样既可以保留原图像中的灰度信息,又可以选择性的突出图像中我们感兴趣的细节部分;本次方法中主要使用了以下两个算子来处理图像:
算子一[[0,1,0],
[1,-4,1],
[0,1,0]]
算子二[[1,1,1],
[1,-8,1],
[1,1,1]]
最中间的值代表峰,值越接近8表示锐化效果越好,值越大,图像锐化的效果逐渐减弱,中心像素的比重越大。
步骤5)构建Faster RCNN网络,选择ResNet作为其特征抽取部分,网络通过一个卷积层和一个池化层对输入图像进行预处理,然后通过由48个卷积层构成的残差网络进行特征提取,第一个卷积层的输入为224*224*3,通过resize程序将图像较长边进行缩放,最后在较长边两侧进行0值均匀填充,使得较短边达到标准长度;
红外热图的温度信息为以为数据,加入图像通道修改程序,通过复制单通道的数据,将输入图像修改为三个通道图像,图像三个通道上的数据相同,不会影响检测精度;
ResNet采用三层的残差学习网络,由于3个卷积层构成一个残差块,ResNet的残差网络分为四个Block块,每个Block块分别包含3个、4个、6个、3个残差块,实现四个Block块,确定Block块中各个残差块的输入参数,包括第三层输出通道数depth、前两层输出通道数bottleneck、中间层步长stride;
以6:2:2的比例将数据集划分为训练集、验证集、测试集,通过网络进行测试,打印其loss和acc信息,分析训练结果并对学习率等参数进行调整,最终生成适用的模型。
本方法通过对数据集的预处理步骤,对样本数据进行了特征增强,使得在训练过程中模型更容易收敛,并取得一个较高的精确度。
关于深度学习:深度学习作为机器学习领域中一个非常热门的应用方向,在计算机视觉、自然语言处理、生物信息学等方面取得了众多研究成果,尤其在图像识别领域取得了远超传统算法的效果。深度学习通过构建深层次的卷积神经网络,对大量已标注的图片样本进行训练,来获取一个能够拟合真实图像信息的算法模型,并利用该模型进行图像的识别操作。
以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何不经过创造性劳动想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求书所限定的保护范围为准。
机译: “财产识别方法”(“ PIM”)是一种新颖的算法,通过该算法,可以通过对文件(如市议会/房屋价格通知)进行图像处理来创建房地产管理局和/或产权转让数据。本发明建立了一种独特的算法,该算法结合了诸如深度学习分段和计算机视觉之类的技术来解码属性信息。该应用程序利用以某种方式配置的计算机实现的技术,以使运输商和房地产经纪人能够自动创建客户端文件。
机译: 单元分析方法,深度学习算法训练方法,单元分析器,深度学习算法训练装置,单元分析程序和深度学习算法训练程序
机译: 深度学习算法,细胞分析装置,深层学习算法,小区分析计划和深度学习算法培训计划的训练方法