首页> 中国专利> 一种复杂造型GRC板块图像的识别方法和系统

一种复杂造型GRC板块图像的识别方法和系统

摘要

本发明涉及图像处理、模式识别及机器学习领域,公开了一种复杂造型GRC板块的识别方法和系统,以能很好的识别复杂造型GRC板块,且抗干扰能力强,识别速度快,精度高。本发明采集需要识别的复杂造型GRC板块图像,采用方向梯度直方图算法对复杂造型GRC板块图像进行预处理;采用卷积神经网络提取预处理后的复杂造型GRC板块图像的图像特征,得到特征图像集I,计算特征图像集I与数据库中各复杂造型GRC板块标准图像的相似度,将数据库中相似度最高的GRC板块标准图像所对应的相关信息输出给用户。

著录项

  • 公开/公告号CN107633010A

    专利类型发明专利

  • 公开/公告日2018-01-26

    原文格式PDF

  • 申请/专利权人 中南大学;

    申请/专利号CN201710693629.2

  • 发明设计人 邓磊;岳川旭;

    申请日2017-08-14

  • 分类号

  • 代理机构长沙朕扬知识产权代理事务所(普通合伙);

  • 代理人何湘玲

  • 地址 410083 湖南省长沙市麓山南路932号

  • 入库时间 2023-06-19 04:27:31

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-06-19

    授权

    授权

  • 2018-02-23

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20170814

    实质审查的生效

  • 2018-01-26

    公开

    公开

说明书

技术领域

本发明涉及图像处理、模式识别及机器学习领域,尤其涉及一种复杂造型GRC板块图像的识别方法和系统。

背景技术

目前,越来越多的建筑采用异形钢结构搭建,而且大部分钢结构为多空间曲面、拱墙,另有蜂窝造型的单层网壳,空间关系复杂,存在大量弯曲、弯扭、弧形构件,因此,大多数建筑物都采用具有复杂造型的GRC板块实现与钢结构更好的结合,为了对安装有复杂造型GRC板块图像的建筑进行更好的后期维护和管理,使工作人员在建筑物上检测GRC板块时能获取GRC板块的具体信息,需要对GRC板块进行图像识别。目前,复杂造型GRC板块图像之间的相似性程度一般是由向量之间的距离来计算的,采用何种方式来度量要识别的复杂造型GRC板块图像特征向量之间的相似度,是基于内容的图像检索中又一重要的研究。一些比较简单的方法是利用欧氏距离或者余弦距离来计算特征向量间的相似度。另一种方法是通过学习策略计算出一个相似度矩阵,并将该矩阵用来进行特征的相似匹配。还有通过把描述图像的特征转换为二进制特征从而利用汉明距离(Hamming Distance)来快速的进行相似性计算。对于复杂结构的GRC板块,简单的向量之间的距离计算难以真实地反映GRC板块之间的相似性程度。

因此,现需提供一种能很好的识别复杂造型GRC板块图像,且抗干扰能力强,识别速度快,精度高的复杂造型的GRC板块的识别方法和系统。

发明内容

本发明目的在于提供一种复杂造型GRC板块图像的识别方法和系统,该方法和系统能很好的识别复杂造型GRC板块图像,且抗干扰能力强,识别速度快,精度高。

为实现上述目的,本发明提供了一种复杂造型GRC板块图像的识别方法,包括:

采集需要识别的复杂造型GRC板块图像,采用方向梯度直方图算法对所述复杂造型GRC板块图像进行预处理;

采用卷积神经网络提取预处理后的复杂造型GRC板块图像的图像特征,得到特征图像集I,其中,所述卷积神经网络中的相邻卷积层和下采样层之间使用公式(1)和公式(2)对卷积层的输出数据进行处理:

式中,表示初步处理后的数据,k表示卷积层输出数据的维度,x表示卷积层的输出数据,x(k)表示卷积层的输出数据的第k维;E[x(k)]表示卷积层第k维所有输出的数据的平均值;表示卷积层第k维所有输出的数据的标准差;

式中,参数γ和β的初始值采用随机取值,然后在反向计算与校验的训练过程中求出最佳值;y(k)表示引入参数进行最终处理后数据;

且所述卷积神经网络中的下采样层使用公式(3)提取图像特征:

O=(∑∑I(i,j)p×G(i,j))1/p;>

式中,i表示图像特征的长度像素、j表示图像特征的宽度像素,p表示下采样层输出数据的维度,I表示输入的复杂造型GRC板块图像,G代表高斯核,1≤P≤∞,当P=l,上式为均值采样;当P→∞时,上式为最大值采样;

计算所述特征图像集I与数据库中各复杂造型GRC板块标准图像的相似度,将数据库中相似度最高的GRC板块标准图像所对应的相关信息输出给用户。

为实现上述目的,本发明提供一种复杂造型GRC板块图像的识别系统,包括:

第一单元:用于采集需要识别的复杂造型GRC板块图像,采用方向梯度直方图算法对所述复杂造型GRC板块图像进行预处理;

第二单元:用于采用卷积神经网络提取预处理后的复杂造型GRC板块图像的图像特征,得到特征图像集I,其中,所述卷积神经网络中的相邻卷积层和下采样层之间使用公式(1)和公式(2)对卷积层的输出数据进行处理:

式中,表示初步处理后的数据,k表示卷积层输出数据的维度,x表示卷积层的输出数据,x(k)表示卷积层的输出数据的第k维;E[x(k)]表示卷积层第k维所有输出的数据的平均值;表示卷积层第k维所有输出的数据的标准差;

式中,参数γ和β的初始值采用随机取值,然后在反向计算与校验的训练过程中求出最佳值;y(k)表示引入参数进行最终处理后数据;

且所述卷积神经网络中的下采样层使用公式(3)提取图像特征:

O=(∑∑I(i,j)p×G(i,j))1/p;>

式中,i表示图像特征的长度像素、j表示图像特征的宽度像素,p表示下采样层输出数据的维度,I表示输入的复杂造型GRC板块图像,G代表高斯核,1≤P≤∞,当P=l,上式为均值采样;当P→∞时,上式为最大值采样;

第三单元:用于计算所述特征图像集I与数据库中各复杂造型GRC板块标准图像的相似度,将数据库中相似度最高的GRC板块标准图像所对应的相关信息输出给用户。

本发明具有以下有益效果:

本发明提供一种复杂造型GRC板块图像的识别方法和系统,首先采用方向梯度直方图算法对需要识别的复杂造型GRC板块图像进行预处理,然后通过卷积神经网络提取预处理后的复杂造型GRC板块图像的图像特征得到特征图像集I,并通过PageRank算法计算所述特征图像集I与数据库中各复杂造型GRC板块标准图像的相似度,将数据库中相似度最高的GRC板块标准图像所对应的相关信息输出给用户。该方法和系统通过卷积神经网络可以自动学习良好的GRC板块图像特征,避免了人工选取特征的局限性,且在卷积神经网络中通过特定计算公式对卷积层的输出数据进行处理,提高了数据的稳定性,使网络加快收敛,提高了速度,进而提高分类的有效性,增加了系统的鲁棒性。

下面将参照附图,对本发明作进一步详细的说明。

附图说明

构成本申请的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:

图1是本发明优选实施例的复杂造型GRC板块图像的识别流程图;

图2为本发明优选实施例的单元格梯度方向示意图;

图3为本发明优选实施例构建的卷积神经网络结构图;

图4为本发明优选实施例卷积神经网络中各层处理复杂造型GRC板块图像结果实例图;

图5为本发明优选实施例的复杂造型GRC板块图像实例图;

图6为本发明优选实施例复杂造型GRC板块图像的具体信息实例图。

具体实施方式

以下结合附图对本发明的实施例进行详细说明,但是本发明可以由权利要求限定和覆盖的多种不同方式实施。

实施例1

参见图1,本发明提供一种复杂造型GRC板块图像的识别方法,包括:

采集需要识别的复杂造型GRC板块图像,采用方向梯度直方图算法对所述复杂造型GRC板块图像进行预处理;

采用卷积神经网络提取预处理后的复杂造型GRC板块图像的图像特征,得到特征图像集I,其中,所述卷积神经网络中的相邻卷积层和下采样层之间使用公式(1)和公式(2)对卷积层的输出数据进行处理:

式中,表示初步处理后的数据,k表示卷积层输出数据的维度,x表示卷积层的输出数据,x(k)表示卷积层的输出数据的第k维;E[x(k)]表示卷积层第k维所有输出的数据的平均值;表示卷积层第k维所有输出的数据的标准差;

式中,参数γ和β的初始值采用随机取值,然后在反向计算与校验的训练过程中求出最佳值;y(k)表示引入参数进行最终处理后数据;

且所述卷积神经网络中的下采样层使用公式(3)提取图像特征:

O=(∑∑I(i,j)p×G(i,j))1/p;>

式中,i表示图像特征的长度像素、j表示图像特征的宽度像素,p表示下采样层输出数据的维度,I表示输入的复杂造型GRC板块图像,G代表高斯核,1≤P≤∞,当P=l,上式为均值采样;当P→∞时,上式为最大值采样;

计算所述特征图像集I与数据库中各复杂造型GRC板块标准图像的相似度,将数据库中相似度最高的GRC板块标准图像所对应的相关信息输出给用户。

优选地,本发明具体包括以下步骤:

(1)将复杂造型GRC板块图像划分为小连通区域,每一个区域称为一个单元格,构建每个单元格的梯度直方图;

(2)把每相邻的至少两个单元格组成一个块,利用一阶微分计算每个块的梯度值,然后根据所述梯度值对复杂造型GRC板块图像进行归一化,并采用Gamma校正法对复杂造型GRC板块图像进行颜色空间的灰度化,得到预处理后的复杂造型GRC板块图像;

可选地,如图2所示,不同单元格中的像素具有不同的梯度方向,将单元格根据梯度的方向划分为不同的区域,用bin表示每个区域;把每相邻的四个单元格组成一个块,然后串联所有块的梯度特征计算出带有维度的特征向量以完成对复杂造型GRC板块图像的预处理:

β×ξ×η; (6)

式中,β是单元格中bin的数目,ξ为块中单元格的数目,η表示复杂造型GRC板块图像中包含的块的数目。

对复杂造型GRC板块图像进行预处理操作,得到带有维度的特征向量便于后续更好的提取复杂造型GRC板块图像的图像特征,此外,还可以调节复杂造型GRC板块图像的对比度,降低复杂造型GRC板块图像局部阴影和光照变化所造成的影响,同时可以抑制噪声带来的干扰,提高计算的准确度。

(3)将预处理后的复杂造型GRC板块图像作为卷积神经网络的输入,其中,所述卷积层提取图像特征并以数据形式输出,并通过公式(1)对卷积层的输出数据进行处理;

如果仅仅使用上述公式(1)对卷积神经网络卷积层的输出数据作归一化,然后再送入下一层,会影响到本层网络学习到的特征,所以,基于上述公式(1)引入参数γ和β形成组成公式(2):

在上式中,参数γ和β的初始值采用随机取值,然后在反向计算与校验的训练过程中求出最佳值,具体有关的训练过程将在以下进行详细描述。

即,y(k)表示引入参数进行最终处理后的数据,且当β(k)=E[x(k)]时,可以恢复出原始的卷积层数据,所以引入参数γ和β可以用来增强数据处理过程中的表达能力。

值得说明的是,上述计算公式(1)和公式(2)经由一系列复杂的推导过程得出,由于整个推导过程复杂,故不在此详述,具体地,因为在卷积神经网络中,每层训练所需要的学习率不一样,且通常需要使用最小的学习率才能保证不对卷积神经网络的训练速度造成影响,故在卷积神经网络中的卷积层和下采样层之间加入上述处理公式,以使卷积层输出的数据的均值为0、标准差为1,提高了数据的稳定性,使网络加快收敛,提高了速度,进而提高分类的有效性。

(4)在下采样层中,使用公式(3),即,最大值和平均值相结合的方式提取图像特征;

优选地,在下采样层中,通过使用求最大值和均值相结合的方式提取图像特征,即,先取P值为1,得出使用均值采样时的结果;然后取P值为∞,得出使用最大值采样的结果,然后组合均值和最大值的结果,可以提取到更加丰富的图像特征。此外,下采样层基于局部相关性原理进行亚采样,在减少数据量的同时保留有用的信息,即,去除信息中的冗余信息,有助于降低计算过程中的特征维度,提高网络效率,可选地,参见图3,本实施例提供的卷积神经网络的结构为输入层INPUT-卷积层C1-下采样层S2-卷积层C3-下采样层S4-全连接层FC5-全连接层FC6-输出层OUTPUT,其中,各层处理复杂造型GRC板块图像的结果如图4所示,需要说明的是,本实施例并不仅限于此,在能实现相同功能的情况下,可以增加卷积层与下采样层的层数来对卷积神经网络的结构做适当的调整。

(5)在下采样层和全链接层分别使用Sigmoid函数和ReLu函数作为激活函数,最终输出卷积神经网络提取的特征图像集I;

具体地,由于每层下采样层的输出特征需要通过激活函数提高网络以及决策函数的非线性特性,所以在构建卷积神经网络的下采样层和全链接层时,分别使用Sigmoid函数和ReLu函数作为激活函数,其中,Sigmoid函数式为:

式中,x表示下采样层的输出数据,S(x)表示Sigmoid函数的输出值;

ReLu函数式为:

f(x)=max(0,x); (8)

式中,x表示全链接层的输出数据,f(x)表示ReLu函数的输出值。

通过上述两个激活函数,在整个卷积神经网络中引入非线性部分,可以增加卷积神经网络的表达能力。

需要说明的是,卷积神经网络在使用的过程中,有一个重要的训练过程,即先对输入的数据进行前向计算,然后再反向计算并校验前向计算中的误差,并根据误差求各个权重和偏置的偏导数,进一步根据偏导数对各个权重,偏置以及相关参数进行校验与调整。

具体地,卷积层与下采样层为一对一非重叠采样,故误差计算公式为:

式中,l表示卷积层,l+1层表示下采样层,up(x)表示升采样操作,即,使得第l+1层的大小扩展和第l层大小一样,其中,下采样层中的权重全都等于常量B,f'(·)表示激活函数f(·)的偏导数,表示每个元素相乘。

进一步地,通过对所有误差中的项目求和来计算出偏置的梯度,则,偏置的导数为:

式中,b表示偏置参数,j表示第j个图像特征,l表示层次,uv表示梯度的两个方向,

由于权重的梯度通过反向传播计算,故对与权重相关的所有梯度求和,得到卷积核的参数k的导数为:

式中,表示第l层第j个特征图像与第l-1层第i个特征图像相连所对应的核,是一个矩阵;表示第l-1层第i个特征图像在卷积过程中被乘过的区域块。

卷积神经网络中卷积层的权重更新过程本质是卷积核的更新过程,一条连接权重的更新量为该条连接的前层神经元的兴奋输出乘以后层神经元的输入错误信号,卷积核的更新也是按照这个规律来进行,具体通过以下公式更新权重。

wj←wj+△wj;>

式中,△w表示更新量,'valid'表示卷积过程,表示第l层第j个特征图像的误差信息,表示在第l层中第j个特征图像;Mj表示被选择的输入图集合;*号实质是让卷积核k在第l-1所有关联的特征图上作卷积运算,wj表示更新后的权重。

值得说明的是,构建的卷积神经网络可自动学习良好的复杂造型GRC板块图像特征,避免了人工选取特征的局限性,特征向量具有较好的鲁棒性,且数据量较小,易于计算,对于复杂造型GRC板块图像的识别具有较好的应用效果。

(6)计算特征图像集I中任意两幅图之间的相似度,得到匹配相似矩阵:

S(RA,CB)=mf/avg(Af,Bf)=S(RB,CA);>

式中,S表示相似矩阵;RA表示特征图像集I中的特征图像A在S中的行数,CB表示特征图像集I中的特征图像B在S中的列数,mf表示特征图像A和特征图像B匹配的特征个数,Af表示从特征图像A中提取的所有的特征个数,Bf表示从特征图像B中提取的所有的特征个数,avg(Af,Bf)表示特征图像A和特征图像B的平均特征个数;

(7)根据相似矩阵,通过PageRank算法计算所述特征图像集I与数据库中各复杂造型GRC板块标准图像的相似度,以得分作为衡量依据:

式中,r(p)表示特征图像集I中特征图像p的得分,βp表示所有指向特征图像P的图像集合,r(Q)表示图像Q的得分,|Q|表示所有指向特征图像p的图像集合中的图像Q所有链出的链接个数;值得说明的是,图像Q所有链出的链接个数,指图像Q指向的所有图像个数。

具体地,PageRank算法基于随机游走模型的思想,即,将网页看成结点,则网页之间存在着的链接就可以看作是结点间相邻的边,那么,边的权重大小和该网页的权重以及网页中的链接个数有关,当模型达到稳定时有:

式中,du是页面u的出度,p(u)代表页面u被访问的概率,E[u,v]代表从u到v的超链接个数,优选地,对上述公式改写可得:

则,对于特征图像P,求PageRank得分r(p)如下:

式中,r(p)表示特征图像集I中特征图像p的得分,βp表示所有指向特征图像P的图像集合,r(Q)表示图像Q的得分,|Q|表示所有指向特征图像p的图像集合中的图像Q所有链出的链接个数,由于需要进行迭代计算,则,当存在n个页面p1,p2,...,pn时,首先随机给每个图像一个初始分数,如:然后通过迭代计算PageRank得分:

则可得改进的VisualRank排序算法公式如下:

式中,t表示迭代次数,d表示阻尼系数,n表示图像集中的图像个数,P表示随机从图像集合中挑选某幅图像的概率,令权值向量的初始值表示为xT=(1,1,…1),其中1的个数用n表示,计算第t次和第t-1次中得到的x值间的欧氏距离,若这个欧氏距离小于某个提前设定的阈值,则停止迭代过程,得到最终的排序结果,值得说明的是,得分表示特征图像与原数据库中复杂造型GRC板块图像的相似程度,得分越高,相似性越大。

(8)将所有得分按照高低顺序排列,得分越高表示相似度越高,找到数据库中相似度最高的GRC板块标准图像所对应的ID,根据所述ID得到复杂造型GRC板块的相关信息并生成二维码发送给用户,以使用户通过手机扫描所述二维码获取相关信息,其中,复杂造型GRC板块图像如图5所示。

参见图6,用户通过扫描所述二维码获取相关信息包括有GRC编号、工程名称、厂家、批次、生产日期、长度、宽度以及出厂图片等信息。

实施例2

本实施例提供一种复杂造型GRC板块图像的识别系统,包括:

第一单元:用于采集需要识别的复杂造型GRC板块图像,采用方向梯度直方图算法对所述复杂造型GRC板块图像进行预处理;

第二单元:用于采用卷积神经网络提取预处理后的复杂造型GRC板块图像的图像特征,得到特征图像集I,其中,所述卷积神经网络中的相邻卷积层和下采样层之间使用公式(1)和公式(2)对卷积层的输出数据进行处理:

式中,表示初步处理后的数据,k表示卷积层输出数据的维度,x表示卷积层的输出数据,x(k)表示卷积层的输出数据的第k维;E[x(k)]表示卷积层第k维所有输出的数据的平均值;表示卷积层第k维所有输出的数据的标准差;

式中,参数γ和β的初始值采用随机取值,然后在反向计算与校验的训练过程中求出最佳值;y(k)表示引入参数进行最终处理后数据;

且所述卷积神经网络中的下采样层使用公式(3)提取图像特征:

O=(∑∑I(i,j)p×G(i,j))1/p;>

式中,i表示图像特征的长度像素、j表示图像特征的宽度像素,p表示下采样层输出数据的维度,I表示输入的复杂造型GRC板块图像,G代表高斯核,1≤P≤∞,当P=l,上式为均值采样;当P→∞时,上式为最大值采样;

第三单元:用于计算所述特征图像集I与数据库中各复杂造型GRC板块标准图像的相似度,将数据库中相似度最高的GRC板块标准图像所对应的相关信息输出给用户。

上述各单元的具体处理过程可参照上述方法实施例,不再赘述。

如上所述,本发明提供一种复杂造型GRC板块图像的识别方法和系统,首先采用方向梯度直方图算法对需要识别的复杂造型GRC板块图像进行预处理,然后通过卷积神经网络提取预处理后的复杂造型GRC板块图像的图像特征得到特征图像集I,并通过PageRank算法计算所述特征图像集I与数据库中各复杂造型GRC板块标准图像的相似度,将数据库中相似度最高的GRC板块标准图像所对应的相关信息输出给用户。该方法和系统通过卷积神经网络可以自动学习良好的GRC板块图像特征,避免了人工选取特征的局限性,且在卷积神经网络中通过特定计算公式对卷积层的输出数据进行处理,提高了数据的稳定性,使网络加快收敛,提高了速度,进而提高分类的有效性,增加了系统的鲁棒性。

以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号