首页> 中国专利> 提高卷积神经网络识别精度的方法

提高卷积神经网络识别精度的方法

摘要

本发明提供一种提高卷积神经网络识别精度的方法,包括以下步骤:将原始样本转化为灰度图;得到x个扫描角度的灰度梯度图;建立灰度梯度图和第1卷积层的全连接层。构建新的卷积神经网络模型架构。优点为:在保证所构建得到的新的卷积神经网络模型架构对原尺寸图片可训练的情况下,还明显降低光照对卷积神经网络模型架构识别精度的影响,提高卷积神经网络模型架构的鲁棒性和识别精度。

著录项

  • 公开/公告号CN105550750A

    专利类型发明专利

  • 公开/公告日2016-05-04

    原文格式PDF

  • 申请/专利权人 长沙网动网络科技有限公司;

    申请/专利号CN201510967554.3

  • 发明设计人 袁家劼;

    申请日2015-12-21

  • 分类号G06N3/08;

  • 代理机构北京市盛峰律师事务所;

  • 代理人席小东

  • 地址 410013 湖南省长沙市高新开发区麓景路2号长沙科技成果转化基地创优楼三楼405房

  • 入库时间 2023-12-18 15:54:55

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-10-17

    授权

    授权

  • 2016-06-01

    实质审查的生效 IPC(主分类):G06N3/08 申请日:20151221

    实质审查的生效

  • 2016-05-04

    公开

    公开

说明书

技术领域

本发明属于人工智能和模式识别技术领域,具体涉及一种提高卷积神经网 络识别精度的方法。

背景技术

卷积神经网络(ConvolutionalNeuralNetwork,CNN)是一种前馈神经网络, 与传统的BP神经网络相比,具有识别效率高、旋转缩放不变性好等优点,已在 数字及人脸识别等各个领域得到了广泛的应用。

卷积神经网络模型的应用原理可大致描述如下:

首先,根据待输入图像的属性设计卷积神经网络模型架构,所设计的卷积 神经网络模型架构为多层结构,包括1个输入层,在输入层之后,按各种顺序排 布有若干个卷积层和若干个降采样层,最后为输出层。其中,输入层用于接收 原始图像;每个卷积层包括多个相同尺寸的特征图,并且,每个特征图的像素, 对应于前一层指定的若干特征图相应窗口位置的像素集合;每个降采样层包括 多个相同尺寸的特征图,并且,降采样层的每张特征图,对应于前一层卷积层 的一张特征图,降采样层的特征图像素对应于前一层相应特征图的采样区域。 某一层节点与前一层节点和后一层节点之间通过边相互连接。

在搭建得到上述具有特定网络架构的卷积神经网络模型后,当需要识别某 一图片时,需要对上述的卷积神经网络模型进行训练,训练过程为:初始化卷 积神经网络模型的参数为随机值,包括:边的权重值以及卷积核的值等;然后, 将训练样本输入卷积神经网络模型,对卷积神经网络模型反复“刺激”,不断调整 边的权重值以及卷积核的值等,直到训练得到可识别该图片的卷积神经网络模 型。在后续应用中,只需要将待分析图片或其他样本输入到训练好的卷积神经 网络模型中,即可达到分类和智能识别的目的。

然而,发明人在研究过程中发现,在得到可识别某一特定特征图片的已训 练好的卷积神经网络模型后,该卷积神经网络模型对特征图片的亮度较为敏感, 当特征图片的亮度发生变化时,会降低卷积神经网络模型的识别精度。例如, 对于多张均包含特征图片但亮度存在区别的图片,在将其输入到已训练好的卷 积神经网络模型后,已训练好的卷积神经网络模型仅可将部分图片识别出来, 而无法识别出其他图片,从而降低了卷积神经网络模型的识别精度。

发明内容

针对现有技术存在的缺陷,本发明提供一种提高卷积神经网络识别精度的 方法,可有效解决上述问题。

本发明采用的技术方案如下:

本发明提供一种提高卷积神经网络识别精度的方法,包括以下步骤:

步骤1:已知一种用于识别w*h尺寸样本的可训练的卷积神经网络模型架构; 其中,w为样本的长度;h为样本的宽度;已知可训练的卷积神经网络模型架构 的模型架构参数均已知,特别包括以下模型架构参数:在输入层之后的第1个卷 积层中,包括的特征图数量为n,第1卷积层所采用的卷积核尺寸为m*m;其中, n和m均为自然数;

步骤2:对于待分类识别的尺寸同样为w*h的原始样本,将其记为原始样本 C1,首先将原始样本C1转化为灰度图;

步骤3,设定x个扫描角度,分别为A1、A2…Ax

对步骤2得到的灰度图分别在A1、A2…Ax方向进行扫描,得到灰度图分别在 A1、A2…Ax方向形成的灰度梯度图B1、B2…Bx

步骤4,对于每个灰度梯度图Bi,其中,i∈(1、2…x),其尺寸必然小于w*h, 因此,对灰度梯度图Bi进行边界修复处理,将灰度梯度图Bi的尺寸修复到w*h, 从而得到灰度梯度图Bi’;

因此,将灰度梯度图B1、B2…Bx进行修复后得到的灰度梯度图,依次记为 B1’、B2’…Bx’;

步骤5,对于灰度梯度图B1’,分别采用n个尺寸为m*m的卷积核进行特征图 映射,得到n个特征图,依次记为:a11、a12…、a1n

对于灰度梯度图B2’,分别采用n个尺寸为m*m的卷积核进行特征图映射,得 到n个特征图,依次记为:a21、a22…、a2n

依此类推

直到对于灰度梯度图Bx’,分别采用n个尺寸为m*m的卷积核进行特征图映 射,得到n个特征图,依次记为:ax1、ax2…、axn

然后,合并特征图a11、a21…ax1,将合并得到的特征图记为特征图E1;

合并特征图a12、a22…ax2,将合并得到的特征图记为特征图E2;

依此类推

直到合并特征图a1n、a2n…axn,将合并得到的特征图记为特征图En;

至此,得到n个特征图,分别为特征图E1、特征图E2…特征图En;

此时可以看到,所得到的特征图E1、特征图E2…特征图En的尺寸与已知可 训练的卷积神经网络模型架构的第1个卷积层的特征图尺寸相等;所得到的特征 图E1、特征图E2…特征图En的数量与已知可训练的卷积神经网络模型架构的第1 个卷积层的特征图数量相等;

步骤6,构建新的卷积神经网络模型架构,其中,所述新的卷积神经网络模 型架构的第1层为输入层,用于输入尺寸为w*h的待分类识别的样本;

新的卷积神经网络模型架构的第2层为图片灰度层,只有一个节点,为步骤 2得到的灰度图;

新的卷积神经网络模型架构的第3层为灰度梯度层,共有x个节点,为步骤3 形成的修复后的灰度梯度图,即:灰度梯度图B1’、灰度梯度图B2’…灰度梯度图 Bx’;

新的卷积神经网络模型架构的第4层为第1卷积层,共有n个节点,为步骤5 计算得到的特征图,即:特征图E1、特征图E2…特征图En;

此外,灰度梯度图B1’、灰度梯度图B2’…灰度梯度图Bx’分别与特征图E1、 特征图E2…特征图En建立全连接;

新的卷积神经网络模型架构的第5层为已知可训练的卷积神经网络模型架 构的第2层;

新的卷积神经网络模型架构的第6层为已知可训练的卷积神经网络模型架 构的第3层;

依此类推,步骤1已知可训练的卷积神经网络模型架构的后续模型架构参数 对应增加到新的卷积神经网络模型架构的对应层,直到将已知可训练的卷积神 经网络模型架构的输出层增加到新的卷积神经网络模型架构的输出层为止;

由此构建得到高鲁棒性和高识别精度的新的卷积神经网络模型架构,并且, 所构建得到的新的卷积神经网络模型架构对于尺寸为w*h的样本必然是可训练 和可收敛的。

优选的,步骤3中,x值为2,分别进行水平X方向扫描和竖直Y方向扫描。

优选的,x值为4,分别进行0度、45度、90度和135度的扫描。

优选的,步骤4中,对灰度梯度图Bi进行边界修复处理具体为:在灰度梯度 图Bi的边界增加像素值为0的像素点,从而将灰度梯度图Bi的尺寸修复到w*h。

本发明提供的提高卷积神经网络识别精度的方法具有以下优点:

在保证所构建得到的新的卷积神经网络模型架构对原尺寸图片可训练的情 况下,还明显降低光照对卷积神经网络模型架构识别精度的影响,提高卷积神 经网络模型架构的鲁棒性和识别精度。

附图说明

图1为传统卷积神经网络模型架构图;

图2为采用传统卷积神经网络模型架构进行训练的结果图;

图3为本发明构建得到的卷积神经网络模型架构进行训练的结果图。

具体实施方式

为了使本发明所解决的技术问题、技术方案及有益效果更加清楚明白,以 下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述 的具体实施例仅用以解释本发明,并不用于限定本发明。

实施例一:

本发明提供一种提高卷积神经网络识别精度的方法,包括以下步骤:

步骤1:已知一种用于识别w*h尺寸样本的可训练的卷积神经网络模型架构; 其中,w为样本的长度;h为样本的宽度;已知可训练的卷积神经网络模型架构 的模型架构参数均已知,特别包括以下模型架构参数:在输入层之后的第1个卷 积层中,包括的特征图数量为n,第1卷积层所采用的卷积核尺寸为m*m;其中, n和m均为自然数;

步骤2:对于待分类识别的尺寸同样为w*h的原始样本,将其记为原始样本 C1,首先将原始样本C1转化为灰度图;

步骤3,设定x个扫描角度,分别为A1、A2…Ax

对步骤2得到的灰度图分别在A1、A2…Ax方向进行扫描,得到灰度图分别在 A1、A2…Ax方向形成的灰度梯度图B1、B2…Bx

所设定的扫描角度的数量根据实际应用需求而灵活设置,可以设计为2个扫 描角度,分别进行水平X方向扫描和竖直Y方向扫描。也可以设计为4个方向的 扫描角度,分别进行0度、45度、90度和135度的扫描。

步骤4,对于每个灰度梯度图Bi,其中,i∈(1、2…x),其尺寸必然小于w*h, 因此,对灰度梯度图Bi进行边界修复处理,将灰度梯度图Bi的尺寸修复到w*h, 从而得到灰度梯度图Bi’;

因此,将灰度梯度图B1、B2…Bx进行修复后得到的灰度梯度图,依次记为 B1’、B2’…Bx’;

步骤5,对于灰度梯度图B1’,分别采用n个尺寸为m*m的卷积核进行特征图 映射,得到n个特征图,依次记为:a11、a12…、a1n

对于灰度梯度图B2’,分别采用n个尺寸为m*m的卷积核进行特征图映射,得 到n个特征图,依次记为:a21、a22…、a2n

依此类推

直到对于灰度梯度图Bx’,分别采用n个尺寸为m*m的卷积核进行特征图映 射,得到n个特征图,依次记为:ax1、ax2…、axn

然后,合并特征图a11、a21…ax1,将合并得到的特征图记为特征图E1;

合并特征图a12、a22…ax2,将合并得到的特征图记为特征图E2;

依此类推

直到合并特征图a1n、a2n…axn,将合并得到的特征图记为特征图En;

至此,得到n个特征图,分别为特征图E1、特征图E2…特征图En;

此时可以看到,所得到的特征图E1、特征图E2…特征图En的尺寸与已知可 训练的卷积神经网络模型架构的第1个卷积层的特征图尺寸相等;所得到的特征 图E1、特征图E2…特征图En的数量与已知可训练的卷积神经网络模型架构的第1 个卷积层的特征图数量相等;

步骤6,构建新的卷积神经网络模型架构,其中,所述新的卷积神经网络模 型架构的第1层为输入层,用于输入尺寸为w*h的待分类识别的样本;

新的卷积神经网络模型架构的第2层为图片灰度层,只有一个节点,为步骤 2得到的灰度图;

新的卷积神经网络模型架构的第3层为灰度梯度层,共有x个节点,为步骤3 形成的修复后的灰度梯度图,即:灰度梯度图B1’、灰度梯度图B2’…灰度梯度图 Bx’;

新的卷积神经网络模型架构的第4层为第1卷积层,共有n个节点,为步骤5 计算得到的特征图,即:特征图E1、特征图E2…特征图En;

此外,灰度梯度图B1’、灰度梯度图B2’…灰度梯度图Bx’分别与特征图E1、 特征图E2…特征图En建立全连接;

新的卷积神经网络模型架构的第5层为已知可训练的卷积神经网络模型架 构的第2层;

新的卷积神经网络模型架构的第6层为已知可训练的卷积神经网络模型架 构的第3层;

依此类推,步骤1已知可训练的卷积神经网络模型架构的后续模型架构参数 对应增加到新的卷积神经网络模型架构的对应层,直到将已知可训练的卷积神 经网络模型架构的输出层增加到新的卷积神经网络模型架构的输出层为止;

由此构建得到高鲁棒性和高识别精度的新的卷积神经网络模型架构,并且, 所构建得到的新的卷积神经网络模型架构对于尺寸为w*h的样本必然是可训练 和可收敛的。

本发明提供一种提高卷积神经网络识别精度的方法,其核心思想为:对原 有的已知卷积神经网络模型架构进行改进,在其输入层和第1卷积层之间增加 图片灰度层、灰度梯度层;其中,灰度梯度层由x个角度形成的x个灰度梯度 图组成;然后,使输入层与图片灰度层的输入端相连;而图片灰度层的输出端 分别与x个灰度梯度图的输入端连接,而每一个灰度梯度图均与原有卷积神经 网络模型架构中第1个卷积层的多个特征图连接,也就是建立灰度梯度层和原 有卷积神经网络模型架构中第1个卷积层之间的全连接,而原有卷积神经网络 模型架构中后续其他模型结构参数保持不变,继续引入到新的卷积神经网络中, 从而构建得到新的卷积神经网络。

上述方法的优点为:

(1)将原始图片转化为多个角度的灰度梯度图后,既使不同待识别图片的 亮度存在差异,但其灰度梯度通常保持不变,因此,以灰度梯度图作为识别对 象后,可降低由图片亮度不同而导致的神经网络识别率降低的问题,从而提高 卷积神经网络的鲁棒性能和识别精度;尤其是对色彩不敏感卷积神经网络,更 能显示提高其智能识别准确率。

(2)通过在灰度梯度层和原有卷积神经网络模型架构中第1个卷积层之间 建立全连接后,假如,假设灰度梯度层共存在x个灰度梯度图,而原有卷积神 经网络模型架构中第1个卷积层共存在n个特征图,则需采用n*x倍的卷积核; 而原有卷积神经网络模型架构中第1个卷积层只需要采用n个卷积核,可见, 新网络第1卷积层所采用的卷积核数量是原有网络第1卷积层所采用的卷积核 数量的x倍,而所采用的卷积核数量越多,其模型精度越高,因此,本发明提 高了原有卷积神经网络模型架构的识别精度。

实施例:

为进一步对本发明理解,以下介绍一种具体的实施例:

对于28*28的原始图片,采用图1所示的卷积神经网络模型架构进行训练, 可得到图2所示的训练结果图。

而对于同一张28*28的原始图片,采用本发明提供的方法,第1层为输入层; 然后将其转换为灰度图,形成第2层;再设定水平X向和垂直Y向两个扫描方向, 对灰度图进行水平X向和垂直Y向的扫描,形成水平向的灰度梯度图和垂直向的 灰度梯度图,即为第3层;第4层为图1的第1卷积层;第5层为图1的第2层,依此 类推,构建得到新的卷积神经网络模型架构;采用新的卷积神经网络模型架构 进行训练,可得到图3所示的训练结果图。

对比图2和图3可以看出,采用本发明提供的方法构建新的卷积神经网络模 型架构并进行训练时,其图像识别精度显著高于传统方法。

以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通 技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰, 这些改进和润饰也应视本发明的保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号