首页> 中国专利> 基于Att-3CRB-Unet网络的指静脉图像分割方法及装置

基于Att-3CRB-Unet网络的指静脉图像分割方法及装置

摘要

本发明涉及一种基于Att‑3CRB‑Unet网络的指静脉图像分割方法及装置,所述的指静脉图像分割方法包括:1)制作用于训练指静脉图像分割模型的训练集;2)将所述训练集中的指静脉图像作为训练样本输入到带有注意力机制的Att‑3CRB‑Unet网络中,训练形成指静脉图像分割模型;3)通过所述指静脉图像分割模型对输入的指静脉图像进行分割,得到分割后的指静脉图像。本发明使用Att‑3CRB‑Unet网络,通过三次循环残差块(3CRB),获得了较好地模型学习效率;本发明在Att‑3CRB‑Unet网络的跳跃连接中使用注意力机制,使注意系数对指静脉图像上的局部区域具有特异性,通过减小噪声点权值,解决了图像分割结果中的少数背景噪声遮挡静脉像素点的问题,有利于提高图像分割性能。

著录项

  • 公开/公告号CN112183510A

    专利类型发明专利

  • 公开/公告日2021-01-05

    原文格式PDF

  • 申请/专利权人 北京圣点云信息技术有限公司;

    申请/专利号CN202011376389.1

  • 发明设计人 赵国栋;李学双;张烜;

    申请日2020-12-01

  • 分类号G06K9/00(20060101);G06K9/34(20060101);G06N3/04(20060101);

  • 代理机构33240 杭州君度专利代理事务所(特殊普通合伙);

  • 代理人乐俊

  • 地址 101400 北京市怀柔区雁栖经济开发区乐园大街17号2层

  • 入库时间 2023-06-19 09:29:07

说明书

技术领域

本发明涉及计算机视觉识别技术领域,具体涉及一种基于Att-3CRB-Unet网络的指静脉图像分割方法及装置。

背景技术

生物识别技术主要是指通过人类特征进行身份认证的一种技术。人类的生物特征通常具有唯一性、遗传性等特点,而指静脉识别技术就属于生物识别技术的一个分支。指静脉识别技术相对于传统的指纹识别、笔迹识别技术而言,其利用外部看不到的指静脉信息进行身份识别,具有极高的防伪性。但由于指静脉图像的采集可能受光照等外部环境以及生物自身比如受到重压等的影响,所采集的指静脉图像可能存在噪声干扰、偏光、低对比度等问题。对于这些受损的指静脉图像利用传统的阈值分割或最大曲率分割等图像分割方式难以提取出图像上的静脉细节特征,影响静脉识别的准确率。

发明内容

本发明以解决传统图像分割方式难以提取受损指静脉图像上的指静脉特征的问题为目的,提供了一种基于Att-3CRB-Unet的指静脉图像分割方法及装置。

为达此目的,本发明提供一种基于Att-3CRB-Unet网络的指静脉图像分割方法,包括:

1)制作用于训练指静脉图像分割模型的训练集;

2)将所述训练集中的指静脉图像作为训练样本输入到带有注意力机制的Att-3CRB-Unet网络中,训练形成指静脉图像分割模型;

3)通过所述指静脉图像分割模型对输入的指静脉图像进行分割,得到分割后的指静脉图像。

优选地,所述Att-3CRB-Unet网络包括编码模块和解码模块,所述指静脉图像输入到所述编码模块中,通过所述编码模块对指静脉进行特征编码,所述编码模块的输出作为所述解码模块的输入,所述解码模块对输入进行特征解码最终输出指静脉分割图,

所述编码模块中包括依序级联的第一编码层、第二编码层、第三编码层、第四编码层和第五编码层,每一编码层包括一3CRB三次循环残差块,前一编码层中的所述3CRB三次循环残差块通过一最大池化层与后一编码层中的所述3CRB三次循环残差块连接,所述第五编码层中的所述3CRB三次循环残差块的输出作为一第一上池化层的输入,所述第一上池化层的输出连接所述解码模块的输入。

优选地,所述解码模块包括依序级联的第一解码层、第二解码层、第三解码层和第四解码层,每一解码层包括一所述3CRB三次循环残差块,所述第一上池化层的输出作为所述第一解码层中的所述3CRB三次循环残差块的输入,前一解码层中的所述3CRB三次循环残差块通过一第二上池化层与后一解码层中的所述3CRB三次循环残差块连接,所述第四解码层中的所述3CRB三次循环残差块的输出连接一用于输出所述指静脉分割图的卷积层。

优选地,所述3CRB三次循环残差块中包含卷积层、BN层和ReLU层,所述3CRB三层循环残差块中的所述卷积层的输出连接所述BN层的输入,所述BN层的输出连接所述ReLU层的输入。

优选地,第

公式(1)中,

表示偏置项;

优选地,所述编码模块和所述解码模块之间设置带有注意力机制的跳跃连接。

优选地,所述注意力机制为加法注意力机制,所述加法注意力机制通过以下公式(2)(3)表达:

公式(3)中

公式(2)中,

公式(4)中,

公式(2)中的

公式(5)中,

优选地,采用Focal loss函数作为训练所述指静脉图像分割模型的损失函数,Focal loss函数通过以下公式(6)表达:

公式(6)中,

优选地,公式(6)中,α=0.25,γ=2。

本发明还提供了一种基于Att-3CRB-Unet网络的指静脉图像分割装置,包括:

1)数据集制作模块,制作用于训练指静脉图像分割模型的训练集;

2)模型训练模块,用于将所述训练集中的指静脉图像输入到带有注意力机制的Att-3CRB-Unet网络中,训练形成指静脉图像分割模型;

3)图像分割模块,用于通过所述指静脉图像分割模型对输入的指静脉图像进行分割,得到分割后的指静脉图像。

本发明具有以下有益效果:

1、本发明使用Att-3CRB-Unet网络,通过三次循环残差块(3CRB),获得了较好地模型学习效率;

2、本发明在Att-3CRB-Unet网络的跳跃连接中使用注意力机制,使注意系数对指静脉图像上的局部区域具有特异性,通过减小噪声点权值,解决了图像分割结果中的少数背景噪声遮挡静脉像素点的问题,有利于提高图像分割性能;

3、本发明采用Focal loss函数作为模型训练的损失函数,解决了模型学习中正负样本比例严重失衡的问题。

附图说明

图1是实施例1提供的指静脉图像分割方法的流程图;

图2是Att-3CRB-Unet网络的网络结构图;

图3是3CRB三次循环残差块的结构示意图;

图4是输入到所述指静脉图像分割模型进行指静脉特征识别的指静脉图像的示意图;

图5是原始的所述指静脉图像和经模型分割输出的分割图像的对比图;

图6是实施例2提供的指静脉图像分割装置的结构示意图。

具体实施方式

下面结合附图并通过具体实施方式来进一步说明本发明的技术方案,但本发明的保护范围并不限于此。

实施例1

一种基于Att-3CRB-Unet网络的指静脉图像分割方法,如图1所示,其包括:

1)制作用于训练指静脉图像分割模型的训练集;

2)将所述训练集中的指静脉图像作为训练样本输入到带有注意力机制的Att-3CRB-Unet网络中,训练形成指静脉图像分割模型;

3)通过所述指静脉图像分割模型对输入的指静脉图像进行分割,得到分割后的指静脉图像。

本发明用于训练指静脉图像分割模型的Att-3CRB-Unet网络的网络结构如图2所示,Att-3CRB-Unet网络包括编码模块和解码模块,指静脉图像输入到编码模块中,通过编码模块对指静脉进行特征编码,编码模块的输出作为解码模块的输入,解码模块对输入进行特征解码最终输出指静脉分割图,

具体地,如图2所示,编码模块中包括依序级联的第一编码层b1、第二编码层b2、第三编码层b3、第四编码层b4和第五编码层b5,每一编码层包括一3CRB三次循环残差块1,前一编码层中的3CRB三次循环残差块通过Maxpooling层2(最大池化层,其池化核尺寸优选为2×2)与后一编码层中的3CRB三次循环残差块1连接,第五编码层b5为编码模块中的最后一层编码层,第五编码层b5中的3CRB三次循环残差块1的输出作为一第一上池化层(Unpooling层)3的输入,第一上池化层3的输出连接解码模块的输入。

具体地,如图2所示,解码模块包括依序级联的第一解码层j1、第二解码层j2、第三解码层j3和第四解码层j4,每一解码层同样包括一3CRB三次循环残差块1,解码层中的3CRB三次循环残差块1和编码层中的3CRB三次循环残差块1的内部结构和内部的卷积层参数相同。第一上池化层3的输出作为第一解码层j1中的3CRB三次循环残差块1的输入,前一解码层中的3CRB三次循环残差块1通过一第二上池化层4(Unpooling层)与后一解码层中的3CRB三次循环残差块1连接。解码模块中的最后一层解码层也就是第四解码层j4中的3CRB三次循环残差块1的输出连接一用于输出指静脉分割图的卷积层5(该卷积层的卷积核尺寸为1×1)。

3CRB三次循环残差块的内部结构如图3所示,3CRB三次循环残差块中包含卷积层(图3中的Conv层,卷积核尺寸优选为3×3)、BN层和ReLU层,3CRB三次循环残差块的输入经卷积层的线性变换后,通过BN层的归一化处理,最后通过ReLU层进行非线性激活输出特征映射。本发明提供的3CRB三次循环残差模块是在现有的残差网络基础上改进而来,由于残差网络可以改善深度神经网络随着层数增多而出现的网络退化问题,在很大程度上能够避免出现梯度消失问题。而3CRB三次循环残差模块在残差网络的基础上,使用循环连接结构用于增强特征的传递,合并前后各层的输出特征,通过有效地使用输出特征图以及复用特征图,有利于对小数据样本集的特征提取。

以下结合图3对编码模块中各3CRB三次循环残差模块的循环连接结构,以及编码模块有效地使用每一编码层的输出特征图以及复用特征图的过程进行简要阐述:

3CRB三次循环残差模块是将前两层的卷积结果与本层的卷积结果的累加结果作为下一层的输入,该累加结果可通过以下公式(1)表示:

公式(1)中,

上述技术方案中,输入到第一编码层中的3CRB三次循环残差块的指静脉图像的特征通道数为64,每一编码层的输出经Maxpooling层的下采样后特征图的尺寸减小一半,但特征通道数增加一倍。每一解码层的输出经Unpooling层的上采样后特征图的尺寸增加一倍,通道数则减少一半。在输出分割图时,能够保证输出的图像与输入图像的尺寸保持一致。

为抑制背景噪声的特征响应,降低背景噪声对识别静脉形态的影响,提高模型的静脉分割性能,如图2所示,本发明在编码模块和解码模块之间设置带有注意力机制的跳跃连接。具体地,本发明在第一编码层b1和第四解码层j4之间、第二编码层b2和第三解码层j3之间、第三编码层b3和第二解码层j2之间以及第四编码层b4和第一解码层j1之间设置带有注意力机制的跳跃连接,本发明在跳跃连接中加入注意力模块6,并将该注意力模块6执行注意力机制的过程定义为:

其中,

优选地,加入到跳跃连接中的注意力机制为加法注意力机制(AGs),该加法注意力机制通过以下公式(2)(3)表达:

公式(3)中

公式(2)中,

公式(4)中,

公式(2)中的

公式(5)中,

为了解决深度学习中正负样本比例严重失衡的问题,本发明采用Focal loss函数作为训练指静脉图像分割模型的损失函数,Focal loss函数通过以下公式(6)表达:

公式(6)中,α表示平衡因子,经实验总结,α优选等于0.25;

γ表示loss因子,γ优选等于2;

图4是原始输入的指静脉图像的示意图。图5(a)是原始输入的指静脉图像,图5(b)是通过本发明训练的指静脉图像分割模型识别的静脉分割图,由图4和图5可知,相比于传统的图像分割方法,采用Att-3CRB-Unet网络训练的指静脉图像分割模型对于受损的指静脉图像实现了更好的分割性能,其提取的指静脉特征明显、细节突出,极大提高了指静脉识别的准确率。

实施例2

本发明还提供了一种基于Att-3CRB-Unet网络的指静脉图像分割装置,如图6所示,该装置包括:

1)数据集制作模块,制作用于训练指静脉图像分割模型的训练集;数据集制作模块用于实现实施例1步骤1)的功能。

2)模型训练模块,用于将所述训练集中的指静脉图像输入到带有注意力机制的Att-3CRB-Unet网络中,训练形成指静脉图像分割模型;模型训练模块用于实现实施例1步骤2)的功能。

3)图像分割模块,用于通过所述指静脉图像分割模型对输入的指静脉图像进行分割,得到分割后的指静脉图像。图像分割模块用于实现实施例1步骤3)的功能。

显然,本实施例的指静脉图像分割装置可以作为上述实施例1的指静脉图像分割方法的执行主体,因此能够实现该指静脉图像分割方法所实现的功能。由于原理相同,本文不再赘述。

需要声明的是,上述具体实施方式仅仅为本发明的较佳实施例及所运用技术原理。本领域技术人员应该明白,还可以对本发明做各种修改、等同替换、变化等等。但是,这些变换只要未背离本发明的精神,都应在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号