公开/公告号CN112801942A
专利类型发明专利
公开/公告日2021-05-14
原文格式PDF
申请/专利权人 广西慧云信息技术有限公司;
申请/专利号CN202011632531.4
申请日2020-12-31
分类号G06T7/00(20170101);G06K9/46(20060101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);
代理机构45128 南宁东之智专利代理有限公司;
代理人戴燕桃;汪治兴
地址 530007 广西壮族自治区南宁市高新区创新路23号9号楼三层
入库时间 2023-06-19 10:58:46
技术领域
本发明涉及图像识别领域,特别涉及一种基于注意力机制的柑橘黄龙病图像识别方法。
背景技术
柑橘黄龙病是当前全球柑橘生产中最具毁灭性的病害,由柑橘黄龙病韧皮部杆菌引起,以携带柑橘黄龙病病原菌的柑橘种苗为传播途径,以柑橘木虱等为传播媒介。世界上近50个国家和地区的柑橘种植区已受感染,曾重创美国佛罗里达、巴西圣保罗以及中国广东、广西等柑橘重要产区,至今仍未找到根治柑橘黄龙病的方法。世界各国农业部门对柑橘黄龙病的防治极为重视,2020年9月15日,柑橘黄龙病被农业农村部列入一类农作物病虫害名录。
早诊断早处理,柑橘黄龙病检测对于防控工作至关重要,目前主要有几种检测方法:PCR检测,通过仪器设备检测柑橘体内病原体DNA序列是否与黄龙病DNA序列一致,需专业机构鉴定,检测效率较低;利用无人机高光谱遥感进行大面积检测,成本较高;基于计算机视觉方案由于低成本、高效率的特点,近年来被广泛用于病虫害识别,但柑橘黄龙病的病害特征属于细粒度特征,通用的图像识别算法识别率较低。
发明内容
本发明针对背景技术存在的不足,提供一种基于注意力机制的柑橘黄龙病图像识别方法,从而克服柑橘黄龙病的病害特征属于细粒度特征,通用的图像识别算法识别率较低的缺陷。
为实现目的,本发明提供了一种基于注意力机制的柑橘黄龙病识别方法,包括以下步骤:
采集柑橘黄龙病图像数据作为正样本和采集非黄龙病图像数据作为负样本,按病害类别分为训练集、验证集与测试集;
建立图像分类网络,所述图像分类网络包括输入层、特征提取模块、注意力机制模块、特征融合模块及输出层;输入层用于接收所述正样本和负样本;特征提取模块用于通过神经学习网络自动提取柑橘黄龙病的特征图;注意力机制模块用于将特征图生成注意力图;特征融合模块,用于将所述特征图与所述注意力图进行特征融合得到特征矩阵;输出层用于将所述特征矩阵转换为分类预测向量输出;
设计中心损失函数和交叉熵损失函数,采用中心损失函数监督注意力图学习柑橘黄龙病特征的过程,采用交叉熵损失函数监督所述分类预测向量的分类过程;
将所述训练集输入所述图像分类网络,采用所述中心损失函数和交叉熵损失函数进行监督训练,训练过程中将所述验证集输入至训练好的所述图像分类网络进行验证;
将训练好的网络参数加载至初始的所述图像分类网络,将所述测试集的病叶与病果图像数据依次输入至该图像分类网络进行测试,以得到柑橘黄龙病图像分类结果。
优选地,上述技术方案中,所述输入层用于将柑橘黄龙病图像缩放至448x448x3,并归一化至[-1,1]。
优选地,上述技术方案中,所述特征提取模块采用Inception v3网络结构,对所述输入层的柑橘黄龙病图像数据进行特征提取,输出26x26x768尺寸的特征图F,其中26x26表示特征图F的宽高,768为特征图F通道数。
优选地,上述技术方案中,所述注意力机制模块由1x1卷积层、BatchNormalization层和ReLU层组成,输入为26x26x768尺寸的特征图F,输出为26x26x32的注意力图A,其中26x26表示注意力图A的宽高,32表示注意力图A通道数,记作M,每个注意力图A通道可对应柑橘黄龙病的一个特征区域。
优选地,上述技术方案中,所述特征融合模块的输入为特征图F和注意力图A,如公式(1)所示,分别将注意力图A的每一个通道A
F
f
优选地,上述技术方案中,所述输出层的输入为特征矩阵P,对特征矩阵P进行L2范数归一化,随后进行flatten操作,转换为24576维特征向量,并输入至一个通道数为类别数6的全连接层,最终得到6维分类预测向量作为输出。
优选地,上述技术方案中,采用交叉熵损失函数CE Loss监督所述分类预测向量的分类过程具体包括:先将6维预测向量输入至CE Loss函数进行交叉熵损失的计算,CE Loss函数如公式(4)所示,其中,x
采用中心损失函数Center Loss监督注意力图学习柑橘黄龙病特征的过程具体包括:如公式(5)所示,f
通过公式(6)对特征中心
CE Loss=-x
与现有技术相比,本发明提供一种基于注意力机制的柑橘黄龙病图像识别方法,与现有柑橘黄龙病图像识别做法相比,根据柑橘黄龙病的叶片斑驳黄化以及果蒂附近着色、果顶部分不着色的视觉特征,通过引入注意力机制模块,自主选择柑橘黄龙病的关键特征,基于图像识别实现低成本、高效率、识别率高的柑橘黄龙病检测方案,并提升了柑橘黄龙病模型的分类效果。
附图说明
图1为本发明实施例的图像分类流程图。
图2为本发明实施例的网络结构图。
具体实施方式
下面结合附图,对本发明的具体实施方式进行详细描述,但应当理解本发明的保护范围并不受具体实施方式的限制。
该实施例中的基于注意力机制的柑橘黄龙病图像识别方法的主要设计思路如下:
(1)数据集制作:收集柑橘黄龙病的病叶与病果数据作为正样本,以及其他非黄龙病的数据作为负样本,按病害类别进行分类,并按0.8:0.1:0.1的比例随机划分为训练集、验证集与测试集。
(2)构建一种基于注意力机制的图像分类网络:由输入层、特征提取模块、注意力机制模块、特征融合模块、输出层组成。
(3)设计损失函数:采用交叉熵损失CE Loss与中心损失Center Loss联合损失函数,CE Loss负责监督分类过程。
(4)模型训练:将训练集输入至步骤(2)中的基于注意力机制的图像分类网络,采用步骤(3)中的损失函数进行监督训练,训练过程中,将验证集输入至训练好的模型进行验证。
(5)模型推理:将步骤(4)中训练好的模型参数加载至步骤(2)基于注意力机制的图像分类网络,并将步骤(1)中测试集的柑橘黄龙病图像依次输入至网络进行推理,得到柑橘黄龙病图像分类结果。
更为具体地,参考图1,基于注意力机制的柑橘黄龙病图像识别方法,包括以下步骤:
步骤S1,收集柑橘黄龙病的病叶与病果数据作为正样本,以及其他非黄龙病的数据作为负样本,按病害类别进行分类,并按0.8∶0.1∶0.1的比例随机划分为训练集、验证集与测试集;
步骤S2,构建一种基于注意力机制的图像分类网络,如图2所示:由输入层、特征提取模块、注意力机制模块、特征融合模块、输出层组成:
输入层:将步骤S1中的柑橘黄龙病图像缩放至448x448x3,并归一化至[-1,1],加快模型训练收敛速度。
特征提取模块的作用是通过神经网络自动提取柑橘黄龙病的视觉特征图。更为具体地,特征提取模块采用Inception v3网络结构,对输入层的图像数据进行特征提取,输出26x26x768尺寸的特征图,记作F,其中26x26表示特征图F的宽高,768为特征图F通道数。
注意力机制模块的作用是从特征提取模块输出的特征图F中生成注意力图,记作A。注意力机制模块由1x1卷积层、Batch Normalization层和ReLU层组成,输入为26x26x768尺寸的特征图F,输出为26x26x32的注意力图A,其中26x26表示注意力图A的宽高,32表示注意力图A通道数,记作M,为人工设置的参数。每个注意力图A通道可对应柑橘黄龙病的一个特征区域,例如柑橘果蒂附近着色的区域,可通过模型训练,自主选择柑橘黄龙病的关键特征。
特征融合模块的作用是将特征提取模块输出的特征图F与注意力机制模块输出的注意力图A进行特征融合。特征融合模块的输入为特征提取模块输出的特征图F以及注意力机制模块输出的注意力图A,如公式(1)所示,分别将注意力图A的每一个通道A
F
f
输出层模块的作用是将特征融合模块的特征矩阵P映射到分类预测向量。具体而言,输出层的输入为特征融合模块输出的特征矩阵P,对P进行L2范数归一化,随后进行flatten操作,转换为24576维特征向量,并输入至一个通道数为类别数6的全连接层,最终得到6维分类预测向量作为输出。
步骤S3,设计损失函数:采用交叉熵损失函数CE Loss与中心损失函数CenterLoss的联合损失函数,CE Loss函数负责监督分类过程。先将步骤S2中输出层的6维预测向量输入至CE Loss函数进行交叉熵损失的计算,CE Loss如公式(4)所示,其中,x
CenterLoss函数负责监督注意力机制的学习过程,如公式(5)所示,f
CE Loss=-x
步骤S4,将训练集输入至步骤S2中的基于注意力机制的图像分类网络,采用步骤S3中的损失函数进行监督训练,训练过程中,将验证集输入至训练好的模型进行验证。
步骤S5,将步骤S4中训练好的模型参数加载至步骤S2基于注意力机制的图像分类网络,并将步骤S1中测试集的柑橘黄龙病图像依次输入至网络进行推理,得到柑橘黄龙病图像分类结果。
综上,该实施例中的基于注意力机制的柑橘黄龙病图像识别方法,与现有柑橘黄龙病图像识别做法相比,根据柑橘黄龙病的叶片斑驳黄化以及果蒂附近着色、果顶部分不着色的视觉特征,通过引入注意力机制模块,自主选择柑橘黄龙病的关键特征,基于图像识别实现低成本、高效率、识别率高的柑橘黄龙病检测方案,并提升了柑橘黄龙病模型的分类效果。
前述对本发明的具体示例性实施方案的描述是为了说明和例证的目的。这些描述并非想将本发明限定为所公开的精确形式,并且很显然,根据上述教导,可以进行很多改变和变化。对示例性实施例进行选择和描述的目的在于解释本发明的特定原理及其实际应用,从而使得本领域的技术人员能够实现并利用本发明的各种不同的示例性实施方案以及各种不同的选择和改变。本发明的范围意在由权利要求书及其等同形式所限定。
机译: CCTV一种基于深度学习的CCTV图像识别方法
机译: 一种基于信号离散的图像识别方法
机译: 基于分层图像分割的特征提取方法和装置以及基于图像的位置识别方法