公开/公告号CN112215082A
专利类型发明专利
公开/公告日2021-01-12
原文格式PDF
申请/专利权人 广东技术师范大学;
申请/专利号CN202010978200.X
申请日2020-09-17
分类号G06K9/00(20060101);G06K9/40(20060101);G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);
代理机构44299 广州恒华智信知识产权代理事务所(普通合伙);
代理人姜宗华
地址 510665 广东省广州市天河区中山大道西293号
入库时间 2023-06-19 09:32:16
技术领域
本发明涉及植物叶片图像识别领域,特别涉及一种植物叶片图像识别方法。
背景技术
大自然中约有40万种植物,其中,已经有超过25万种被命名并将其信息结构录入数据库,植物在人类生存活动中充当着重要角色,比如农学、环境学、医学等领域。
植物的分类与识别通常采取的方式是选取植物的局部特征(如植物的叶、花、果、茎、枝条等)进行分类和识别,因为植物叶片相比于其他的器官,其存活时间较长并且方便采集,所以植物叶片常作为植物的识别特征和认识植物的主要参照器官;而且叶形、纹理、脉络等也是研究植物物种的形态变异和分化的重要指标,因此以叶片作为切入点的植物识别是最直接有效且最简单的方法。
传统的植物识别是人工辨识法,随着计算机技术和模式识别算法的发展,取代人工辨识法的是基于图像识别植物种类,现有的图像识别方法的特点是通过相关算法在叶片图像中提取对应的特征,然后对提取的特征分类,进而实现对应植物的分类,这种识别方法使用了传统机器学习算法,虽然所需样本较少,识别过程明确,但其局限是会导致高度依赖专家对叶片特征知识的掌握程度和分析能力,计算过程和提取难度大,缺乏统一预定义的最佳特征参数。随着深度学习的发展与应用,卷积神经网络对图像识别具有突出效果,在植物叶片识别应用中,卷积神经网络不需要人为划分提取特征,该模型直接对叶片图像数据进行学习训练并提取特征,实验结果表明此方法准确率和稳定性均显著提高。但是,深度学习模型需要大数据支撑,选择合适的模型与数据至关重要,而且对于植物叶片数据来说通常是高维复杂、特征参数较多,易导致深度学习网络训练时间长久、准确率不稳定、过拟合等现象,所以卷积神经网络识别图像的效果取决于深度学习网络的训练,也就是植物叶片数据的处理,因此,需要设计一种能够在植物叶片识别中有效降低数据复杂度并保留特征信息的植物叶片图像识别方法,可以高效地实现植物叶片图像识别。
发明内容
本发明提供一种植物叶片图像识别方法,能够在植物叶片识别中有效降低数据复杂度并保留特征信息,高效地实现植物叶片图像识别。
本发明提供了一种植物叶片图像识别方法,包括以下步骤:
获取若干种植物的叶片图像数据集;其中,每一种植物的叶片图像数据集含有60-80张叶片图像;
将所述若干种植物的叶片图像数据集包含的叶片图像数据均进行归一化预处理;
将所述归一化预处理后的叶片图像数据进行深度矩阵分解,以保留叶片图像数据的目标特征信息;
将深度矩阵分解之后的叶片图像数据输入卷积神经网络中进行学习训练,得到深度学习模型;
将待识别植物的叶片图像输入所述深度学习模型中,识别出待识别植物的种类。
优选地,所述将所述若干种植物的叶片图像数据集包含的叶片图像数据均进行归一化预处理,包括以下步骤:
采用Python对所述叶片图像数据的jpg格式、灰度化、像素值的统一进行处理,并将处理后的叶片图像数据分为训练集和验证集,训练集和验证集的比例为8:2。
优选地,所述将所述若干种植物的叶片图像数据集包含的叶片图像数据均进行归一化预处理之后,该方法还包括以下步骤:
通过自适应中值滤波算法对所述归一化预处理后的叶片图像数据进行去噪处理;
将所述归一化预处理后的叶片图像数据进行深度矩阵分解,以保留叶片图像数据的目标特征信息,具体为:
将所述去噪处理后的叶片图像数据进行深度矩阵分解,以保留叶片图像数据的目标特征信息。
优选地,所述自适应中值滤波算法去噪的算法流程包括A和B两种,其中,
A:A
If A
Else increase the window size;
If the increased size is≤S
Otherwise,directly output Z
B:B
If B
Else outputZ
其中,S
优选地,所述深度矩阵分解模型如下:
优选地,所述卷积神经网络模型如下:模型由10层构成,输入图像数据为X×X,激活函数为“relu”,该模型结构可用于输入(X,X,1)-C1(20、5、5、1)-P1(2,2,“same”)-C2(20、5、5、1)-P2(2,2,“same”)-C3(20、5、5、1)-P3(2,2,“same”)-fc(1024)-fc(786)-fc(128)-fc(8),其中C(20、5、5、1)是一个卷积过程中每个通道的卷积核,步长为1,并采用“0”填充的方式铺满特征图的边界。
优选地,fc为全连接层生成输出向量,每个输出向量包含相应的单位,并在fc(786)-fc(128)两层加入Dropout(0,5)以防止过拟合。
与现有技术相比较,本发明的有益效果如下:
本发明将深度矩阵分解与卷积神经网络相结合,通过卷积神经网络可以简化图像识别的流程,将数据输入深度学习神经网络模型就可以直接得到识别结果,识别效率和准确率都得到提高;通过深度矩阵分解可以有效的解决由于叶片图像数据高维复杂、特征参数较多而导致的网络训练时间长久、准确率不稳定、过拟合等问题,能够有效降低数据的复杂度并保留特征信息,高效地实现植物叶片图像识别。
附图说明
此处所说明的附图用来提供对本发明的进一步理解,构成本申请的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。附图中:
图1是本发明实施例一的一种植物叶片图像识别方法的流程图;
图2是本发明实施例一的自适应中值滤波效果对比图;
图3是本发明实施例一的深度矩阵分解示意图;
图4是本发明实施例一的深度矩阵分解效果对比图;
图5是本发明实施例一的卷积神经网络结构图;
图6是本发明实施例一的自适应中值滤波流程图;
图7是本发明实施例一的植物样本图。
具体实施方式
为了使本发明的技术方案和实现方法更加清楚,下面将结合本发明附图以及优选的实施例对其实现过程进行详细描述。但所描述的实施例仅仅是本发明一部分实施例,基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例一
本发明实施例一提供了一种植物叶片图像识别方法,图1是根据本发明实施例一的一种植物叶片图像识别方法的流程图,如图1所示,包括以下步骤:
步骤S101:获取若干种植物的叶片图像数据集;
本发明实施例中,上述若干种植物的每一种植物的叶片图像数据集含有60-80张叶片图像;如图7所示为本实施例获取的部分植物叶片的样本图;
步骤S102:将若干种植物的叶片图像数据集包含的叶片图像数据均进行归一化预处理;
本发明实施例中,上述步骤S102的具体实施方式为采用Python对叶片图像数据的jpg格式、灰度化、像素值进行处理,使其统一,并将处理后的叶片图像数据分为训练集和验证集,训练集和验证集的比例为8:2;
步骤S103:通过自适应中值滤波算法对归一化预处理后的叶片图像数据进行去噪处理;
本发明实施例中,中值滤波的基本原理为:通过把数字图像或者数字序列中一点的值用该点的一个邻域中各点值的中值代替,让周围的像素值接近真实值,从而消除孤立的噪声点,具体方法是用某种结构的二维滑动模板,将板内像素值的大小进行排序生成单调上升或单调下降的二维数据序列,二维中值滤波输出为:g(x,y)=med{f(x-k,y-l),(k,l∈w)},其中,f(x,y),g(x,y)分别为原始图像和处理后图像,w为二维模板,通常为2×2,3×3区域,也可以是不同的形状,如线状、圆形、十字形、圆环形等;如图2所示为灰度化后的其中一种植物图像数据经过不同大小窗口中值滤波后的效果对比图,可以看出经过中值滤波后的图像变得平滑,但是窗口的过大会导致图像模糊化,不利于识别分类,因此本发明采取自适应中值滤波能够很好地解决此问题,保留了图像的完整性;
本发明实施例中,上述自适应中值滤波算法去噪的算法流程包括A和B两种,其中,
A:A
If A
Else increase the window size;
If the increased size is≤S
Otherwise,directly outputZ
B:B
If B
Else outputZ
其中,S
步骤S104:将去噪处理后的叶片图像数据进行深度矩阵分解,以保留叶片图像数据的目标特征信息;
本发明实施例中,通过上述步骤S104将去噪处理后的叶片图像数据进行深度矩阵分解,可以保留叶片图像数据的主要特征信息,降低数据复杂度,为后续网络训练减少参数并提高效率和稳定性;深度矩阵分解的示意图如图3所示,深度矩阵分解的效果图如图4所示,从图4可以看出,随着特征参数的减少,效率会有所提高,但是准确率会下降,可见特征参数去除过多也不利于卷积神经网络的识别,所以本发明通过深度矩阵分解来保留叶片图像数据的主要特征信息,这样有利于效率和准确率同时得到提高;
本发明实施例中,上述深度矩阵分解模型如下:
进一步的,在深度矩阵分解模型的训练中,初始化数据矩阵X≈Z
步骤S105:将深度矩阵分解之后的叶片图像数据输入卷积神经网络中进行学习训练,得到深度学习模型;
本发明实施例中,卷积神经网络结构如图5所示,卷积神经网络模型如下:模型由10层构成,输入图像数据为X×X,激活函数为“relu”,该模型结构可用于输入(X,X,1)-C1(20、5、5、1)-P1(2,2,“same”)-C2(20、5、5、1)-P2(2,2,“same”)-C3(20、5、5、1)-P3(2,2,“same”)-fc(1024)-fc(786)-fc(128)-fc(8),其中C(20、5、5、1)是一个卷积过程中每个通道的卷积核,步长为1,并采用“0”填充的方式铺满特征图的边界;所有池化层(2×2)均采用最大池化的方式,可以有效地避免失真;
fc为全连接层生成输出向量,每个输出向量包含相应的单位,并在fc(786)-fc(128)两层加入Dropout(0,5)以防止过拟合;最后,采用softmax回归函数表示类隶属度的概率估计每一个图像。模型训练过程可以设置epochs=20,batchsize=30,并采用Adam优化器,将学习率设为0.0001;
步骤S106:将待识别植物的叶片图像输入深度学习模型中,识别出待识别植物的种类。
综合上述,通过上述实施例,本发明将深度矩阵分解与卷积神经网络相结合,通过卷积神经网络可以简化图像识别的流程,将数据输入深度学习神经网络模型就可以直接得到识别结果,识别效率和准确率都得到提高;通过深度矩阵分解可以有效的解决由于叶片图像数据高维复杂、特征参数较多而导致的网络训练时间长久、准确率不稳定、过拟合等问题,能够有效降低数据的复杂度并保留特征信息,高效地实现植物叶片图像识别。
机译: “财产识别方法”(“ PIM”)是一种新颖的算法,通过该算法,可以通过对文件(如市议会/房屋价格通知)进行图像处理来创建房地产管理局和/或产权转让数据。本发明建立了一种独特的算法,该算法结合了诸如深度学习分段和计算机视觉之类的技术来解码属性信息。该应用程序利用以某种方式配置的计算机实现的技术,以使运输商和房地产经纪人能够自动创建客户端文件。
机译: 带有多个图像的水印的防伪全息膜,一种制造方法和一种水印识别方法,可通过水印轻松识别是否有真相膜的安全产品
机译: 一种图像识别方法。