首页> 中国专利> 一种基于机器学习的自然环境下绿色番茄识别方法

一种基于机器学习的自然环境下绿色番茄识别方法

摘要

本发明公开了一种基于机器学习的自然环境下绿色番茄识别方法,包括S1.获取待识别图像,并对待识别图像进行预处理;S2.对预处理后的图像使用多尺度滑动窗口进行检测,截取图像子图,将图像子图统一缩放后提取HOG特征向量;S3.基于HOG特征向量使用SVM模型对图像子图分类判断,获取候选框;S4.通过非极大值抑制算法对候选框进行选择,最终得到绿色番茄识别结果。本发明通过计算HOG特征,使用SVM模型实现对自然环境下绿色番茄果实识别,解决了绿色番茄果实颜色和环境极为相似、环境背景复杂,传统的图像分割算法无法准确识别绿色番茄的技术问题,识别效果好,准确率高。

著录项

  • 公开/公告号CN113239837A

    专利类型发明专利

  • 公开/公告日2021-08-10

    原文格式PDF

  • 申请/专利权人 华南农业大学;

    申请/专利号CN202110559489.6

  • 申请日2021-05-21

  • 分类号G06K9/00(20060101);G06K9/36(20060101);G06K9/62(20060101);G06N20/00(20190101);

  • 代理机构11465 北京慕达星云知识产权代理事务所(特殊普通合伙);

  • 代理人符继超

  • 地址 510642 广东省广州市天河区五山路483号

  • 入库时间 2023-06-19 12:10:19

说明书

技术领域

本发明涉及果实识别技术领域,更具体的说是涉及一种自然环境下绿色番茄识别方法。

背景技术

机器学习的发展与应用,促进了现代农业向智能化方向发展。其中,果蔬的目标检测是实现作物生长监测、农药变量喷施和果蔬自动采收等智能化生产的关键技术之一。

目前,在番茄果实的识别方面,研究集中在对成熟番茄果实的识别以及温室内番茄识别,对自然环境下的绿色番茄果实的识别研究较少。绿色番茄果实颜色呈绿色,与枝叶的细节特征相似,传统的图像分割算法无法准确识别出番茄;此外自然环境下背景较复杂,尤其是光照不均、重叠和遮挡等现象增加了绿色番茄果实目标检测难度,使用传统的颜色分析法对绿色番茄果实分割,效果很差。

因此,如何在自然环境下对绿色番茄进行准确识别是本领域技术人员亟需解决的问题。

发明内容

有鉴于此,本发明提供了一种基于机器学习的自然环境下绿色番茄识别方法,通过计算HOG特征,使用SVM模型实现对自然环境下绿色番茄果实识别。

为了实现上述目的,本发明采用如下技术方案:

一种基于机器学习的自然环境下绿色番茄识别方法,包括以下步骤:

S1.获取待识别图像,并对待识别图像进行预处理;

S2.对预处理后的图像使用多尺度滑动窗口进行检测,截取图像子图,将图像子图统一缩放后提取HOG特征向量;

S3.基于HOG特征向量使用SVM模型对图像子图分类判断,获取候选框;

S4.通过非极大值抑制算法对候选框进行筛选,获得绿色番茄识别结果。

优选的,所述方法还包括SVM模型的训练,所述步骤S3之前对SVM模型进行训练,使用训练后的SVM模型对图像子图进行分类判断。

优选的,SVM模型的训练包括以下步骤:

(1)收集一定数量的番茄果实图像及背景图像作为训练集,将番茄果实图像设为正样本,背景图像设为负样本;

(2)对训练集图像统一归一化为36*36大小,将归一化处理后的训练集图像转换为灰度图像,并进行伽马校正;

(3)对伽马校正后的训练集图像计算图像梯度,包括水平方向上的梯度和竖直方向上的梯度,以及每个像素处梯度的方向和幅值,计算公式如下:

G

G

α(x,y)=arctan9G

其中,x,y分别表示为像素横坐标和纵坐标,G

(4)计算梯度直方图,提取HOG特征;

(5)根据训练集图像的HOG特征值得到训练样本集D,

D={(m

(6)将训练样本集D输入到SVM模型中,利用超平面将正样本和负样本最大间隔分开,超平面表达式为:w

n

采用线性核函数对SVM模型进行训练,得到最优模型并保存为xml文件。

优选的,步骤(4)计算梯度直方图,提取HOG特征具体包括以下步骤:

a.将训练集图像分为9*9个cell,每个cell含4*4个像素,根据每个cell中梯度的方向和幅值进行直方图统计,梯度直方图角度范围共分成9个bin,对应0~180度的梯度方向,每20度一个bin;

b.将2*2个cell组成一个block,针对block对训练集图像进行扫描,扫描步长为一个cell;

c.将每个block中的cell梯度直方图进行串联并进行归一化处理,最后将所有block的HOG特征串联起来。

优选的,步骤S1中对待识别图像进行预处理包括以下步骤:

S11.将获取的待识别图像由RGB颜色模型转换为HSV颜色模型;

S12.使用阈值分割法对HSV颜色模型图像进行分割;

S13.将分割后的HSV颜色模型图像转化为灰度图像,并对灰度图像进行伽马校正。

优选的,步骤S11中所述待识别图像尺寸为300*300。

优选的,步骤S2使用多尺度滑动窗口进行检测,具体步骤包括,滑动窗口初始尺寸设为300*300,每遍历一次图像滑动窗口边长缩小到之前的3/4,直到小于36*36。

优选的步骤S4中非极大值抑制算法具体步骤包括,

S41.从候选框中选取置信度最高的候选框;

S42.遍历置信度最高候选框以外的所有其他待检测候选框,分别和置信度最高候选框进行交并比IOU计算,公式如下:

IOU=(A∩B)/(A∪B)

式中A表示其他待检测候选框的面积,B表示置信度最高候选框的面积;

S43.设置阈值为:0.5,将交并比IOU高于阈值的候选框删除,得到包含绿色番茄最终结果的候选框。

经由上述的技术方案可知,本发明公开了一种基于机器学习的自然环境下绿色番茄识别方法,与现有技术相比具有以下有益效果:

1、本发明克服了绿色番茄识别颜色与枝叶的细节特征相似以及自然环境下背景复杂的技术问题,相对于传统识别方法,识别效果更好,准确率更高。

2、本发明建立的模型体积较小,能够应用到各种嵌入式设备及绿色番茄采摘机器人上,应用范围广。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。

图1附图为本发明提供的方法步骤流程图;

图2附图为本发明实施例提供的绿色番茄果实识别效果图,

其中图2(a)为绿色番茄果实识别去除部分背景效果图,图2(b)为绿色番茄果实识别最终效果图;

图3附图为本发明实施例提供的SVM模型训练集图像,

其中图3(a)为训练集正样本图,图3(b)为训练集负样本图.

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例公开了一种基于机器学习的自然环境下绿色番茄识别方法,包括:

S1、获取待识别图像,待识别图像尺寸为300*300,并对待识别图像进行预处理:将待识别图像由RGB颜色模型转换为HSV颜色模型,转换公式为:

使用阈值分割法对待识别图像进行分割,将像素值在(26,43,46)~(99,255,255)区间的将像素值统一设定为(255,255,255),其它区间的像素值设定为(0,0,0)作为分割图像,将分割图像与原图进行与操作去除原图像的部分背景,如图2(a)所示。将图像转化为灰度图像,并对图像进行伽马校正。

S2、对预处理后的图像使用多尺度滑动窗口进行检测,采用多尺度滑动窗口在图像滑动截取子图,滑动窗口初始尺寸设为300*300,每遍历一次图像滑动窗口边长缩小到之前的3/4,直到小于36*36。对于滑动窗口截取的子图统一缩放到36*36,提取HOG特征向量。

S3、将上一步中获取的HOG特征向量放入到训练好的SVM模型进行判别,最终得到多个候选框。

S4、通过非极大值抑制算法对候选框进行筛选,获得包含绿色番茄最终结果的候选框,如图2(b)所示,具体流程为:

遍历所有其它候选框,分别和置信度最高候选框进行交并比(IOU)计算,公式如下:IOU=(A∩B)/(A∪B),A,B分别表示待检测候选框和置信度最高候选框的面积,将高于阈值0.5的候选框删除。对未处理的候选框依次进行上一步处理。其中,置信度表示为测试样本到SVM模型超平面的距离,离分界面越远的点置信度越大,从候选框中选取置信度最高的候选框。

本实施例中SVM模型训练过程如下:

(1)收集2000张番茄果实图像和2000张背景图像作为训练集,果实图像设为正样本如图3(a)所示,背景图像设为负样本如图3(b)所示。

(2)将训练集图像都归一化为36*36大小。将图像转换为灰度图像,去除图像中的颜色信息。对图像进行伽马矫正,减小光照因素的影响。

(3)计算图像梯度,分别计算图像在水平和竖直方向上的梯度,并计算每个像素处梯度的方向和幅值,计算公式如下:

G

G

α(x,y)=arctan(G

(4)将图像分为9*9个cell,每个cell含4*4个像素,根据cell中梯度的方向和幅值进行直方图统计,直方图共分成9个bin,对应0~180度的梯度方向,每20度一个bin。

2*2个cell组成一个block,用block对图像进行扫描,扫描步长为一个cell,将每个block中的cell梯度直方图进行串联并进行归一化处理,最后将所有block的特征串联起来。

(5)提取完图像的HOG特征后得到训练样本集D,m为特征向量,n为标签值,正样本n=1,负样本n=-1。

D={(m

(6)将训练样本集D输入到线性SVM模型中进行训练,SVM模型分类基本思想是基于训练集D找到一个超平面,从而将正样本和负样本最大间隔分开,超平面表达式为:w

w为超平面最优法向量,w

n

采用线性核函数训练SVM模型,SVM模型训练完最优模型C参数为:0.01,将训练完的SVM模型保存为xml文件。

本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。

对所公开的实施例的上述说明,使本领域专业技术人员能够实现或使用本发明。对这些实施例的多种修改对本领域的专业技术人员来说将是显而易见的,本文中所定义的一般原理可以在不脱离本发明的精神或范围的情况下,在其它实施例中实现。因此,本发明将不会被限制于本文所示的这些实施例,而是要符合与本文所公开的原理和新颖特点相一致的最宽的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号