首页> 中国专利> 一种基于深度学习的生活垃圾分类方法

一种基于深度学习的生活垃圾分类方法

摘要

本发明涉及一种基于深度学习的生活垃圾分类方法。包括:建立生活垃圾数据集,采用数据增强方法扩充数据集;建立神经网络分类模型,使用幻象模块替换ResNet18残差单元的普通卷积,得到G‑ResNet18网络;将扩充后的数据集经过预处理操作后输入到G‑ResNet18网络进行分类训练;将待分类的生活垃圾图片经过预处理操作后输入到训练后的G‑ResNet18模型,输出分类结果;实验结果表明:G‑ResNet18网络在本实验数据集上的识别精度达到91.6%,识别精度提高了1%,网络的参数量减少了46%。本发明能在不降低网络识别精度的同时大大减少网络的参数量,可以应用于垃圾的智能分类。

著录项

  • 公开/公告号CN112364944B

    专利类型发明专利

  • 公开/公告日2022-07-05

    原文格式PDF

  • 申请/专利权人 福州大学;闽都创新实验室;

    申请/专利号CN202011502665.4

  • 申请日2020-12-18

  • 分类号G06V10/764(2022.01);G06V10/774(2022.01);G06V10/82(2022.01);G06K9/62(2022.01);G06N3/04(2006.01);

  • 代理机构福州元创专利商标代理有限公司 35100;福州元创专利商标代理有限公司 35100;

  • 代理人钱莉;蔡学俊

  • 地址 350108 福建省福州市闽侯县福州大学城乌龙江北大道2号福州大学

  • 入库时间 2022-08-23 13:58:26

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-07-05

    授权

    发明专利权授予

说明书

技术领域

本发明涉及深度学习图像分类算法应用研究领域,特别是一种基于深度学习的生活垃圾分类方法。

背景技术

根据中国城乡建设统计年鉴统计,我国城市生活垃圾的产生量由1979年的0.25亿吨增至2018年的2.28亿吨。随着人民生活水平的提高,垃圾产生量仍在上升。有效回收生活垃圾成为急需解决的问题,这对于可持续发展具有重大的意义。垃圾分类是回收的前提。目前,我国垃圾分类主要以人工分拣为主,存在劳动强度大,效率低等缺点。实现垃圾分拣的智能化与自动化具有重要的意义。垃圾图片分类算法有助于实现垃圾分拣的智能化与自动化。

近年来,越来越多的专家学者对垃圾分类算法进行了研究与实践。吴建等人使用传统的计算机视觉方法,手动提取特征,识别实验室废物垃圾。黄惠玲等人提出基于HSV的阈值分割算法和K均值聚类算法识别建筑垃圾图像。黄兴华等人提出基于纹理特征融合的道路垃圾图像识别算法。向伟等人提出改进的CaffeNet网络识别水面垃圾。但是缺乏针对生活垃圾图片分类算法的研究。目前,我国各城市全面推行垃圾分类制度,基本建立相应的法律法规和标准体系,将生活垃圾细分,大致可分为可回收垃圾、有害垃圾、厨余垃圾和其他垃圾四大类。针对我国垃圾分类现状,收集制作了小型生活垃圾数据集,选取经典网络ResNet18作为基础网络,使用GhostNet的幻象模块代替残差学习单元中的普通卷积,减少网络的参数量,提出基于幻象残差结构的垃圾图片分类算法。

发明内容

有鉴于此,本发明的目的是提出一种基于深度学习的生活垃圾分类方法,能在不降低网络识别精度的同时大大减少网络的参数量,可以应用于垃圾的智能分类。

本发明采用以下方案实现:一种基于深度学习的生活垃圾分类方法,包括以下步骤:

步骤S1:建立生活垃圾数据集,采用数据增强方法扩充训练数据集;

步骤S2:建立神经网络分类模型,将步骤S1扩充后的训练数据集经过预处理操作后输入到网络中进行分类训练,得到训练后的神经网络分类模型;

步骤S3: 将待分类的生活垃圾图片经过预处理操作后输入到步骤S2训练后的神经网络分类模型,输出分类结果。

进一步地,所述步骤S1的具体内容为:

采集不同大小、角度、光照下的常见生活垃圾图片作为数据集,将数据集打乱后按4:1随机划分为训练集和测试集。并采用随机水平翻转、随机垂直翻转、随机缩放、随机旋转、逆时针方向裁剪、水平偏移和竖直偏移的数据增强方法扩充训练数据。

进一步地,所述步骤S2具体包括以下步骤:

所述步骤S2具体包括以下步骤:

步骤S21:采用ResNet18作为基础网络,使用幻象模块Ghost Module替换ResNet18残差单元的普通卷积,得到幻象残差学习单元;通过顺序堆叠幻象残差学习单元得到G-ResNet18网络。

步骤S22:将步骤S1扩充后的训练数据集中的每张图像的大小统一缩放为(224 ,224)的大小,并将图像的每一个像素值乘以1/255,使每一个数值都处于0~1之间,获得预处理后的图像数据集;

步骤S23:将步骤S22预处理后得到图像数据集输入到步骤S21得到的G-ResNet18网络中进行分类训练,得到训练后的G-ResNet18模型即训练后的神经网络分类模型。

进一步地,所述步骤S3的具体内容为:

将待分类的生活垃圾图片缩放为(224 ,224)的大小后输入到训练后得到的神经网络分类模型中,输出分类结果。

与现有技术相比,本发明有以下有益效果:

本发明能在不降低网络识别精度的同时大大减少网络的参数量,可以应用于垃圾的智能分类。

附图说明

图1为本发明实施例的方法流程图。

图2为本发明实施例的幻象模块结构图。

图3为本发明实施例的幻象残差学习单元结构图。

图4为本发明实施例的幻象残差学习单元结构图。

图5为本发明实施例的G-ResNet18网络结构图。

具体实施方式

下面结合附图及实施例对本发明做进一步说明。

应该指出,以下详细说明都是示例性的,旨在对本申请提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本申请所属技术领域的普通技术人员通常理解的相同含义。

需要注意的是,这里所使用的术语仅是为了描述具体实施方式,而非意图限制根据本申请的示例性实施方式。如在这里所使用的,除非上下文另外明确指出,否则单数形式也意图包括复数形式,此外,还应当理解的是,当在本说明书中使用术语“包含”和/或“包括”时,其指明存在特征、步骤、操作、器件、组件和/或它们的组合。

如图1所示,本实施例提供了一种基于深度学习的生活垃圾分类方法,包括以下步骤:

步骤S1:建立生活垃圾数据集,采用数据增强方法扩充训练数据集;

步骤S2:建立神经网络分类模型,将步骤S1扩充后的训练数据集经过预处理操作后输入到网络中进行分类训练,得到训练后的神经网络分类模型;

步骤S3: 将待分类的生活垃圾图片经过预处理操作后输入到步骤S2训练后的神经网络分类模型,输出分类结果。

在本实施例中,所述步骤S1的具体内容为:

采集不同大小、角度、光照下的常见生活垃圾图片作为数据集,将数据集打乱后按4:1随机划分为训练集和测试集。并采用随机水平翻转、随机垂直翻转、随机缩放、随机旋转、逆时针方向裁剪、水平偏移和竖直偏移的数据增强方法扩充训练数据。本实验采集部分常见的生活垃圾图片构成数据集,类别和图片数量分别为废纸:579、易拉罐:568、茶叶渣:476、香蕉皮:421、烟蒂:478、口罩:502、一次性纸杯:506、纽扣电池:586。共8类,4116张图片;

在本实施例中,所述步骤S2具体包括以下步骤:

步骤S21:采用ResNet18作为基础网络,使用幻象模块Ghost Module(说明书附图2)替换ResNet18残差单元的普通卷积,得到幻象残差学习单元。当步长为1时,幻象残差学习单元如说明书附图3所示,当步长为2时,幻象残差学习单元如说明书附图4所示。通过顺序堆叠幻象残差学习单元得到G-ResNet18网络(说明书附图5);ResNet18网络的参数量为11186624, G-ResNet18网络的参数量为6063424,参数量减少了46%。幻象模块替换普通卷积:幻象模块如说明书附图2所示,相比于普通卷积,幻象模块分三步走。首先采用卷积核个数减半的普通卷积操作生成真实特征层,然后将真实特征层做深度卷积(卷积核大小取3x3,步长取1)进行线性变换获得幻象特征层,再将真实特征层与幻象特征层拼接到一起组成完整的特征层。若普通卷积的卷积核个数为n,步长为stride,卷积核大小为kernel,则幻象模块的普通卷积部分卷积核个数为n/2,步长为stride, 卷积核大小为kernel。说明书附图3:输入特征图经过幻象模块、BatchNormalization层、ReLu激活函数、幻象模块后得到的特征图与原始输入特征图做相加操作后再经过BatchNormalization层、ReLu激活函数得到输出特征图。说明书附图4:输入特征图经过幻象模块、BatchNormalization层、ReLu激活函数、幻象模块后得到的特征图与原始输入特征图经过普通卷积(卷积核大小取1x1,步长同幻象模块的普通卷积步长,卷积核数量为幻象模块的普通卷积核数量的两倍)后得到的特征图做相加操作后再经过BatchNormalization层、ReLu激活函数得到输出特征图。说明书附图5:第1层为输入,第2层为普通卷积,第3层为最大池化,第4-11层为幻象模块,第12层为全局平均池化,第13层为全连接层加softmax分类器。

步骤S22:将步骤S1扩充后的训练数据集中的每张图像的大小统一缩放为(224 ,224)的大小,并将图像的每一个像素值乘以1/255,使每一个数值都处于0~1之间,获得预处理后的图像数据集;

步骤S23:将步骤S22预处理后得到图像数据集输入到步骤S21得到的G-ResNet18网络中进行分类训练,得到训练后的G-ResNet18模型即训练后的神经网络分类模型。G-ResNet18网络在本实验数据集上的测试识别精度达到91.6%,相比ResNet18网络在本实验数据集上的测试识别提高了1%。

在本实施例中,所述步骤S3的具体内容为:

将待分类的生活垃圾图片缩放为(224 ,224)的大小后输入到训练后得到的神经网络分类模型中,输出分类结果。

较佳的,本实施例提出一种基于深度学习的生活垃圾分类方法,能在不降低网络识别精度的同时大大减少网络的参数量,可以应用于垃圾的智能分类。

本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述仅为本发明的较佳实施例,凡依本发明申请专利范围所做的均等变化与修饰,皆应属本发明的涵盖范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号