首页> 中国专利> 基于通道重要性剪枝与二值量化的图像分类系统

基于通道重要性剪枝与二值量化的图像分类系统

页面导航

摘要
著录项
说明书
相似文献

摘要

一种基于通道重要性剪枝与二值量化的图像分类系统，包括训练模块，用于训练初始复杂神经网络的权重参数，得到训练后的复杂神经网络模型；压缩模块，用于对训练后的复杂神经网络模型重复进行基于通道重要性的网络剪枝与恢复性训练，在保证精度的前提下，得到初步压缩的神经网络模型；接着对初步压缩的神经网络模型进行二值量化，从而得到精简的神经网络模型；分类模块，用于将压缩后的神经网络模型，用于对目标图像进行图像分类。本发明缩小神经网络的模型体积，提高运行速度。

著录项

公开/公告号CN113177580A

专利类型发明专利
公开/公告日2021-07-27

原文格式PDF
申请/专利权人浙江大学;
展开▼

申请/专利号CN202110395377.1
发明设计人潘赟;惠思琦;朱怀宇;
展开▼

申请日2021-04-13
分类号G06K9/62(20060101);G06N3/04(20060101);G06N3/08(20060101);
代理机构33241 杭州斯可睿专利事务所有限公司;
代理人王利强
地址 310027 浙江省杭州市西湖区浙大路38号
入库时间 2023-06-19 12:00:51

说明书

技术领域

本发明涉及机器学习和图像分类技术领域，尤其是涉及一种基于通道重要性剪枝与二值量化的图像分类系统。

背景技术

神经网络是一种深度监督学习下的机器学习模型，通过组合低层特征逐步提取图像的高级特征，在计算机视觉，包括图像分类、物体识别、语义分割与目标跟踪等领域中，得到广泛应用。但是，神经网络需要庞大的存储空间与计算资源，这极大的限制了深度神经网络在资源受限的边缘平台上的应用。

近些年来，神经网络的压缩与加速逐渐称为研究热点，其中，网络剪枝通过剪枝掉神经网络中重要性较低的通道或卷积核，从而实现网络参数的压缩与推理速度的提升；二值量化通过将浮点参数量化为{-1，+1}，并将卷积运算替换成加法运算，从而缩小网络体积，提升计算速率。

现有图像分类方法使用神经网络存在内存占用与计算量过大的弊端。

发明内容

为了克服图像分类方法使用神经网络内存占用与计算量过大的不足，本发明提出了一种基于通道重要性剪枝与二值量化的图像分类方法，缩小神经网络的模型体积，提高运行速度。

为了解决上述技术问题本发明提供如下的技术方案：

一种基于通道重要性剪枝与二值量化的图像分类系统，所述图像分类系统包括：

训练模块，用于训练初始复杂神经网络的权重参数，得到训练后的复杂神经网络模型；

压缩模块，用于对训练后的复杂神经网络模型重复进行基于通道重要性的网络剪枝与恢复性训练，在保证精度的前提下，得到初步压缩的神经网络模型；接着对初步压缩的神经网络模型进行二值量化，从而得到精简的神经网络模型；

分类模块，用于将压缩后的神经网络模型，用于对目标图像进行图像分类。

进一步，所述压缩模块中，依据神经网络中各个通道重要性对神经网络进行剪枝，剔除冗杂通道；通过恢复性训练，减少因网络剪枝造成的性能下降，并反复进行剪枝、恢复性训练，得到精简的神经网络；对剪枝后的精简网络进行二值量化，并利用正则函数项与“热身”策略，减少量化过程的误差波动，进而得到极致压缩的神经网络。

再进一步，依据神经网络中各个通道重要性对神经网络进行剪枝，剔除冗杂通道，过程为：

神经网络中，各通道的重要性计算方法为：

其中，

再进一步，对剪枝后的神经网络进行二值量化，并利用正则函数项与“热身”策略，减少量化过程的误差波动，进而得到极致压缩的神经网络，其中，精心设计的正则函数项为：

其中，J(W

其中，所述“热身”策略通过在训练过程中逐步增加二值权重正则项系数β从而减少训练过程中二值权重的正负翻转，进而减少量化过程中的误差波动，所述正则项系数变化情况为：

其中，β为正则项系数，β

本发明的技术效果主要表现在：图像分类系统使用的神经网络，依据神经网络中各个通道重要性对神经网络进行剪枝，剔除冗杂通道；通过恢复性训练，减少因网络剪枝造成的性能下降并反复进行剪枝、恢复性训练，直至获得精简的神经网络；对剪枝后的精简网络进行二值量化，并利用正则函数项与“热身”策略，减少量化过程的误差波动，进而得到极致压缩的神经网络；缩小神经网络的模型体积，提高运行速度。

附图说明

图1是本发明中基于通道重要性剪枝与二值量化的图像分类系统的模块结构示意图。

图2是本发明基于通道重要性剪枝与二值量化的神经网络压缩方法的流程图；

图3是本发明中正则函数项图例，其中，(a)是全精度卷积层正则项，(b)是二值化卷积层正则项。

具体实施方式

下面将结合附图，对本发明方法中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明的一部分实施例，而不是全部实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都应属于本发明保护的范围。

参照图1～图3，一种基于通道重要性剪枝与二值量化的图像分类方法，所述图像分类系统包括：

训练模块，用于训练初始复杂神经网络的权重参数，得到训练后的复杂神经网络模型；

压缩模块，用于对训练后的复杂神经网络模型重复进行基于通道重要性的网络剪枝与恢复性训练，在保证精度的前提下，得到初步压缩的神经网络模型；接着对初步压缩的神经网络模型进行二值量化，从而得到精简的神经网络模型；分类模块，用于将压缩后的神经网络模型，用于对目标图像进行图像分类。

进一步，所述压缩模块中，首先，依据神经网络中各个通道重要性对神经网络进行剪枝，剔除冗杂通道；急着，通过恢复性训练，减少因网络剪枝造成的性能下降，并反复进行剪枝、恢复性训练，直至获得精简的神经网络；最后，对剪枝后的精简网络进行二值量化，并利用正则函数项与“热身”策略，减少量化过程的误差波动，进而得到极致压缩的神经网络。

如图2所示，本发明基于通道重要性剪枝与二值量化的神经网络压缩方法，包括以下步骤：

1)通过计算每层卷积网络层中各通道的重要性，并对重要性较低的通道进行剪枝；

2)通过恢复性训练，减少因网络剪枝造成的性能下降，并重复步骤1)与步骤2)，直至得到精简的全精度神经网络；

3)对剪枝后的神经网络，除第一层与最后一层网络参数保持浮点数外，对余下网络层的权重参数进行二值量化，并利用正则函数项，减少量化过程的误差波动，进而得到极致压缩的神经网络。

所述步骤1)中，通过计算每层卷积网络层中各通道的重要性，进而剪枝掉冗杂的通道，所述各通道重要性计算方法为：

其中，

所述步骤2)中，通过在原数据集上重新训练，从而减少因网络剪枝造成的网络性能下降，并重复步骤1中的剪枝与步骤2中的恢复性训练，直至得到极致压缩的神经网络。

所述步骤3)中，对剪枝后的神经网络结构，除第一层与最后一层网络参数保持浮点数外，对余下网络层的权重参数进行二值量化，并利用正则函数项与“热身”策略，在训练过程中，对各个卷积层的参数进行约束，减少量化过程的误差波动，进而得到极致压缩的神经网络，所述正则函数项为：

其中，J(W

所述“热身”策略通过在训练过程中逐步增加二值权重正则项系数β从而减少训练过程中二值权重的正负翻转，进而减少量化过程中的误差波动，所述正则项系数变化情况为：

其中，β为正则项系数，β

基于上述方法，本发明采用采用VGG-18在CIFAR-10与SVHN数据集上进行验证，结果如表1，表1为CIFAR-10与SVHN数据集剪枝效果：

表1

以上所述，仅为本发明的具体实施方式，但本发明的保护范围并不局限于此，任何熟悉本技术领域的技术人员在本发明揭露的技术范围内，可轻易想到各种等效的修改或替换，这些修改或替换都应涵盖在本发明的保护范围之内。因此，本发明的保护范围应以权利要求的保护范围为准。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 基于通道重要性剪枝与二值量化的图像分类系统 [P] . 中国专利： CN113177580A . 2021-07-27
2. 一种基于模型剪枝的轻量化图像分类方法、系统及设备 [P] . 中国专利： CN112668630A . 2021-04-16
3. Method, system and article of manufacturing for converting data values quantified using a first measurement unit into equivalent data values when quantified using a second measurement unit in order to receive query results including data values measured using at least one of the first and second measurement units [P] . 美国专利： US7246116B2 . 2007-07-17

机译：方法，系统和制造品，用于在使用第二测量单元量化时将使用第一测量单元量化的数据值转换为等效数据值，以便接收包括使用第一和第二测量单元中至少一个测量的数据值的查询结果
4. System and Methods for Efficiently Implementing a Convolutional Neural Network Incorporating Binarized Filter and Convolution Operation for Performing Image Classification [P] . 美国专利： US2019286953A1 . 2019-09-19

机译：有效实现结合了二值化滤波和卷积运算的卷积神经网络进行图像分类的系统和方法
5. System and methods for efficiently implementing a convolutional neural network incorporating binarized filter and convolution operation for performing image classification [P] . 美国专利： US10311342B1 . 2019-06-04

机译：用于有效实现结合了二值化滤波器和卷积运算以进行图像分类的卷积神经网络的系统和方法