基于组合三值量化的神经网络压缩算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

近年来，深度学习再次掀起了人工智能技术的浪潮，并被成功地应用于许多领域。然而以卷积神经网络为代表的深度学习模型，参数规模巨大且计算成本高昂，非常依赖GPU甚至GPU集群等高性能计算设备。这严重限制了深度学习模型部署应用在硬件资源有限的边缘计算场景中，因此对深度神经网络进行模型压缩成为目前的研究热点。量化作为卓有成效的压缩方法之一，使用低精度数值替代原始浮点参数，可以有效降低模型参数内存和计算能耗。当神经网络的权重和激活值都被量化到1bit或2bit时，加速效果最为显著。然而，量化比特数越低，伴随的计算误差越大，并且这些误差还会在神经网络的前向计算和反向传播时层层累加，从而不可避免地造成严重的精度损失。针对这一问题，采取合理的量化策略，在算法通用性、压缩能力和精度损失之间取得平衡，具有重要意义。本文在卷积神经网络的三值权重量化和激活值定点量化的基础上，做了以下相关工作：　　(1)提出了组合三值量化权重的算法，以多个尺度系数和三值权重的乘积组合量化卷积层权重。与直接量化相比，带尺度系数的二值或三值权重能够减小量化误差。组合三值量化虽然会增加少许参数和计算量，却能突破单个量化权重的局限，具有更好的拟合效果。　　(2)基于2bit定点量化，提出使用箱型图统计激活值张量的数据分布，截断其中的异常值。研究了直接定点量化激活值时，可能存在一些数值较大的离群点，导致大量信息在量化后被丢失。该方法可以使得量化前数据的分布更加均匀集中，让量化误差保持在正常范围之内。　　(3)结合权重和激活值量化策略，形成整体的卷积模型量化架构，根据反向传播算法，给出了量化架构的完整训练流程，并详细介绍了训练算法中的相关细节。在模型推断计算时，可以将绝大部分浮点数运算转换为更高效的定点整数运算。在图像识别任务中，对比原始浮点数模型和其他量化模型的预测准确度，该量化算法在保证通用性和压缩能力的同时，还能有效降低精度损失。

著录项

作者
杨佩龙;
展开▼
作者单位

湖南大学;

展开▼
授予单位湖南大学;
学科机械工程
授予学位硕士
导师姓名崔向阳;
年度 2020
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词
神经网络,压缩算法,组合三值量化,深度学习;

相似文献

中文文献
外文文献
专利

1. 基于等腰直角三角形的二值图像压缩算法研究 [J] . 邓江华 ,熊小红 . 黄冈师范学院学报 . 2007,第006期
2. 基于北斗三频组合观测值的精密定位算法研究 [J] . 郑欣芳 . 山西科技 . 2018,第001期
3. 基于三值神经网络的组合电路测试生成算法 [J] . 吴丽华 ,王旭东 ,沃晓丹 . 伺服控制 . 2011,第008期
4. 基于三值神经网络的组合电路测试生成算法 [J] . 赵莹 ,吴丽华 ,马怀俭 . 哈尔滨理工大学学报 . 2004,第004期
5. 基于差分量化局部二值模式的人脸反欺诈算法研究 [J] . 束鑫 ,唐慧 ,杨习贝 . 计算机研究与发展 . 2020,第007期
6. 不同量化位数与压缩倍率组合对图像压缩质量影响初步分析 [C] . 产晓冰 ,周川杰 . 第19届中国遥感大会 . 2014
7. 基于量化卷神经网络的模型压缩方法研究 [A] . 郝立扬 . 2020

基于组合三值量化的神经网络压缩算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅