首页> 中文期刊> 《网络安全与数据治理》 >基于浮栅器件的低位宽卷积神经网络研究

基于浮栅器件的低位宽卷积神经网络研究

     

摘要

浮栅器件(Flash)能够将存储和计算的特性相结合,实现存算一体化,但是单个浮栅单元最多只能存储位宽为4 bit的数据。面向Nor Flash,研究了卷积神经网络参数的低位宽量化,对经典的AlexNet、VGGNet以及ResNet通过量化感知训练。采用非对称量化,将模型参数从32位浮点数量化至4位定点数,模型大小变为原来的1/8,针对Cifar10数据集,4位量化模型的准确率相对于全精度网络仅下降不到2%。最后将量化完成的卷积神经网络模型使用Nor Flash阵列加速。Hspice仿真结果表明,相对于全精度模型,部署在Nor Flash阵列中的量化模型精度仅下降2.25%,验证了卷积神经网络部署在Nor Flash上的可行性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号