首页> 中国专利> 一种降低低比特卷积神经网络推理运算复杂度的方法

一种降低低比特卷积神经网络推理运算复杂度的方法

摘要

本发明提供一种降低低比特卷积神经网络推理运算复杂度的方法,包括S1神经网络训练结束后,利用保存的数据进行量化,假设第i层的量化如下:其中δi为激活函数,QA为feature map的量化公式,Qw为权重的量化公式;S2当S1中公式的参数符合条件,量化通过定点数的运算获得:S3从feature map的量化确定阈值:feature map的量化:由feature map的量化公式直接推出阈值为(0.5,1.5…(2k‑0.5)),其中k是量化的比特位宽;因为阈值之间的距离都是1.0,所以在最终量化时只需保存其中则阈值n∈{0,1…(2k‑1)}其中k是量化的比特位宽;S4由于量化为低比特时,量化后feature map的数值确定,并且QA为均匀量化,所以S2中的通过和一系列阈值(T1,T2…Tn)比较获得最终的量化结果。本申请解决低比特模型推理过程计算复杂度和计算资源需求大的问题。

著录项

  • 公开/公告号CN113762496A

    专利类型发明专利

  • 公开/公告日2021-12-07

    原文格式PDF

  • 申请/专利权人 合肥君正科技有限公司;

    申请/专利号CN202010497777.9

  • 发明设计人 张东;

    申请日2020-06-04

  • 分类号G06N3/08(20060101);G06N3/04(20060101);G06N5/04(20060101);

  • 代理机构11706 北京竹辰知识产权代理事务所(普通合伙);

  • 代理人聂鹏

  • 地址 230088 安徽省合肥市高新区望江西路800号合肥高新股份有限公司C-3研发楼9层

  • 入库时间 2023-06-19 13:37:05

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号