首页> 中国专利> 一种降低低比特卷积神经网络推理运算复杂度的方法

一种降低低比特卷积神经网络推理运算复杂度的方法

摘要

本发明提供一种降低低比特卷积神经网络推理运算复杂度的方法,所述方法包括以下步骤:S1,假设第i层的权重为Wi,深度卷积全精度权重数据分布符合正态分布,权重所有数据对称性分布于平均值左右两侧;S2,meanw,varw分别代表权重的平均值、标准差;meanw‑3*varw至meanw+3*varw范围:此范围所占比率为全部数值之99%;在权重量化代码之前添加3个标准差的数据剪裁;S3,对权重进行3个标准差的剪裁之后,保留99%的权重数据,利用剪裁之后数据进行量化,剔除异值过大数值。解决现有低比特量化微调、重训过程中存在网络不收敛,训练时间长,低bit模型定点数不能充分利用等问题。

著录项

  • 公开/公告号CN114077894A

    专利类型发明专利

  • 公开/公告日2022-02-22

    原文格式PDF

  • 申请/专利权人 合肥君正科技有限公司;

    申请/专利号CN202010794905.6

  • 发明设计人 周飞飞;

    申请日2020-08-10

  • 分类号G06N5/04(20060101);G06N3/04(20060101);

  • 代理机构11706 北京竹辰知识产权代理事务所(普通合伙);

  • 代理人聂鹏

  • 地址 230088 安徽省合肥市高新区望江西路800号合肥高新股份有限公司C-3研发楼9层

  • 入库时间 2023-06-19 14:14:25

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-03-11

    实质审查的生效 IPC(主分类):G06N 5/04 专利申请号:2020107949056 申请日:20200810

    实质审查的生效

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号