首页> 外国专利> LINEAR NEURAL RECONSTRUCTION FOR DEEP NEURAL NETWORK COMPRESSION

LINEAR NEURAL RECONSTRUCTION FOR DEEP NEURAL NETWORK COMPRESSION

机译:用于深度神经网络压缩的线性神经重构

摘要

A method and apparatus for performing deep neural network compression of convolutional and fully connected layers using a linear approximation of their outputs with information, such as in matrices representing weights, biases and non-linearities, to iteratively compress a pre-trained deep neural network by low displacement rank based approximation of the network layer weight matrices. Extension of the technique enables consecutive layers to be compressed jointly, allowing compression and speeding inference by reducing the number of channels/hidden neurons in the network.
机译:一种用于执行卷积层和完全连接层的深度神经网络压缩的方法和装置,使用其输出与信息的线性近似,例如在表示权重、偏差和非线性的矩阵中,通过基于网络层权重矩阵的低位移秩近似来迭代压缩预训练的深度神经网络。该技术的扩展使连续层能够被联合压缩,通过减少网络中通道/隐藏神经元的数量,实现压缩和加速推理。

著录项

  • 公开/公告号EP3973460A1

    专利类型

  • 公开/公告日2022-03-30

    原文格式PDF

  • 申请/专利权人 INTERDIGITAL VC HOLDINGS INC.;

    申请/专利号EP20200731726

  • 发明设计人 JAIN SWAYAMBHOO;ROBIN DAVID A.R.;

    申请日2020-05-20

  • 分类号G06N3/04;G06N3/10;H03M7/30;

  • 国家 EP

  • 入库时间 2022-08-25 00:09:56

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号