首页> 外国专利> PER KERNEL KMEANS COMPRESSION FOR NEURAL NETWORKS

PER KERNEL KMEANS COMPRESSION FOR NEURAL NETWORKS

机译:神经网络的每内核KMEANS压缩

摘要

Methods and apparatus relating to techniques for incremental network quantization. In an example, an apparatus comprises logic, at least partially comprising hardware logic to determine a plurality of weights for a layer of a convolutional neural network (CNN) comprising a plurality of kernels; organize the plurality of weights into a plurality of clusters for the plurality of kernels; and apply a K-means compression algorithm to each of the plurality of clusters. Other embodiments are also disclosed and claimed.
机译:与用于增量网络量化的技术有关的方法和装置。在一个示例中,一种装置包括逻辑,该逻辑至少部分地包括硬件逻辑,用于确定包括多个内核的卷积神经网络(CNN)的层的多个权重;将多个权重组织为多个内核的多个簇;并将K均值压缩算法应用于多个聚类中的每个聚类。还公开和要求保护其他实施例。

著录项

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号