首页> 外国专利> Processing device utilizing polynomial-based signature subspace for efficient generation of deduplication estimate

Processing device utilizing polynomial-based signature subspace for efficient generation of deduplication estimate

机译:利用基于多项式的签名子空间的处理装置,以实现重复数据删除估计的高效生成

摘要

An apparatus in one embodiment comprises at least one processing device comprising a processor coupled to a memory. The processing device is configured to identify a dataset to be scanned to generate a deduplication estimate for that dataset, to designate a subset inclusion characteristic to be utilized in the scan, and for each of a plurality of pages of the dataset, to scan the page, where scanning the page includes computing a polynomial-based signature for the page, determining whether or not the polynomial-based signature satisfies the designated subset inclusion characteristic, and responsive to the polynomial-based signature satisfying the designated subset inclusion characteristic, computing a content-based signature for the page and updating a corresponding entry of a deduplication estimate table for the dataset based at least in part on the content-based signature. The processing device generates the deduplication estimate for the dataset based at least in part on contents of the deduplication estimate table.
机译:一个实施例中的装置包括至少一个处理设备,包括耦合到存储器的处理器。处理设备被配置为识别要扫描的数据集以生成该数据集的重复数据删除估计,以指定要在扫描中使用的子集包含特性,以及用于数据集的多个页面中的每一个来扫描该页面,其中扫描该页面包括计算页面的基于多项式的签名,确定基于多项式的签名是否满足指定的子集包含特性,并且响应于满足指定子集包含特性的多项式的签名,计算内容基于页面的基于签名,并至少部分地基于基于内容的签名来更新数据集的重复数据删除估计表的相应条目。处理设备至少部分地基于重复数据删除估计表的内容生成数据集的重复数据删除估计。

著录项

  • 公开/公告号US10983962B2

    专利类型

  • 公开/公告日2021-04-20

    原文格式PDF

  • 申请/专利权人 EMC IP HOLDING COMPANY LLC;

    申请/专利号US201815991054

  • 发明设计人 ANTON KUCHEROV;DAVID MEIRI;

    申请日2018-05-29

  • 分类号G06F16/174;G06F3/06;G06F16/901;

  • 国家 US

  • 入库时间 2022-08-24 18:17:11

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号