首页> 外国专利> Processing device utilizing content-based signature prefix for efficient generation of deduplication estimate

Processing device utilizing content-based signature prefix for efficient generation of deduplication estimate

机译:利用基于内容的签名前缀的处理设备,以便高效生成重复数据删除估计

摘要

An apparatus in one embodiment comprises at least one processing device comprising a processor coupled to a memory. The processing device is configured to identify a dataset to be scanned to generate a deduplication estimate for that dataset, to designate a content-based signature prefix to be utilized in the scan, and for each of a plurality of pages of the dataset, to scan the page, where scanning the page includes computing a content-based signature for the page, comparing an initial portion of the content-based signature to the designated content-based signature prefix, and responsive to a match between the initial portion and the designated content-based signature prefix, updating a corresponding entry of a deduplication estimate table for the dataset. The processing device generates the deduplication estimate for the dataset based at least in part on contents of the deduplication estimate table.
机译:一个实施例中的装置包括至少一个处理设备,包括耦合到存储器的处理器。处理设备被配置为识别要扫描的数据集以生成该数据集的重复数据删除估计,以指定要在扫描中使用的基于内容的签名前缀,以及用于数据集的多个页面中的每一个扫描该页面,其中扫描该页面包括计算页面的基于内容的签名,将基于内容的签名的初始部分与基于指定的内容的签名前缀进行比较,并响应于初始部分和指定内容之间的匹配基于签名前缀,更新数据集的重复数据删除估算表的相应条目。处理设备至少部分地基于重复数据删除估计表的内容生成数据集的重复数据删除估计。

著录项

  • 公开/公告号US10977216B2

    专利类型

  • 公开/公告日2021-04-13

    原文格式PDF

  • 申请/专利权人 EMC IP HOLDING COMPANY LLC;

    申请/专利号US201815991035

  • 发明设计人 ANTON KUCHEROV;DAVID MEIRI;

    申请日2018-05-29

  • 分类号G06F17;G06F16/174;G06F3/06;G06F16/22;

  • 国家 US

  • 入库时间 2024-06-14 21:24:51

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号