首页> 外国专利> Systems and methods for byte-level or quasi byte-level single instancing

Systems and methods for byte-level or quasi byte-level single instancing

机译:字节级或准字节级单实例化的系统和方法

摘要

Described in detail herein are systems and methods for deduplicating data using byte-level or quasi byte-level techniques. In some embodiments, a file is divided into multiple blocks. A block includes multiple bytes. Multiple rolling hashes of the file are generated. For each byte in the file, a searchable data structure is accessed to determine if the data structure already includes an entry matching a hash of a minimum sequence length. If so, this indicates that the corresponding bytes are already stored. If one or more bytes in the file are already stored, then the one or more bytes in the file are replaced with a reference to the already stored bytes. The systems and methods described herein may be used for file systems, databases, storing backup data, or any other use case where it may be useful to reduce the amount of data being stored.
机译:本文详细描述了用于使用字节级或准字节级技术对数据进行重复数据删除的系统和方法。在一些实施例中,文件被分成多个块。一个块包括多个字节。生成文件的多个滚动哈希。对于文件中的每个字节,将访问可搜索的数据结构以确定该数据结构是否已包含与最小序列长度的哈希匹配的条目。如果是这样,则表明相应的字节已被存储。如果已经存储了文件中的一个或多个字节,则将文件中的一个或多个字节替换为对已经存储的字节的引用。本文描述的系统和方法可以用于文件系统,数据库,存储备份数据,或者可以减少存储的数据量的任何其他用例。

著录项

  • 公开/公告号US8725687B2

    专利类型

  • 公开/公告日2014-05-13

    原文格式PDF

  • 申请/专利权人 COMMVAULT SYSTEMS INC.;

    申请/专利号US201313855514

  • 发明设计人 MICHAEL F. KLOSE;

    申请日2013-04-02

  • 分类号G06F17/30;

  • 国家 US

  • 入库时间 2022-08-21 16:04:48

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号