首页> 外国专利> Distributed deduplication using locality sensitive hashing

Distributed deduplication using locality sensitive hashing

机译:使用位置敏感的散列进行分布式重复数据删除

摘要

Deduplication in a distributed storage system is described. A deduplication manager identifies a data item that includes multiple data chunks. The deduplication manager defines a first extent on a first node in a distributed storage system. The deduplication manager compares the first extent to existing groups of similar extents to find one of the existing groups that has extents that are similar to the first extent. The deduplication manager selects a second extent from the found group of extents. The second closely matches the first extent and removes from the first extent one or more data chunks that are included in the first extent and the second extent. The deduplication manager associates, with the first extent, a pointer to the second extent for the removed one or more data chunks.
机译:描述了分布式存储系统中的重复数据删除。重复数据删除管理器标识包含多个数据块的数据项。重复数据删除管理器在分布式存储系统中的第一节点上定义了第一扩展区。重复数据删除管理器将第一个扩展盘区与具有类似扩展盘区的现有组进行比较,以找到具有与第一个扩展盘区相似的扩展盘区的现有组之一。重复数据删除管理器从找到的扩展区组中选择第二个扩展区。第二个紧密匹配第一个扩展区,并从第一个扩展区中删除第一个扩展区和第二个扩展区中包含的一个或多个数据块。重复数据删除管理器将第一个扩展区的指向第二个扩展区的指针与已删除的一个或多个数据块相关联。

著录项

  • 公开/公告号US9678976B2

    专利类型

  • 公开/公告日2017-06-13

    原文格式PDF

  • 申请/专利权人 RED HAT INC.;

    申请/专利号US201414337070

  • 发明设计人 HENRY DAN LAMBRIGHT;

    申请日2014-07-21

  • 分类号G06F17/30;

  • 国家 US

  • 入库时间 2022-08-21 13:45:53

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号