首页> 外国专利> Dictionary architecture and methodology for revision-tolerant data de-duplication

Dictionary architecture and methodology for revision-tolerant data de-duplication

机译:允许修订的重复数据删除的字典体系结构和方法

摘要

Redundant data is removed from a volume of data by partitioning the volume of data into fixed-length input segments and, for each of the input segments, traversing nodes of a search tree in accordance with the value of a fixed-size portion of the input segment to determine if the search tree contains a pointer to a matching fixed-sized portion of a segment within a dictionary. If the search tree contains the pointer, the input segment is compared with the segment within the dictionary pointed to by the pointer, and a token representative of the segment within the dictionary is substituted for at least part of the input segment determined to match the segment within the dictionary.
机译:通过将数据量划分为固定长度的输入段,并根据输入的固定大小部分的值遍历搜索树的节点,从数据量中删除冗余数据片段,以确定搜索树是否包含指向字典中片段的匹配固定大小部分的指针。如果搜索树包含指针,则将输入段与指针所指向的字典中的段进行比较,并用代表字典中该段的标记代替确定为与该段匹配的输入段的至少一部分在字典中。

著录项

  • 公开/公告号US8244691B1

    专利类型

  • 公开/公告日2012-08-14

    原文格式PDF

  • 申请/专利权人 KAREMPUDI V. RAMARAO;

    申请/专利号US201113289377

  • 发明设计人 KAREMPUDI V. RAMARAO;

    申请日2011-11-04

  • 分类号G06F17/00;G06F7/00;

  • 国家 US

  • 入库时间 2022-08-21 17:30:31

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号