首页> 外国专利> FUZZY SEARCH USING FIELD-LEVEL DELETION NEIGHBORHOODS

FUZZY SEARCH USING FIELD-LEVEL DELETION NEIGHBORHOODS

机译:使用现场级别删除街区的模糊搜索

摘要

The disclosure provides an efficient dataset search and/or deduplication that improve the speed and efficiency of dataset record search and/or deduplication over traditional methods. Certain implementations apply field-level deletion neighborhood processing to ordered field permutations of dataset records encoded with hash values. A method includes determining a field-level deletion neighborhood for two or more field combinations of the record by determining field hash values, creating field permutations, determining combined record hash values for each permutation; and associating each record hash value to the unique entity identifier. The method includes searching other entity representation records for matching combined record hash values, and assigning one or more of a unique entity identifier and a duplicate entity identifier to the other entity representation records having the matching combined record hash values. Certain implementations can include removing, from the database, at least one of the other entity representation records having a duplicate record identifier.
机译:本公开提供了一种有效的数据集搜索和/或重复数据删除,可以通过传统方法提高数据集记录搜索和/或重复数据删除的速度和效率。某些实现将现场级别删除邻域处理应用于以散列值编码的数据集记录的订购字段置换。一种方法包括通过确定场散列值来确定记录的两个或更多个字段组合的现场级别删除邻域,从而创建场序列,确定每个排列的组合记录哈希值;并将每个记录哈希值与唯一的实体标识符相关联。该方法包括搜索用于匹配组合记录散列值的其他实体表示记录,并将唯一实体标识符和重复的实体标识符分配给具有匹配的组合记录散列值的其他实体表示记录的一个或多个。某些实现可以包括从数据库中删除具有重复记录标识符的其他实体表示记录中的至少一个。

著录项

  • 公开/公告号US2021397591A1

    专利类型

  • 公开/公告日2021-12-23

    原文格式PDF

  • 申请/专利权人 LEXISNEXIS RISK SOLUTIONS INC.;

    申请/专利号US202016904921

  • 发明设计人 DANIEL SCOTT CAMPER;

    申请日2020-06-18

  • 分类号G06F16/215;G06F16/22;G06F16/28;G06F16/23;

  • 国家 US

  • 入库时间 2022-08-24 22:59:24

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号