首页> 外国专利> SUFFIX ARRAY CANDIDATE SELECTION AND INDEX DATA STRUCTURE

SUFFIX ARRAY CANDIDATE SELECTION AND INDEX DATA STRUCTURE

机译:前缀数组候选选择和索引数据结构

摘要

A method and system for identifying a candidate subset of a data set comprises comparing suffixes of query field values to data field values of records in the data set. Sufficiently similar records are included in the candidate subset. Query field value suffixes may range in length from the query field value itself down to a minimum suffix length. The longest suffix may be processed first, and then successively shorter suffixes may be processed until a satisfactory number of candidates are identified. Entries in an index data structure derived from the data set may associate various suffixes found in the data set with individual records. The data structure entries may include record keys identifying records with data field values identical to the suffix and may also include suffix pointers identifying related data structure entries with suffixes similar to the entry's suffix.
机译:一种用于识别数据集的候选子集​​的方法和系统,包括将查询字段值的后缀与数据集中记录的数据字段值进行比较。足够相似的记录包含在候选子集中。查询字段值后缀的长度范围可以从查询字段值本身到最小后缀长度。最长的后缀可以先处理,然后依次处理较短的后缀,直到确定令人满意的候选数。从数据集派生的索引数据结构中的条目可以将在数据集中找到的各种后缀与各个记录相关联。数据结构条目可以包括记录关键字,该记录关键字标识具有与后缀相同的数据字段值的记录,并且还可以包括后缀指针,该后缀指针标识具有与该条目的后缀相似的后缀的相关数据结构条目。

著录项

  • 公开/公告号WO2012064826A3

    专利类型

  • 公开/公告日2012-07-05

    原文格式PDF

  • 申请/专利权人 TIBCO SOFTWARE INC.;AUSTERMANN PATRICK;

    申请/专利号WO2011US59940

  • 发明设计人 AUSTERMANN PATRICK;

    申请日2011-11-09

  • 分类号G06F17/30;

  • 国家 WO

  • 入库时间 2022-08-21 17:16:00

相似文献

  • 专利
  • 外文文献
  • 中文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号