【24h】

Document Retrieval with One Wildcard

机译:使用一个通配符检索文档

获取原文

摘要

In this paper we extend several well-known document listing problems to the case when documents contain a substring that approximately matches the query pattern. We study the scenario when the query string can contain a wildcard symbol that matches any alphabet symbol; all documents that match a query pattern with one wildcard must be enumerated. We describe a linear space data structure that reports all documents containing a substring P in O(∣P∣ + σ (log log log)~(1/2)+docc) time, where σ is the alphabet size and docc is the number of listed documents. We also describe a succinct solution for this problem. Furthermore our approach enables us to obtain an O(nσ)-space data structure that enumerates all documents containing both a pattern P_1 and a pattern P_2 in the special case when P_1 and P_2 differ in one symbol.
机译:在本文中,我们将几个众所周知的文档列表问题扩展到文档包含与查询模式大致匹配的子字符串的情况。我们研究了查询字符串可以包含与任何字母符号匹配的通配符的情况;必须枚举与一个查询模式匹配一​​个通配符的所有文档。我们描述了一个线性空间数据结构,该结构以O(∣P∣ +σ(log log log)〜(1/2)+ docc)的时间报告包含子字符串P的所有文档,其中σ是字母大小,docc是数字列出的文件。我们还描述了针对此问题的简洁解决方案。此外,我们的方法使我们能够获得O(nσ)空间数据结构,该结构枚举在特殊情况下(当P_1和P_2在一个符号中不同时)同时包含模式P_1和模式P_2的所有文档。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号