【24h】

Cache-Oblivious Index for Approximate String Matching

机译:近似字符串匹配的不带缓存的索引

获取原文
获取原文并翻译 | 示例
获取外文期刊封面目录资料

摘要

This paper revisits the problem of indexing a text for approximate string matching. Specifically, given a text T of length n and a positive integer κ, we want to construct an index of T such that for any input pattern P, we can find all its k-error matches in T efficiently. This problem is well-studied in the internal-memory setting. Here, we extend some of these recent results to external-memory solutions, which are also cache-oblivious. Our first index occupies O((n log~κ n)/B) disk pages and finds all k-error matches with O((|P| + occ)/B + log~κ n log log _B n) I/Os, where B denotes the number of words in a disk page. To the best of our knowledge, this index is the first external-memory data structure that does not require Ω(|P| + occ + poly(log n)) I/Os. The second index reduces the space to O((n log n)/B) disk pages, and the I/O complexity is O((|P| + occ)/B + log~(κ(κ+1)) n log log n).
机译:本文重新探讨了为近似字符串匹配为文本编制索引的问题。具体来说,给定长度为n的文本T和正整数κ,我们想要构造一个T的索引,以使得对于任何输入模式P,我们都可以在T中高效地找到其所有k错误匹配。在内部存储器设置中已对该问题进行了充分研究。在这里,我们将这些最近的结果中的一些扩展到也可以忽略缓存的外部内存解决方案。我们的第一个索引占用O((n log〜κn)/ B)磁盘页,并找到与O((| P | + occ)/ B + log〜κn log log _B n)I / O的所有k错误匹配,其中B表示磁盘页面中的单词数。据我们所知,该索引是第一个不需要Ω(| P | + occ + poly(log n))I / O的外部存储器数据结构。第二个索引将空间减少到O((n log n)/ B)个磁盘页,并且I / O复杂度为O((| P | + occ)/ B + log〜(κ(κ+ 1))n日志日志n)。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号