首页> 外文会议>Combinatorial Pattern Matching >Approximate String Matching Using Compressed Suffix Arrays
【24h】

Approximate String Matching Using Compressed Suffix Arrays

机译:使用压缩后缀数组进行近似字符串匹配

获取原文

摘要

Let T be a text of length n and P be a pattern of length m, both strings over a fixed finite alphabet A. The k-difference (k-mismatch, respectively) problem is to find all occurrences of P in T that have edit distance (Hamming distance, respectively) at most k from P. In this paper we investigate a well-studied case in which k = 1 and T is fixed and preprocessed into an indexing data structure so that any pattern query can be answered faster. This paper gives a solution using O(n) bits indexing data structure with O(m log~2 n) query time. To the best of our knowledge, this is the first result which requires linear indexing space. The results can be extended for the k-difference problem with k ≥ 1.
机译:令T为长度为n的文本,P为长度为m的模式,两个字符串都位于固定的有限字母A上。k差异(分别为k不匹配)问题是查找T中所有出现的具有编辑的P距P的最大距离(分别为汉明距离)。在本文中,我们研究了一种经过充分研究的情况,其中k = 1并且T是固定的,并且预处理为索引数据结构,以便可以更快地回答任何模式查询。本文提出了一种使用O(n)位索引数据结构和O(m log〜2 n)查询时间的解决方案。据我们所知,这是需要线性索引空间的第一个结果。可以将结果推广到k≥1的k差问题。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号