【24h】

Quasi-linear-time substring searching by q-gram distance

机译:通过q-gram距离搜索准线性时间子串

获取原文
获取原文并翻译 | 示例

摘要

The q-gram distance dq(x, y) between two strings x and y is a string similarity measure correlated with a famous string distance: the edit distance. In addition, it can be computed much faster, in linear (O(|x|+|y|)) time, than the edit distance in quadratic (O(|x||y|)) time, where | · | denotes the string length. However, it does not mean that we can find all substrings of a text t similar to a pattern p in linear time. In this paper we will propose a searching algorithm achieving quasi-linear (O(|t| log |p| + |p|)) time by the q-gram distance.
机译:两个字符串x和y之间的q-gram距离d q (x,y)是与著名字符串距离(编辑距离)相关的字符串相似性度量。此外,在线性(O(| x | + | y |))时间中,它的计算比在二次(O(| x || y |))时间中的编辑距离要快得多,其中| ·|表示字符串长度。但是,这并不意味着我们可以在线性时间内找到类似于模式p的文本t的所有子字符串。在本文中,我们将提出一种通过q-gram距离实现准线性(O(| t | log | p | + | p |))时间的搜索算法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号