首页> 外文期刊>International journal of computing science and mathematics >Efficient dictionary matching by Aho-Corasick automata of truncated patterns
【24h】

Efficient dictionary matching by Aho-Corasick automata of truncated patterns

机译:通过截断模式的Aho-Corasick自动机进行高效的字典匹配

获取原文
获取原文并翻译 | 示例

摘要

We present a space-efficient data structure for dictionary matching. We truncate patterns to truncated patterns where symbols are ℓ-length substrings of the pattern. By employing the AC automaton of truncated patterns and that of ℓ-length substrings, we simulate the AC automaton of the original pattern set. The new structure is space economical as we apply the prefix merging to substrings of patterns. Using this structure, the dictionary matching runs in O(n log k + tocc log k + occ) time where n is the length of the text, k the number of patterns, occ the number of occurrences of patterns in the text, and tocc the number of occurrences of strings that are longest prefix of each pattern with length of a multiple of ℓ.
机译:我们提出了一种节省空间的数据结构,用于字典匹配。我们将模式截断为截断的模式,其中符号是模式的ℓ长度子串。通过采用截断模式的交流自动机和ℓ长度子串的交流自动机,我们模拟了原始模式集的交流自动机。当我们将前缀合并应用于模式的子字符串时,这种新结构在空间上是经济的。使用这种结构,字典匹配以O(n log k + tocc log k + occ)时间运行,其中n是文本的长度,k是模式的数量,occ文本中出现模式的数量,以及tocc是每个模式的最长前缀且长度为multiple的倍数的字符串的出现次数。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号