...
首页> 外文期刊>Theoretical computer science >Masking patterns in sequences: A new class of motif discovery with don't cares
【24h】

Masking patterns in sequences: A new class of motif discovery with don't cares

机译:序列中的掩盖模式:无需关心的新型主题发现

获取原文
获取原文并翻译 | 示例
   

获取外文期刊封面封底 >>

       

摘要

We introduce a new notion of motifs, called masks, that succinctly represents the repeated patterns for an input sequence T of n symbols drawn from an alphabet ∑. We show how to build the set of all frequent maximal masks of length L in O(2~Ln) time and space in the worst case, using the Karp-Miller-Rosenberg approach. We analytically show that our algorithm performs better than the method based on constant-time enumerating and checking all the potential (|∑| + 1)~L candidate patterns in T, after a polynomial-time preprocessing of T. Our algorithm is also cache-friendly, attaining O(2~L sort(n)) block transfers, where sort(n) is the cache complexity of sorting n items.
机译:我们引入了一个新的主题概念,即遮罩,它简洁地表示了从字母∑提取的n个符号的输入序列T的重复图案。我们展示了如何使用Karp-Miller-Rosenberg方法在最坏的情况下在O(2〜Ln)的时间和空间中构建长度为L的所有频繁最大掩码集。通过分析表明,在对T进行多项式时间预处理之后,我们的算法比基于恒定时间枚举并检查T中所有潜在(| ∑ | + 1)〜L个候选模式的方法性能更好。友好,获得O(2〜L sort(n))块传输,其中sort(n)是对n个项目进行排序的缓存复杂度。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号