首页> 外文会议>Theory and Applications of Models of Computation >Efficient Algorithms for Model-Based Motif Discovery from Multiple Sequences
【24h】

Efficient Algorithms for Model-Based Motif Discovery from Multiple Sequences

机译:从多个序列中基于模型的主题发现的高效算法

获取原文
获取原文并翻译 | 示例

摘要

We study a natural probabilistic model for motif discovery that has been used to experimentally test the quality of motif discovery programs. In this model, there are k background sequences, and each character in a background sequence is a random character from an alphabet Σ. A motif G = g_1g_2 ... g_m is a string of m characters. Each background sequence is implanted a randomly generated approximate copy of G. For a randomly generated approximate copy b_1b_2 … b_m of G, every character is randomly generated such that the probability for b_i ≠ g_i is at most α. In this paper, we give the first analytical proof that multiple background sequences do help for finding subtle and faint motifs.
机译:我们研究了用于主题发现的自然概率模型,该模型已用于通过实验测试主题发现程序的质量。在该模型中,有k个背景序列,并且背景序列中的每个字符都是字母Σ中的随机字符。图案G = g_1g_2 ... g_m是m个字符的字符串。每个背景序列都植入了随机生成的G近似副本。对于随机生成的G近似副本b_1b_2…b_m,将随机生成每个字符,使得b_i≠g_i的概率最大为α。在本文中,我们提供了第一个分析证明,即多个背景序列确实有助于发现细微和模糊的图案。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号