首页> 外文期刊>Bioinformatics >Exhaustive whole-genome tandem repeats search
【24h】

Exhaustive whole-genome tandem repeats search

机译:详尽的全基因组串联重复搜索

获取原文
获取原文并翻译 | 示例
       

摘要

Motivation: Approximate tandem repeats (ATR) occur frequently in the genomes of organisms, and are a source of polymorphisms observed in individuals, and thus are of interest to those studying genetic disorders. Though extensive work has been done in order to identify ATRs, there are inherent limitations with the current approaches in terms of the number of pattern sizes that can be searched or the size of the input length.Results: This paper describes (1) a new algorithm which exhaustively finds all variable-length ATRs in a genomic sequence and (2) a precise description of, and an algorithm to significantly reduce, redundancy in the output. Our ATR definition is parameterized by a mismatch ratio p which allows for more mismatches in longer tandem repeats (and fewer in shorter). Furthermore, our algorithm is embarrassingly parallel and thus can attain near-linear speed-up on Beowulf clusters. We present results of our algorithm applied to sequences of widely differing lengths (from genes to chromosomes).
机译:动机:大约串联重复序列(ATR)在生物体基因组中经常发生,并且是在个体中观察到的多态性的来源,因此对于那些研究遗传疾病的人很感兴趣。尽管已经进行了大量工作来识别ATR,但是当前方法在可搜索的图案大小数量或输入长度的大小方面存在固有的局限性。结果:本文描述了(1)一种新的穷举查找基因组序列中所有可变长度ATR的算法,以及(2)精确描述和显着减少输出冗余的算法。我们的ATR定义由不匹配率p来参数化,该不匹配率p在较长的串联重复中允许更多的不匹配(在较短的重复中更少)。此外,我们的算法令人尴尬地是并行的,因此可以在Beowulf群集上达到近乎线性的加速。我们介绍了我们算法的结果,该算法应用于长度差异很大的序列(从基因到染色体)。

著录项

  • 来源
    《Bioinformatics》 |2004年第16期|p. 2702-2710|共9页
  • 作者

    Krishnan A; Tang F;

  • 作者单位

    Bioinformat Inst, Singapore 138671, Singapore;

  • 收录信息 美国《科学引文索引》(SCI);美国《化学文摘》(CA);
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类 生物科学;
  • 关键词

    GENE;

    机译:基因;
  • 入库时间 2022-08-17 23:50:20

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号