首页> 美国卫生研究院文献>Genome Biology >Ultra-large alignments using phylogeny-aware profiles
【2h】

Ultra-large alignments using phylogeny-aware profiles

机译:使用系统发育感知配置文件的超大比对

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Many biological questions, including the estimation of deep evolutionary histories and the detection of remote homology between protein sequences, rely upon multiple sequence alignments and phylogenetic trees of large datasets. However, accurate large-scale multiple sequence alignment is very difficult, especially when the dataset contains fragmentary sequences. We present UPP, a multiple sequence alignment method that uses a new machine learning technique, the ensemble of hidden Markov models, which we propose here. UPP produces highly accurate alignments for both nucleotide and amino acid sequences, even on ultra-large datasets or datasets containing fragmentary sequences. UPP is available at .Electronic supplementary materialThe online version of this article (doi:10.1186/s13059-015-0688-z) contains supplementary material, which is available to authorized users.
机译:许多生物学问题,包括对深层进化史的估计以及对蛋白质序列之间远距离同源性的检测,都依赖于大型数据集的多重序列比对和系统树。但是,准确的大规模多序列比对非常困难,特别是当数据集包含片段序列时。我们提出了UPP,这是一种多序列比对方法,它使用一种新的机器学习技术,即我们在此提出的隐马尔可夫模型的集合。即使在超大型数据集或包含片段序列的数据集上,UPP仍可为核苷酸和氨基酸序列产生高度精确的比对。 UPP可从.Electronic补充材料中获得。本文的在线版本(doi:10.1186 / s13059-015-0688-z)包含补充材料,授权用户可以使用。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号