首页> 美国卫生研究院文献>Molecular Biology and Evolution >CompositeSearch: A Generalized Network Approach for Composite Gene Families Detection
【2h】

CompositeSearch: A Generalized Network Approach for Composite Gene Families Detection

机译:CompositeSearch:用于复合基因家族检测的通用网络方法

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Genes evolve by point mutations, but also by shuffling, fusion, and fission of genetic fragments. Therefore, similarity between two sequences can be due to common ancestry producing homology, and/or partial sharing of component fragments. Disentangling these processes is especially challenging in large molecular data sets, because of computational time. In this article, we present CompositeSearch, a memory-efficient, fast, and scalable method to detect composite gene families in large data sets (typically in the range of several million sequences). CompositeSearch generalizes the use of similarity networks to detect composite and component gene families with a greater recall, accuracy, and precision than recent programs (FusedTriplets and MosaicFinder). Moreover, CompositeSearch provides user-friendly quality descriptions regarding the distribution and primary sequence conservation of these gene families allowing critical biological analyses of these data.
机译:基因通过点突变进化,也可以通过基因片段的改组,融合和分裂而进化。因此,两个序列之间的相似性可以归因于共同祖先产生的同源性,和/或组分片段的部分共享。由于计算时间的原因,在大型分子数据集中解开这些过程尤其具有挑战性。在本文中,我们介绍了CompositeSearch,这是一种内存有效,快速且可扩展的方法,用于检测大型数据集(通常在数百万个序列的范围内)中的复合基因家族。与最近的程序(FusedTriplets和MosaicFinder)相比,CompositeSearch广泛使用相似性网络来检测复合和成分基因家族,具有更高的查全率,准确性和精确度。此外,CompositeSearch提供了有关这些基因家族的分布和一级序列保守性的用户友好型质量描述,从而可以对这些数据进行关键的生物学分析。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号