首页> 美国卫生研究院文献>other >UniqTag: Content-Derived Unique and Stable Identifiers for Gene Annotation
【2h】

UniqTag: Content-Derived Unique and Stable Identifiers for Gene Annotation

机译:UniqTag:用于基因注释的内容派生的唯一且稳定的标识符

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

When working on an ongoing genome sequencing and assembly project, it is rather inconvenient when gene identifiers change from one build of the assembly to the next. The gene labelling system described here, UniqTag, addresses this common challenge. UniqTag assigns a unique identifier to each gene that is a representative k-mer, a string of length k, selected from the sequence of that gene. Unlike serial numbers, these identifiers are stable between different assemblies and annotations of the same data without requiring that previous annotations be lifted over by sequence alignment. We assign UniqTag identifiers to ten builds of the Ensembl human genome spanning eight years to demonstrate this stability. The implementation of UniqTag in Ruby and an R package are available at sjackman/uniqtag. The R package is also available from CRAN: install.packages ("uniqtag"). Supplementary material and code to reproduce it is available at .
机译:在进行中的基因组测序和装配项目中,当基因标识符从装配的一个版本转换到另一个版本时,这非常不便。此处描述的基因标记系统UniqTag解决了这一常见挑战。 UniqTag为每个基因分配一个唯一的标识符,该标识符是一个代表性的k-mer,长度为k,从该基因的序列中选择。与序列号不同,这些标识符在不同程序集和同一数据的注释之间是稳定的,而无需通过序列比对来替换先前的注释。我们将UniqTag标识符分配给横跨八年的Ensembl人类基因组的十个版本,以证明这种稳定性。 sjackman / uniqtag提供了Ruby中的UniqTag和R包的实现。 R包也可以从CRAN获得:install.packages(“ uniqtag”)。可从上获取补充材料和复制该代码的代码。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号