首页> 美国卫生研究院文献>Genome Biology >RefSeq database growth influences the accuracy of k-mer-based lowest common ancestor species identification
【2h】

RefSeq database growth influences the accuracy of k-mer-based lowest common ancestor species identification

机译:RefSeq数据库的增长影响基于k-mer的最低共同祖先物种识别的准确性

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

In order to determine the role of the database in taxonomic sequence classification, we examine the influence of the database over time on k-mer-based lowest common ancestor taxonomic classification. We present three major findings: the number of new species added to the NCBI RefSeq database greatly outpaces the number of new genera; as a result, more reads are classified with newer database versions, but fewer are classified at the species level; and Bayesian-based re-estimation mitigates this effect but struggles with novel genomes. These results suggest a need for new classification approaches specially adapted for large databases.
机译:为了确定数据库在生物分类序列分类中的作用,我们研究了数据库在一段时间内对基于k-mer的最低共同祖先分类分类的影响。我们提出了三个主要发现:NCBI RefSeq数据库中添加的新物种数量大大超过了新属的数量;结果,使用较新的数据库版本分类的阅读次数更多,但在物种级别分类的阅读次数更少;基于贝叶斯的重新估计减轻了这种影响,但与新的基因组作斗争。这些结果表明需要特别适合大型数据库的新分类方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号