首页> 美国卫生研究院文献>BMC Bioinformatics >DNA barcode analysis: a comparison of phylogenetic and statistical classification methods
【2h】

DNA barcode analysis: a comparison of phylogenetic and statistical classification methods

机译:DNA条码分析:系统发育和统计分类方法的比较

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

BackgroundDNA barcoding aims to assign individuals to given species according to their sequence at a small locus, generally part of the CO1 mitochondrial gene. Amongst other issues, this raises the question of how to deal with within-species genetic variability and potential transpecific polymorphism. In this context, we examine several assignation methods belonging to two main categories: (i) phylogenetic methods (neighbour-joining and PhyML) that attempt to account for the genealogical framework of DNA evolution and (ii) supervised classification methods (k-nearest neighbour, CART, random forest and kernel methods). These methods range from basic to elaborate. We investigated the ability of each method to correctly classify query sequences drawn from samples of related species using both simulated and real data. Simulated data sets were generated using coalescent simulations in which we varied the genealogical history, mutation parameter, sample size and number of species.
机译:背景技术DNA条形码的目的是根据个体在一个小位点(通常是CO1线粒体基因的一部分)上的序列,将其分配给给定物种。除其他问题外,这提出了一个问题,即如何应对物种内的遗传变异性和潜在的反式多态性。在这种情况下,我们研究了几种属于两个主要类别的分配方法:(i)系统发育方法(邻居连接和PhyML),这些方法试图解释DNA进化的家谱框架;(ii)有监督的分类方法(k近邻) ,CART,随机森林和内核方法)。这些方法的范围从基本到详尽。我们研究了每种方法使用模拟数据和真实数据正确分类从相关物种样品中提取的查询序列的能力。使用合并模拟生成模拟数据集,其中我们改变了族谱历史,突变参数,样本大小和物种数量。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号