首页> 中文期刊> 《计算机系统应用》 >基于仿射聚类的宏基因组序列物种聚类

基于仿射聚类的宏基因组序列物种聚类

     

摘要

随着下一代测序技术的迅猛发展,宏基因组学已经成为新的研究热点,宏基因组学序列聚类问题使用无参考的方法,对包含多个物种的宏基因组序列进行有效分离。为此,提出一种结合相似度信息和结构信息的宏基因组物种聚类算法,并引入仿射聚类来进行序列物种聚类。实验数据表明该方法聚类精度高、执行速度快。我们也开发了基于该方法的宏基因组序列物种聚类软件。%Nowadays, with the rapid development of the next generation sequencing technologies, metagenomics have become a new hotspot,However research in metagenomics faces the issue of binning --- identification and taxonomic characterization of the NGS short reads. To solve this problem, this paper first analyzes the next generation sequencing technology characteristics, statistical characteristics of metagenomic sequence, then proposes a new clustering method for DNA sequence binning. Test results show that this method has a very good clustering accuracy. In the same time, we developed an software for metagenomic binning based on this algorithm MetaBinning.

著录项

  • 来源
    《计算机系统应用》 |2013年第11期|165-170,142|共7页
  • 作者

    聂鹏宇; 潘玮华; 徐云;

  • 作者单位

    安徽省高性能计算重点实验室;

    安徽合肥 230027;

    中国科学技术大学计算机科学与技术学院;

    安徽合肥 230027;

    安徽省高性能计算重点实验室;

    安徽合肥 230027;

    中国科学技术大学计算机科学与技术学院;

    安徽合肥 230027;

    安徽省高性能计算重点实验室;

    安徽合肥 230027;

    中国科学技术大学计算机科学与技术学院;

    安徽合肥 230027;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

    宏基因组学; DNA序列; 物种聚类; 仿射聚类; 倒排索引;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号