首页> 中文期刊> 《计算机系统应用》 >生物序列数据K-mer频次统计问题的算法

生物序列数据K-mer频次统计问题的算法

     

摘要

生物序列的k-mer频次统计是生物信息处理中一个非常基础且重要的问题.本文针对多序列在对齐模式下,不同偏移处一段长度范围内的k-mer频次统计问题进行了研究.提出了一种逆向遍历k-mer计数算法BTKC.该算法能够充分利用长度的k-mer统计信息,快速得到长度的k-mer统计信息,从而避免了统计任意长度的k-mer频次信息时都需要对所有序列进行遍历.算法的时间复杂度分析及实验结果表明,相比于传统的前向遍历 FTKC算法, BTKC算法性能提升非常明显,且其时间复杂度与k-mer长度的变化范围无关,非常适合于在k-mer长度变化范围较大的情况下使用.%K-mer counting of biological sequence is a fundamental and very important problem in biological information processing. This paper focuses on counting k-mers at each position of multiple sequences within aligned mode. We present a new backward traverse k-mer counting algorithm called BTKC. BTKC algorithm takes full advantage of the k+1-mer’s statistic information to obtain k-mer’s statistic information quickly. Thus, it’s no need to traverse the whole sequences when counting each single k-mer. Both the algorithm’s time complexity and experiment results show that BTKC gets an obvious improvement compared with forward traverse k-mer counting algorithm FTKC, and its time complexity was found not to be realted with the range of k-mer length.

著录项

  • 来源
    《计算机系统应用》 |2014年第4期|121-124,158|共5页
  • 作者单位

    中国科学技术大学计算机科学与技术学院;

    合肥 230027;

    安徽省高性能计算重点实验室;

    合肥 230027;

    中国科学技术大学计算机科学与技术学院;

    合肥 230027;

    安徽省高性能计算重点实验室;

    合肥 230027;

    中国科学技术大学计算机科学与技术学院;

    合肥 230027;

    中国科学技术大学计算机科学与技术学院;

    合肥 230027;

    安徽省高性能计算重点实验室;

    合肥 230027;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

    k-mer; k-mer计数; 频次统计; 逆向遍历; 生物信息处理;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号