首页> 中文期刊> 《遗传》 >基因组二代测序数据的自动化分析流程

基因组二代测序数据的自动化分析流程

         

摘要

二代测序技术的发展对测序数据的处理分析提出了很高的要求。目前二代测序数据分析软件很多,但是绝大多数软件仅能完成单一的分析功能(例如:仅进行序列比对或变异读取或功能注释等),如何能正确高效地选择整合这些软件已成为迫切需求。文章设计了一套基于 perl 语言和 SGE资源管理的自动化处理流程来分析Illumina平台基因组测序数据。该流程以测序原始序列数据作为输入,调用业界标准的数据处理软件(如:BWA, Samtools, GATK, ANNOVAR等),最终生成带有相应功能注释、便于研究者进一步分析的变异位点列表。该流程通过自动化并行脚本控制流程的高效运行,一站式输出分析结果和报告,简化了数据分析过程中的人工操作,大大提高了运行效率。用户只需填写配置文件或使用图形界面输入即可完成全部操作。该工作为广大研究者分析二代测序数据提供了便利的途径。%The development of next-generation sequencing has generated high demand for data processing and analysis. Although there are a lot of software for analyzing next-generation sequencing data, most of them are designed for one specific function (e.g., alignment, variant calling or annotation). Therefore, it is necessary to combine them together for data analysis and to generate interpretable results for biologists. This study designed a pipeline to process Illumina sequencing data based on Perl programming language and SGE system. The pipeline takes original sequence data (fastq format) as input, calls the standard data processing software (e.g., BWA, Samtools, GATK, and Annovar), and finally outputs a list of annotated va-riants that researchers can further analyze. The pipeline simplifies the manual operation and improves the efficiency by automatization and parallel computation. Users can easily run the pipeline by editing the configuration file or clicking the graphical interface. Our work will facilitate the research projects using the sequencing technology.

著录项

  • 来源
    《遗传》 |2014年第6期|620-626|共7页
  • 作者单位

    中国医学科学院;

    北京协和医学院;

    国家心血管病中心;

    阜外心血管病医院;

    心血管疾病国家重点实验室;

    北京 100037;

    中国医学科学院;

    北京协和医学院;

    国家心血管病中心;

    阜外心血管病医院;

    心血管疾病国家重点实验室;

    北京 100037;

    中南民族大学生物医学工程学院;

    武汉430074;

    中国医学科学院;

    北京协和医学院;

    国家心血管病中心;

    阜外心血管病医院;

    心血管疾病国家重点实验室;

    北京 100037;

    中国医学科学院;

    北京协和医学院;

    国家心血管病中心;

    阜外心血管病医院;

    心血管疾病国家重点实验室;

    北京 100037;

    中国医学科学院;

    北京协和医学院;

    国家心血管病中心;

    阜外心血管病医院;

    心血管疾病国家重点实验室;

    北京 100037;

    中国医学科学院;

    北京协和医学院;

    国家心血管病中心;

    阜外心血管病医院;

    心血管疾病国家重点实验室;

    北京 100037;

    中南民族大学生物医学工程学院;

    武汉430074;

    中国医学科学院;

    北京协和医学院;

    国家心血管病中心;

    阜外心血管病医院;

    心血管疾病国家重点实验室;

    北京 100037;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类
  • 关键词

    二代测序; 自动化数据分析; 流程; 变异检测;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号