首页> 中文学位 >基于二代测序的目标区段SNP识别数据流的建立与比较分析
【6h】

基于二代测序的目标区段SNP识别数据流的建立与比较分析

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1研究背景

1.1.1 Ion测序技术

1.1.2 基因分型背景

1.1.3目标区段随机获取与PCR扩增重测序

1.2部分二代测序数据分析软件的简介

1.2.1 DNA序列的质控(quality control)

1.2.2 Adaptor切除软件

1.2.3 Barcode筛选软件

1.2.4 DNA序列的alignment软件①BWA

1.2.5 SNP Calling软件①Samtools

1.3 研究目的与意义

1.3.1 本研究涉及的基于二代测序的SNP鉴定技术

1.3.2本研究带来的经济价值与社会效应

第二章 数据结构与流程的初步实现

2.1数据信息的简介

2.1.1数据的结构

2.1.2 测序数据中的Barcode 信息

2.1.4 Sample ID及其对应的barcode信息

2.1.5 参考序列的信息

2.2处理流程的建立

2.2.1数据的处理流程图

2.2.2流程图的详解

2.3流程的初步实现

2.3.1质控的实现及使用说明

2.3.2 3’-primer切除

2.3.3 序列两端barcode筛选与样本分类

2.3.4 序列两端的barcode切除

2.3.5 参考基因的预处理

2.3.6 短序列的比对(alignment)

2.3.7 SNP位点处碱基的统计(SNP calling)

2.3.8 分析结果的呈现

第三章 整个流程的数据结果

3.1测序数据的质控结果

3.1.1测序质量的分布情况

3.1.2 Reads的quality均值分布

3.1.3统计序列不同位置上ATCG四种碱基的分布。

3.1.4质控是去除低质量的测序数据。

3.2样本barcdoe的筛选结果

3.3 Alignment(比对)及 SNP calling的结果

第四章 流程优化

4.1 样本筛选分类优化

4.1.1 样本筛选问题

4.1.2 BSFI流程图

4.1.3 BSFI筛选结果一致性的评估

4.1.4筛选结果准确度的比较

4.1.5筛选速度的比较

4.2序列切除软件的比较

总结与展望

本课题的创新之处在于:

展望:

参考文献

致谢

展开▼

摘要

随着测序技术的不断革新,高通量测序技术在个体化诊疗中的需求日益高涨。结合高通量测序,通过对基因组测序数据的分析,来明确病人DNA信息,并帮助医生对疾病的诊断治疗已经成为当前的一个医疗趋势。目前,该领域存在的主要问题是现有的生物信息学分析流程仍然不能很好的满足当前大数据的分析需求。作者所在实习单位开发了基于二代测序平台的 SNP鉴定技术,其所带来的个体化数据解决方案亟待开发。本研究针对该测序方案建立了目标区段 SNP识别数据流,主要包括测序数据的质控,测序数据接头引物的去除,样本的筛选与分类,barcode的切除,序列的比对,参考序列SNP位点处的突变鉴定,样本基因型的判断。在得到原始测序数据后,通过这套数据处理流程可以快速而准确的获得样本SNP分型信息。
  在本工作流程中,先使用Cutadapt软件以Q20指标进行reads质量过滤与引物接头剪切,能够去约四分之一质量较差的数据;然后使用Fastx或BSFI软件进行样本分类,可归集到约64%的reads数;待样本分类完成之后,借助连在barcode上接头序列使用Cutadapt将这些片段连同barcode一并切除;再通过自己编写脚本从筛选好的数据中挑出不同项目的样本数据,并将这些数据比对到项目对应的参考序列上,比对所选用软件是BWA,在分类好的样本序列中,超过90%的reads可以比对到参考基因上,随后从比对结果中使用Samtools软件鉴定SNP信息。在鉴定SNP信息之后,获得了包含样本比对结果的mpileup文件,再通过编写脚本对mpileup文件中的数据进行简化归类并对分型结果进行判定,并将判定结果以更加简洁的文本形式输出。
  由于在样本分类过程中使用Fastx所耗计算时间过多,因此在流程优化时,重点编写了全新的BSFI程序。在该程序中的barcode筛选中额外加入了允许一个碱基的缺失(Deletion),并采用了多线程来加快数据的筛选速度。与Fastx相比,在不损失准确度的情况下,BSFI的样本分类速度显著提升,大约缩短至原先的六分之一,使得整体SNP数据流能在一个工作日能完成。
  本研究开发的基于二代测序数据的 SNP识别数据流,从数据获取到数据产生仅需6小时,能够满足基于二代测序平台的SNP鉴定技术所带来的个体化数据需求。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号