首页> 中文学位 >新一代高通量测序数据校正方法研究
【6h】

新一代高通量测序数据校正方法研究

代理获取

目录

声明

摘要

第1章绪论

1.1论文的背景及研究意义

1.1.1论文的研究背景

1.1.2论文研究意义

1.2国内外研究现状

1.3论文内容及目的

1.4本文的主要工作和章节安排

第2章测序数据的提取和预处理

2.1测序基本原理及过程

2.1.1 Illumina测序原理

2.1.2 Illumina测序过程

2.1.3 Ion Torrent测序原理

2.1.4 Ion Torrent测序过程

2.2测序数据提取及预处理

2.2.1 SFF文件的信息

2.2.2 FASTQ测序数据

2.3测序数据比对

2.3.1人类参考基因组

2.3.2 BAM和SAM的文件格式

2.3.3局部序列比对方法

2.4测序数据处理工具

2.4.1 Seqan

2.4.2 Samtools

2.5本章小结

第3章测序数据的交叉校正

3.1测序数据获取来源

3.2 Ion Torrent测序数据处理

3.2.1序列比对Multiple mapping数据处理

3.2.2比对不成功数据去除

3.2.3 PCR duplication数据去除

3.2.4扩增区间外数据处理

3.3 Illumina测序数据分析

3.3.1 Illumina数据Prephasing问题现象

3.3.2 Illumina数据phasing问题现象

3.3.3测序读数及误测分析

3.4测序数据交叉校正

3.4.1两种测序数据的比对分析

3.4.2 Ion Torrent测序数据校正算法设计

3.4.3 Illumina测序数据校正算法设计

3.5本章小结

第4章Ion Torrent测序数据综合校正模型

4.1神经网络模型的介绍与特征分析

4.1.1多层神经网络模型

4.1.2相邻电压信号的分析及特征分组

4.1.3特征向量的预处理与神经网络参数调节

4.2综合模型构建

4.2.1参考基因的还原

4.2.2动态规划和综合模型

4.3本章小结

第5章校正效果分析

5.1测序数据校正结果分析

5.2测试数据信息分布

5.3综合模型调参

5.4综合模型识别结果

5.5本章小结

结论

参考文献

攻读硕士学位期间发表的论文和取得的科研成果

致谢

展开▼

摘要

随着信息检测技术的飞速发展,高通量测序技术把生命科学研究推上了一个新的高度。目前,Illumina和Ion Torrent高通量测序平台是两款主要的测序平台,Illumina是基于可逆终止的、荧光标记dNTP来边合成、边测序的,而Ion Torrent则是基于半导体芯片,通过传感器将序列合成化学反应过程中的pH值变化,转化成电压信号进行测序的。
  Ion Torrent测序平台每次测一类碱基,存在多聚碱基(连续相同碱基)长度测不准的问题,而Illumina测序平台每次只测一个碱基则不存在这个问题;Illumina测序平台采用光学测序,有可能测错碱基类型,而因为Ion Torrent依靠化学反应进行检测,则不会测错碱基类型。由于测序原理截然不同,两款测序仪有很强的互补性。所以根据两个测序平台的互补性,提出一种Illumina和Ion Torrent两种高通量测序数据交叉校正的方法。
  本文设计了逻辑分析方法实现了Illumina测序数据中碱基类型错误校正和Ion Torrent测序数据中多聚碱基长度错误校正。其中第一种方法依据三个原则对两个测序数据进行相互校正,即Illumina测序数据的测序长度是正确的;Ion Torrent测序数据的测序类型是正确的;同一位点处Illumina测序和Ion Torrent测序不会同时出错。基于该原则,首先对两组测序数据进行预处理,并分析导致Illumina测序数据出错的原因;然后,比对分析总结出两种测序数据相互校正原则;最后,根据校正原则设计相互交叉校正的算法对数据进行校正。根据研究结果,因Illumina测序成本较高,还单独设计了一个基于神经网络和动态规划算法的综合模型,对Ion Torrent测序数据中的多聚碱基长度错误进行直接校正。针对于该方法,首先分析导致Ion Torrent测序数据中多聚碱基长度检测误差的因素;然后,设计基于多层神经网络的误差校正模型;最后,为了提高识别精度,引入参考基因信息,设计多层神经网络和动态规划算法结合的综合模型,该模型可以直接对Ion Torrent测序数数据直接校正。随后的实验结果表明,所提出方法能够有效校正Illumina测序数据中碱基类型错误,以及对Ion Torrent测序数据中多聚碱基长度错误校正。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号