首页> 中文学位 >高通量测序误差模型分析及解码方案设计
【6h】

高通量测序误差模型分析及解码方案设计

代理获取

目录

声明

摘要

第一章 绪论

1.1 引言

1.2 测序技术的诞生与“人类基因组计划”

1.3 高通量测序技术问世

1.3.1 高通量测序技术的诞生

1.3.2 第三代测序技术

1.3.3 各类测序技术间的比较

1.4 高通量测序技术的应用与千人基因组计划

1.4.1 全基因组测序

1.4.2 宏基因组测序

1.4.3 研究DNA和蛋白质的相互作用

1.4.4“千人基因组计划”

1.5 高通量测序目前存在的问题

1.6 课题的研究的意义与内容

1.6.1 课题背景及意义

1.6.2 课题研究内容

1.7 论文章节安排

1.8 本章小结

第二章 高通量测序的偏差及现行解决方案

2.1 高通量测序的偏差分类

2.1.1 不完善的化学反应引入的偏差

2.1.2 采用光学检测而带来的偏差

2.2 现行的碱基识别工具

2.3 本章小结

第三章 AG-100测序平台的误差模型分析及碱基识别方案研究

3.1 引言

3.2 荧光光谱串扰的校正思想

3.2.1 串扰模型

3.2.2 串扰矩阵分析

3.2.3 串扰校正流程

3.3 相位偏移校正

3.3.1 基于连接法测序的相位偏移处理

3.3.2 相位偏移处理的基本过程

3.4 AGNGS碱基识别软件

3.5 本章小结

第四章 两核苷酸同时合成DNA测序的解码方案研究

4.1 引言

4.2 两核苷酸同时合成DNA测序技术

4.2.1 两核苷酸同时合成DNA测序原理

4.2.2 两核苷酸同时合成DNA测序技术特点分析

4.2.3 解码方案相关术语

4.3 基于两组编码序列信息的解码方案

4.4 基于三组编码序列信息的解码方案的初步研究

4.4.1 无测序错误下基于三组编码序列信息的解码方案

4.4.2 存在测序错误下基于三组编码序列信息的解码方案

4.5 本章小结

第五章 总结与展望

5.1 工作总结

5.2 展望

参考文献

附录

致谢

作者简介

展开▼

摘要

高通量DNA测序技术是目前生命科学领域的一种重要的研究手段。经过十几年的发展,高通量测序技术无论在测序通量还是测序速度上都有了很大的提升,测序成本也有了大幅度的降低。然而高通量测序错误率高等难题仍未得到有效解决。另外,目前市场上所有的商用测序仪器及其配套试剂都被国外测序仪公司所垄断,要打破这种局面必须发展具有自主知识产权的国产测序仪。本课题针对东南大学生物电子学国家重点实验室自主研制的AG系列测序仪,研究系统误差的来源及其纠错模型,以期提高现有AG-100测序平台数据产生的准确率,在此基础上,建立碱基识别算法并开发软件系统,并同时为双碱基编码测序技术的AG-200平台提供解码方案。
  本论文首先分析了高通量测序平台中常见的测序误差,介绍并比较了一些比较流行的误差模型及校正的工具。在此基础上,对自主研发的基于连接法测序的AG-100高通量测序平台,我们分析了该平台的误差来源,建立了相应的误差校正模型,主要包括荧光光谱串扰校正和相位偏移校正。对于光谱串扰,我们将其视作一个线性转换问题,建立相应的数学模型,明确了求解串扰矩阵是校正流程中的关键步骤。我们采取了逐步迭代的方法对串扰矩阵进行估算,并在迭代的过程中对荧光强度数据进行不断地校正。在相位偏移的校正步骤中,我们将测序片段按照连接法测序时的顺序分割成更小的片段,对分割后的片段分别建立相位偏移矩阵,然后逐一校正,再将其合成。最后我们为AG-100平台的碱基识别流程开发了软件,该软件接收荧光强度数据作为输入,输出fastq格式的包含序列和及其质量的文件。通过模拟试验证明该软件能有效地校正光谱串扰偏差。
  为提高测序效率,在连接测序的基础上,我们实验室还提出了两核苷酸同时合成DNA测序方案。相比较单核苷酸测序,两核苷酸测序具有较高的精度,但同时也造成每一轮测序结果不直观,我们需要对其进行解码。为此我们提出了相应的解码方案,并采用模拟数据集进行了测试,取得了完全正确的解码结果。然后将这个方案推广到包含测序错误的情况下,我们详细分析了三组编码序列的全部误差模式,并分别为其可能出现的测序错误提出了相应的纠正方案。通过模拟数据集的测试,初步验证了该解码方案的正确性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号