首页> 中文学位 >人类基因组indel与结构变异的检测和分析方法的研究
【6h】

人类基因组indel与结构变异的检测和分析方法的研究

代理获取

目录

封面

中文摘要

英文摘要

目录

第1章 绪 论

1.1 课题背景和意义

1.2相关背景知识

1.3研究现状

1.4 本文结构

第2章 人类个体基因组中indel数量估计方法的研究

2.1 引言

2.2 人类基因组indel总数估计流程

2.3 测序数据分析

2.4 多平台数据综合分析方法的研究

2.5 Indel杂合性分析方法的研究

2.6 Indel总数估计模型的研究

2.7 本章小结

第3章 Indel与结构变异检测模拟实验方法的研究

3.1 引言

3.2 Indel与结构变异检测模拟实验基本流程

3.3模拟数据构造方法的研究

3.4 模拟实验结果评价方法的研究

3.5 实验结果与分析

3.6 本章小结

第4章 基于最长空位固定罚分的拆分测序片段映射方法的研究

4.1 引言

4.2 拆分测序片段映射的搜索空间

4.3 拆分测序片段映射算法

4.4 实验结果与分析

4.4 本章小结

第5章 基于两种序列映射征分析的结构变异检测方法的研究

5.1 引言

5.2 异常测序片段对与拆分测序片段的产生

5.3拆分测序片段映射与结构变异检测

5.4 实验结果与分析

5.5 影响indel与结构变异检测效果的因素

5.6 本章小结

结 论

参考文献

攻读博士学位期间发表的论文及其它成果

声明

致谢

个人简历

展开▼

摘要

高通量测序技术的不断发展促进了人类基因组的研究,其中indel与结构变异的检测与分析是一项重要的内容。Indel与结构变异的存在会导致高通量测序片段难以映射,从而使临近区域序列分析变得困难。在海量的高通量测序数据中进行indel与结构变异的检测和分析为生物信息学研究提出了新的挑战。本文针对人类基因组indel和结构变异研究中所存在的困难进行了深入的探讨和研究。本文的主要内容如下:
  (1)提出了基于多测序平台数据indel检测结果分析方法与人类基因组总数估计模型。研究中通过对NA1807个体基因组Illumina36bp测序数据与100bp测序数据的实验与分析,证实了使用大量36bp短测序片段数据的千人基因组计划所报告的人类个体indel数量是偏低的,并使用提出的模型对NA18507个体基因组内的indel总数的下限进行了估计。
  (2)研究了indel与结构变异检测研究中的模拟数据构造方法与模拟实验结果评价方法。并通过程序设计实现,提供了一套为indel与结构变异检测研究服务的模拟实验工具。通过对近年发表的几种测序片段映射方法以及indel与结构变异检测方法的模拟实验与评测,证实了本研究所提出的模拟实验与结果评价方法能够从过去研究中所忽视的异常测序片段对映射和拆分测序片段映射等方面来反映这些方法潜在的差异。
  (3)提出了一种对拆分测序片段中最长空位进行固定罚分的序列映射算法。该算法通过对拆分测序片段映射中一段最长的空位进行固定罚分,来控制整体映射结构的分值不会受到长空位的影响而过低,同时对于其他较短空位仍进行与空位长度相关的罚分策略,以保证映射结果中空位的总体数量不至于过多。本文的实验结果显示,这种算法映射拆分测序片段的效果相比已有方法具有明显优势。
  (4)提出了一种将异常测序片段对分析与拆分测序片段映射相结合的新型结构变异检测方法。这种方法利用异常测序片段对的分析结果大致地确定变异存在的范围,然后以此范围为基础在缩小的搜索空间内进行拆分测序片段映射,并根据映射结果检测indel与结构变异。本文将这种新的方法加以程序实现,并进行了大量的模拟数据实验、真实数据实验以及生物验证实验,证实了新方法与已有方法相比具有更好的运行效率以及综合的indel与结构变异检测效果。最后,本文还根据研究结果进一步分析了数据覆盖率以及变异区域重复序列对indel与结构变异的的影响。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号