首页> 中文学位 >基于高通量测序数据的基因组变异检测方法研究
【6h】

基于高通量测序数据的基因组变异检测方法研究

代理获取

目录

第1章 绪 论

1.1课题背景及研究的目的和意义

1.2相关背景知识

1.3研究现状

1.4本文的主要研究内容

第2章 面向拷贝数变异检测的基因组测序片段深度建模方法

2.1引言

2.2 reads深度的影响因素分析

2.3 reads深度概率模型

2.4千人基因组计划数据实验结果与分析

2.5本章小结

第3章 肿瘤—正常配对样本基因组拷贝数变异检测方法

3.1 引言

3.2等位基因频率概率模型

3.3肿瘤—正常配对样本拷贝数变异联合检测方法

3.4模拟肿瘤—正常配对样本测序数据的实验结果与分析

3.5本章小结

第4章 家系基因组拷贝数变异检测方法

4.1引言

4.2家系基因组拷贝数变异联合检测方法

4.3家系基因组拷贝数变异检测实验结果与分析

4.4本章小结

第5章 家系基因组新突变过滤方法

5.1引言

5.2基于梯度提升的新突变过滤方法

5.3新突变的检测与过滤实验结果与分析

5.4本章小结

结论

参考文献

攻读博士学位期间发表的论文及其它成果

声明

致谢

个人简历

展开▼

摘要

近十年来,高通量测序技术迅猛发展,个人基因组测序已经在基础医学研究、临床诊疗、健康管理、新药研发等领域得到广泛应用,极大地推动了相关领域的发展。由于个人基因组测序数据具有碎片化、规模巨大、高度复杂等特点,对其分析面临巨大的挑战。基因组变异是指不同个体的DNA序列之间的差异,基因组变异决定不同个体之间表型的差异以及多种疾病。从个人基因组测序数据中准确地检测各种不同类型的基因组变异对于个人基因组测序在不同领域的广泛应用具有重要的意义。基于高通量测序数据的基因组变异检测问题已成为计算机科学和生物信息学领域的研究热点与难点问题。围绕针对不同类型基因组测序数据的基因组变异检测问题,虽然新的算法、软件与工具层出不穷,但现有的基因组变异检测方法仍存在准确率较低的问题,大大限制了个人基因组测序在不同领域的广泛应用。
  本研究主要内容包括:⑴针对现有的基于reads深度信息的拷贝数变异检测方法对reads深度分布无法准确建模的问题,研究基于负二项回归的reads深度概率模型,有效处理reads深度分布的过离散问题,同时准确体现GC含量和Mappability对reads深度的影响。该模型可以应用于单样本基因组拷贝数变异检测、群体基因组拷贝数变异检测、肿瘤-正常配对样本基因组拷贝数变异检测、家系基因组拷贝数变异检测。⑵针对现有的肿瘤-正常配对样本基因组拷贝数变异检测方法无法同时检测生殖系拷贝数变异和体细胞拷贝数突变以及检测准确率较低的问题,研究基于隐马尔可夫模型的肿瘤—正常配对样本基因组拷贝数变异检测方法。该方法将肿瘤细胞和正常细胞在基因组同一位置的拷贝数状态的组合定义为隐藏状态;根据基于β—二项分布的等位基因频率概率模型和基于负二项回归的reads深度概率模型计算输出概率,且在输出概率的计算过程中利用了肿瘤样本的不纯净性和肿瘤细胞染色体呈非整倍性的特征;根据生殖系拷贝数变异的拷贝数状态转移和体细胞拷贝数突变的拷贝数状态转移计算输出概率;利用Viterbi算法预测最可能发生的隐藏状态序列,从而检测出肿瘤细胞和正常细胞中均存在的生殖系拷贝数变异以及只有肿瘤细胞中存在的体细胞拷贝数突变。⑶针对单样本基因组拷贝数变异检测方法和群体基因组拷贝数变异检测方法在家系基因组测序数据上检测准确率较低的问题,研究基于隐马尔可夫模型的家系基因组拷贝数变异检测方法。该方法将一个三样本家系中所有样本在基因组同一位置的拷贝数状态的组合定义为隐藏状态;根据基于负二项回归的reads深度概率模型计算输出概率;根据孟德尔遗传和新突变事件两种遗传模式下的拷贝数状态遗传概率计算转移概率;利用Viterbi算法预测最可能发生的隐藏状态序列,从而检测出遗传性拷贝数变异和拷贝数新突变。⑷针对现有的家系基因组新突变(SNV和INDEL类型)检测方法无法处理 reads错误比对导致检测结果假阳性率较高这一问题,研究基于梯度提升的新突变过滤方法。该方法对常用新突变检测方法产生的结果进行过滤,在确保基本不损失敏感度的前提下,显著降低错误的新突变的数量。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号