首页> 中文学位 >三倍体个体单体型组装问题的研究
【6h】

三倍体个体单体型组装问题的研究

代理获取

目录

摘要

第1章 绪论

1.1 研究背景及意义

1.2 遗传和变异的相关知识

1.2.1 遗传的物质基础和DNA测序

1.2.2 可遗传的变异

1.3 三倍体个体单体型组装问题

1.3.1 问题描述

1.3.2 计算模型

1.3.3 国内外研究现状

1.4 论文主要研究内容

1.5 论文内容与安排

第2章 一种基于支持度的重建算法HTMS

2.1 基本概念和符号定义

2.2 HTMS算法设计及实现

2.2.1 预处理

2.2.2 重建单体型

2.2.3 扩展

2.3 算法复杂性

2.4 实验结果与分析

2.4.1 实验数据

2.4.2 评价指标

2.4.3 性能评价

2.5 本章小结

第3章 一种基于差异度的重建算法HTLD

3.1 基本概念和符号定义

3.2 HTLD算法设计及实现

3.3 算法复杂性

3.4 实验结果

3.5 本蕈小结

第4章 总结和展望

4.1 总结

4.2 展望

参考文献

攻读硕士期间发表的与学位论文有关的论文目录

致谢

声明

展开▼

摘要

SNP的研究对探索三倍体物种的遗传特性和表型差异等方面发挥着重要的作用,而单体型数据比单个SNP位点携带更多的遗传信息,其在生物个体的表型差异、基因表达和疾病预测等方面发挥的作用更大。由于目前的实验技术水平有限,直接通过生物学手段来测定一个个体的单体型的时间和金钱成本过高,因此通过计算方法来获取个体单体型成为生物学关注的热点问题。本文主要研究三倍体个体单体型组装问题,具体工作如下:
  针对带基因型信息的最少错误更正模型对组装问题进行研究,提出一种基于支持度的重建算法HTMS(Haplotyping a Triploid individual with Most Support)。HTMS算法依次重建三条单体型上的每一个SNP位点取值,对于给定位点,首先根据其基因型取值枚举该位点的三种单体型取值情况,然后选择获片段支持度最高的取值作为该位点的重建值。实验测试数据由CELSIM和MetaSim两种测序片段模拟生成器生成,在片段覆盖率、错误率、单片段长度、单体型长度和单体型海明距离等参数的不同设置下,比较分析算法HTMS、T-HC、GTIHR、W-GA和Q-PSO的重建率和运行时间。实验结果显示,算法HTMS在不同的参数设置下,都能用最快的运行速度获得最高的重建率。
  针对带基因型信息的最少错误更正模型,提出一种基于差异度的重建算法HTLD(Haplotyping a Triploid individual with Least Difference)。HTLD算法采取一种新的计算方法度量片段和单体型间的距离。当由基因型枚举出待重建位点的三种取值时,分别计算三种取值下,单体型与覆盖该位点的片段之间的距离和,选择对应最小片段差异度的取值,即对应距离和最小的取值。实验结果表明,在不同的参数取值下,算法HTLD和HTMS具有相近的问题求解性能,且都比算法T-HC、GTIHR、W-GA和Q-PSO的重建精度更高,运行时间更短。
  综上所述,本文基于带基因型信息的最少错误更正模型,提出两种重建算法HTMS和HTLD。大量的实验结果显示,HTMS和HTLD算法都能以更快的求解速度获得精度更高的单体型,是解决三倍体个体单体型组装问题的实用方法,具有很强的应用价值。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号