首页> 中文学位 >基因组全序列寡聚核苷酸频率概形的研究
【6h】

基因组全序列寡聚核苷酸频率概形的研究

代理获取

目录

文摘

英文文摘

声明

第一章 前言

1.1基因组相关的生物信息学研究

1.2基因统计特征的一些表示

1.3链对称性研究

1.4 DNA寡聚核苷酸的频率保守性

1.5研究的内容和意义

第二章 材料和方法

2.1 材料来源

2.2分析过程和方法

第三章 结果和讨论

3.1 原核生物基因组的三核苷酸频率计算及概形分析

3.2不同GC含量的同属原核生物的三核苷酸频率概形分析

3.3 部分真核生物基因序列三核苷酸频率概形分析

3.4线粒体基因组的三核苷酸频率概形分析

3.5 叶绿体基因组的三核苷酸频率概形分析

3.6质粒的三核苷酸频率概形分析

3.7病毒的三核苷酸频率概形分析

3.8噬菌体的三核苷酸频率概形分析

3.9随机序列的三核苷酸频率概形分析

3.10原核生物单核苷酸、二核苷酸和4~6阶核苷酸的频率概形分析

第四章 总结与展望

4.1总结

4.2展望

参考文献

附录:

致谢

展开▼

摘要

随着基因组测序技术以及基因组学的飞速发展,使得越来越多物种的全基因组序列测序完成,在全基因组中寻找一些共性的基因特征和遗传痕迹成为可能,由于自然选择和物种进化的作用,不同物种的基因组对碱基的偏好度不同,在长期的进化过程中,序列越短,在进化过程中被改变的概率就越小,因此,基因组中的核苷酸和寡聚核苷酸保留了大量的生物信息。
   本文计算了已完成测序557个原核生物基因组的571条序列的GC含量和三核苷酸的出现频率,根据物种的三核苷酸频率数据的相关性进行聚类分析。根据聚类分析结果,试图寻找在不同基因组中,三核苷酸频率是否存在的某些特定的概形特征。
   结果表明,原核生物基因组全序列的三核苷酸频率主要存在两种主概形。低GC含量序列组成一个概形,高GC含量序列组成另一个概形。同时我们还对部分有代表性的线粒体、叶绿体、质粒、噬菌体、病毒、真核生物进行了分析,发现链对称性好的线粒体、叶绿体、质粒基因组的低GC含量序列和高GC含量序列分别存在两个不同的概形,链对称性不好的噬菌体基因组序列不存在明显的概形特征。为了进一步探讨原核生物基因组全序列的三核苷酸频率概形和序列的GC含量及链对称性的关系。我们对不同GC含量的随机序列进行了分析,发现链对称性好的低GC含量随机序列在和高GC含量随机序列也分别存在两个不同的概形,而且和原核生物基因组序列的两个概形相似性很高。以上分析表明,原核生物基因组不同GC含量序列的两个概形和GC含量以及链对称有关。
   本文同时分析了571条原核生物基因组的单核苷酸、二核苷酸、四核苷酸、五核苷酸和六核苷酸的频率概形。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号