首页> 中文学位 >人类基因组8-mer使用保守性和CpG岛序列结构的关系
【6h】

人类基因组8-mer使用保守性和CpG岛序列结构的关系

代理获取

目录

声明

摘要

第一章 绪论

1.1 DNA序列中k-mer的研究进展

1.1.1 DNA序列中k-mer的研究

1.1.2 DNA序列中k-mer分布图谱

1.2 CpG岛序列

1.2.1 CpG岛的研究现状

1.2.2 CGIs的序列特征

1.3 课题研究背景

1.4 论文结构安排

第二章 数据信息与研究方法

2.1 数据库

2.1.1 人类基因组DNA序列

2.1.2 CpG岛序列

2.2 研究方法

2.2.1 DNA序列中的8-mer频次

2.2.2 8-mer按照二核苷酸含量分类

2.2.3 8-mer中m核苷酸的相对频数

2.2.4 8-mer特征量Ktri

第三章 人类基因组上8-mer频数分布特征

3.1 人类基因组上的8-mer频数分布

3.2 按照二核苷酸分类后的8-mer频数分布

3.3 三峰分布与进化的关系

第四章 CG2模体子集与CpG岛序列的相关性

4.1 提取作为研究的序列

4.2 CpG岛和非CpG岛序列的Ktri值

4.3 以二核苷酸CG分类的Ktri分布

4.4 以16种二核苷分类的Ktri值分布比较

第五章 CpG岛序列结构分析

5.1 CpG岛序列上C+G含量分布

5.2 CpG岛中Ktri的分布

5.3 CpG岛序列中CG2所对应的Ktri分布以及局域结构的分布特征

5.3.1 标准化后的CG2所对应的Ktri分布

5.3.2 CG2对应的Ktri形成的局域结构所对应的序列长度分布

第六章 总结和展望

6.1 总结

6.2 展望

参考文献

附录

致谢

展开▼

摘要

基因组序列的k-mer使用是非随机的,研究k-mer非随机使用规律以及特征k-mer的生物学功能,对于了解基因组结构和进化具有重要的生物学意义。本文从整个人类基因组出发,通过研究DNA序列8-mer频数分布特征探究其进化保守性。为此我们对人类基因组DNA序列进行了8-mer的提取,按照频数出现从小到大的顺序,设置相同的区组对其绘制频数分布图像,结果显示其分布呈现三峰现象。我们将这三个峰按照从左到右依次叫做峰一、峰二和峰三。按照包含二核苷酸XY的个数,将整个8-mer集合按照不包含、包含一个和包含两个及以上分成三个模体子集,分别记为XY0、XY1和XY2,并且分别绘制分布图,发现只有以CG分组的CG0、CG1和CG2模体子集各自形成独立的单峰,并且与整体8-mer所呈现的三峰相对应。我们在同一坐标系下绘制组分约束下的随机序列8-mer频数分布与人类基因组DNA序列频数分布图像,发现峰三与随机序列相对应,而峰一峰二远离随机分布中心,说明峰三具有随机性,峰一和峰二具有很强的保守性。
  结合之前组内的研究,我们推测CG2模体子集是CpG岛序列的核心模体,为了验证我们的猜想,本文中提取整个人类基因组上的CpG岛序列,同时相应的提取等长的非CpG岛序列,按照二核苷酸的分类分别计算每一个模体中的CpG岛序列和非CpG岛序列的特征量,通过分别绘制对应的分布验证了CG2模体子集是CpG岛分类的指标。在之后的研究中,我们对CpG岛序列根据以CG分类的三种特征量Ktri做分布图,发现以CG2分类的特征量在CpG岛序列上呈现了明显的局域结构,再次证明CG2模体子集是CpG岛序列的核心模体,我们分别设定一定的标准提取代表局域结构的序列片段,发现其长度集中在15bp至23bp间,峰值出现在17bp的位置。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号