首页> 中文学位 >植物基因组串联重复序列的数据挖掘及在线服务平台的构建
【6h】

植物基因组串联重复序列的数据挖掘及在线服务平台的构建

代理获取

目录

声明

摘要

英文缩略表

第一章 引言

1.1 基因组测序

1.1.1 DNA测序技术

1.1.2 植物基因组测序的进展

1.2 植物串联重复序列

1.2.1 植物串联重复基因

1.2.2 植物微卫星DNA

1.3.1 生物信息数据库

1.3.2 生物信息网络服务

1.4 本研究的目的和意义

第二章 串联重复基因对芝麻基因组复杂性的影响

2.1 引言

2.2 数据来源

2.3 分析方法

2.3.1 功能注释与基因对的功能分化

2.3.2 基因对的选择压力分析

2.4 结果与分析

2.4.1 芝麻基因组的多倍化事件

2.4.2 芝麻基因组中共线性基因对的保留和丢失分析

2.4.3 芝麻基因组中共线性基因对的功能分化

2.4.4 芝麻基因组中共线性基因对的选择压力分析

2.4.5 串联重复事件对芝麻基因组的影响

2.4.6 芝麻基因组串联重复基因的功能分化

2.4.7 芝麻基因组多倍化基因和串联重复基因的功能差异

2.4.8 芝麻基因组不同类型的基因对的序列分化

2.4.9 芝麻基因组串联重复事件发生的时间

2.4.10 芝麻基因组中受不同进化事件影响的特定基因家族

2.5 讨论

2.5.1 多倍化基因和串联重复基因的功能补偿

2.5.2 芝麻基因组不同选择压力下的动态进化过程

2.6 结论

第三章 串联重复基因对细胞色素P450基因家族的影响

3.1 引言

3.2 数据来源

3.3 分析方法

3.3.1 细胞色素P450基因的鉴定

3.3.2 在染色体上的定位

3.3.3 系统发育分析

3.3.4 Ka、Ks和Ka/Ks的计算

3.3.5 统计检验

3.3.6 转录组分析

3.4 结果分析

3.4.1 拟南芥和芸薹属物种基因组细胞色素P450基因家族的比较

3.4.2 拟南芥、白菜和甘蓝基因组中细胞色素P450基因的进化分析

3.4.3 拟南芥和芸薹屡物种细胞色素P450基因的共线性分析

3.4.4 拟南芥和芸薹属物种细胞色素P450同源基因的选择压力分析

3.4.5 串联重复基因对细胞色素P450基因家族的贡献

3.4.6 多倍化事件和串联重复事件对细胞色素P450基因家族的影响

3.4.7 细胞色素P450基因家族的家族特异扩张

3.4.8 拟南芥、白菜和甘蓝基因组中细胞色素P450基因的表达分析

3.4.9 拟南芥和芸薹属基因组中不同类型细胞色素P450基因的表达差异

3.5 讨论

3.5.1 拟南芥和芸薹属物种基因组中的细胞色素P450基因家族的比较

3.5.2 芸薹属中细胞色素P450基因家族特异性的扩张或丢失

3.5.3 串联重复基因的在细胞色素P450基因家族进化历史中的动态变化

3.6 结论

第四章 植物基因组串联重复基因的数据库构建

4.1 引言

4.2 数据来源

4.3 分析方法

4.3.1 鉴定串联重复基因

4.3.2 串联重复基因的功能注释

4.3.3 PTGBase数据库的构建

4.4 功能界面和数据库使用介绍

4.4.2 浏览模块

4.4.3 检索模块

4.4.6 贡献模块

4.5 讨论

4.6 结论

第五章 植物基因组微卫星DNA及标记设计数据库

5.1 引言

5.2 数据来源

5.3 分析方法

5.4 数据库实现

5.5 结果与分析

5.5.1 数据库组织结构

5.5.2 可视化的界面

5.5.3 功能说明

5.6 讨论

5.7 结论

第六章 全文结论

参考文献

致谢

作者简历

展开▼

摘要

串联重复序列是植物基因组中一类重要的基因组组分。我们以植物基因组中功能串联重复序列-串联重复基因和简单串联重复序列-微卫星DNA为研究对象,结合目前已经发布的植物基因组数据,进行了全基因组水平上的深度信息挖掘和数据整合,并构建了两类串联重复序列的在线服务平台。
  1.串联重复基因对芝麻基因组复杂性的影响
  芝麻基因组先后经历了基因组的多倍化事件和串联重复事件,这两类事件为研究芝麻基因组的复杂性提供了丰富的数据基础。通过芝麻两条亚基因组的共线性分析发现,芝麻经历了多倍化以后产生的两条亚基因组中的共线性基因对经历了不对等的丢失。基因组的多倍化和串联重复事件产生的多拷贝基因的序列比较,我们发现芝麻基因组中大部分的串联重复基因是在多倍化之后产生的,但是也有一些串联重复基因位于亚基因组上,而且在两条亚基因组上有对应的共线性基因对,这就意味两条亚基因组上成对存在的串联重复基因在芝麻基因组多倍化之前就已经存在。通过对芝麻基因组的多倍化事件和串联重复事件对芝麻基因组影响的比较分析,我们发现两类事件都导致了芝麻基因组中基因剂量的增加,但是两类事件带来的基因功能相互补偿,协同作用,共同维护了物种的稳定。
  2.串联重复基因对细胞色素P450基因家族的影响
  根据已经发布的拟南芥、白菜和甘蓝基因组数据,利用细胞色素P450基因家族的保守结构特征,我们在拟南芥、白菜和甘蓝基因组中分别鉴定得到251、356和346个P450基因。三个物种基因组的进化分析和共线性分析显示芸薹属物种基因组中P450基因家族的扩张主要是由基因组的多倍化事件和串联重复事件引起的,而基因组多倍化事件是芸薹属物种中P450基因家族扩张的主要机制。通过对芸薹属中P450基因的转录组分析,我们发现多倍化事件产生的P450基因的表达模式几乎一致,但是串联重复事件产生的P450基因的表达模式差异显著。
  3.创建了植物基因组串联重复基因的数据库
  本研究整理了39个已经完成基因组测序的植物物种的基因组数据,进行了植物基因组中串联重复基因的鉴定。首先,利用物种的系统发育关系确定39个物种所属的不同进化分支,然后利用orthoMCL来确定不同进化分支上的同源基因簇;其次,确定同源基因在39不同物种的染色体或基因组大片段上的位置;最后,利用orthoMCL鉴定得到的同源基因簇在染色体或基因组大片段上的位置,确定串联重复基因簇。经过整理,共得到39个植物基因组中的54,130串联重复基因簇及其对应的129,652个串联重复基因。根据上述挖掘得到的数据,构建了39个物种的植物基因组串联重复基因的数据库PTGBase。
  4.创建了植物基因组微卫星DNA及其标记设计的数据库
  基于已发布的微卫星DNA鉴定的Perl程序(MISA),我们进行了优化修改,降低了程序复杂度,提高了运算效率,进一步搭建了微卫星DNA及其标记开发的流程。利用该流程,从110个已经完成基因组测序的植物基因组中鉴定得到了26,230,099微卫星DNA,并为每个微卫星DNA提供了多达3对的引物序列。利用微卫星DNA鉴定的流程,开发了一个用于在线鉴定微卫星DNA的网络服务MISAweb。我们把这两部分内容整合起来,构建了植物基因组微卫星DNA及其标记设计的数据库PMDBase。因此,PMDBase既可以帮助用户获取重要植物基因组中微卫星DNA的数据信息,又可以利用在线工具MISAweb来鉴定自己感兴趣的物种基因组区段上的微卫星DNA,并进行在线的批量分子标记设计。
  本研究对植物基因组中功能串联重复序列-串联重复基因在基因组和基因家族两个层面上进行了详细的信息挖掘,深入探讨了串联重复基因对基因组和基因家族进化和形成机制的影响,并构建了植物基因组串联重复基因的数据库。通过植物基因组中简单串联重复序列-微卫星DNA在不同植物基因组中的信息挖掘,进行了不同物种基因组间,以及基因区和基因间区的比较分析,并构建了植物基因组微卫星DNA及其标记设计的数据库。该研究不仅可以为研究者们研究基因组和基因家族进化和比较分析提供生物学模型,而且可以为研究者们在基因组学,比较基因组学以及分子育种研究提供基因资源丰富的在线服务平台。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号