首页> 中文学位 >利用高通量测序技术研究基因组复制与关系以及可变剪切
【6h】

利用高通量测序技术研究基因组复制与关系以及可变剪切

代理获取

目录

摘要

第一章 绪论

1.1 测序技术的产生和进展

1.1.1 第一代测序技术的产生

1.1.2 第二代测序技术的产生

1.2 第二代测序目前的主要应用

1.2.1 第二代测序在检测全基因组加倍中的应用

1.2.2 第二代测序在转录组学中的应用

1.2.3 第二代测序在环境基因组学中的应用

1.2.4 第二代测序在其他方面的应用

1.3 本研究的目的和意义

第二章 被子植物中多倍化事件是普遍存在的

2.1 背景介绍

2.1.1 全基因组多倍化的定义和意义

2.1.2 全基因组加倍的普遍性

2.1.3 被子植物的重要地位

2.2 数据和方法

2.2.1 全基因组测序物种的收集和转录组物种的测序

2.2.2 转录组测序,拼接以及蛋白质预测

2.2.3 基因家族的识别和基因树的构建

2.2.4 同义替换速率的计算(Ks)和混合模型拟合

2.2.5 全基因组加倍事件的发现

2.2.6 保留基因的GO(Gene Ontology)功能分析

2.3 基于Ks的方法验证已经发现的和识别新的全基因组加倍事件

2.3.1 已知全基因组加倍事件的验证

2.3.2 多个新全基因组加倍事件的发现

2.4 基于系统发生树的方式来发现和定位全基因组加倍事件

2.4.1 蔷薇类植物全基因组加倍事件

2.4.2 菊类植物全基因组加倍事件

2.4.3 单子叶植物全基因组加倍事件

2.4.4 木兰类及金鱼藻,金粟兰植物全基因组加倍事件

2.5 保留的重复基因的功能偏好性分析

2.5.1 十字花科的alpha(α)和beta(β)重复以后的保留的重复基因

2.5.2 豆科祖先基因组重复后保留基因的功能分析

2.5.3 禾本科的两次重复后保留的重复基因

2.6 gamma(γ)事件以后不同分支的丢失比较

2.7 本章小结

2.8 附图和附表

第三章 拟南芥早期花发育转录组中可变剪切分析

3.1 背景介绍

3.1.1 可变剪切研究的历史

3.1.2 可变剪切的主要形式

3.1.3 植物中的可变剪切

3.1.4 可变剪切的功能

3.2 材料与方法

3.2.1 拟南芥早期花转录组的收集,RNA提取和测序

3.2.2 测序片段比对和转录本拼接,表达量估计

3.2.3 可变剪切基因识别

3.2.4 寻找差异表达的可变剪切基因

3.2.5 差异表达基因的聚类和功能分析

3.2.6 未注释转录区域的识别

3.3 拟南芥早期花发育转录组的描述

3.4 表达量的估计

3.5 可变剪切事件的识别

3.6 不同发育时期差异表达的可变剪切基因

3.6.1 差异表达可变剪切基因的聚类分析

3.6.2 时期特异的可变剪切基因

3.7 新的转录区域的识别

3.7.1 序列拼装Cufflinks识别新的转录区域

3.8 本章小结

3.9 附图和附表

第四章 基于二代测序和组分特征的宏基因组学的研究方法

4.1 背景介绍

4.2 材料和方法流程

4.2.1 下载已有的细菌和真菌微生物的蛋白质组

4.2.2 构建参考基因的K串数据库

4.2.3 比较目标短串和参考基因数据库

4.2.4 对目标短串进行分类注释和功能注释

4.2.5 构建154个属中的不同长度的短串序列模拟数据

4.2.6 构建428个物种的不同长度的短串序列模拟数据

4.2.7 124个人类的肠道环境基因组

4.3 比较MetaCV与其他三种方法的敏感度和特异性(模拟数据一)

4.4 比较MetaCV与其他三种方法在随机数据集中的表现(模拟数据二)

4.5 评价MetaCV对于环境其他真核生物的污染的稳定性

4.6 利用MetaCV可以快速处理海量真实人类肠道的环境基因组数据

4.7 本章小结

4.8 附图和附表

参考文献

致谢

攻读博士期间所获奖励

攻读博士学位期间(待)发表的学术论文

博士期间给下列杂志审过稿件

声明

展开▼

摘要

快速准确地获取生物体的遗传信息对于生命科学的研究具有重要的意义。对于每一个生物体而言,遗传信息的载体是基因组(包括核基因组和细胞器基因组)。而测序技术能够真实准确地反映基因组上的遗传信息,进而比较全面地揭示基因组的复杂性和多样性及其规律,因此基因组的测序在生命科学研究中起着十分重要的作用。
  二代测序技术(Next Generation Sequencing,NGS)已经被广泛应用在基因组,转录组,甲基化组,环境基因组以及系统分类组等研究领域。在本研究中,利用这一技术获得的数据分析了被子植物中全基因组多倍化的情况,了解到多倍化在已经有全基因组测序物种和没有基因组测序的物种中的分布都非常普遍,而且在代表大小物种类群的物种中都发现有基因组多倍化的痕迹,暗示多倍化本身并不会直接导致物种类群的扩散和扩增。而通过对多倍化后保留基因的功能分析,我们发现编码转录因子,激酶,转运蛋白等的基因容易在基因组加倍以后中保留,这与之前多个研究的结果一致。除此之外,一些与发育和环境应答相关的基因也容易保留下来,这从基因的水平上暗示了多倍化对于物种适应环境、自身进化具有重要的作用。
  和基因组多倍化相比,可变剪切在对基因功能的多样化贡献以及蛋白质组的贡献具有一定的类似作用。在植物中的可变剪切研究相比动物还处在一个刚起步的阶段,就目前研究最为清楚的模式生物拟南芥而言,对于可变剪切的研究将会对其他非模式植物具有重要的参考价值。为此,我们利用第二代测序技术中的RNA-Seq研究拟南芥花发育过程中的可变剪切。花发育作为植物有性生殖的关键环节,对植物的繁衍和进化具有重要的意义,也是植物发育过程中研究最多的过程之一。通过对三个发育时期的比较,我们发现了众多基因被时期调控的可变剪切,并且发现了数百个之前注释或研究中所没发现的新转录区域。这些结果为日后植物可变剪切的研究提供了重要的参考信息。
  显然二代测序的发展在基因组多倍化还是可变剪切研究中都起到了巨大的推进作用,而对于环境基因组学而言,这种推进作用是史无前例的。对环境样本中的微生物的直接测序克服了大多数微生物不能够在实验室单独培养的缺点,使科学家可以从整体上研究环境样本中微生物的种类和微生物间的相互作用,是微生物学家研究方法上的重要突破。而随着样本和数据量的增加,人们越来越需要有快速的生物信息方法,能够在较短的时间内高效地处理大量环境基因组的测序数据。为此我和另一位博士生合作建立了一种叫MetaCV的算法,意在有效、快速、准确的处理各种环境基因组数据,并提供方便的数据分析和数据展示。MetaCV的优势在于对原始的测序数据不进行拼装,而直接用测序数据预测含有几个氨基酸残基的“词”,并用这些词进行物种分类和丰度估计,这在理念上有别于传统的拼装和序列比对的方法,极大地提升了计算速度。同时通过采用了组分矢量的方法,可以尽可能地保留了物种间的分类信息,使最后的分类结果准确可靠。分析结果显示在分析模拟数据和真实数据时,MetaCV都要比现有的其他算法更快、更准确。
  总之,借助于二代测序技术,我揭示了全基因组多倍化事件在被子植物中的普遍性,了解了拟南芥花发育过程不同时期的可变剪切情况,同时还合作建立了一种快速、有效的利用环境基因组学数据分析微生物关系的方法。这些研究不仅丰富了二代测序的应用,也为其他相关研究提供了重要的参考和理论依据。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号