首页> 中文学位 >白菜参考基因组组装升级和进化分析
【6h】

白菜参考基因组组装升级和进化分析

代理获取

目录

声明

摘要

英文缩略表

第一章 引言

1.1 测序技术简介

1.1.1 第一代DNA测序技术

1.1.2 第二代DNA测序技术

1.1.3 第三代DNA测序技术

1.1.4 RNA-Seq测序技术

1.2 基因组组装算法和工具

1.2.1 组装算法简介

1.2.2 组装工具简介

1.2.3 基因组组装面临的挑战

1.3 基因注释流程和工具

1.3.1 基因注释流程简介

1.3.2 基因注释主流工具简介

1.3.3 基因注释面临的挑战

1.4 白菜基因组研究进展

1.5 本课题研究目的

第二章 白菜V2.0版本基因组组装与注释

2.1 材料与方法

2.1.1 试验材料

2.1.2 试验方法

2.2 结果与分析

2.2.1 V2.0版本基因组组装结果

2.2.2 V2.0版本基因组Scaffold序列的锚定

2.2.3 V2.0版本基因组注释结果

2.3 小结及讨论

第三章 基于V2.0基因组的比较基因组学与进化分析

3.1 材料与方法

3.1.1 试验材料

3.1.2 试验方法

3.2 结果与分析

3.2.1 V1.5版本与V2.0版本串联重复基因的比较分析

3.2.2 V1.5版本与V2.0版本基因组共线性分析

3.2.3 V2.0版本基因组额外基因及转座子形成原因鉴定

3.2.4 V2.0版本亚基因组优势现象

3.2.5 V2.0版本基因的保留

3.2.6 V2.0版本基因组中特有的转座子扩增事件

3.3 小结及讨论

第四章 全文结论

参考文献

附录

致谢

作者简介

展开▼

摘要

白菜属于十字花科芸薹属,芸薹属包括许多以蔬菜、调味品以及油料栽培的重要作物。近年来,芸薹属物种的基因组被陆续测序,2011年白菜基因组完成了测序,2014年甘蓝和甘蓝型油菜的基因组先后完成了测序,2016年芥菜和黑芥的基因组完成了测序。白菜是芸薹属第一个完成测序的物种,为其他芸薹属基因组组装、基因注释和基因功能研究提供了重要参考。白菜参考基因组被广泛应用于十字花科作物比较基因组学及进化分析等研究。白菜基因组第一版(V1.5)的组装大小只有283.8Mb,占预测基因组大小(485Mb)的58.52%。考虑到有41.48%的序列没有被组装,其中很有可能包含一部分重要基因的序列。另外,V1.5版本利用InDels和SSRs等标记构建低密度遗传图谱,将Scaffold锚定到假染色体上,低密度的标记限制了Scaffold锚定的数量以及准确性。同时,PacBio单分子测序数据没有被用于V1.5版本基因组的组装,PacBio数据能够有效解决组装过程中重复序列和gap填补的问题。对于基因预测,第一版本的基因组注释过程中没有用到大量的mRNA-Seq数据,仍有很大的提升空间。因此,利用Illumina和PacBio测序产生的高质量数据进行基因组序列的重新组装,利用高密度遗传图谱重新构建染色体连锁群,以及基于大量mRNA-Seq数据重新注释基因来提升白菜参考基因组十分必要。
  本研究通过使用更多高质量的Illumina、PacBio以及mRNA-Seq数据来提升白菜参考基因组组装和基因注释的质量。获得了升级的V2.0版本,详细比较了该版本与V1.5版本的注释基因和转座子之间的差异。利用V2.0版本基因组重新区分了三套亚基因组,开展了比较基因组学及进化分析,包括:1)基因的过保留;2)偏向性丢失;3)亚基因组间优势基因表达;4)小RNA介导的转座子甲基化与基因表达调控关系等。该研究获得的主要结果如下:
  1.升级基因组(V2.0)的大小为389.2Mb,比V1.5版大106 Mb。覆盖白菜基因组预测大小(485Mb)的80.25%。V2.0基因组包括86986个Scaffold,Scaffold N50大小为3.38 Mb。构建了两个高密度遗传图,总遗传距离分别为1316.731 cM和1391.516 cM,最终将330Mb的Scaffold序列锚定到10条染色体上。
  2.V2.0版基因组预测出了48826个基因,比V1.5版多7652个。V2.0版中32.3%的序列为转座子,约126 Mb。V2.0版比V1.5版基因组多组装了约106 Mb的序列,其中6Mb为编码序列(coding)、4Mb为内含子序列(intron)、54 Mb为重复序列(TEs)、30 Mb为基因间区序列(intergenic),12Mb为“N”(gap区)。
  3.对两个版本基因组的基因、转座子进行了详细比较,结果表明V2.0版基因和转座子注释质量明显优于V1.5版;重新构建了V2.0版的三个亚基因组,LF亚基因组上有更多的基因被保留下来;亚基因组间优势基因表达分析发现,LF亚基因组上有更多的基因优势表达,为优势亚基因组;通过GO功能富集分析发现,全基因组复制后和串联复制后基因的保留情况符合基因平衡假说;小RNA介导的转座子甲基化对基因表达调控的影响分析发现,在亚基因组水平上,基因上游2kb区域内,小RNA靶向转座子与基因表达水平呈负相关关系,优势表达基因在上游2kb的区域内小RNA靶向转座子的水平比同源的非优势表达基因低。
  4.基于V2.0版基因组,发现了两个新的现象:1)V2.0版组装出了更多的串联重复基因,发现与适应性相关的基因通过串联复制方式进行了大量的扩增。2)发现了白菜特有的转座子扩增事件,约发生在6.5个百万年前,在V1.5版中没有观察到该现象。改变了之前认为白菜基因组三倍扩增后没有发生转座子扩增的观点。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号