首页> 中文学位 >基于栽培辣椒和野生辣椒的全基因组测序揭示辣椒属的驯化与特异性
【6h】

基于栽培辣椒和野生辣椒的全基因组测序揭示辣椒属的驯化与特异性

目录

声明

摘要

第一章 文献综述

1 辣椒的起源、进化、分布和分类

1.1 辣椒的起源与驯化

1.2 辣椒的传播与分布

1.3 辣椒的分类和遗传多样性

2 辣椒基因组学研究进展

3 辣椒分子育种研究进展

3.1 分子标记的种类应用

3.2 分子遗传图谱的建立

3.3 重要性状的遗传定位

4 高通量测序技术的发展及在基因组学中的应用

5 研究的目的和意义

6 研究的必要性

7 实验技术路线

第二章 材料与方法

1 试验材料

1.1 辣椒基因组de novo测序的材料

1.2 辣椒重测序的材料

1.3 辣椒转录组测序的材料

1.4 辣椒small RNA测序的材料

1.5 辣椒长非编码RNA(long no-coding RNA)测序的材料

1.6 用HPLC/MS/MS法测定辣椒素含量的材料

2 试验方法

2.1 辣椒全基因组de novo测序(de novo sequencing)和组装

2.2 不同辣椒材料的转录组测序

2.3 辣椒核心种质资源的重测序

2.4 辣椒连锁遗传图谱的构建及染色体的锚定

2.5 两个基因组测序数据的覆盖度和组装质量的评估

2.6 核基因组中叶绿体基因组的插入的验证

2.7 重复序列和基因组的注释

2.8 基因的进化和比较

2.9 辣椒中辣椒素生物合成途径的基因家族和其在其他物种中直系同源基因的鉴定

2.10 用HPLC/MS/MS法测定辣椒素含量

第三章 结果与分析

1 ‘遵辣1号’和‘Chiltepin’基因组的组装和染色体的锚定

1.1 ‘遵辣1号’和‘Chiltepin’的基因组信息预测

1.2 Zunla-1和Chiltepin基因组文库构建与测序数据分析

1.3 ‘Zunla-1’和‘Chiltepin’基因组的组装

1.4 ‘Zunla-1’和‘Chiltepin’基因组组装质量的评估

1.5 辣椒遗传图谱的构建和染色体的连接

2 转座元件的鉴定和基因组的扩增

2.1 ‘Zunla-1’和‘Chiltepin’基因组中转座元件的鉴定及分析

2.2 辣椒基因组的扩增

3 基因注释和基因的转录

3.1 蛋白编码基因的注释

3.2 非编码RNA的注释

3.3 特异表达基因的鉴定

4 茄科的比较基因组、进化和基因的分子进化分析

4.1 辣椒基因家族和特异基因的鉴定

4.2 茄科的进化

4.3 茄科成员基因组之间的染色体易位和倒位

4.4 基因的分子进化分析

5 人工选择的分子印迹

5.1 重测序和SNPs的筛选

5.2 贝叶斯聚类揭示野生辣椒到栽培辣椒的基因渗入

5.3 辣椒基因组中驯化的足迹(Footprints)

6 辣椒与番茄的果实发育比较

7 辣椒素合成基因的进化

第四章 讨论

1 ‘Zunla-1’、‘Chiltepin’和‘CM334’基因组测序策略、组装质量、scaffold锚定及基因注释的比较

2 辣椒基因组扩张的原因解析

3 辣椒与番茄果实发育生物学的比较

4 辣椒素合成途径的进化

第五章 结论与展望

参考文献

致谢

项目基金

攻读博士学位期间发表的学术论文

展开▼

摘要

为了深入研究辣椒的特异性和驯化,本研究开展辣椒的全基因组测序。测序的辣椒材料为遵义市农业科学研究院选育的一年生辣椒‘遵辣1号’及其来自墨西哥的野生材料‘Chiltepin’,并对其他18个辣椒栽培材料和2个野生/半野生辣椒材料进行了重测序。通过辣椒基因组、转录组、群体多样性、小RNA和次级代谢产物等方面的研究,得到如下结果:
  1.完成辣椒全基因组测序,获得两个辣椒材料基因组的精细序列图谱
  对一年生辣椒‘遵辣1号’和其野生材料“Chikepin”分别进行了146.43x(全基因组覆盖率,下同)和96.37x的全基因组测序,最后分别获得99.78x和66.73x的高质量测序数据。通过复杂的生物信息学分析和测序数据的组装,两个辣椒材料基因组的组装大小分别为3.35 Gb和3.48 Gb。‘遵辣1号’的scaffold N50和contig N50分别为1.22 Mb和55.43kb;‘Chiltepin’的scaffold N50和contig N50分别为445.59 kb和52.23kb。通过高密度遗传图谱的协助组装,获得均超过80%测序数据都锚定到相应染色体上的2个精细序列图谱。
  2个基因组的完整序列和基因组注释信息公布在自建的辣椒基因组数据库网站上(release2.0,http://peppersequence.genomics.cn),供全球辣椒研究者或者相关研究者参考。
  2.重复序列和基因组的扩张
  本研究采用同源搜索和从头预测相结合的方法鉴定‘遵辣1号’和‘Chiltepin’基因组中的转座元件,检测到Ⅰ型和Ⅱ型转座子,前者有LTR反转录转座子(主要包括copia类和gypsy类)、长散在核重复序列(long interspersed nuclear elements,LINE)类、短散在核重复序列(Short interspersed nuclear elements,SINE)类等,后者有hat、En-Spam、Mudra及相关的序列等。
  上述转座元件的分析表明,不同类型的转座元件占辣椒基因组大小的81%(约2.7 Gb),显著高于番茄、马铃薯基因组中转座元件所占的比重(约61%)。大部分植物中已发现的转座元件均在辣椒基因组中存在,包括占基因组70.3%的长末端重复序列(LTR)转座子和4.5% DNA转座子。这表明LTR转座子可能导致了辣椒基因组的扩增,远大于其在番茄(占基因组的50.3%)、马铃薯(占基因组的47.2%)和葡萄(占基因组的46.2%)中对基因组的贡献,与玉米基因组中LTR转座子的贡献(占基因组的75%)非常相似。在LTR转座子中,权重最高的是Gypsy类(54.5%)和Copia类(8.6%)转座子。这和单子叶植物如小麦基因组中LTR转座子的分布不同,后者Copia类转座子是DNA重复序列中比例最高的。在辣椒所有鉴定的转座元件中,与番茄、马铃薯相比较,分别有23.1%和16.2%是祖先的重复序列,它们在番茄、马铃薯与辣椒分化之前就已经存在。在进化分支上,辣椒属和番茄属分开后,发生了基因组的扩增,新产生了一些特异的转座元件,它们占基因组的50.8%,其中LTR转座子是其最主要的类型。
  为分析辣椒基因组的扩增,利用序列分歧分析估算所有LTR转座子的插入时间。分析发现,从300万年前开始,辣椒属的基因组逐渐有LTR转座子的插入;从100万年前开始,LTR转座子的插入活性逐渐增强,在约30万年前时达到峰值,这表明茄科植物进化过程中辣椒属基因组的扩增是近期发生的事件。进一步分析Copia和Gypsy类的插入时间和系统发生树,结果和基于所有LTR转座子序列分歧分析的结果相近,这进一步证实了上述推论。自茄科植物分化后,Gypsy类转座子比Gypsy类具有更强的插入活性,并在辣椒基因组中占有最高的比例。
  3.基因注释和基因的转录
  为注释‘遵辣1号’和‘Chiltepin’的基因,通过对代表不同发育时期和不同组织的30个样品的转录组进行测序,共获得90.5 Gb高质量的测序数据。‘遵辣1号’和‘Chiltepin’采用证据支持和从头预测(de novo)相结合的方法分别预测得到35,336和34,476个高度可信的蛋白编码基因,获得的基因数和番茄相近,略低于马铃薯、水稻或大白菜,高于其他五个物种(拟南芥、番木瓜、葡萄、西瓜、黄瓜)。两个物种的基因在着丝粒附近的密度相对较低,但转座元件在这些区域的密度却很高,这表明重复序列在染色体上呈不均匀的散在分布。
  通过对‘遵辣1号’花蕾的长非编码RNA测序,获得2,717,180个序列片段。用自主开发的软件鉴定得到6,527个lncRNAs。根据其所处的位置,将这些lncRNA细分为5,976基因间lncRNA、222个内含子重叠的lncRNA和329个双向lncRNA。
  采用生物信息学共鉴定到176个miRNA基因候选位点,其中有141个候选miRNA基因对应于141个成熟的miRNAs,属于35个保守的miRNA家族;其他为辣椒特异的miRNA,归为29个新的家族。基于上述鉴定的176个miRNA(64个家族),采用生物信息学的方法共预测这些miRNAs的1,104个靶基因,其中78%具有假定的功能。这些靶基因的结构域的分析表明,32个miRNA家族通过靶向作用编码转录因子的mRNAs,在转录后调控起着重要的作用。
  4.茄科植物的进化
  利用OrthoMCL软件,鉴定了辣椒、番茄、马铃薯和拟南芥的基因家族。结果显示,它们共同拥有10,279个基因家族,这些与生命攸关的重要基因(常被进化生物学家称为“核心基因”)古老而保守,以“生命的粮食”形式在物种之间代代相传。辣椒共有17,671基因家族,每个家族至少含有一个直系同源基因,其中的1,257个基因家族(含有3,143个基因)是辣椒特有的。这些特有基因主要富集在对生物刺激的响应、蛋白质水解等基因本体分类,从而使辣椒适应广泛的气候环境。
  我们还从葡萄、番木瓜、辣椒、番茄、马铃薯和拟南芥6个物种中鉴定了5,231个单拷贝的直系同源基因。以这些基因构建的系统进化树,结果表明,双子叶植物分化出茄科的时间几乎在15,600万年之前,大概在单子叶植物和双子叶植物分开后不久。辣椒和马铃薯、番茄分开的时间大约在3600万年以前。
  通过对辣椒与番茄、马铃薯基因组之间的比较分析,发现辣椒与后两者之间分别存在1,052和799个大的共线性区域,同时也分别发生了612和430个染色体易位,这些易位几乎分布在所有12条染色体上,另外还分别存在468和367个染色体的倒位。
  通过辣椒与葡萄基因组之间的精细分析,发现辣椒基因组曾发生了全基因组的三倍化事件,三倍化区域的序列占基因组的39%,达到1.32 Gb;三倍化区域的基因数目达到23,017个,占总基因数目的65%。在进化的过程中,祖先基因中有5,726个基因经全基因组复制后所产生的3个拷贝仅保留一个拷贝,有723个基因保留了2个拷贝,有45基因保留了3个拷贝,另外有2,675个基因的3个拷贝竟然完全丢失。
  基于组装结果,通过物种间比较共线性片段内旁系基因的4DTv(four-folddegenerate sites)突变率估算了基因组的复制,发现在0.48和0.3处分别出现了辣椒、番茄和马铃薯之间共同的峰,由此估计出辣椒的祖先与葡萄的分化发生在大约8,900万年前,经历了第一次三倍化的复制过程,另一次则发生在6000万年前,巧合的是——这段时间正是许多恐龙物种灭绝的时期。或许这两次基因组复制事件正是辣椒、番茄和马铃薯的祖先在该时期得以幸存的原因。另外,辣椒还有一次特异复制,由此估计辣椒与番茄、马铃薯的分化发生在大约2,000万年前,没有证据表明在此之后经历了全基因组的复制,进一步证实了转座子元件的扩张是导致辣椒基因组扩增的主要原因。
  5人工选择的分子印迹
  对18个辣椒栽培材料、2个野生/半野生材料进行重测序(测序深度为20x~30x,覆盖度83%以上)后,共获得845,020 Gb的数据量。经过分析,每个样品平均得到9,826,526个SNP和237,509个小的(<5bp) InDel。从总SNP的数目来看,野生/半野生材料比栽培材料具有更多的遗传多样性。为在基因组水平上检测栽培辣椒和野生/半野生辣椒的差异,我们用Clustal X构建了一个Neighbor-joining无根系统进化树。结果显示,栽培辣椒形成一个类群,野生种/半野生辣椒形成另一个类群。用贝叶斯聚类的方法(K=2-5)分析上述材料的群体结构,栽培种能够形成一个亚群,保持相对的一致,与野生种/半野生种分离开。当K=5时,栽培种之间的区分最为明显,而且还发现很多栽培材料内含有野生材料的血缘,这在CM334、ZJ14、ZJ19、11c1363、ZJ18和Z儿2中表现得尤为明显,表明近期有从野生材料(如Chiltepin)到栽培材料的基因渗入。
  为进一步检测驯化导致的栽培辣椒群体多态性的降低,我们使用滑动窗口策略来估计栽培种群体的θπ和θw值。在栽培材料群体中共鉴定到115个具有强烈选择扫荡信号的区域,区域序列总长度85.2 Mb,占基因组序列的2.6%,这些区域含有511个选择的“候选基因”。,它们分布在不同染色体上;人工选择区域长度从0.3 kb到61.9 kb不等,且多态性水平相对较低,说明这些区域是受人工驯化影响的。对获得的511个“候选基因”进行富集分析,结果表明受人工选择的“候选基因”主要集中在转录调控、压力和/或防御响应、蛋白-DNA复合物的组装、生长和果实的发育,其中有34个包括AP2、ERF和bHLH家族在内的转录因子和10个含有NB-ARC域的抗病蛋白基因。上述“候选基因”可能解释栽培辣椒和野生辣椒之间存在的形态学和生理学的差异。
  6.辣椒和番茄果实发育的比较
  通过比较番茄和辣椒果实成熟期(6个转色期前的阶段、转色期和3个转色后阶段)的基因表达模式,结果表明,番茄有2,281个差异表达基因,但辣椒只有1,440个,这些基因都参与了番茄和辣椒的细胞壁重塑、激素信号传导和新陈代谢、碳水化合物的代谢、蛋白质降解和非生物压力响应等。番茄和辣椒果实在成熟期基因的表达差异在一定程度上可能反映了具有转变期的果实(如番茄)和没有转变期的果实(如辣椒)之间的差异,从而造成后者具有较慢的变软过程,以及对乙烯处理没有响应的后果。
  7.辣椒素生物合成相关基因的进化
  基于前人对辣椒辣味相关基因的研究,本研究鉴定了参与辣椒素生物合成的51个基因家族,同时还鉴定了这些基因在番茄、马铃薯和拟南芥等3个物种中的直系同源基因。系统进化分析表明,和番茄、马铃薯和拟南芥相比较,辣椒发生了12个基因家族的独立复制(如ACLd,AT3,β-CT,C3H,CAD,CCR,KasⅠ和PAL基因家族)。基因拷贝之间的序列分歧可能导致不同的功能或新功能化,促进了特异的辣椒素生物合成的进化。以酰基转移酶3(AT3)为例,本研究鉴定了at3基因(Pun1)3个串联拷贝(AT3-D1,AT3-D2和AT3-D3),at3基因编码酰基转移酶,并担当一些辣椒品种辣味的调控子角色。和番茄和马铃薯AT同源基因比较,相邻的酰基转移酶基因AT3-D1和AT3-D2在保守的DFGWGKP motif发生一个氨基酸的突变(K390R),这种突变可能导致AT3-D1和AT3-D2基因发生了功能的变化,能够合成辣椒素并产生辣椒果实独特的辣味。
  通过对不同辣度的辣椒果实相关转录组数据进行比较分析,结果表明,随着辣椒素含量的逐渐增加,除ACL-D4和ACL-D5基因外,其他参与辣椒素合成途径的基因呈现组织/发育阶段特异性表达,但是仅有CCoAOMT-D9,AT3-D1和AT3-D2等3个基因在辣椒果实发育阶段显著表达,而处于发育期的果实正是辣椒素合成的组织。基于深入的序列比较,发现在没有辣味或者辣度极低的辣椒中AT3-D1基因有长度不等的片段缺失,可能使该基因失去调控功能,但AT3-D2基因却正常表达,并且在这些辣椒果实中仍然存在痕量的辣椒素(人类可能感知不到这种极低的辣味),这可能是由AT3-D2基因负责合成的。在辣度不同的辣椒中,AT3-D1和AT3-D2在CDS区都存在SNP,我们推测这两个基因可能协同作用,合成并积累含量不同的辣椒素,这可能是一种与辣椒素积累相连的关键因素(或调控机制),可以决定不同品种辣椒的辣度。
  辣椒基因组图谱的完成将促进辣椒抗性、品质等重要农艺性状基因的定位研究,为通过分子育种进行辣椒品种改良奠定基础,同时还将促进茄科植物的进化研究,以及果实发育机理等基础生物学研究。

著录项

  • 作者

    覃成;

  • 作者单位

    四川农业大学;

  • 授予单位 四川农业大学;
  • 学科 作物遗传育种
  • 授予学位 博士
  • 导师姓名 潘光堂,胡开林,张志明;
  • 年度 2014
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 辣椒;
  • 关键词

    辣椒; 全基因组测序; 特异性; 分子育种;

相似文献

  • 中文文献
  • 外文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号