法律状态公告日
法律状态信息
法律状态
2022-03-11
未缴年费专利权终止 IPC(主分类):C12Q 1/6869 专利号:ZL2017102146783 申请日:20170401 授权公告日:20200505
专利权的终止
2020-05-05
授权
授权
2017-08-25
实质审查的生效 IPC(主分类):C12Q1/68 申请日:20170401
实质审查的生效
2017-08-01
公开
公开
技术领域
本发明属于基因工程领域,具体是通过三代测序平台(PacBio RS II)检测多倍体材料中基因等位变异的方法。
背景技术
小麦作为三大粮食作物之一,在世界范围内广泛种植。小麦基因组庞大且复杂(2n=6x=42),是由A、B和D三个同源性极高的基因组组成的异源六倍体。分子标记辅助选择(MAS)的应用加速了小麦育种的进程,MAS的研究思路:克隆目标性状相关基因,鉴定更多等位变异,通过关联分析推测基因功能并开发相应的标记辅助育种。在过去几十年间,育种家通过在小麦中利用传统的分子标记如:SSR、RFLP、AFLP、RAPD和DArT等,鉴定出许多控制重要农艺性状的QTL。QTL mapping的缺点是不仅耗时而且价格昂贵,同时由于小麦基因组的特点,在小麦中进行图位克隆的研究相对比较困难(Barrero等)。许多研究表明水稻、小麦、大麦和玉米等不同植物基因组间遗传标记和基因的线性顺序是非常保守的(Choi等;Fulton等;Gale 和 Devos;Gupta等),这为通过比较基因组学方法在小麦中进行基因挖掘提供了强有力的工具。
目前鉴定到的控制大多数农艺性状的基因均为不同的等位变异,如:在水稻中SSIIIa的一种等位变异与抗性淀粉含量呈负相关(Zhou等);在小麦中Pinb-D1b作为Pinb的一种等位变异与优质磨粉品质呈正相关(Chen等);Hap-6A-A作为TaGW2-6A的一种优异等位变异表现为与粒宽和千粒重呈显著正相关。这些结果都显示了等位基因的重要性,因此,当前研究的热点是通过基因间多态性的鉴定,筛选出更多有利等位变异,从而为作物育种提供参考。
由于多倍体物种中基因的特点是同一基因的不同基因组序列相似性非常高,目前关于多倍体中基因等位变异检测的方法,主要包括传统的Sanger测序和Illumina等二代测序,但是他们都存在一些缺点,主要表现为:传统的Sanger测序方法不仅耗时耗力,而且通量太低;Illumina等二代测序平台虽然通量高,但是读长太短,这严重影响了多倍体中同一基因不同基因组序列的有效组装。而第三代测序(PacBio RS II)作为一种新的测序平台可直接用于多倍体中基因等位变异的挖掘,其优点表现为通量高(平均每个SMRT cell中有70,000个ZMWs产生序列)和读长长(平均读长可达到约10 kb),PacBio RS II是一种单分子实时DNA测序系统(SMRT),不需要任何PCR的过程。每个SMRT cell中含有150,000零模波导孔(ZMWs),每个ZMW同时包含一个DNA聚合酶和一条DNA样品链进行单分子测序,可以实时检测插入碱基的荧光信号。同时PacBio RS II测序系统在细菌基因组的de-novo组装(Rasko等;Mou等)、叶绿体基因组组装(Chen等)、补齐基因组缺口(Zhang等)、全长转录本的获得及转录本突变体的筛选(Ocwieja等)等方面得到了很好的应用。最近该技术也被用于小麦谷蛋白基因的克隆中,研究者利用从一个SMRT Cell测序数据中得到10个品种的424个小麦储藏蛋白基因(Zhang等),该技术单分子及平均读长相对长的特性有效地保证对A、B和D三个高度相似基因组序列的识别,在小麦家族基因克隆及等位变异挖掘方面具有很强的优势。
淀粉占小麦籽粒干重的70 %左右,其组成和比例直接影响小麦面粉品质,而淀粉的合成是由一系列酶基因控制。前人对六倍体小麦中淀粉合成途径相关基因优良等位变异筛选开展了一些研究,如TaSuSy1和TaSuSy2,但是在小麦中开展整个淀粉合成途径相关基因等位变异筛选的研究相对较少。因此,通过PacBio>
发明内容
本发明的目的是为了解决多倍体物种(小麦、大豆等)中基因等位变异检测的技术问题,提出一种高效检测六倍体小麦中高相似性基因等位变异的方法。
本发明提供的检测多倍体中基因等位变异的方法,包括如下步骤:
1)根据待测多倍体基因的参考序列设计其保守引物;所述引物对扩增的PCR产物的长度为4-5 kb,且此区段包含多个外显子和内含子;在正反向引物的5'前端都加上不同的Barcode,所述的Barcode序列长度为8-12 bp的Barcode序列,不同Barcode组合的正反向引物来识别不同的材料;
2)选择不同材料的基因组DNA和相应的引物进行PCR扩增,得到PCR扩增产物;
3)对步骤2)得到的PCR产物进行定量,对来自不同材料不同基因的PCR产物进行等量混合;
4)对步骤3)的混合物进行纯化后,得到的混合产物文库可直接用于测序;
5)对步骤4)得到的文库进行三代测序,从而得到不同材料、多个基因中同时含有相似性较高的不同拷贝的序列信息;
6)对步骤5)得到的所有序列信息进行多重比对从而达到等位变异筛选的目的。
所述的方法,其中第3)步所述的定量采用琼脂糖凝胶电泳仪或Fragmentanalyzer仪进行;所述不同材料为六倍体小麦中36个自然群体小麦材料。
所述的方法,其中第4)步所述的纯化是磁珠法。
所述的方法,其中所述三代测序是采用PacBio RS II测序平台,可以方便有效地实现多倍体中相似性高的基因的等位变异的检测。
所述的方法,其中所述多倍体为小麦。
所述的方法,其中所述待测多倍体基因为六倍体小麦中A、B和D基因组序列。
所述的方法,其中所述基因为29个淀粉合成相关基因,因而所述保守引物为分别扩增29个淀粉合成相关基因的A、B和D基因组的保守引物。
上述方法中,所述根据第三代测序平台批量进行不同材料不同基因等位变异筛选的的方法为:将所述PCR扩增产物经定量和等量混合后,再经纯化后,通过三代测序平台获得待测材料中待测基因的所有序列信息,经多重序列比对从而达到等位变异筛选的目的。
本发明还提供所述的引物,或所述的方法在多倍体小麦中进行基因等位变异筛选的应用:进行重要基因等位变异的筛选,从而为培育优质小麦品种提供参考。
所述的应用是在筛选多倍体中高相似性基因等位变异的应用。
本发明所述的方法可用于序列相似性较高的基因家族基因序列的多态性分析。
本发明具有以下有益效果:本发明为解决多倍体基因等位变异检测的技术问题,提供一种检测方法,有助于快速有效地进行不同小麦材料中同一基因或多个基因等位变异的筛选。该方法基于普通小麦品种中基因的多拷贝及长读长的特点:在基因的保守区段设计A、B和D基因组序列通用的PCR引物,同时在正反向引物的5'前端分别加上区别不同材料的8-12 bp的Barcode序列,通过普通PCR扩增的方法得到不同材料的同一基因的DNA片段,扩增长度为4-6 kb,然后对不同材料不同基因的PCR产物进行等量混合并建库,再经PacBioRS II测序得到含有不同Barcode的DNA片段序列信息,经比对分析得到这些基因序列的多态性,从而实现高通量的对不同小麦品种中同一基因或多个基因等位变异的挖掘。应用该策略可以对多倍体中同一材料的不同基因组序列进行比对分析;可以对不同材料的同一基因进行等位变异的分离鉴定;也可以对不同材料的多个基因进行快速有效的等位基因的分离鉴定。
本发明方法中,根据实验室前期研究的结果以及在小麦中国春中通过Sanger测序法对29个淀粉合成相关基因进行的测序分析,同时用第三代测序平台进行淀粉合成相关基因的分离鉴定验证了该第三代测序平台的有效性,也表明了该等位变异筛选系统的准确性和可靠性。
本发明方法无需昂贵的仪器和试剂,通过常规的PCR仪、琼脂糖凝胶电泳仪和Fragment analyzer仪就可以完成样品的准备,制备好的样品送测序公司测序,易于操作。本发明方法基于用于PCR扩增的正反向引物5'前端不同的Barcode序列组成用于区分来自不同材料的同一基因序列,可以有效分离并准确鉴定来自不同材料的同一基因的序列信息,从而进行此基因新等位变异的筛选和鉴定。在本发明方法中,通过一次PCR反应、定量、混合和纯化过程就可以获得多个小麦品种中一个或多个基因的序列信息,而且PCR仪、琼脂糖凝胶电泳仪和Fragment analyzer仪都是自动化和高通量的仪器。本发明方法极大地提高了基因鉴定的效率和准确性。
本发明方法基于第三代测序平台进行基因多态性的鉴定,由于PacBio RS II平均读长可达到约10 kb,可使小麦中相似性高的A、B和D基因组序列进行准确组装,同时通过单次测序可得到含有目的片段全长的序列信息,不仅方便快捷而且价格便宜,表现为可单次对批量基因进行操作。
本发明方法不仅适用于多倍体中基因等位变异的筛选,同样适用于序列相似性较高的基因家族基因序列的多态性分析。该发明将直接促进基因等位变异的筛选以及在作物育种中对优异等位基因的应用。
附图说明
图1 中国春蔗糖合酶(TaSus1)基因的结构,其中:CDSf,第一个外显子;CDSi,内部的外显子;CDSI,最后的外显子。
图2 不同材料中TaSus1基因的多序列比对结果。
图3 TaSus1基因在部分小麦材料中的等位变异。
具体实施方式
下述实施例中所使用的实验方法如无特殊说明,均为常规方法。
下述实施例中所用的材料、试剂等,如无特殊说明,均可从商业途径得到。
实施例1、小麦中国春中蔗糖合酶(TaSus1)基因的A、B和D基因组序列分析
一、引物设计
参考国际上已公布的小麦基因组数据库信息(包括中国春、乌拉尔图小麦和粗山羊草基因组框架图序列),对中国春中蔗糖合酶(TaSus1)基因进行了预测,结果表明:TaSus1基因不同基因组序列的共同特点是序列较长,参考预测结果,设计该基因A、B和D基因组序列的保守引物SEQ>TaSus1基因全长基因组序列。
二、中国春中TaSus1基因的A、B和D基因组序列分析
小麦品种中国春来自中国科学院遗传与发育生物学研究所植物细胞与染色体工程国家重点实验室,最初购于河南舞阳县种子公司。
利用CTAB法从中国春的叶片中提取基因组DNA。
根据表2中的引物SEQ ID NO :1和SEQ ID NO :2,以中国春叶片的基因组DNA为模板进行PCR扩增,反应体系如下:
PCR扩增产物通过Fragment analyzer仪定量和磁珠法(AMPure PB Beads)纯化后,送公司进行PacBio RS II平台测序,通过单次测序反应可得到TaSus1基因的三类序列信息,初步命名为TaSus1-1、TaSus1-2和TaSus1-3,这三类序列再经过与已知参考序列进行比对后,分别将其归类为TaSus1-A、TaSus1-B和TaSus1-D;通过DNAMAN软件进行多重比对分析发现三个基因组的序列相似性非常高,仅有个别SNP的差异;经softberry(www.softberry.com)对基因结构进行预测表明:TaSus1-A、TaSus1-B和TaSus1-D都是由15个外显子和13个内含子组成,其基因组序列长度分别为4037>
三、对中国春中TaSus1基因的Sanger测序验证
已知六倍体小麦中TaSus1的三个基因组序列相似性非常高,通过设计此基因的保守引物,经单次PCR扩增得到PCR产物,再经PacBio>TaSus1-A、TaSus1-B和TaSus1-D三类序列,为了验证PacBio>TaSus1基因进行克隆,再通过Sanger测序法获得TaSus1的A、B和D基因组序列信息,将得到的序列与PacBio>TaSus1基因的三个拷贝序列完全一致,相似性达到了100>
实施例2、36份小麦品种中29个淀粉合成相关基因A、B和D基因组序列的差异
通过对中国春29个淀粉合成相关基因的A、B和D基因组序列分析,发现这些基因的序列存在如下特点:(1)基因序列较长,如TaAGPS基因的A、B和D基因组序列长度较长,分别为7528>TaSus1基因的A、B和D基因组序列长度较长,分别为4037>
一、引物设计
设计了29个淀粉合成相关基因的特异引物(表1),这些引物都为A、B和D基因组的保守引物,且扩增的目的片段的长度为4-6 kb,同时此区段包含了多个外显子和内含子。
由于三代测序中每个SMRT cell中可以包含多个材料中多个基因的扩增产物,若此SMRT cell中包含36份材料的29个淀粉合成相关基因,为了区别SMRT cell中来自36份材料中同一基因的序列信息,在正反向引物的5'前端都加上不同的Barcode。以TaSus1基因为例,设计的此基因的特异引物为SEQ>
表1、29个淀粉合成相关基因的保守引物序列
表2、扩增36份材料中TaSus1基因的引物信息
表3、扩增36份材料的引物组合信息
二、不同小麦材料中淀粉合成相关基因的PCR扩增、检测、定量和混合
36份小麦材料来自中国科学院遗传与发育生物学研究所植物细胞与染色体工程国家重点实验室。
利用CTAB法从小麦材料的叶片中提取基因组DNA。以36份小麦材料的基因组DNA为模板,然后利用每份材料相应的引物组合(如表3)进行PCR扩增,反应体系如下:
为了保证每个基因都能产生A、B和D三个基因组的序列信息,PCR反应过程中的循环数应尽量降低,一般为30-32,首先参考琼脂糖凝胶电泳的相对定量结果(前提是明确琼脂糖凝胶电泳结果中不同亮度的条带与浓度之间的倍数关系),把同一基因不同材料的PCR产物进行等量混合,从而得到29管不同基因的混合产物。然后采用Fragment analyzer仪对不同基因的混合产物进行精确定量,参考定量的结果,对不同基因的PCR混合物进行等量混合。最终形成的单管混合产物为构建好的用于PacBio RS II测序的文库,为了满足测序要求,此文库的原始浓度为10 µg左右。
三、库样品的纯化
为了保证测序样品的特异性,通过磁珠法(AMPure PB beads)对文库样品进行纯化,纯化后样品浓度为4-5 µg,纯化过程如下:
(1)实验前上下颠倒AMPure PB beads,加1×Beads于PCR反应液中(即500 µl PCR产物+500 µl Beads),上下颠倒混匀;
(2)室温放置5 min,用于磁珠和核酸结合;
(3)然后把EP管置于磁力架上至溶液澄清,弃上清;
(4)现配80 %乙醇,加入相对于PCR产物2倍体积量的80 %乙醇,混匀,再置于磁力架上,室温30s,弃上清;
(5)重复4;
(6)掀开盖在磁力架上干燥10 min;
(7)加100 µl水洗脱DNA,混匀,上下颠倒后置于磁力架上;
(8)转移100 µl上清置于新离心管中。
此样品直接送千年基因或华大基因等测序公司测序。
四、PCR产物测序结果的分析
通过对单个SMRT cell的测序结果分析表明,经测序后产生78,280条subreads(52.19%ZMWs利用率),且此SMRT cell产生的CCS(circular consensus sequence)原始数据为36,311条reads,其中有31,230条CCS reads(86.01 %)通过序列同源性比对能够匹配到基因上,然后根据识别不同材料的Barcode序列将25,343条CCS reads(69.79 %)拆分到不同材料中。也就是说,这25,343条reads含有扩增基因的全长序列,即为有效数据。由于我们构建的文库中包含有36份材料中29个基因的A、B和D三个拷贝,同时经过PacBio RS II测序后产生25343条有效reads,那么理论上每份材料的每个基因的单个拷贝可产生约8条reads。实际上通过对每份PCR产物的精确定量也可保证后续测序产生的每份材料中每个基因序列的一致性。因此,我们可通过PacBio RS II测序平台可以批量获得几十份材料中几十个基因的序列信息。
为了进一步分析测序得到的这些基因序列中是否能够满足找等位变异的目的,选择36份材料的TaSus1基因序列进行分析,每份材料中TaSus1的reads数目的分布虽然存在差异(1-132>TaSus1基因的2-3个拷贝的序列信息,通过对部分材料中TaSus1基因进行多序列比对发现,这些序列中确实含有TaSus1基因的三个拷贝(TaSus1-A、TaSus1-B和TaSus1-D)(图2);比较不同材料的TaSus1基因的同一拷贝的序列信息,在TaSus1的B基因组的Exon>
核苷酸序列表
<110>中国科学院遗传与发育生物学研究所
<120>利用三代测序平台(PacBio RS II)进行多倍体基因等位变异挖掘的方法
<160> 14
<210> 1
<211> 23
<212> DNA
<400> 1
AGTGTTGATATCCTAGTGGCTGT
<210> 2
<211> 20
<212> DNA
<400> 2
CACGACCAGACCAAATGAAA
<210> 3
<211> 31
<212> DNA
<400> 3
GAGGCTTGAGTGTTGATATCCTAGTGGCTGT
<210> 4
<211> 31
<212> DNA
<400> 4
CCTCCAGGAGTGTTGATATCCTAGTGGCTGT
<210> 5
<211> 31
<212> DNA
<400> 5
CCTACTAGAGTGTTGATATCCTAGTGGCTGT
<210> 6
<211> 31
<212> DNA
<400> 6
GGCTGAGGAGTGTTGATATCCTAGTGGCTGT
<210> 7
<211> 31
<212> DNA
<400> 7
GGAACCTGAGTGTTGATATCCTAGTGGCTGT
<210> 8
<211> 31
<212> DNA
<400> 8
CTTCGCCAAGTGTTGATATCCTAGTGGCTGT
<210> 9
<211> 29
<212> DNA
<400> 9
CCACCTGCACACGACCAGACCAAATGAAA
<210> 10
<211> 29
<212> DNA
<400> 10
GGTGGACCACACGACCAGACCAAATGAAA
<210> 11
<211> 29
<212> DNA
<400> 11
GAACACTCACACGACCAGACCAAATGAAA
<210> 12
<211> 29
<212> DNA
<400> 12
GAGAATCCACACGACCAGACCAAATGAAA
<210> 13
<211> 29
<212> DNA
<400> 13
CGTGGTCGACACGACCAGACCAAATGAAA
<210> 14
<211> 29
<212> DNA
<400> 14
GGTAGGTCACACGACCAGACCAAATGAAA
机译: 用于对基因组材料进行测序的方法,用于对样品中的DNA进行测序,用于减少PCR引入的突变以及用于治疗癌症的方法以及样品中的DNA测序方法和定向代表性测序
机译: 用于检测apirase mansoni RNA测序的方法,通过测序方法检测apirase s.Mansoni RNA的存在,用于检测apgenase基因在DNA基因中的存在的方法。人体中重组疫苗apirase片段的生产,血浆表达,抗体apirase s的生产方法,Mansoni apirase,抗体,疫苗,apirase s蛋白的检测方法,mansoni的生产方法人体apirase中表达该基因的重组体,重组DNA载体,载体,蛋白apirase蛋白S.mansoni,S.mansoni apirase的cDNA基因
机译: 利用Intron序列变异直接进行基因测序的基因组映射方法