首页> 中国专利> 一种基于转录组测序开发山黧豆EST‑SSR引物组及方法和应用

一种基于转录组测序开发山黧豆EST‑SSR引物组及方法和应用

摘要

本发明提供基于转录组测序开发山黧豆EST‑SSR引物组及方法和应用。获得两个不同花色山黧豆品种在苗期的根、茎、叶全部转录本集合,形成原始序列数据库;去除带接头和低质量的测序数据,形成高质量的过滤序列数据库;对高质量的过滤序列进行拼接,还原转录本,将转录本与参考蛋白质数据库NR进行BLAST比对,保留最优比对结果并确定最长序列作为Unigene代表序列。用MISA 1.0进行Unigene中SSR位点的扫描;primer 3.0进行SSR引物设计,筛选SSR引物,对43份山黧豆材料进行指纹图谱构建。本发明方便、快速、准确、成本低廉,为山黧豆SSR引物开发和种质资源鉴定提供了新思路。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-07-29

    未缴年费专利权终止 IPC(主分类):C12Q 1/6895 专利号:ZL2017107213799 申请日:20170822 授权公告日:20200626

    专利权的终止

  • 2020-06-26

    授权

    授权

  • 2017-12-08

    实质审查的生效 IPC(主分类):C12Q1/68 申请日:20170822

    实质审查的生效

  • 2017-11-14

    公开

    公开

说明书

技术领域

本发明属于分子标记及生物信息学技术领域,具体涉及一种基于转录组测序开发山黧豆EST-SSR引物组及方法和应用。

背景技术

山黧豆(Lathyrussativus>

转录组测序(RNA-Seq, RNA Sequencing)是基于下一代测序技术(NGS,Next-Generation Sequencing)的RNA测序方法。转录组测序不仅速度快、效率高、成本低,而且可以进行基因表达谱分析、开发相关联基因的SSR和SNP标记。转录组测序步骤主要包括:实验设计、RNA提取和分离、文库构建、测序和数据分析。基于转录组测序开发的SSR标记不仅更加可靠,而且基于Unigene开发更有利于基因的挖掘。

简单重复序列(simple sequence repeat,SSR),也称微卫星DNA(microsatelliteDNA),是指DNA分子中1-5个核苷酸的串联重复,SSR以其在动植物基因组随机分布、高信息量和多态性、共显性和孟德尔遗传等优势,在遗传图谱的构建、遗传多样性分析、亲缘关系鉴定、DNA指纹图谱构建、功能基因标记等方面具有公认的优越性和应用前景。但SSR标记的开发通常需要文库构建,包括SSR克隆的筛选、测序、引物设计和PCR扩增与分析等步骤,要投入大量的人力物力。

表达序列标签(Experssed sequence Tags EST),是将mRNA 反转录成cDNA并克隆到质粒或噬菌体载体构建成cDNA文库后,大规模随机挑选cDNA克隆,对其5’或3’端进行单向单次测序后所获得序列,其长度约为150-500bp。

EST-SSR是利用已有的EST序列通过电子筛选鉴别SSR,然后用PCR检测。利用EST开发SSR避免了SSR引物开发过程中的克隆和测序步骤,充分利用了现有数据,降低了开发成本。由于EST-SSR的保守性较好,在不同物种间通用性好,可作为校正远亲物种间基因组连锁图谱与比较作图的方法,在这两方面有较高的利用价值。

EST-SSR标记广泛分布于动植物等生物mRNA中,与基因组gSSR相比,其大多位于外显子,并与基因编码区序列直接相关,因此在基因定位方面,相比较gSSR等标记在基因挖掘上面更加经济和高效。现阶段该标记已在作物品种指纹图谱和群体遗传结构分析、遗传连锁图谱构建、基因的定位和克隆等研究中广泛应用。

由于山黧豆基因组庞大(8.2Gb),目前尚未进行全基因组测序且EST-SSR引物数量匮乏。通过山黧豆的不同品种转录组分析,可得到山黧豆高质量的转录本,可用于不同数据库的功能注释等后续分析。通过山黧豆的不同品种转录组测序和SSR引物的开发,可为后续山黧豆的功能基因挖掘和分子育种等研究提供重要参考。

发明内容

本发明针对现有技术的不足,提供了一种基于转录组测序开发山黧豆EST-SSR引物组及方法和应用。基于山黧豆转录组测序开发的山黧豆EST-SSR引物组,具有扩增稳定、电泳条带清晰、多态性丰富等优点,可有效用于山黧豆种质指纹图谱的构建、遗传多样性分析、分子标记辅助育种等研究领域。

本发明由如下技术方案实现:一种基于转录组测序开发山黧豆EST-SSR引物组,所述引物组包括8对引物,其核苷酸序列如序列表 SEQ ID NO.1-16所示。

制备所述的一种基于转录组测序开发山黧豆EST-SSR引物组的方法,提取山黧豆两个品种苗期根、茎、叶混合材料的总RNA,获得两个品种苗期的根、茎、叶全部转录本集合,形成原始序列数据库;将序列拼接为一个转录组,将转录组与参考蛋白质数据库NR进行BLAST比对,取比对到同一个GI号的转录本中最长的作为 Unigene代表序列;采用MISA1.0进行Unigene中SSR序列识别;利用Primer3.0进行SSR引物设计;利用来源不同的山黧豆种质资源对设计的SSR引物进行有效性筛选,利用ID Analysis4.0软件计算SSR引物扫描山黧豆种质资源材料的多态性数据,构建山黧豆指纹图谱。

具体步骤如下:

(1)转录组文库的构建:利用天恩泽柱式植物RNAout试剂盒分别提取山黧豆RQ23和RQ36两个品种苗期根、茎、叶混合材料的总RNA,采用oligo dT磁珠富集mRNA,用含二价阳离子的片段缓冲液将富集的mRNA打断为200-300 nt的片段,然后反转录为cDNA,经QIAquickPCR Extraction 试剂盒纯化、EB缓冲液洗脱,通过核酸外切酶和聚合酶进行突出末端的修复,在cDNA片段3’末端加“A”与测序接头连接,用AMPure XP beads纯化已加接头的体系,然后PCR扩增,利用2%琼脂糖凝胶电泳对文库进行片段大小选择和纯化,构建转录组文库,采用Quantifluor TM>ST fluorometer E6090 荧光计和Agilent 2100 生物分析仪进行cDNA文库的检测,合格文库标准化后达到10 nM;转录组文库用Illumina NextSeq500进行2×150 bp双末端测序,获得山黧豆转录组测序数据,每个样品个体测序数据量为>10Gb CleanData;

(2)测序数据过滤、拼接、分析:用cutadapt 1.2.1去除序列接头和低质量的序列,获得平均质量分数≥Q20的过滤序列,过滤序列用Trinity拼接成完整的转录本,利用参考蛋白质数据库即NR 库进行版本为 2.2.30+的BLAST比对,选择比对到同一个GI号的转录本中最长的序列作为 Unigene代表序列;

(3)SSR引物设计:采用MISA1.0对步骤(2)中所获得的Unigene进行SSR序列识别;利用Primer3.0模块进行SSR引物批量设计;

(4)SSR引物筛选:来源不同的山黧豆种质资源采集苗期叶片进行DNA提取,利用提取的DNA和随机选择若干步骤(3)中所设计的SSR引物进行PCR扩增,然后用6-8%聚丙烯酰胺凝胶电泳进行多态性检测,筛选SSR有效引物;

(5)构建山黧豆种质资源的指纹图谱:用步骤(4)筛选的多态性引物及对所述来源不同的山黧豆种质资源多态性扫描结果,利用ID Analysis4.0软件筛选并获得最佳标记以区分来源不同的山黧豆种质,进行指纹图谱构建,所获得的指纹图谱至少能用6-10个SSR有效标记准确鉴定来源不同的山黧豆品种。

步骤(1)中所述山黧豆两个品种苗期根、茎、叶混合材料的总RNA浓度大于80ng/μL,A260/280>1.8,单次建库总量大于4μg;cDNA片段锚定接头序列为:正向引物:SEQ IDNO.17;反向引物:SEQ ID NO.18。

步骤(3)中SSR序列识别的具体方法为:安装perl语言并从http://pgrc.ipk-gatersleben.de/misa/misa.html下载misa.pl程序,将包含Unigene的序列文件命名为S.fasta拷贝至C盘perlin目录中,在perl环境下执行命令C:perlinperl misa.plS.fasta,搜索序列中的SSR位点并得到S.fasta.misa和S.fasta.statistics两个文件。其中1、2、3、4、5、6个碱基的重复次数最低分别为10, 6, 5, 5, 5, 5,两个SSR之间距离小于100 bp则合并为一个复合型SSR位点。

SSR引物批量设计的方法为:在perl环境下,使用primer3模块批量设计SSR引物。将p3_out.pl拷贝至c:perlin目录并运行命令“c:perlin>perl p3_in.plS.fasta.misa”,得到 S.fasta.p3in输入文件。将 S.fasta.p3in文件拷贝到c 盘perlinprimer3in目录下,运行C:Perlinprimer3in>primer3_core.exe <S.fasta.p3in > S.fasta.p3out 实现批量的引物设计并产生一个名为 S.fasta.p3out的文件,最后将 C.fasta.p3out 文件拷贝至 C:Perlin目录下,运行命令C:perlin>perl p3_out.pl S.fasta.p3out S.fasta.misa,得到S.fasta.results 文件,SSR引物设计完成。

所述基于转录组测序开发山黧豆EST-SSR引物组在山黧豆品种鉴定中的应用。

应用本发明所述方法成功设计3204对SSR引物,随机选择284对引物利用43份山黧豆种质资源进行有效性验证,其中175对SSR引物在100-500bp检测到清晰的目的条带,87对具有多态性;利用ID Analysis4.0软件计算87对SSR引物扫描43份材料的多态性数据,得到8个有效标记能够区分43份山黧豆种质,构建了43份山黧豆指纹图谱。本发明方便、快速、准确、成本低廉,为山黧豆SSR引物开发和种质资源鉴定提供了新思路。

附图说明

图1为文库片断选择与纯化——2%琼脂糖凝胶电泳图;图2为转录组测序建库流程图;图3为转录组测序结果分析流程图;图4为Unigene长度频度分布图;图5为Unigene在不同数据库的注释信息分布图;图6.1为引物13、27和58对43份来源于不同国家的山黧豆多态性验证结果;图6.2为引物62、110和116对43份来源于不同国家的山黧豆多态性验证结果;图6.3为引物203和253对43份来源于不同国家的山黧豆多态性验证结果;图7为No.51引物筛选凝胶电泳图。

具体实施方式

以下实施例用于说明本发明,但不用来限制本发明的范围。若未特别说明,实施例均按照常规实验条件,如按照制造厂商说明书建议条件。

以下实施例中所用实验材料如无特殊说明,均从常规试剂商店购买得到。以下实验均设置三次重复。

实施例1:RNA-Seq分析及SSR引物设计

一、转录组数据测定

利用天恩泽柱式植物RNAout试剂盒分别山黧豆RQ23和RQ36两个品种苗期根、茎、叶混合材料的总RNA,利用oligo dT 磁珠捕获mRNA进行纯化;采用含二价阳离子的fragmentation buffer将捕获的mRNA打断为200-300 nt的片段,利用含有6个碱基的随机引物和片段mRNA合成第一条cDNA链,然后利用DNA polymerase I和RNase H合成第二条cDNA链。产物经QIAquick PCR Extraction 试剂盒纯化、EB缓冲液洗脱并通过核酸外切酶和聚合酶进行突出末端的修复。在cDNA片段3’末端加“A”与测序接头连接,利用AMPure XPbeads纯化已加接头的体系,然后进行PCR扩增,最终利用2%的琼脂糖凝胶电泳对文库做最终的片段选择和纯化。构件好的文库用Illumina NextSeq500进行双末端测序。具体方法如下:

1.山黧豆总RNA提取

采用天恩泽柱式植物RNAout试剂盒分别提取山黧豆K748和K91两个品种苗期根、茎、叶混合材料的总RNA,纯化获得RNA浓度大于80ng/μL,A260/280>1.8,单次建库总量大于4μg。

2.mRNA的富集和片段化

用Illumina的TruSeq Stranded mRNA LT Sample Prep 试剂盒,针对真核生物带有的polyA尾巴,用带有oligo-dT的磁珠捕获mRNA。采用含二价阳离子的fragmentation buffer将捕获的mRNA打断为200-300 nt的片段。

3.cDNA的合成

利用六聚体随机引物、逆转录酶和片段mRNA合成cDNA第一条链,然后利用RNaseH和DNA聚合酶I合成第二条cDNA链。

4.cDNA纯化、测序接头连接和末端修复

采用QIAquick PCR Extraction试剂盒进行纯化,EB缓冲液洗脱并通过3’→5’核酸外切酶和聚合酶进行突出末端的修复。在c DNA片段锚定接头序列,所锚定的接头序列为正向引物:SEQ ID NO.17,即5’- aatgatacgg cgaccaccga gatctacact ctttccctacacgacgctct tccgatct - 3’;反向引物:SEQ ID NO.18,即5’- gatcggaaga gcacacgtctgaactccagt cacatcacga tctcgtatgc cgtcttctgc ttg - 3’。用上述接头序列中的引物进行15个循环的PCR扩增。

5. cDNA片段扩增、纯化和片段筛选:在cDNA的3’端加一个碱基A以防止DNA自连,同时保证cDNA与3’端有一个突出碱基T的测序接头相连。通过A与T互补连接测序接头并进行PCR扩增,利用BECKMAN AMPure XP beads纯化PCR体系,最终用2%琼脂糖凝胶电泳来对文库做最终的片段选择与纯化。电泳结果见图1。

6.文库的检测:取 1μL文库,采用Agilent High Sensitivity DNA Kit生物分析仪进行cDNA文库的检测,合格的文库应该有单一的峰,无接头;利用 Quantifluor TM>STfluorometer E6090 荧光计进行定量,要求合格文库标准化后达到10 nM。

7.mRNA片段的测序:对合格的文库,在Illumina NextSeq测序仪上,利用NextSeq500 High Output Kit(300 cycles)进行2×150bp的双末端测序,文库经 0.2N NaOH 变性成单链进行上机测序,上样量要求控制在4-5 pM。

8. 测序数据的过滤、拼接和分析:对原始下机数据即Raw data采用FastQC(http://www.bioinformatics.babraham.ac.uk/projects/fastqc)进行碱基质量控制。在质量控制合格的基础上,利用cutadapt 1.2.1去除接头序列,同时去除低质量reads,要求平均质量分数≥Q20,最终得到Clean data。通过Trinity(版本为r20140717,k-mer 25bp),对过滤的Clean data 进行转录组的拼接,得到初步拼接的 contig 序列,再通过 contig序列间的 overlap 将其聚类,利用聚类情况还原转录本trancript。在此基础上,将每一条transcript与参考蛋白质数据库(NR 库)进行 BLAST(version 2.2.30+)比对,将比对到同一个GI号的转录本中最长的作为 Unigene。

二、SSR引物的设计

1. SSR序列的识别和提取:安装perl语言,从http://pgrc.ipk-gatersleben.de/misa/misa.html下载misa.pl程序,将包含Unigene的序列文件命名为S.fasta拷贝至C盘perlin目录中,在perl环境下执行命令C:perlinperl misa.pl S.fasta,搜索序列中的SSR位点并得到S.fasta.misa和S.fasta.statistics两个文件。其中1-6个碱基的最低重复次数分别为10, 6, 5, 5, 5, 5,两个SSR之间距离小于100 bp就合并为一个复合型SSR。

2.引物设计

在perl环境下,使用primer3模块批量设计SSR引物。将p3_out.pl拷贝至c:perlin目录并运行命令“c:perlin>perl p3_in.pl S.fasta.misa”,得到S.fasta.p3in输入文件。将 S.fasta.p3in文件拷贝到c 盘perlinprimer3in目录下,运行C:Perlinprimer3in>primer3_core.exe < S.fasta.p3in > S.fasta.p3out 实现批量的引物设计并产生一个名为 C.fasta.p3out 的文件,最后将 C.fasta.p3out 文件拷贝至 C:Perlin目录下,运行命令C:perlin>perl p3_out.pl S.fasta.p3out S.fasta.misa,得到S.fasta.results 文件,至此SSR引物设计完成。表1为所设计的SSR重复基元的统计结果。

表1 SSR重复基元统计

实施例2 SSR引物的验证

利用表2记载的来源地不同的43份山黧豆种质资源进行种植,分别采集苗期叶片2g,利用高通量粉碎机进行叶片的粉碎,采用上海生工DNA提取试剂盒(Ezup柱式植物基因组DNA抽提试剂盒,B518261-0050)进行叶片DNA提取,在酶标仪上进行DNA质量检测以及浓度的测定,并将DNA稀释至终浓度30ng/μL,至于-20℃保存。利用43份材料DNA和随机选择的284对SSR引物进行PCR扩增,验证引物的多态性。PCR反应体系共计10μL,其中包括1.5 μL (30ng/μL)基因组DNA, 5 μL 2× Taq PCR MasterMix (天根, KT:121221),2μL (0.002nmol/μL)的正反引物合计。PCR扩增反应程序为:95℃预变性5min,95℃变性30s,52℃退火45s,72℃延伸45s,进行35个循环,最后72℃延伸10min。反应结束后产物加入2μL loading buffer并离心,以100-600bp DNA ladder为标准,采用6-8%的非变性聚丙烯酰胺进行凝胶电泳,电泳缓冲液为0.5×TBE,200-300电压电泳2-3h,至扩增片段电泳到凝胶中部为止。电泳结束后采用银染法染色,最终将凝胶置于成像仪上成像并标记拍照。结果见图7。

选取284对引物对43份山黧豆种质资源进行验证。结果表明87对引物能够检测到多态性位点,多态性引物得率为30.6%。通过对43份山黧豆遗传多样性计算,等位基因数量变化幅度为2-8个,平均值为3.6个,信息度指数(PIC)变化幅度为0.0848-0.7425 平均值为0.4158,这些实验结果均表明本次引物设计和开发的有效性较高。

表2 43份山黧豆资源来源地

实施例3:构建43份山黧豆种质资源指纹图谱

利用284对引物对43份山黧豆种质资源DNA的PCR扩增结果,选择87对有多态性的SSR标记(87对有多态性的SSR标记见表3),对87对引物43份材料的多态性扫描数据,利用IDAnalysis 4.0软件筛选最佳标记用以区分43份山黧豆种质,最终得到8个有效标记能够区分43份山黧豆材料。

通过8对引物对43份材料的PCR扩增和聚丙烯酰胺凝胶电泳结果进行读带,8对引物可分别扩增出不同的带型,其中SSR No.013为6条带型,分别标记为1-6;SSR No.253为5条带型,分别标记为1-5;SSR No.58为5条带型,分别标记为1-5;SSR No.203为4条带型,分别标记为1-4;SSR No.116为4条带型,分别标记为1-4;SSR No.27为4条带型,分别标记为1-4;SSR No.62为4条带型,分别标记为1-4;SSR No.110为4条带型分别标记为1-4。43份山黧豆种质资源的指纹图谱代码见表2,表中0表示无扩增条带,@表示为杂合带型,即2条不同扩增条带,其余数字代表其扩增的相应标记带型。(见图6.1,6.2,6.3)

指纹图谱通过利用8对引物对每一份山黧豆资源的扩增产物的可能的带型组合,最终鉴定该种质资源。通过对43份山黧豆资源利用8对引物建立的指纹图谱,可高效、准确和快速的进行山黧豆种质资源的区分和鉴定。

表3:43份种质资源的指纹图谱

表4为87对山黧豆SSR引物的名称、上下游序列、重复单元类型、退火温度和扩增产物大小

虽然上文中已用一般性说明及具体实施方案对本发明做了详细的描述,但在本发明基础上,可对其做出一些修改或改进,这对本领域技术人员来说是彰明较著的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。

序列表

<110> 山西省农业科学院农作物品种资源研究所;中国农业科学院作物科学研究所

<120> 一种基于转录组测序开发山黧豆EST-SSR引物组及方法和应用

<160> 18

<170> SIPOSequenceListing 1.0

<210> 1

<211> 27

<212> DNA

<213> Artificial

<220>

<221> primer_bind

<223> 引物13正向引物

<400> 1

aacagacgtt atgtcggtat atacatt 27

<210> 2

<211> 20

<212> DNA

<213> Artificial

<220>

<221> primer_bind

<223> 引物13反向引物

<400> 2

ttgatcgatt aagcacgcag 20

<210> 3

<211> 22

<212> DNA

<213> Artificial

<220>

<221> primer_bind

<223> 引物27正向引物

<400> 3

tgttcttctg cttttcttca gc 22

<210> 4

<211> 20

<212> DNA

<213> Artificial

<220>

<221> primer_bind

<223> 引物27反向引物

<400> 4

aacccatagt ccccatcctc 20

<210> 5

<211> 20

<212> DNA

<213> Artificial

<220>

<221> primer_bind

<223> 引物58正向引物

<400> 5

tggtcaaact ttcaatggca 20

<210> 6

<211> 20

<212> DNA

<213> Artificial

<220>

<221> primer_bind

<223> 引物58反向引物

<400> 6

taaaaacata gctgcgggct 20

<210> 7

<211> 20

<212> DNA

<213> Artificial

<220>

<221> primer_bind

<223> 引物62正向引物

<400> 7

aaattgcttt gttggcatcc 20

<210> 8

<211> 20

<212> DNA

<213> Artificial

<220>

<221> primer_bind

<223> 引物62反向引物

<400> 8

atagcagaag ctcccaagca 20

<210> 9

<211> 20

<212> DNA

<213> Artificial

<220>

<221> primer_bind

<223> 引物110正向引物

<400> 9

atccgggttt tcaattttcc 20

<210> 10

<211> 20

<212> DNA

<213> Artificial

<220>

<221> primer_bind

<223> 引物110反向引物

<400> 10

cataactgct tttggggcat 20

<210> 11

<211> 20

<212> DNA

<213> Artificial

<220>

<221> primer_bind

<223> 引物116正向引物

<400> 11

acaccccact ctctctccct 20

<210> 12

<211> 20

<212> DNA

<213> Artificial

<220>

<221> primer_bind

<223> 引物116反向引物

<400> 12

ttgaatgagg ctctcggagt 20

<210> 13

<211> 20

<212> DNA

<213> Artificial

<220>

<221> primer_bind

<223> 引物203正向引物

<400> 13

ttcgtgtgca aaacgttcat 20

<210> 14

<211> 20

<212> DNA

<213> Artificial

<220>

<221> primer_bind

<223> 引物203反向引物

<400> 14

gatttcctga ttgctcccaa 20

<210> 15

<211> 20

<212> DNA

<213> Artificial

<220>

<221> primer_bind

<223> 引物253正向引物

<400> 15

aacctgcagg accactcaac 20

<210> 16

<211> 20

<212> DNA

<213> Artificial

<220>

<221> primer_bind

<223> 引物253反向引物

<400> 16

ccagtttcct ctcgaagcac 20

<210> 17

<211> 58

<212> DNA

<213> Artificial

<220>

<221> primer_bind

<223> cDNA片段锚定接头正向引物

<400> 17

aatgatacgg cgaccaccga gatctacact ctttccctac acgacgctct tccgatct 58

<210> 18

<211> 63

<212> DNA

<213> Artificial

<220>

<221> primer_bind

<223> cDNA片段锚定接头反向引物

<400> 18

gatcggaaga gcacacgtct gaactccagt cacatcacga tctcgtatgc cgtcttctgc 60

ttg 63

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号