首页> 中国专利> 利用全基因组和EST数据开发多态性EST-SSR标记的方法

利用全基因组和EST数据开发多态性EST-SSR标记的方法

摘要

本发明公开了利用全基因组和EST数据开发多态性EST-SSR标记的方法,属于分子生物学领域。本发明首先获取基因组序列与EST数据;接着在全基因组中搜索SSR位点,并鉴定、筛选基因组单一SSR位点;然后设计单一SSR位点比对引物,以EST序列数据为模版进行比对;统计比对结果,筛选在EST模板中有2个以上模拟扩增产物且具有多态性的SSR位点;最后设计多态性EST-SSR位点引物,得到多态性EST-SSR标记。利用本发明开发EST-SSR标记高效、简便,并且能防止因供验证的基因组序列或实验材料遗传差异不足而淘汰掉具有潜在利用价值的EST-SSR标记。所开发的EST-SSR标记与单一基因紧密关联,具有更高的遗传与育种应有价值。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-05-07

    未缴年费专利权终止 IPC(主分类):C12Q1/68 授权公告日:20171107 终止日期:20180524 申请日:20140524

    专利权的终止

  • 2017-11-07

    授权

    授权

  • 2015-07-01

    实质审查的生效 IPC(主分类):C12Q1/68 申请日:20140524

    实质审查的生效

  • 2015-06-03

    公开

    公开

说明书

技术领域

本发明涉及利用全基因组和EST数据开发多态性EST-SSR标记的方法,属于分子生物学领域。

背景技术

SSR标记的原理是与微卫星序列相邻的两侧区域保守性通常较高,可以在此保守区域设计一对特异的PCR引物,扩增其中的微卫星序列,通过聚丙烯酰胺凝胶电泳,即可显示出个体间在此位点的微卫星序列的多态性。由于SSR在基因组中大量地、随机地分布,具有广泛的位点变异,揭示比RAPD、RFLP更多的多态性,并且SSR标记为共显性标记,能够区分纯合型和杂合型,提供完整的遗传信息,在检测多态性时可以采用PCR方法,不需要过多的分子克隆手段,对DNA模板的要求不高,重复性好。因此成为日前运用最广泛的分子标记之一,广泛地运用于动植物、微生物鉴定、遗传多样性分析、分子标记连锁图的构建和群体遗传学等遗传与育种研究领域。

传统的SSR标记是通过构建小片段或大片段的基因组,筛选阳性克隆。通过传统的影印或挑单菌落点膜的方法,把克隆转移到尼龙膜上,经过固定后,用标记过的序列重复寡核苷酸或含微卫星序列的探针与尼龙膜上的克隆点杂交,筛选出其中的阳性克隆,然后测序、设计引物、优化PCR反应条件,获得的阳性克隆经过确认后,全部或经过随机挑选后测序,然后根据微卫星序列两侧保守区域的序列设计引物,获得稳定、可靠的SSR标记,耗时耗力,而且成本非常高。

随着测序技术的不断发展,基因组序列数据资源不断增加,人们开始利用生物信息学方法基于基因组序列数据筛选SSR位点,采用遗传差异足够大的多个基因组序列或生物样本对候选SSR标记进行多态性筛选和鉴定。基因组序列或生物样本间遗传差异小会导致具有潜在利用价值的多态性SSR标记被误淘汰;仅采用基因组序列数据开发的多态性分子标记通常位于基因间序列,通常只适合于遗传多样性及其相关研究,在与基因(遗 传功能)有关的研究(如功能基因克隆)中应用价值有限。

现在开发SSR标记的序列的另一种来源是EST,由于基因功能组学的快速发展,EST被大量测序,并存放在公共序列数据库中,利用EST序列,筛选开发SSR标记的方法简单易行,已发展成为开发SSR标记的主要方法。但是建库时,数据库中的EST是由不同的研究者用随机或鸟枪法获得的,这就会造成EST的冗余性。在进行EST-SSR标记开发时,SSR位点搜索前要先对EST数据进行比对、拼接,去除冗余序列否则极有可能对同一个SSR位点设计不同的引物,并且费时费力存在错误拼接的可能,而且去除的冗余序列中可能含有SSR长度的多态性。综合现在所有的SSR标记方法,新开发的标记通常都需要采用两个以上不同基因组序列对候选SSR标记进行多态性筛选和鉴定,否则就需要运用基因型差异足够大的多个样本DNA进行实验室筛选和验证,其间供试基因组序列、样本间无差异的SSR标记必然会被淘汰。而对于基因组序列数据来源较少、差异小和供试基因型样本的差异不大、代表性不足、具有潜在利用价值的多态性SSR标记极有可能被误淘汰。因此,现有技术还有待于改进和发展。

发明内容

有鉴于此,本发明目的在于:提供利用全基因组和EST数据开发多态性EST-SSR标记的方法,该方法可以大大提高全基因组数据来源较少、实验室验证时供试样本间差异较小,但EST数据较丰富的物种EST-SSR标记的开发效率,并防止因供试验证基因组序列或实验材料遗传差异不足而淘汰具有潜在利用价值的SSR标记。所开发的多态性EST-SSR标记与单一基因紧密关联,具有更高的遗传与育种应有价值。

为实现上述目的,本发明采用如下之技术方案:

利用全基因组和EST数据开发多态性EST-SSR标记的方法,包括下述步骤:

一种利用全基因组和EST数据开发多态性EST-SSR标记的方法,其特征在于,包括下述步骤:

①获取基因组序列与EST数据,从公共数据库下载基因组序列数据、相应的基因注释信息和EST数据,用基因组注释信息进行基因组外显子、内含子序列分析,选取基因TSS转录起始位点前2000bp作为启动子序列;

②将步骤①获得的全基因组数据进行SSR位点搜索与分析,采用MISA程序扫描全基因组染色体DNA序列,搜索、分析基因组序列中包含的SSR位点。采用MISA程序的默认SSR扫描参数:单核苷酸重复、二核苷酸重复、三核苷酸重复、四核苷酸重复、五核苷酸重复以及六核苷酸重复,重复单元分别大于10、7、6、5、4、4次重复;距离100bp的视为一个SSR位点;每种重复基元的各种变异类型及其反向互补类型均归为一类;

③单一SSR位点筛选,采用Perl编写程序,从每个SSR结构域前若干碱基对(如5bp)开始,提取18~24bp的序列作为电子模拟PCR扩增的上引物;间隔10~24bp后,提取18~24bp序列,反向重复后作为下引物;采用Bowtie软件将引物序列比对到步骤①所下载的参考基因组上,根据需要允许若干(如1~3)个碱基的错配;采用Perl语言编写程序,鉴定、筛选单一SSR位点;

④EST中多态性SSR位点鉴定与分析,采用序列比对软件Bowtie以EST序列为模板,以具有单一侧翼序列的SSR比对引物进行比对,采用Perl语言编程统计匹配区域长度信息;

⑤多态性EST-SSR位点筛选,筛选EST模板中有2个以上模拟扩增产物,且产物具有多态性(长度差异)的EST-SSR位点;

⑥多态性EST-SSR标记引物设计,采用引物设计软件设计多态性EST-SSR标记引物。

上述方法中所述基因组和EST数据可以是植物基因组和EST数据;也可以是动物基因组和EST数据;也可以是微生物基因组和EST数据。在获得一定数量的EST数据的基础上,该方法适用于所有物种,更特别地适用于基因组序列数据来源较少、差异小和供试基因型样本的差异不大、代表性不足的物种,具体如马铃薯。

本发明所提供的利用全基因组和EST数据开发多态性EST-SSR标记的方法,由于采用了首先在全基因组序列中进行SSR位点搜索、筛选,筛选到基因组中单一SSR位点,然后以EST序列为模板进行SSR标记的多态性筛选、验证。充分利用了EST的冗余性中对SSR标记筛选验证所需的多态性,大大提高了SSR标记的开发效率,而且对于全基因组数据来源较少、实验室验证时供试样本间差异较小,但EST数据较丰富的物 种EST-SSR标记的开发和防止因供试验证基因组序列或实验材料遗传差异不足而淘汰具有潜在利用价值的SSR标记具有重要作用。

由于所开发的SSR标记均为EST-SSR标记,且与单一基因直接关联,因而具有更高的遗传与育种应有价值。

附图说明

图1.在EST模版中比对产物不同长度差异的马铃薯SSR标记数

图2.引物5在20份材料中的扩增条带

具体实施方式

本发明提供的利用全基因组和EST数据开发多态性EST-SSR标记的方法。为使本发明的目的、技术方案及优点更加清楚明确,以下以马铃薯为实例并参照附图进一步详细说明。下述实验方法如无特殊说明,均为常规方法,材料和试剂如无特殊说明均可从商业途径获得。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。

实施例:马铃薯EST-SSR标记的开发与验证

利用全基因组和EST数据开发EST-SSR标记

1.1获取马铃薯基因组序列和EST数据:

从公共数据库(http://solanaceae.plantbiology.msu.edu/)下载马铃薯基因组序列数据(PGSC_DM_v3_2.1.11_pseudomolecules)与相应的基因注释信息(PGSC_DM_v3.4)。从NCBI(http://www.ncbi.nlm.nih.gov/)下载马铃薯EST数据,共26万余条(截至2013年4月)。

用基因组注释信息进行外显子Exon、内含子Intron序列分析,选取基因TSS转录起始位点前2000bp作为启动子序列。

1.2马铃薯基因组SSR位点搜索与分析:

采用MISA程序(http://pgrc.ipk-gatersleben.de/misa/)扫描马铃薯全基因组12条染色体DNA序列,搜索、分析基因组序列中包含的SSR位点,SSR扫描标准如下:单核苷酸重复(MNRs)、二核苷酸重复(DNRs)、三核苷酸重复(TNRs)、四核苷酸重复(TTRs)、五核苷酸重复(PNRs)以及六核苷酸重复(HNRs),重复单元分别大于10、 7、6、5、4、4次重复;距离100bp的视为一个SSR位点;每种重复基元的各种变异类型及其反向互补类型均归为一类。其中12条染色体上搜索到的SSR位点及其染色体分布特征见表1。

1.3单一SSR位点筛选: 

采用Perl编写程序,从每个SSR结构域前5bp开始,提取20bp的序列作为电子模拟PCR扩增(比对)的上引物;间隔20bp后,提取20bp序列,反向重复后作为下引物。

采用Bowtie软件将这些引物序列比对到马铃薯参考基因组上,允许2个碱基的错配。采用Perl语言编写程序,鉴定、筛选单一SSR(Unique SSR)位点。

1.4EST中多态性SSR位点鉴定与分析:

采用序列比对软件Bowtie,提取上述分析所揭示的101351个单一SSR位点区域20bp和两端侧翼序列各40bp,总共100bp设计比对引物,以马铃薯EST序列为模板进行比对(模拟扩增)。采用Perl语言编程统计匹配区域长度信息。

经比对在261998条EST序列中具有匹配产物的SSR引物有2104个,共获得6511个匹配结果,每对引物平均获得3.10个比对结果。比对结果最多的SSR位点是位 于马铃薯第5染色体1294789-1294810间的(A)n SSR位点,获得了7个有长度差异的结果,最大长度差异达168bp。具有两个以上长度差异比对结果的SSR位点标记(多态性SSR标记)共611个,占有结果SSR标记的29.04%;其中差异为1bp的SSR标记比例最多(158个)见图1。

比对结果中长度差异最大的SSR位点是位于第3染色体4261010-4261042之间的(GGA)n类型SSR位点,差异为168bp;差异大于3bp的多态性SSR标记有357个。具有多个长度信息、且长度较大差异的SSR位点,在实验室操作中检测效率更高。

1.5SSR标记PCR引物设计与合成:

根据步骤4的分析结果,选取34个分别位于各条染色体上的多态性SSR位点,采用Primer5.0软件设计引物,设计完成后合成引物。34对SSR-PCR引物及其所在染色体、位置和解链温度见表2。

2.引物多态性的实验室验证

为了进一步验证按本发明方法所开发的EST-SSR标记的多态性(可靠性和实用性),采用34对引物对20份供试材料(如表3所示)进行SSR-PCR扩增、产物检测分析。

2.1马铃薯基因组DNA提取与检测 

本试验采用马铃薯栽培品种、地方品种、国外引进品种及新品系详见表3,在马铃薯幼嫩期取幼嫩展开的叶片,采用CTAB法提取DNA,并(分别采用分光光度计法和琼脂糖凝胶电泳)检测DNA的浓度和质量。其主要步骤如下:

1)取40ml2×CTAB,预先65℃水浴;将5ml EP管加入0.04PVP,并预先水浴;

2)取约0.5g新鲜马铃薯叶片,剪成碎块,放在预冷的研钵中,用液氮迅速研成粉末迅速转入预冷的5ml EP管中(一般不超过1/2管体积);

3)迅速向EP管中加入2ml65℃水浴的2×CTAB缓冲液,轻轻摇匀后,65℃水浴45min,并约不时的轻轻摇动;

4)放置通风橱15min,冷却至室温;

5)缴入等体积的氯仿∶异戊醇(24∶1),混匀,轻微振荡15min;

6)室温下,8000r/min离心8min;

7)吸取上清液至新的5ml EP管;

8)重复5~6一次;

9)吸取上清液转入另一支干净的5ml EP管中,加入等体积预冷的异丙醇(4℃);

10)室温下,8000r/min离心15min;

11)弃上清液,用力加入75%乙醇1ml,混匀,弃上清(乙醇沉淀);

12)重复11一次;

13)加入无水乙醇进行沉淀一次;

14)弃上清,在通风橱放置直至乙醇完全挥发(1-2h);

15)用100μl的TE Buffer溶解DNA,4℃过夜;

16)加入1μl的RNase A,37℃恒温30min水浴30min,-20℃贮存,备用。

2.2SSR-PCR扩增与检测 

SSR-PCR采用20μl SSR-PCR反应体系:Mix10μl,Taq DNA聚合酶0.75U,10pmol/μl引物(F+R)1.6μl,100ng/μL DNA模板0.6μl,用ddH2O补齐。

PCR反应程序:为94℃模板预变性5min;94℃变性1min,退火1min(退火温度范围在53~60℃),72℃延伸1min,35个循环;最后72℃下延伸8min,4℃退火温度随 引物而变化。PCR产物加入2μL loading buffer,94℃变性5min,-20℃冰箱保存备用。

采用6%变性聚丙烯酰胺凝胶电泳分离扩增产物,Bio-Rad高压电泳仪和垂直电泳槽(北京六一DYCZ-20C型)恒定功率80W,电泳时间约60min。经银染、显影,数码相机拍照记录电泳结果。

2.3引物多态性分析

将分子标记任一扩增条带看作一个等位位点,按带有/无建立1,0型二维数据矩阵;统计各对引物扩增总位点数、多态性位点数;计算各对引物多态性位点比率(多态性位点数/总位点数×100%)、多态性信息量(Polymorphic Information Content,PIC=1-∑(Pi2),Pi为第i个条带的频率)。

采用34对引物对20份供试材料进行SSR-PCR扩增,其中:28对引物获得清晰的扩增条带(表4),总位点数58个,如图2所示引物5的位点数最多(6个位点),另有6对引物具有3个扩增位点、13对引物具有2个扩增位点、8对引物只有1个扩增位点,58个位点中,多态性位点55个,多态性率达94.83%。28对引物中,3对引物在供试材料上无多态性位点,其余引物的多态性率均为100%。图2示出引物5在20份材料上的扩增产物条带。

8对只扩增1个位点的引物的多态性信息量(PIC)为0,引物5的多态性信息量最高(0.823),5对引物的多态性信息量达到0.55以上;28对引物的平均多态性信息量为0.347;排除8对多态性信息量为0的引物后,20对引物的平均多态性信息量为0.486。

综上,利用本发明对马铃薯的全基因组序列搜索、筛选单一SSR位点,利用EST数据的冗余性和多态性,以EST序列为模板进行多态性SSR标记筛选、验证,极大地提高了马铃薯多态性EST-SSR标记的开发效率。

用20份马铃薯材料对其中34个EST-SSR标记进行实验室验证,结果表明:所开发的多态性EST-SSR标记具有很高的多态性水平,这些均来源于基因编码区的SSR标记,在特定基因遗传、功能研究、杂交育种亲本选配及品种鉴定等应用中具有很高的价值。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号