首页> 中国专利> 一种柑橘全基因组KASP标记库的构建方法及应用

一种柑橘全基因组KASP标记库的构建方法及应用

摘要

本发明提供一种柑橘全基因组KASP标记库的构建方法及应用,属于KASP标记库技术领域。所述柑橘KASP标记库的构建方法,包括如下步骤:导入群体父母本DNA样本以及杂交子代单株DNA样本;滤除样本中的偏分离位点;将过滤后的基因组VCF文件中的未知基因型数据进行基因型填充;对经填充的基因组VCF文件中的单碱基变异SNP数据进行过滤处理,得到最终基因组VCF文件;将最终基因组VCF文件导入KASP标记生成软件中,生成柑橘KASP标记库。本发明还公开了上述构建的柑橘KASP标记库的应用。本发明的KASP标记库可用于鉴定表型,具有高效、准确的优点。

著录项

  • 公开/公告号CN112289384A

    专利类型发明专利

  • 公开/公告日2021-01-29

    原文格式PDF

  • 申请/专利权人 华中农业大学;

    申请/专利号CN202011104524.7

  • 申请日2020-10-15

  • 分类号G16B50/00(20190101);G16B50/30(20190101);G16B30/10(20190101);C12Q1/6895(20180101);

  • 代理机构11212 北京轻创知识产权代理有限公司;

  • 代理人姚晓丽

  • 地址 430070 湖北省武汉市洪山区狮子山街1号

  • 入库时间 2023-06-19 09:43:16

说明书

技术领域

本发明主要涉及标记库构建技术领域,具体涉及一种柑橘全基因组KASP标记库的构建方法及应用。

背景技术

柑橘是世界上最重要的水果作物之一,我国柑橘年产量超过4000万吨,居世界首位。但柑橘的杂交育种进展一直缓慢,这是因为柑橘中具有独特的无融合生殖(Apomixis)现象。一方面多胚性状在柑橘生产中广泛利用,尤其是在砧木育种中通过无融合生殖产生的后代发芽和出苗率高、苗木均匀粗壮、整齐一致,是其它果树不具备的优点;另一方面,对杂交育种来说,受珠心胚干扰,导致杂交后往往得不到有性后代,严重影响了柑橘杂交育种效率。分子标记辅助育种在柑橘中有很大的利用价值,理论上利用分子标记可以在苗期鉴定出优良基因型的杂交种,能够提前预测表型,但是实际上有用的分子标记却很少。因此,选择高效的分子标记对于柑橘杂交育种及砧木育种是十分必要的。

近年来,随着分子生物学的发展,品种鉴定进入到基因水平。DNA标记技术具有准确、快速和自动化的特点,成本也在逐年下降,是未来品种鉴定的趋势,其中SSR和SNP是特别适用于品种鉴定的方法。SNP作为第三代分子标记有着诸多优势,也被认为是极具应用前景的分子标记技术。而KASP技术(Kompetitive Allele Specific PCR,即竞争性等位基因特异性PCR)是基于引物末端碱基的特异匹配来对SNP分型以及检测InDels(Insertionsand Deletions,插入和缺失),可在广泛的基因组DNA样品中(甚至是一些复杂基因组的DNA样品),对SNPs和特定位点上的InDels进行精准的双等位基因判断,该技术具有高度稳定性与准确性的特点。作为一种高通量、低成本和低失误率的检测SNP分型方法之一,在作物辅助育种应用中具有重要作用。

SNP在基因组上广泛分布,密度大,类型多样,目前也有根据基因组开发SSR标记的方法,但是却没有全基因组KASP标记库的构建方法,因为测序和比对错误导致构建过程中具有较高的假阳性率,尤其是缺乏柑橘全基因组的KASP标记库的构建方法。

现有技术中,有两种获得基因组单一位点KASP标记方法:第一种是针对自然群体进行高通量测序,根据在小区间内标记连锁这个特征来筛选KASP标记,因为自然群体变异大,标记数量少,假阳性较高,往往配合关联分析来进行表型鉴定。第二种是针对遗传群体的父母本的进行重测序或者经过扩增之后进行PCR测序,重测序的方法标记中假阳性率极高,原因是:测序错误、比对准确性、变异检测误差。同时也没有一个标准去鉴定获得的标记的准确性,只能再去PCR扩增测序加以验证。

鉴于此,有必要提供一种柑橘全基因组KASP标记库的构建方法及应用,以解决现有技术的不足。

发明内容

本发明的目的之一,是提供一种柑橘全基因组KASP标记库的构建方法。本发明利用柑橘的遗传群体进行变异检测,并滤除偏分离位点,获得父母本在基因组上高度可信的变异位点信息,从而得到柑橘全基因组KASP标记库,该KASP标记库可用于鉴定表型,具有高效、准确的优点。

本发明解决上述技术问题的技术方案如下:一种柑橘全基因组KASP标记库的构建方法,包括如下步骤:

导入群体父母本DNA样本以及杂交子代单株DNA样本,所述群体父母本DNA样本和杂交子代单株DNA样本是通过微量DNA提取方法分别提取群体父母本以及多棵杂交子代单株得到的;

滤除所述群体父母本DNA样本和所述杂交子代单株DNA样本中的偏分离位点,得到滤除处理后的基因组VCF文件;

利用基因型填充软件将过滤后的基因组VCF文件中的未知基因型数据进行基因型填充;

对经填充的基因组VCF文件中的单碱基变异SNP数据进行过滤处理,得到可在KASP标记生成软件中使用的最终基因组VCF文件;

将最终基因组VCF文件导入所述KASP标记生成软件中,生成柑橘KASP标记库。

本发明选择杂交子代单株的数量为231棵。

选择父母本测序是为获取父母本的基因型,选择231棵子代的测序即可获得子代的基因型,同时测序父母本和子代数据就可以获得父母本基因型并建立子代和父母本基因型的遗传关系。

本发明的柑橘全基因组KASP标记库的构建方法的有益效果是:

本发明利用柑橘的遗传群体进行变异检测,并滤除偏分离位点,获得父母本在基因组上高度可信的变异位点信息,从而得到柑橘全基因组KASP标记库,该KASP标记库可用于鉴定表型,具有高效、准确的优点。

在上述技术方案的基础上,本发明还可以做如下改进。

进一步,滤除所述群体父母本DNA样本和所述杂交子代单株DNA样本中的偏分离位点的过程包括:

将所述群体父母本DNA样本和所述杂交子代单株DNA样本建立文库后导入illumina novaseq 6000测序平台,得到双端配对的fastq格式的父母本下机数据和杂交子代单株下机数据;双端配对即双端测序,为illumina novaseq 6000测序平台其中一种模式;

利用fastp数据质控软件分别对所述父母本下机数据和所述杂交子代单株下机数据的测序接头进行去除处理,得到父母本测序数据和杂交子代单株测序数据;

利用bwa序列比对软件将父母本测序数据和杂交子代单株测序数据比对到参考基因组,并利用samtools序列比对软件以及预设的基因组位置信息分别对经比对的父母本测序数据和经比对的杂交子代单株测序数据的序列进行排序;

利用picard高通量测序数据格式工具包分别对经排序的父母本测序数据和经排序的杂交子代单株测序数中的重复片段PCR进行过滤处理;

将经过滤的父母本测序数据和经过滤的杂交子代单株测序数据中的基因型数据进行合并,得到待处理基因组VCF文件,并统计待处理基因组文件中每个位点的子代基因型覆盖数,根据所述子代基因型覆盖数和预设过滤值对各个位点进行过滤;

对经位点过滤的基因组VCF文件中剩余的位点进行类型标记,并根据各个位点的标记信息确定偏分离位点,并将所述偏分离位点过滤,得到过滤后的基因组VCF文件。

采用上述进一步方案的有益效果是:能够得到满足孟德尔规传定律的变异位置。

进一步,根据所述子代基因型覆盖数和预设过滤值对各个位点进行过滤的过程包括:

设位点的子代基因型覆盖数为m,杂交子代单株总数为n,预设过滤值为0.95,计算m与n的比值,若比值小于预设过滤值0.95,则过滤对应的位点。

采用上述进一步方案的有益效果是:得到的数据更为准确。

进一步,对经位点过滤的基因组VCF文件中剩余的位点进行类型标记的过程包括:

根据测序的基因型确定标记类型,若基因型为“0/1”,则标记为杂合位点,若基因型为“0/0”,则标记为纯和位点,若母本基因型为“0/0”并且父本基因型为“0/1”,则标记为nn×np,若母本基因型为“0/1”并且父本基因型为“0/0”,则标记为lm×ll,母本基因型为“0/1”并且父本基因型为“0/1”,则标记为hk×hk。

进一步,根据各个位点的标记信息确定偏分离位点,并将所述偏分离位点过滤的过程包括:

统计所有标记nn×np位点的nn基因型个数a和np基因型个数b,将a:b与(a+b)/2:(a+b)/2在设置的置信区间进行卡方检测,得到第一p值,若所述第一p值小于0.01,则判定为偏分离位点,并过滤偏分离位点,其中,所述置信区间为0.05;

统计所有标记lm×ll位点的lm基因型个数c和ll基因型个数d,将c:d与(c+d)/2:(c+d)/2在设置的置信区间进行卡方检测,得到第二p值,若所述第二p值小于0.01,则也判定为偏分离位点,并过滤偏分离位点,其中,所述置信区间为0.05;

统计所有标记hk×hk位点的hh基因型个数e和hk基因型个数f以及kk基因型个数g,将e:f:g与(e+f+g)/4:(e+f+g)/2:(e+f+g)/4在设置的置信区间进行卡方检测的,得到第三p值,若所述第三p值小于0.01,则也判定为偏分离位点,并过滤偏分离位点,其中,所述置信区间为0.05。

具体遗传关系以及三种基因型的孟德尔遗传定律:nn×np指母本是aa,父本是Aa类型,在自交一代即可分离,分离比是1:1。lm×ll指母本是Aa,父本是aa类型,在自交一代即可分离,分离比也是1:1,hk×hk指父母本是Aa和Aa,后代分离比是1:2:1。

进一步,对经填充的基因组VCF文件中的单碱基变异SNP数据进行过滤处理的过程包括:

利用VCF文件操作软件包对经填充的基因组VCF文件中的单碱基变异SNP进行过滤处理。

本发明的目的之二,是提供上述柑橘全基因组KASP标记库的应用。上述柑橘全基因组KASP标记库准确度高,通量大,覆盖了柑橘全基因组,应用领域广泛。

本发明解决上述技术问题的技术方案如下:上述柑橘全基因组KASP标记库在柑橘聚类分型中的应用。

本发明的柑橘全基因组KASP标记库的应用的有益效果是:

上述柑橘全基因组KASP标记库准确度高,通量大,覆盖了柑橘全基因组,应用领域广泛。具体而言,可以用于如下领域:

领域1:上述柑橘全基因组KASP标记库中测序品种被用于配置另外的杂交授粉组合,只需要再测未知的父母本,就可以直接使用本柑橘全基因组KASP标记库进行标记。

领域2:本柑橘全基因组KASP标记库的使用可以扩展到柑橘自然品种,只需要做其它野生种的重测序,然后根据本KASP的位点进一步过滤所需要的标记位点即可。

领域3:可以直接在柑橘属材料的QTL或者GWAS定位后,根据本KASP的位点进一步在候选区段内过滤所需要的标记位点即可。

在上述技术方案的基础上,本发明还可以做如下改进。

进一步,所述应用的具体方法是:

步骤1:利用QTL进行定位,确定候选区段为4号染色体1.23Mb的区段;

步骤2:提取柑橘叶片DNA

取待测柑橘品种的叶片组织,提取全基因组DNA;

步骤3:PCR扩增反应

反应体系为:5μl浓度为0.5ng/μl的步骤2得到的全基因组DNA,5μl的2×KASP反应混合物和0.14μl的引物混合物,总体积为10.14μl;反应程序为:①94℃,15min;②94℃,20s;③从61℃开始,在60s内以0.6℃/循环的速度,降至55℃,10个循环;④94℃,20s,55℃,60s,26个循环;得到PCR扩增产物;

步骤4:聚类分型

将步骤3得到的PCR扩增产物进行荧光定量PCR读带,选定荧光类型为FAM和HEX,选择等位基因分型,得到待测柑橘品种的聚类分型。

采用上述进一步的有益效果是:采用上述方法,可以用于判断待测柑橘品种的聚类分型。

其中步骤1中,QTL,英文全称是QuantitativeTraitLocus,中文名称是数量性状座位或者数量性状基因座,指的是控制数量性状的基因在基因组中的位置。

如果表型遗传规律为父本显性,则在上述柑橘全基因组KASP标记库中选择nnXnp类型的KASP标记;如果表型遗传规律为母本显性,则在上述柑橘全基因组KASP标记库中选择lmXll类型的KASP标记;如果使用F2代群体进行实验,则在上述柑橘全基因组KASP标记库中选择hkXhk类型的KASP标记,在1.23Mb内选择了标记位点为kasp_chr4_29357745,并获取该标记位点侧翼60bp序列,利用primer3.0软件设计了引物1、引物2和引物3。

步骤3中,将DNA浓度稀释至5ng/μl,可以保证后续每个反应有和其基因组大小相应的DNA量,待测样品基因组/300Mb×5ng。

2×KASP反应混合物购自英国LGC公司,产品目录号为KBS-1016-002(适用于96/384的孔板)。

更进一步,步骤2中,所述提取全基因组DNA采用CTAB法。

采用上述更进一步的有益效果是:采用上述方法,可以提取得到全基因组DNA。

更进一步,步骤3中,所述引物混合物由引物1、引物2和引物3等体积混合而成,其中,所述引物1的核苷酸序列如SEQ ID NO.1所示,所述引物2的核苷酸序列如SEQ ID NO.2所示,所述引物3的核苷酸序列如SEQ ID NO.3所示。

引物1(SEQ ID NO.1):gaaggtgaccaagttcatgctatcacttagtgcactacaac;

引物2(SEQ ID NO.2):gaaggtcggagtcaacggattatcacttagtgcactacaaa;

引物3(SEQ ID NO.3):tcgaacatgcctggtcatt。

采用上述更进一步的有益效果是:采用上述方法,可以获得带有FAM和HEX荧光信号的PCR扩增产物。

附图说明

图1为本发明实施例中,QTL定位图。

图2为本发明的实施例中,柑橘多胚KASP标记和柑橘多胚INDEL标记连锁图。

图3为本发明的实施例中,采用全基因组KASP标记库获得的柑橘多胚KASP标记进行多个遗传群体的基因型鉴定结果图。

具体实施方式

以下结合附图对本发明的原理和特征进行描述,所举实例只用于解释本发明,并非用于限定本发明的范围。

下面通过具体实施例介绍柑橘全基因组KASP标记库的构建方法,其包括如下步骤:

导入群体父母本DNA样本以及杂交子代单株DNA样本,所述群体父母本DNA样本和杂交子代单株DNA样本是通过微量DNA提取方法分别提取群体父母本以及多棵杂交子代单株得到的;

滤除所述群体父母本DNA样本和所述杂交子代单株DNA样本中的偏分离位点,得到滤除处理后的基因组VCF文件;

利用基因型填充软件将过滤后的基因组VCF文件中的未知基因型数据进行基因型填充;

对经填充的基因组VCF文件中的单碱基变异SNP数据进行过滤处理,得到可在KASP标记生成软件中使用的最终基因组VCF文件;

将最终基因组VCF文件导入所述KASP标记生成软件中,生成柑橘KASP标记库。

具体地,滤除所述群体父母本DNA样本和所述杂交子代单株DNA样本中的偏分离位点的过程包括:

将所述群体父母本DNA样本和所述杂交子代单株DNA样本建立文库后导入illumina novaseq 6000测序平台,得到双端配对的fastq格式的父母本下机数据和杂交子代单株下机数据;

利用fastp数据质控软件分别对所述父母本下机数据和所述杂交子代单株下机数据的测序接头进行去除处理,得到父母本测序数据和杂交子代单株测序数据;

利用bwa序列比对软件将父母本测序数据和杂交子代单株测序数据比对到参考基因组,并利用samtools序列比对软件以及预设的基因组位置信息分别对经比对的父母本测序数据和经比对的杂交子代单株测序数据的序列进行排序;

利用picard高通量测序数据格式工具包分别对经排序的父母本测序数据和经排序的杂交子代单株测序数中的重复片段PCR进行过滤处理;

将经过滤的父母本测序数据和经过滤的杂交子代单株测序数据中的基因型数据进行合并,得到待处理基因组VCF文件,并统计待处理基因组文件中每个位点的子代基因型覆盖数,根据所述子代基因型覆盖数和预设过滤值对各个位点进行过滤;

对经位点过滤的基因组VCF文件中剩余的位点进行类型标记,并根据各个位点的标记信息确定偏分离位点,并将所述偏分离位点过滤,得到过滤后的基因组VCF文件。

上述实施例中,能够得到满足孟德尔规传定律的变异位置。

具体地,根据所述子代基因型覆盖数和预设过滤值对各个位点进行过滤的过程包括:

设位点的子代基因型覆盖数为m,杂交子代单株总数为n,预设过滤值为0.95,计算m与n的比值,若比值小于预设过滤值0.95,则过滤对应的位点。

具体地,对经位点过滤的基因组VCF文件中剩余的位点进行类型标记的过程包括:

根据测序的基因型确定标记类型,若基因型为“0/1”,则标记为杂合位点,若基因型为“0/0”,则标记为纯和位点,若母本基因型为“0/0”并且父本基因型为“0/1”,则标记为nn×np,若母本基因型为“0/1”并且父本基因型为“0/0”,则标记为lm×ll,母本基因型为“0/1”并且父本基因型为“0/1”,则标记为hk×hk。

具体地,根据各个位点的标记信息确定偏分离位点,并将所述偏分离位点过滤的过程包括:

统计所有标记nn×np位点的nn基因型个数a和np基因型个数b,将a:b与(a+b)/2:(a+b)/2在设置的置信区间进行卡方检测,得到第一p值,若所述第一p值小于0.01,则判定为偏分离位点,并过滤偏分离位点,其中,所述置信区间为0.05;

统计所有标记lm×ll位点的lm基因型个数c和ll基因型个数d,将c:d与(c+d)/2:(c+d)/2在设置的置信区间进行卡方检测,得到第二p值,若所述第二p值小于0.01,则也判定为偏分离位点,并过滤偏分离位点,其中,所述置信区间为0.05;

统计所有标记hk×hk位点的hh基因型个数e和hk基因型个数f以及kk基因型个数g,将e:f:g与(e+f+g)/4:(e+f+g)/2:(e+f+g)/4在设置的置信区间进行卡方检测的,得到第三p值,若所述第三p值小于0.01,则也判定为偏分离位点,并过滤偏分离位点,其中,所述置信区间为0.05。

具体地,对经填充的基因组VCF文件中的单碱基变异SNP数据进行过滤处理的过程包括:

利用VCF文件操作软件包对经填充的基因组VCF文件中的单碱基变异SNP进行过滤处理。

上述实施例中,本发明利用柑橘的遗传群体进行变异检测,并滤除偏分离位点,获得父母本在基因组上高度可信的变异位点信息,从而得到柑橘全基因组KASP标记库,该KASP标记库可用于鉴定表型,具有高效、准确的优点。

本实施例所得到的柑橘全基因组KASP标记库的部分内容示例,如表1所示。

表1柑橘全基因组KASP标记库的部分内容示例

上述柑橘全基因组KASP标记库在柑橘聚类分型中的应用。

所述应用的具体方法是:

步骤1:利用QTL进行定位,确定候选区段为4号染色体1.23Mb的区段。

步骤2:提取柑橘叶片DNA

取待测柑橘品种的叶片组织,采用CTAB法提取全基因组DNA。

步骤3:PCR扩增反应

反应体系为:5μl浓度为0.5ng/μl的步骤2得到的全基因组DNA,5μl的2×KASP反应混合物和0.14μl的引物混合物,总体积为10.14μl。其中,所述引物混合物由引物1、引物2和引物3等体积混合而成,其中,2×KASP反应混合物购自英国LGC公司,产品目录号为KBS-1016-002(适用于96/384的孔板)。所述引物1的核苷酸序列如SEQ ID NO.1所示,所述引物2的核苷酸序列如SEQ ID NO.2所示,所述引物3的核苷酸序列如SEQ ID NO.3所示。

引物1(SEQ ID NO.1):gaaggtgaccaagttcatgctatcacttagtgcactacaac;

引物2(SEQ ID NO.2):gaaggtcggagtcaacggattatcacttagtgcactacaaa;

引物3(SEQ ID NO.3):tcgaacatgcctggtcatt。

反应程序为:①94℃,15min;②94℃,20s;③从61℃开始,在60s内以0.6℃/循环的速度,降至55℃,10个循环;④94℃,20s,55℃,60s,26个循环;得到PCR扩增产物。

步骤4:聚类分型

将步骤3得到的PCR扩增产物进行荧光定量PCR读带,选定荧光类型为FAM和HEX,选择等位基因分型,得到待测柑橘品种的聚类分型。单胚和多胚类型会聚类成两种不同类型,其中aa型为单胚柑橘,Aa型为多胚柑橘。

分析:

现有技术中,多胚和单胚的鉴定一般是通过肉眼在显微镜下观察,而且需要等到柑橘成熟结果后才能利用种子观察到胚的数量,从而确定胚性。由于胚属于细微结构,观察存在一定的误差,现有技术的方法存在费时、费力、准确率不高的缺点。然而关于柑橘多胚性状共分离分子标记的开发,多年来进展缓慢。前几年开发出了INDEL标记,因为需要跑琼脂糖凝胶电泳,每次检测的数量有限,不利于进行高通量检测。此外,单多胚表型定位在chr4,但该INDEL标记在一段复杂的DNA结构中,扩增效率低,而且产物容易形成高级结构。

在本发明实施例的231个单株和父母本测序实验中,该群体存在多个分离性状,其中就包含单多胚性状,本发明利用这个群体做QTL,如图1所示,成功定位到主效基因在chr4的一个1.23Mb的区间内,然后利用nnXnp类型的标记去定位重组单株,并将区段缩小在313Kb的一个区域,和现有技术的定位区段一致,说明准确性高。在检索上述柑橘全基因组KASP标记库之后,本发明找到了一个和INDEL标记完全连锁的KASP标记,kasp_chr4_29357745,位于同一个基因座,如图2所示,是一个nnXnp的标记。

再者,本发明还采用LGC公司的试剂盒KBS-1016-016结合罗氏

进一步,本发明还测试了本次研究所利用的群体,并且测试了同父本的第二个群体,发现这个KASP标记在两个群体中因为父本相同,均具有良好作用,能够以完全区分单胚类型和多胚类型,且准确,没有假阳性,通量大,能够在3h完成接近700个样品的检测任务。部分检测结果如图3所示。

以上,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。

序列表

<110> 华中农业大学

<120> 一种柑橘全基因组KASP标记库的构建方法及应用

<160> 3

<170> SIPOSequenceListing 1.0

<210> 1

<211> 41

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

gaaggtgacc aagttcatgc tatcacttag tgcactacaa c 41

<210> 2

<211> 41

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

gaaggtcgga gtcaacggat tatcacttag tgcactacaa a 41

<210> 3

<211> 19

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

tcgaacatgc ctggtcatt 19

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号