首页> 中国专利> 一种测试玉米品种实质性派生关系的方法

一种测试玉米品种实质性派生关系的方法

摘要

本发明公开了一种测试玉米品种实质性派生关系的方法。该方法包括:获得变异位点;确定测试区域;抽样提取并获得抽样样本的DNA;制备引物;利用所述引物分别对两个抽样样本的DNA进行扩增,分别得到两个待测玉米品种在测试区域的扩增产物用于构建两个待测玉米品种的高通量测序文库;对两个高通量测序文库分别进行高通量测序,分别得到两个所述待测玉米品种的测序片段组;分析两个测序片段组,分别获得两个待测玉米品种基因型;比较两个待测玉米品种基因型,获得待测玉米品种间差异基因型的比例;根据待测玉米品种间差异基因型的比例,判断两个待测玉米品种的实质性派生关系。该方法能够准确、快速且简单地判断待测玉米品种间的实质性派生关系。

著录项

  • 公开/公告号CN104805186A

    专利类型发明专利

  • 公开/公告日2015-07-29

    原文格式PDF

  • 申请/专利权人 江汉大学;农业部科技发展中心;

    申请/专利号CN201510148683.X

  • 发明设计人 张静;彭海;陈红;章伟雄;

    申请日2015-03-31

  • 分类号

  • 代理机构北京三高永信知识产权代理有限责任公司;

  • 代理人徐立

  • 地址 430056 湖北省武汉市沌口经济技术开发区新江大路8号江汉大学

  • 入库时间 2023-12-18 10:02:35

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-01-05

    授权

    授权

  • 2015-08-26

    实质审查的生效 IPC(主分类):C12Q1/68 申请日:20150331

    实质审查的生效

  • 2015-07-29

    公开

    公开

说明书

技术领域

本发明涉及生物技术领域,特别涉及一种测试玉米品种实质性派生关系的 方法。

背景技术

UPOV(International Union for the Protection of New Varieties of Plants:国 际植物新品种保护联盟)公约1991年文本对实质性派生品种做了原则性的规 定,即实质性派生品种是指由A品种选育得到的B品种没有实质性的变化,B 品种称为A品种的实质性派生品种,A品种与B品种间具有实质性派生关系。 判断两个品种间是否具有实质性派生关系的方法是检测这两个品种间基因型的 差异比例,当该差异比例超过一定值时,即可认为两个品种间不具有实质性派 生关系,相反,则认为两个品种间具有实质性派生关系。

目前检测实质性派生性关系的方法还很少,仅有方法的大致流程为:通过 SSR标记或SNP标记,扩增待测玉米品种的每个测试区域,再通过电泳或一代 测序检测获得的每个测试区域的基因型,根据基因型,判断待测玉米品种间的 实质性派生关系。

在实现本发明的过程中,发明人发现现有技术至少存在以下问题:

实质性派生关系需要对待测玉米品种间大量的基因位点进行检测后,才能 准确判断两个品种间是否具有实质性派生关系。在现有的检测实质性派生性关 系的方法中,检测位点少导致实质性派生关系的判定结论不准确。同时,现有 的SSR标记和SNP标记由于需要单独扩增和单独检测每个测试区域,因此,测 试区域数目过多,必然会导致工作量极大增加,因此,现有的方法的测试区域 数目都在300个以内,不能完整代表待测玉米品种的全部基因型,从而导致检 测结果不准确,实质性派生关系的判定结论也不准确。

发明内容

为了解决现有技术中检测实质性派生关系不准确的问题,本发明实施例提 供了一种测试玉米品种实质性派生关系的方法。所述技术方案如下:

本发明实施例提供了一种测试玉米品种实质性派生关系的方法,所述方法 包括:

获得不同玉米品种间的变异位点;

通过所述变异位点确定测试区域;

分别对两个待测玉米品种进行抽样,提取并获得两个所述待测玉米品种的 抽样样本的DNA;

制备扩增所述测试区域的引物;

利用所述引物分别对两个所述抽样样本的DNA进行扩增,分别得到两个所 述待测玉米品种在所述测试区域的扩增产物,所述扩增产物分别用于构建两个 所述待测玉米品种的高通量测序文库;

对两个所述待测玉米品种的所述高通量测序文库分别进行高通量测序,分 别得到两个所述待测玉米品种的测序片段组;

分析两个所述待测玉米品种的测序片段组,分别获得两个待测玉米品种基 因型,所述待测玉米品种基因型为所述测试区域内变异碱基的组合,且所述待 测玉米品种基因型的频率≥30%;

比较两个所述待测玉米品种基因型,获得待测玉米品种间差异基因型的比 例;

根据所述待测玉米品种间差异基因型的比例,判断两个所述待测玉米品种 的实质性派生关系。

具体地,所述测试区域不包括扩增产生杂株基因型的区域;

所述杂株基因型指频率≥0.02%,且所述杂株基因型与所述待测玉米品种的 所有基因型间的差异碱基的数量≥2个或所述差异碱基中有非连续碱基的插入 或缺失。

具体地,所述测试区域的数目满足以下条件为:BINOMDIST(SD*TN,TN,0. 80*SD,TRUE)≥95%,其中,TN为所述测试区域的数目,SD为判定阈值;所述 测试区域的数目满足的条件含义为:当所述测试区域的数目为TN、所述判定阈 值为SD且所述待测玉米品种间差异基因型的比例为0.80*SD时,判断所述待测 玉米品种间差异基因型的比例小于所述判定阈值SD的概率保障大于等于95%。

具体地,分别对两个所述待测玉米品种进行抽样的方法为:对两个所述待 测玉米品种分别随机选取100个以上的样本混合后获得两个所述待测玉米品种 的抽样样本。

具体地,判断两个所述待测玉米品种的实质性派生关系的方法为:

当所述待测玉米品种间差异基因型的比例<SD时,两个所述待测玉米品种 间有实质性派生关系;当所述待测玉米品种间差异基因型的比例≥SD时,两个 所述待测玉米品种不具有实质性派生关系,其中,SD为判定阈值。

进一步地,若判断两个所述待测玉米品种具有实质性派生关系时,结论正 确的概率≥BINOMDIST(SD*TRN,TRN,OD,TRUE);若判断两个所述待测玉米品 种间不具有实质性派生关系时,结论正确的概率≥BINOMDIST((1-SD)*TRN,TR N,1-OD,TRUE);其中,TRN为两个所述待测玉米品种的共有测试区域的数目, OD为所述待测玉米品种间差异基因型的比例,BINOMDIST为excel 2010函数, BINOMDIST(SD*TRN,TRN,OD,TRUE)的含义为:当所述共有测试区域的数目为 TRN时,所述待测玉米品种间差异基因型的比例OD小于所述判定阈值SD的 概率;BINOMDIST((1-SD)*TRN,TRN,1-OD,TRUE)含义为:当所述共有测试区 域的数目为TRN时,所述待测玉米品种间差异基因型的比例OD大于所述判定 阈值SD的概率。

具体地,通过所述变异位点确定所述测试区域的方法为:

通过区分度计算区分度的值,其中,a为变异窗口区域中被 检测到的品种总数,bi为所述变异窗口区域中第i种基因型的品种数,且bi>1, k为包含大于1个品种的基因型的数目,所述变异窗口区域为以每个单核苷酸变 异位点为中心,向所述单核苷酸变异位点的两侧各延伸测序列长度的1/2作为检 测的窗口;

所述测试区域为细胞质基因组上区分度大的区域或细胞核基因组上所述区 分度大且均匀分布的区域。

本发明实施例提供的技术方案带来的有益效果是:本发明实施例提供的方 法通过多位点扩增和高通量测序,保证待测玉米品种的测试区域的大样本抽样, 成功实现了准确判断待测玉米品种间实质性派生关系的目标,且测试简单、快 速。

具体实施方式

为使本发明的目的、技术方案和优点更加清楚,下面将对本发明实施方式 作进一步地详细描述。

实施例.测定玉米品种“GL95”与“1102”间的实质性派生关系

本发明实施例提供的待测玉米品种为玉米品种“GL95”和“1102”,二者均为 公开、公知的品种。

一、获得不同玉米品种间的变异位点。

不同玉米品种间的变异位点可以从已公布的文献资料中获取,但该方法所 获得的结果比较零星,在本实施例中,通过将不同玉米的基因组序列与参考玉 米品种的基因组序列进行比对,获得了大量的不同玉米品种间的变异位点,其 中参考玉米品种可以为“B73”玉米,该“B73”玉米可以替换为其他已知的参考玉 米品种。

进一步地,获得不同玉米品种的基因组序列的方法如下:

本实施例的不同玉米品种的基因组序列有两种来源,第一种为Chia等对103 个玉米品种的基因组的高通量测序序列,相关文献信息如下:Chia JM et al.Maize  HapMap2identifies extant variation from a genome in flux.Nat Genet.2012, 44(7):803-7。该103个玉米品种的基因组序列公布于NCBI Short Read Archive (http://www.ncbi.nlm.nih.gov/sra),接收号为SRA051245;第二种为按Chia等的 上述发表的文章中提供的方法对“GL95”、“1102”和杂交种“高赖145”进行了高通 量测序。本实施例共获得了106个玉米品种的基因组的高通量测序序列。

进一步地,利用不同品种的基因组序列获得变异位点。

具体地,由于这106个玉米品种的测序深度都不高,仅能鉴定单核苷酸变 异(SNP)位点,其它变异类型如重复数变异,由于可信度低,不进行鉴定。利 用Frederick Sanger比对软件(版本号为0.4)将这106个玉米品种的基因组的高 通量测序序列比对到“B73”玉米细胞核参考基因组(版本为IRGSP 4.0,下载地 址:http://www.ncbi.nlm.nih.gov)和细胞质参考基因组上,该细胞质参考基因组 包括线粒体参考基因组与叶绿体参考基因组,其在NCBI(National Center for  Biotechnology Information,美国国立生物技术信息中心)上的接收号分别为 NC_011033和NC_001320。对比时,插入片段长度设为500bp,其他参数设定 为默认值。采用的Ssaha Pileup软件包(版本号为0.5)鉴定每个品种的SNP位 点。该SNP位点定义为差异确定的碱基对、单碱基的插入或单碱基的缺失。该 差异确定的碱基对是指不包括差异不确定的碱基对,差异不确定的碱基对指是 某些简并碱基间的碱基对,如R代表A或G,因此,A与R之间可能存在差异, 也可能不存在差异,因此,A与R间差异不明确,互不为SNP。因此,本发明 实施例中的SNP位点为不包括上述差异不确定的碱基对。按以上SNP位点的定 义,本发明实施例在所有106个玉米品种间共获得53855606个SNP位点,其中 9005个SNP位点位于细胞质基因组上,其余的SNP位点位于细胞核基因组上。 后文提及的基因型即是指测试区域内多个SNP位点的组合,核基因型指基因型 位于细胞核基因组上,质基因型是指基因型位于细胞质基因组上。例如,表1 中第8个测试区域位于细胞核基因组上,为核基因型,该测试区域共有7个SNP 位点,该测试区域的基因型即为这7个SNP位点的组合。

二、通过变异位点确定测试区域,具体方法如下:

测试区域为细胞质基因组上区分度大的区域或细胞核基因组上区分度大且 SNP位点均匀分布的区域,其中,区分度其中,a为变异窗口 区域中被检测到的品种总数,bi为变异窗口区域中第i种基因型的品种数,且 bi>1,k为包含大于1个品种的基因型的数目,变异窗口区域为以每个单核苷酸 变异位点(SNP位点)为中心,向单核苷酸变异位点的两侧各延伸测序列长度 的1/2作为检测的窗口;测试区域为细胞质基因组上区分度大的区域或细胞核基 因组上区分度大且均匀分布的区域。区分度的计算原理如下:所有品种间的组 合数为其中,同一基因型内的不同品种间的组合是不可区分的,其数目为 那么,不可被区分的品种组合的比例为可被区分的品种组合的 比例即区分度由此可见,区分度越大,越能将不同品种区分开, 区分度大的变异窗口区域对实质性派生关系的测试更有效。若细胞核基因组上 的变异窗口区域分布不均匀,会导致某些区域相邻,从而连锁遗传,信息容易 重叠,因此,细胞核基因组上选择测试区域的综合原则是:区分度大且SNP位 点均匀分布。细胞质基因组无连锁遗传问题,所以,细胞质基因组上只需要选 择区分度大的区域即可。

首先,以获得的每个SNP位点为中心,向左右各延伸99bp和100bp,构 成200bp的变异窗口。根据获得的53855606个SNP位点,可以获得53855606 个变异窗口,计算这些变异窗口区域的区分度例如,第1个变异 窗口区域中,共检测到了a=102个品种,共有k=3种基因型CCA、TCA、TCG, 它们的品种数分别为b1=5个、b2=11个和b3=76个,因此,其含义是:通过第1个变异窗口区域,可以将102个品种 中的43%的品种组合区分开,另外47%的品种组合无法区分开,需要更多的变 异窗口才能区分开。按照同样的方法,计算获得全部53855606个变异窗口的区 分度并从中选取位于细胞核基因组中区分度最大的8000个变异窗口和位于细胞 质基因组中区分度最大的100个变异窗口。逐个检查位于细胞核基因组的8000 个变异窗口中,每个变异窗口与下一个变异窗口间的距离,若距离超过500K(1K =1000个碱基),则放弃其中区分度较小的变异窗口之后再检查,直至相邻查变 异窗口的距离均大于500K为止。选择500K的距离标准是因为玉米基因组大小 约为2300M(1M=100万个碱基),按最终入选2400个位于细胞核基因组的测 试区域计,平均的测试区域间距离为1M,但由于一些特异区域如着丝粒等很少 有变异位点,因此,平均距离应该小于1M。按以上方法,选出了5030个位于 细胞核基因组的变异窗口,它们与获得的位于细胞质基因组中区分度最大的100 个变异窗口一起共5130个变异窗口作为入选的测试区域。其中,选择区分度最 大的100个变异窗口,为经验值,该数量可以根据具体情况进行修改。

三、分别对两个待测玉米品种进行抽样,提取并获得两个待测玉米品种的 抽样样本的DNA,抽样样本的获得方法为:对两个待测玉米品种分别随机选取 100个以上的样本混合后,获得抽样样本。

在本实施例中,选取了待测玉米品种“GL95”的5000粒种子发芽,随机选 取4000个大小大致相等的芽混合后置于研钵中,向研钵中加入液氮后充分研磨 成粉。采用北京天根生化科技有限公司生产的货号为DP305的植物基因组DNA 提取试剂盒提取并获得待测玉米品种“GL95”混合样本的DNA,DNA提取方法 按该试剂盒的操作手册进行。利用美国Invitrigen公司生产的dsDNA HS  Assay Kit(货号为Q32852)及其说明书对获得的DNA进行定量,将定量后的 待测玉米品种“GL95”的DNA稀释为10.00ng/μl。

按照同样的方法,对待测玉米品种“1102”进行抽样并提取DNA,同样将 定量后的待测玉米品种“1102”的DNA稀释为10.00ng/μl。

四、制备扩增测试区域的引物,具体如下:

测试区域采用多重PCR(Polymerase Chain Reaction,聚合酶链式反应)技 术进行检测,多重PCR技术是指在同一个PCR反应中加入多个PCR引物,同 时扩增基因组上的多个位点。该技术的关键是设计并合成多重PCR引物,本实 施例采用美国LifeTechnology公司提供的多重PCR技术,其能够设置多至12000 重PCR引物。

测试区域的数目满足以下条件:BINOMDIST(SD*TN,TN,0.80*SD,TRUE) ≥95%,其中,TN为测试区域的数目,SD为判定阈值;BINOMDIST(SD*TN, TN,0.80*SD,TRUE的含义为:当测试区域的数目为TN、待测玉米品种间差异基 因型的比例为0.80*SD且判定阈值为SD时,判断待测玉米品种间差异基因型的 比例小于判定阈值SD的概率保障大于等于95%。该条件的含义是:当待测玉米 品种间差异基因型的比例为判断阈值的80%时,由测试区域的数目决定的判断 待测玉米品种具有实质性派生关系的正确率≥95%。实质性派生关系的判断阈值 是根据各国的育种现状、标记方式、要求严格程度而人为确定的。在本实施例 中,SD确定为3%。逐步加大测试区域的数目TN发现,当TN≥1934时,上述 公式成立,因此,测试区域的数目应该≥1934。对已有的SSR和SNP测试来说, 200个测试区域已算很多了,若待测玉米品种间差异基因型的比例为判断阈值的 80%,其正确率仅≥BINOMDIST(3%*200,200,0.80*3%,TRUE)=79%,因此,本 实施提供的方法,可以获得更为准确的结论。

引物获取过程如下:登录LifeTechnology公司多重PCR引物在线设计网页 https://ampliseq.com/protected/help/pipelineDetails.action,按其要求提交相关信息 即可。其中,本实施例中,“Application type”选项选择“DNA Hotspot designs (single-pool)”。若选择multi-pool,则多重PCR将分多管进行,成本会有所增加, 而single-pool的引物只需要一次多重PCR即可,节省成本,缺点是某些通用测 试区域引物设计可能失败,但基因组上的备选的通用测试区域较多,因此,放 弃一些备选的通用测试区域并不影响结果。将待测玉米品种的细胞核参考基因 组和细胞质参考基因组融合为一个文件,并在“Select the genome you wish to use” 选项中选择“Custom”后,上传融合的文件作为设计多重PCR引物时的参考基 因组。DNA Type选项选择“Standard DNA”,在Add Hotspot选项中,添加需要 设计的通用测试区域内的SNP位点的位置信息即可,包括染色体信息、SNP的 起始位点和SNP的结束位点,其部分实例见表1。最后点击“Submit targets”按 钮提交并得到设计的多重PCR引物。本实施例中,从所有5130个测试区域中, 设计并验证了2506对多重PCR引物,用于扩增相应的2506个测试区域。验证 多重PCR引物的方法为按本发明提供的方法,提取同一株玉米上的叶片基因组 DNA,并利用设计的多重PCR引物对获得的基因组DNA进行扩增、建库、高 通量测序并分析测序片段组,去掉以下测试区域相应的引物:该测试区域的测 序片段数不足1000或存在杂株基因型,保留下来的引物即为验证成功的多重 PCR引物。所以,测试区域不包括扩增产生杂株基因型的区域,杂株基因型指 频率≥0.02%,且杂株基因型与待测玉米品种的所有基因型间的差异碱基的数量 ≥2个或差异碱基中有非连续碱基的插入或缺失。由于基因组DNA来源于同一 株玉米叶片,不可能存在杂株品种,因此,杂株基因型是由测试区域的特殊结 构造成的PCR或测序偏好性错误,去掉这些测试区域避免了此类系统错误。规 定测试区域为不包括扩增产生杂株基因型的测试区域的另一个目的是:保留下 来的测试区域除了用作待测玉米品种间的实质性派生关系的测试外,还可以作 杂株率的计算,实现了同一套测试引物的多重用处。验证成功的多重PCR引物 也由该公司混合好后以液体的形式提供给客户使用。上述成功设计了多重PCR 引物的2506个测试区域即为最终用于待测玉米品种检测的测试区域,其中,34 个测试区域位于细胞质基因组上,剩余的2472个测试区域位于细胞核基因组上。 已有的实质性派生品种判定都未采用细胞质基因组上的测试位点,而细胞质的 不同,同样可以产生不同的品种性状表现,应该用于实质性派生品种关系的判 定。

五、利用引物分别对两个抽样样本的DNA进行扩增,分别得到两个待测玉 米品种在测试区域的扩增产物,扩增产物分别用于构建两个待测玉米品种的高 通量测序文库,具体方法如下:

利用文库构建试剂盒2.0(由美国LifeTechnology公司生产,货号为4475345) 多重PCR扩增测试区域后,利用扩增产物构建高通量测序文库。该试剂盒包括 以下试剂:5×Ion AmpliSeqTM HiFi Mix、FuPa试剂、转换试剂、测序接头溶液 和DNA连接酶。文库构建的方法按该试剂盒的操作手册《Ion AmpliSeqTM Library  Preparation》(出版号:MAN0006735,版本:A.0)进行。通过多重PCR扩增 2506个测试区域,多重PCR的扩增体系如下:5×Ion AmpliSeqTM HiFi Mix 4μl、 制备的测试区域引物混合液4μl、待测玉米品种“GL95”的DNA 10ng和无酶水 11μl。多重PCR的扩增程序如下:99℃,2分钟;(99℃,15秒;60℃,4分钟) ×25个循环;10℃保温。利用FuPa试剂消化掉多重PCR扩增产物中多余的引物 后,再进行磷酸化,具体方法为:向多重PCR的扩增产物中加入2μL FuPa试 剂,混匀后,在PCR仪上按如下程序反应:50℃,10分钟;55℃,10分钟;60℃, 10分钟;10℃保存,得到混合物a,混合物a为含有经过磷酸化的扩增产物溶液。 将磷酸化的扩增产物连接上测序接头,具体方法为:向混合物a中加入转换试 剂4μL、测序接头溶液2μL和DNA连接酶2μL,混匀后,在PCR仪上按如 下程序反应:22℃,30分钟;72℃,10分钟;10℃保存,得到混合液b。利用 标准的乙醇沉淀方法纯化混合液b后溶解于10μL无酶水中。利用美国Invitrigen 公司生产的dsDNA HS Assay Kit(货号为Q32852)并按照其说明书进行 测定,并获得混合液b的质量浓度后,将纯化后混合液b稀释至15ng/ml,得到 浓度约100pM的测试区域的高通量测序文库。

按照同样的方法,对待测玉米品种“1102”进行高通量测序文库的构建, 同样得到浓度约100pM的测试区域的高通量测序文库。

六、对两个待测玉米品种的高通量测序文库分别进行高通量测序,分别得 到两个待测玉米品种的测序片段组,方法如下:

确定高通量测序深度:高通量测序的深度≥5000倍,即平均覆盖测试区的 片段数≥5000个片段,5000倍为一个经验值,可根据实际情况调整。之所以规 定这个值,是因为5000倍的测序量成本并不高但足以准确计算30%的待测基因 型频率,因此,规定5000倍作为高通量测序的深度。

利用高通量测序文库进行高通量测序

利用获得的所有测试区域的高通量测序文库和试剂盒Ion PI Template OT2  200Kit v2(美国invirtrigen公司生产,货号为4485146)进行测序前的ePCR (Emulsion PCR,乳化聚合酶链反应)扩增,操作方法按该试剂盒的操作手册 进行。利用ePCR产物和试剂盒Ion PI Sequencing 200Kit v2(美国invirtrigen公 司生产,货号为4485149)在Proton二代高通量测序仪上进行高通量测序,操作 方法按该试剂盒的操作手册进行。在本实施例中,高通量测序通量设置为平均 覆盖测试区域10000倍。

对高量测序结果进行预处理

将高通量测序片段比对到所有2506个测试区域,去掉比对不成功和基因型 检测不全的测序片段后,剩余的所有测序片段称为测序片段组。基因型检测不 完全的测序片段是指没能将表1中“SNP在参考基因组上的位置”所示的所有 SNP位点检测到的测序片段,基因型检测不全的原因是测序片段过短,比对不 成功的原因是测序片段多为非特异扩增产物。

七、分析两个待测玉米品种的测序片段组,分别获得两个待测玉米品种基 因型,待测玉米品种基因型为测试区域内变异碱基的组合,且待测玉米品种基 因型的频率≥30%,具体方法如下:

将测序片段组比对到所有测试区域,并统计每个测试区域中的测序片段数, 去掉测序片段数≤1000条的测试区域,剩余的测试区域为检测成功的测试区域。 在本实施例中,共获得2465个检测成功的测试区域。比对到测试区域的片段称 为该测试区域的测序片段,从测序片段中提取表1中“SNP在参考基因组上的位 置”所示的位置的碱基组合称为该测序片段的基因型。基因型的频率是指测序片 段组中,代表该基因型的测序片段数占该基因型所在测试区域的测序片段总数 的比例。待测玉米品种基因型为测试区域内变异碱基的组合,且待测玉米品种 基因型的频率≥30%。一般来说,所抽取的样本中,杂种子的量不高于10%,测 序错误不超过1%,二者合计不超过11%,因此,对于纯合位点来说,待测玉米 品种基因型只有一种,其频率应该大于89%,而对于杂合位点来说,待测玉米 品种基因型有2种,其比例应该大于45.5%,因此,规定待测玉米品种基因型的 频率≥30%,可以排除因测序错误和待测玉米品种中混杂有杂株而对待测玉米品 种基因型的干扰。

例如,在测序片段组中,第1个测序区域的测序片段总数为9987条,有TCA、 TCG、TCC、TCT……共25种基因型,代表这些基因型的测序片段数分别9612 条、218条、1条、2条……,这些基因型的频率为9612/9987=96.25%、 218/9987=2.18%、1/9987=0.01%、2/9987=0.02%……。按待测玉米品种基因型的 定义,TCA为第1个测试区域的待测玉米品种“GL95”基因型,其它基因型为测 序错误或杂株引起的基因型。按相同的方法,判断并获得全部2465个检测成功 的测试区域的待测玉米品种“GL95”基因型。

按与待测玉米品种“GL95”相同的方法提取待测玉米品种“1102”的DNA、 构建高通量测序文库、高通量测序、分析测序片段组,同样获得了2465个检测 成功的测试区域和待测玉米品种“1102”在所有检测成功的测试区域的基因型, 部分结果见表1。由于篇幅限制,本实施例没有完整列出全部待测玉米品种在所 有测试区域基因型,只列出了部分实例。同样基于篇幅限制,本实施例中还有 部分地方也仅列出部分相关实例,其余未列出的数据可根据本实施例的方法补 全。

表1 为待测玉米品种基因型及其相关信息

八、比较两个待测玉米品种基因型,获得待测玉米品种间差异基因型的比 例,方法如下:

若在测试区域中,所有待测玉米品种基因型均无缺失,称该测试区域为待 测玉米品种的共有测试区域。在共有测试区域中,若待测玉米品种间的基因型 不完全相同,则称该基因型为待测玉米品种间差异基因型,例如,若待测玉米 品种A的基因型为AA、AA、AA、AA、AA/CC、AA/CC,待测玉米品种B 对应的基因型为AA、CC、AA/CC、CC/TT、AA/CC、CC/TT,那么在这6个测 试区域中待测玉米品种间差异基因型判定如下:不是、是、是、是、不是和是。 以上基因型中的“/”代表该测试区域为基因杂合位点,因此检测到了“/”前后 两种基因型。待测玉米品种间差异基因型的比例=拥有待测玉米品种间差异基因 型的测试区域的数目/共有测试区域的数目。

在本实施例中,待测玉米品种“1102”与待测玉米品种“GL95”的共有测 试区域为2465个,在第1个共有测试区域中,它们的基因型分别为TCG和TCG, 它们完全相同,因此,不为待测玉米品种间差异基因型。按此方法,逐个判断 所有2465个共有测试区域中,是否存在待测玉米品种间差异基因型,结果为: 所有共有测试区域中,存在待测玉米品种间差异基因型的测试区域数目为63个, 所以,待测玉米品种间差异基因型的比例OD=63/2465=2.56%。

根据待测玉米品种间差异基因型的比例和判定阈值,判断两个待测玉米品 种的实质性派生关系,判断两个待测玉米品种的实质性派生关系的方法为:当 待测玉米品种间差异基因型的比例<SD时,两个待测玉米品种具有实质性派生 关系;当待测玉米品种间差异基因型的比例≥SD时,两个待测玉米品种不具有 实质性派生关系,其中,SD为判定阈值。

本实施例中,待测玉米品种间差异基因型的比例=2.56%<SD=3%,因此判 断待测玉米品种“1102”与待测玉米品种“GL95”间具有实质性派生关系。

若判断两个待测玉米品种具有实质性派生关系时,结论正确的概率 ≥BINOMDIST(SD*TRN,TRN,OD,TRUE);若判断两个待测玉米品种不具有实质 性派生关系时,结论正确的概率≥BINOMDIST((1-SD)*TRN,TRN,1-OD,TRUE); 其中,TRN为两个待测玉米品种的共有测试区域的数目,SD为判定阈值,OD 为待测玉米品种间差异基因型的比例,BINOMDIST为excel 2010函数, BINOMDIST(SD*TRN,TRN,OD,TRUE)的含义为:当共有测试区域的数目为 TRN时,待测玉米品种间差异基因型的比例OD小于判定阈值SD的概率; BINOMDIST((1-SD)*TRN,TRN,1-OD,TRUE)含义为:当共有测试区域的数目为 TRN时,待测玉米品种间差异基因型的比例OD大于判定阈值SD的概率。

本实施例中,判断两个待测玉米品种间具有实质性派生关系且共有测试区 域的数目为2465个,因此,结论正确的概率≥BINOMDIST(SD*TRN,TRN,OD,T RUE)=BINOMDIST(3%*2465,2465,2.56%,TRUE)=90.53%,因此,本实施中, 判断两个待测玉米品种具有实质性派生关系的结论是比较准确的。

九、结果的验证

目前,没有一种标准的品种间实质性派生关系的检测方法,国际新品种保 护联盟于1991年给出了实质性派生关系的定义,根据该定义,若A与B两个品 种间差异较小,表明血缘关系较近,可以判定具有实质性派生关系。根据这一 定义,本实施例中,将两个待测品种按《植物新品种特异性、一致性和稳定性 测试指南-玉米》中的方法种植并观察两个待测玉米品种间的多个情况,在所调 查的70个性状中,仅3个性状差异达到显著水平,表明这两个待测品种间差异 不大,很可能具有实质性派生关系,与本实施例得到的结论相符。

本发明实施例通过高通量测序和多位点扩增,实现了待测玉米品种内测试 区域的大样本抽样,保证了实质性派生关系检测的准确性。同时,利用多位点 扩增技术,多个测试区域的检测工作量实质上相当于传统SSR或SNP检测的一 个测试区域的工作量,因此,本实施例不但准确,而方法简单、快速。例如, 若同样检测2465个测试区域,利用传统的SSR或SNP检测方法,需要进行2465 次PCR扩增和2465次的扩增产物的检测(SSR按电泳方法检测,SNP按一代 测试的方法检测),其工作量、速度以及检测成本都是不可被接受的。除此之外, 本实施例中得到了测试区域内每个碱基的序列,分辨率已经达到极致,且信息 量也是最大的,是其它检测方法都无法比拟,例如,SSR得到的是片段的长度 信息,可能存在的问题是:片段长度相差过小,可能检测不到,即使是相同长 度的片段,其内部的碱基组成也可能不一样,但SSR同样检测不到。一次SNP 检测只能检测一对SNP位点,而本实施例中,可以检测测试区域所有SNP,还 可以发现测试区域内SNP之外的变异,如重复数、缺失与插入等,这些都是单 个SNP检测无法发现的。另外,除采用一代测序检测SNP外,也有采用杂交的 方式检测SNP,这种情况下,得到的是杂交信号,噪音大且无法发现未知变异, 且一个探针仅能检测一对SNP,分辨率与信息量也远小于本发明。

以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的 精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的 保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号