首页> 中国专利> 一种鉴别云南西北部产金荞麦的SNP分子标记组合及其方法与应用

一种鉴别云南西北部产金荞麦的SNP分子标记组合及其方法与应用

摘要

本发明属于分子生物学分子标记领域,涉及一种鉴别云南西北部产金荞麦的SNP分子标记组合及其方法与应用,所述分子标记组合包括40个SNP分子标记,所述40个SNP分子标记的核苷酸序列如SEQ ID No.1‑SEQ ID No.40所示。本发明的鉴别云南西北部产金荞麦的SNP分子标记组合及其方法与应用,采用基因组学技术,在金荞麦基因组层面获得SNP标记,能够快速准确确定所检测的金荞麦产地是否为云南西北部产地。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-11-10

    授权

    发明专利权授予

  • 2023-09-08

    实质审查的生效 IPC(主分类):C12Q 1/6895 专利申请号:2023108682116 申请日:20230714

    实质审查的生效

  • 2023-08-22

    公开

    发明专利申请公布

说明书

技术领域

本发明属于分子生物学分子标记领域,特别涉及一种鉴别云南西北部产金荞麦的SNP分子标记组合及其方法与应用。

背景技术

金荞麦为蓼科植物金荞麦的干燥根茎,金荞麦又叫野荞麦、天荞麦、开金锁、野荞麦根,金荞麦有清热解毒、散风化痰、活血散淤、健脾利湿的功效,金荞麦有治疗咽喉肿痛、肺热咳嗽、肺痈痰臭、风湿痹痛、肺脓疡、痢疾的作用。

不同产地的金荞麦的药效质量差异较大。具体到云南产地,云南中部地区(包括昆明、曲靖、玉溪等地)产的金荞麦总黄酮含量高;云南西北部地区(包括怒江、迪庆、楚雄等地)产的金荞麦含量较低,基本不合格;云南南部地区(包括文山州、红河州等地)产的金荞麦茎秆绿色,老茎稍红,含量中等,部分地区含量合格。药材的“道地性”是由于各个地区生态环境差异导致药材的药效不同,特定的地理气候种植的特定的药材,才能更好地发挥药效,也是道地药材的精髓。

金荞麦产地的鉴别一直是金荞麦物种鉴定的技术难点,也是当前中药资源产业面临的行业难题。当前金荞麦产地鉴别多运用性状鉴别及显微鉴别等方法,依赖个人经验及主观判断,准确性不高,技术可推广性不强。

发明内容

针对上述问题,本发明提供了一种鉴别云南西北部产金荞麦的SNP分子标记组合及其方法与应用。

本发明首先提供一种鉴别云南西北部产金荞麦的SNP分子标记组合,所述分子标记组合包括40个SNP分子标记,所述40个SNP分子标记的核苷酸序列如本申请中SEQ IDNo.1-No.40所示。

进一步地,所述SNP分子标记组合的40个SNP分子标记在染色体上的位置及碱基情况如下所示:

其次,本发明提供一种利用鉴别云南西北部产金荞麦的SNP分子标记组合鉴别金荞麦产地的方法,其特征在于,所述方法包括以下步骤:

获取待测样本DNA;

对待测样本DNA进行建库测序,获得样本DNA测序数据;

对所述样本DNA测序数据进行质控,获得样本DNA质控数据;

将所述样本DNA质控数据的序列与参考序列进行比对、去重后,进行SNP检测得到所述待测样本SNP基因型;

将相同基因组位置处的待测样本SNP基因型与前述云南西北部产金荞麦的SNP分子标记组合进行比对,判断所述待测样本是否有与所述云南西北部产金荞麦的SNP分子标记SEQ ID No.1- SEQ ID No.20相同的19-20个SNP分子标记,同时判断所述待测样本是否没有与所述云南西北部产金荞麦的SNP分子标记SEQ ID No.21- SEQ ID No.40相同的19-20个SNP分子标记;

若两次判断结果均为是,则判断待测样本为云南西北部产地金荞麦;若任一次判断结果为否,则所述待测样本为非云南西北部产地金荞麦。

进一步地,所述的测序之前还包括检测待测样本是否合格,所述样本DNA的测序采用高通量测序。

进一步地,所述对所述样本DNA测序数据进行质控包括:

对所述样本DNA测序数据的原始reads进行过滤;

所述过滤规则包括:

去掉含有接头序列的reads;

去掉reads中N的比例大于10%的reads;

去掉测序质量低于20的碱基数量比例大于40%的reads。

进一步地,将所述样本DNA质控数据的序列与参考序列进行比对、去重以及SNP检测得到所述待测样本SNP基因型包括:

以来自公共数据库的金荞麦基因组作为参考序列,利用比对软件进行序列比对,获得bam文件;

利用排序软件对所述bam文件进行排序,并移除重复序列;

利用基因分型软件处理排序去PCR重复序列和碱基质量值校正的bam文件,然后获得待测样本初步SNP基因型;

利用“QUAL

本发明还提供一种利用上述SNP分子标记组合在鉴别云南西北部产金荞麦中的应用。

本发明还提供一种含上述的SNP分子标记组合的基因芯片或试剂盒。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例,对本发明实施例中的技术方案进行清楚、完整地说明,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

实施例1云南西北部金荞麦SNP分子标记的获取及鉴定方法建立

1.DNA提取

运用mCTAB法(modified CTAB method)对金荞麦叶片材料进行DNA提取。具体提取步骤如下:

(1) 取来自云南西北部(云南怒江傈僳族自治州、楚雄州、迪庆州)的金荞麦新鲜植物叶片100 mg放入2.0 mL的离心管中,同时加入少量石英砂和一颗磁珠,将新鲜叶片浸入液氮中冻存1 min左右,置于研磨机中打磨至细小的粉末状备用;

(2) 在研磨好的材料中加入1.5mL buffer A (0.1M Tris-HCl pH 8.0;5mMEDTA;0.25 M NaCl;1%PVP-40)溶液,反复颠倒离心管使溶液与材料粉末均质混匀,冰浴10min,其间将沉淀下的粉末重新均质混合3-10次。10000×g离心后,弃掉上清液;

(3) 重复步骤(2)一次,在沉淀中加入800 μL预热的2% CTAB(0.1M Tris-HClpH8.0;1.4M NaCl;25mM EDTA;2%(w/v) CTAB;0.2%(v/v) β-巯基乙醇;1% PVP-40)溶液,将沉淀均质悬浮于溶液后置于65℃水浴锅中保存1.5-2h,其间要颠倒均质溶液2-8次;

(4) 10000×g室温离心后,将上清液小心倒入一个新的2.0 mL离心管中,加入等体积CI(氯仿:异戊醇=24:1(v/v ))溶液,在颠倒摇床上混合10 min;

(5) 10000×g离心后,以移液枪小心吸取上层水相清液至一个新的2.0 mL离心管中,加入等体积CI溶液,在颠倒摇床上混合10 min;

(6) 10000×g离心后,以移液枪小心吸取上层水相清液至一个新的1.5 mL离心管中加入0.6倍体积冰冷的异丙醇,颠倒混合后置于-20℃冰箱保存1小时以上;

(7) 取出冰箱中的离心管,10000×g离心,弃去上清液,倒置于干燥纸上尽量控干液滴,加入100μL的RNase 溶液(100 mg/L),37℃保存0.5 h;

(8) 在离心管中依次加入150μL ddH2O,50μL 5M NaCl和700μL无水乙醇,充分混合后10000×g离心,弃去上清,在纸上倒干;

(9) 加入600μL 70 %乙醇,弹底混合后离心,弃上清,重复一遍;

(10) 真空干燥掉乙醇,加100 μL TE溶解DNA,并根据NaNodrop测定将样品DNA浓度并稀释至50 ng/µL。

2.建库测序

对DNA进行常规浓度及纯度检测,检测合格的DNA样品随机打断成350bp的片段,采用华大自研试剂盒进行建库。库检合格后,根据文库的有效浓度和实际产出需求进行BGI-SEQ高通量测序,获得DNA测序原始数据。浓度检测和纯度检测可根据实际情况设置,例如浓度不低于50ng/µL,纯度检测设置样品A260/280吸光度在1.8-2.0之间。

3.测序数据质控

测序得到的原始reads包含接头序列,低质量和含N的reads。为了保证信息分析质量,需要对原始reads进行过滤。过滤规则包括:

A.去掉含有接头序列的reads;

B.去掉reads中N的比例大于10%的reads;

C.去掉测序质量低于20的碱基数量比例大于40%的reads。

4.基因组组装

通过对基因组进行HiFi 测序得到高精度的测序序列,然后通过hifiasm软件组装得到基因组contig序列;再利用Hi-C染色质构象捕获技术将contig序列定位到染色体,最终得到金荞麦基因组8条染色体序列。

5.数据预处理

以前面组装的金荞麦基因组作为参考序列,利用BWA软件将reads比对参考序列,比对参数为mem-t2-R。比对获得的bam文件利用Samtools软件进行排序,然后使用picard的MarkDuplicates工具去除PCR重复序列,最后对碱基质量值进行重校正(BQSR)。

6.SNP检测和筛选

得到校正的bam文件后,利用GATK软件的HaplotypeCaller工具获得个体的SNP基因型信息gvcf文件。再用GATK的CombineGVCFs工具将gcvf文件进行合并,然后用GATK的GenotypeGVCFs工具完成变异检测; 为了提高SNP检测的准确率,用VariantFiltration采用参数“QUAL

进一步对SNP进行过滤掉杂合大于0.1、Missing 大于0.1 、MAF 小于0.05 的SNP,然后通过vcftools计算各个位点的遗传分化指数Fst值。 最终筛选获得与云南西北部片区金荞麦关联的SNP分子标记40个,它们的核苷酸序列如SEQ ID No.1- SEQ ID No.40所示,它们在染色体上位置、标记前5bp起始共10bp碱基序列如表1所示。

表1 云南西北部金荞麦关联SNP标记信息

7.建立筛选标准

检测各个待检测样本基于表1中40个SNP位点的基因型。如果所有待测样本均满足如下40个位点的不低于95%的检测标准,则待测样本为云南西北部片区金荞,具体为同时满足:待测样具本有与云南西北部产金荞麦的SNP分子标记SEQ ID No.1- SEQ ID No.20相同的19-20个SNP分子标记,同时所述待测样品没有与所述云南西北部产金荞麦的SNP分子标记SEQ ID No.21- SEQ ID No.40相同的19-20个SNP分子标记,则所述待测样品为云南西北部产金荞麦,否则为非云南西北部产金荞麦。

实施例2鉴别云南西北部产金荞麦实例

样本信息:分别采集来自云南南部3个县/乡、云南西北部3个县/乡,云南中部3个县/乡、贵州省3个市/县,共计四大区域、12个具体产地的金荞麦样本,分别按照实施例1建立的方法和标准进行鉴定。

根据检测结果,为了便于分析,对全部样品进行了分类编号。样本的具体产地信息和检测后的编号信息见表2。

表2 样本来源及编号

鉴定步骤:

1.样本DNA提取

运用mCTAB法(modified CTAB method)对各样本金荞麦叶片材料进行DNA提取。具体提取步骤如下:

(1) 取新鲜植物叶片100 mg放入2.0 mL的离心管中,同时加入少量石英砂和一颗磁珠,新鲜叶片浸入液氮中冻存1 min左右,置于研磨机中打磨至细小的粉末状备用;

(2) 在研磨好的材料中加入1.5 mL buffer A (0.1 M Tris-HCl pH 8.0; 5 mMEDTA; 0.25 M NaCl; 1 % PVP-40)溶液,反复颠倒离心管使溶液与材料粉末均质混匀,冰浴10min,其间将沉淀下的粉末重新均质混合几次。10000×g离心后,弃掉上清液;

(3) 重复步骤(2)一次,在沉淀中加入800 μL预热的2% CTAB(0.1 M Tris-HCl pH8.0;1.4 M NaCl; 25 mM EDTA;2 % (w/v) CTAB; 0.2 %, (v/v ) β-巯基乙醇;1 % PVP-40)溶液,将沉淀均质悬浮于溶液后置于65℃ 水浴锅中保存1.5-2 h.其间要颠倒均质溶液若干次;

(4) 10000×g室温离心后,将上清液小心倒入一个新的2.0 mL离心管中,加入等体积CI(氯仿:异戊醇=24:1(v/v ))溶液,在颠倒摇床上混合10 min;

(5) 10000×g离心后,以移液枪小心吸取上层水相清液至一个新的2.0 mL离心管中,加入等体积CI溶液,在颠倒摇床上混合10 min;

(6) 10000×g离心后,以移液枪小心吸取上层水相清液至一个新的1.5 mL离心管中加入0.6倍体积冰冷的异丙醇,颠倒混合后置于-20 ℃冰箱保存1小时以上;

(7) 取出冰箱中的离心管,10000×g离心,弃去上清液,倒置于干燥纸上尽量控干液滴,加入100 μL的RNase 溶液(100 mg/L),37 ℃保存0.5 h;

(8) 在离心管中依次加入150 μL ddH2O, 50 μL 5 M NaCl和700 μL无水乙醇,充分混合后10000×g离心,弃去上清,在纸上倒干;

(9) 加入600 μL 70 %乙醇,弹底混合后离心,弃上清,重复一遍;

(10) 真空干燥掉乙醇,加100 μL TE溶解DNA,并根据NaNodrop测定将样品DNA浓度并稀释至50 ng/µL。

2.筛选比对,鉴定云南西北部产金荞麦

2.1将上述各来源的金荞麦样本的基因组SNP信息与表1中SNP信息比对,部分样品的对比结果如表3所示。

表3 SNP基因型鉴定结果1

注:单一一个A或C或G或T代表纯合子。

通过表3的鉴定结果发现,样本YWJQ101-YWJQ102、YWJQ201-YWJQ202、YWJQ301-YWJQ302均具有与本申请SEQ ID No.1- SEQ ID No.20所示相同的20个SNP分子标记,同时不具有与云南西北部金荞麦第SEQ ID No.21- SEQ ID No. 40相同的20个SNP分子标记,而YSJQ101-102、YSJQ201-202、YSJQ301-302,YCJQ101-102、YCJQ 201-202、YCJQ 301-302,GZJQ101-102、GZJQ 201-202、GZJQ 301-302等样本,均不能同时满足上述标准,说明样本YWJQ101-YWJQ102、YWJQ201-YWJQ202、YWJQ301-YWJQ302为云南西北部产地,而上述其他样本为非云南西北部产地,鉴定结果与实际情况相符。

2.2其它样品的对比结果如表4所示。

表4SNP基因型鉴定结果2

注:单一一个A或C或G或T代表纯合子。

通过表4的鉴定结果可知,样本YWJQ103、YWJQ203、YWJQ303基因型具有与本申请云南西北部金荞麦SEQ ID No.2- SEQ ID No.20所示相同的19个SNP分子标记,同时不具有与SEQ ID No.21- SEQ ID No.39相同的19个SNP分子标记,而YSJQ103、YSJQ203、YSJQ303,YCJQ103、YCJQ 203、YCJQ 303,GZJQ103、GZJQ 203、GZJQ 303等样本,均不能同时满足上述标准,说明样本YWJQ103、YWJQ203、YWJQ303为云南西北部产地,而上述其他样本为非云南西北部产地,鉴定结果与实际情况相符。

综上所述,本申请通过40个SNP分子标记进行云南西北部金荞麦产地鉴定的方法,将本发明的40个SNP位点的基因型与待测金荞麦相同位置处的SNP基因型进行对比,确定当满足有与SEQ ID No.1- SEQ ID No.20所示相同的19-20个SNP分子标记,同时没有与SEQID No.21- SEQ ID No.40所示相同的19-20个SNP分子标记,则待测样品为云南西北部片区金荞麦。本发明的云南西北部产金荞麦鉴定方法简单快速,结果准确,能够有效鉴别非云南西北部产地的金荞麦。

尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号