首页> 中国专利> 基于测序基因分型技术的猪SNP标记位点的分析方法

基于测序基因分型技术的猪SNP标记位点的分析方法

摘要

本发明提供了一种基于测序基因分型技术的猪SNP标记位点的分析方法,包括以下步骤:(1)预测用EcoRI与MspI的双酶切猪基因组所获得的酶切片段分布情况;(2)根据EcoRI与MspI的酶切识别序列设计通用接头、条形码接头及PCR扩增引物;(3)构建简化基因组测序文库;(4)利用步骤(3)构建的文库进行上机测序;(5)根据测序结果获得SNP标记位点。本发明提供的方法中所使用的酶切组合适用于所有的猪品种,利用该组合进行简化基因组测序,能够得到高于目前市场已有芯片上的SNP数目,能够用于全基因关联分析研究和基因组选择研究,同时还能保证单个个体的分型成本低于目前流行的芯片。

著录项

  • 公开/公告号CN106566872A

    专利类型发明专利

  • 公开/公告日2017-04-19

    原文格式PDF

  • 申请/专利权人 中国农业大学;

    申请/专利号CN201510669935.3

  • 申请日2015-10-13

  • 分类号C12Q1/68(20060101);

  • 代理机构11002 北京路浩知识产权代理有限公司;

  • 代理人王文君

  • 地址 100193 北京市海淀区圆明园西路2号

  • 入库时间 2023-06-19 01:53:56

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-08-14

    授权

    授权

  • 2017-05-17

    实质审查的生效 IPC(主分类):C12Q1/68 申请日:20151013

    实质审查的生效

  • 2017-04-19

    公开

    公开

说明书

技术领域

本发明涉及生物技术领域,具体的,涉及一种基于测序基因分型技术的猪SNP标记位点的分析方法。

背景技术

单核苷酸多态性(Single nucleotide polymorphisms,SNP)作为第三代分子标记,具有数量多、分布广、遗传稳定等特点,被广泛应用于连锁分析、全基因组关联分析和基因组选择等遗传育种领域。目前Illumina公司和GeneSeek公司均推出了猪全基因组SNP芯片,其中Illumina推出的PorcineSNP60v2芯片含64,232SNPs,GeneSeek推出的PorcineSNP80芯片含有68,528SNPs,然而这些芯片主要是根据国外瘦肉型猪种(如长白猪、大白猪、杜洛克猪、皮特兰猪等)的基因组测序数据而设计的,很多并不适用于我国地方品种;而且芯片一旦设计好,其所含的SNP位点便很难去改变以适应不同的猪品种或品系。因此,我们需要一种能够快速的从特定品种中鉴定并分型SNP的方法。

简化基因组测序技术利用限制性内切酶对基因组DNA进行酶切,通过稳定地回收部分酶切片段进行深度测序,从而获得覆盖全基因组的高密度SNP。该技术具有效率高、成本低等特点,所获得的SNP标记通常是目标群体中多态性较好的位点,而不像高密度SNP那样只能固定地检测特定的位点。这一特点使得该技术非常适合在中国地方品种或高度纯化的品系中进行分型,从而获得更大的信息量。利用该技术获得与高密度SNP芯片相等的标记密度的前提下,所需成本只有高密度SNP芯片的二分之一。因此,利用简化基因组测序获得覆盖猪全基因组SNP信息,是一种经济适用的方法。

我国是世界上最大的生猪养殖国和猪肉消费国,养殖量和猪肉产 量均占世界总量的50%左右。目前,猪遗传育种研究领域的两个重大课题就是利用全基因组选择技术鉴定重要经济性状的候选基因,以及利用基因组选择技术快速增加遗传进展。这些研究都需要利用覆盖全基因组的SNP标记信息。因此,开发一种新的使用于猪的全基因组SNP分型方法,将极大推动功能基因定位以及基因组选择技术在猪科学养殖中的应用。

发明内容

本发明的目的在于提供一种使用于猪的全基因组SNP分型技术。

为此本发明提供了一种基于测序基因分型技术的猪SNP标记位点的分析方法,其特征在于,包括以下步骤:

(1)预测用EcoRI与MspI的双酶切猪基因组所获得的酶切片段分布情况;

(2)根据EcoRI与MspI的酶切片段分布特点设计通用接头、条形码接头及PCR扩增引物;

(3)构建简化基因组测序文库;

(4)利用步骤(3)构建的文库进行上机测序;

(5)根据测序结果获得SNP标记位点。

其中,步骤(2)中所述的通用接头带有与限制性内切酶MspI相同的粘性末端序列,所述的条形码接头带有与限制性内切酶EcoRI相同的粘性末端序列。

其中,所述通用接头是由SEQ ID NO:1和SEQ ID NO:2所示序列退火形成的双链DNA,其中SEQ ID NO:1经过5’磷酸化修饰。

其中,所述条形码接头是由SEQ ID NO:3和SEQ ID NO:4所示序列退火形成的双链DNA;其中SEQ ID NO:4经过5’磷酸化修饰,SEQ ID NO:3和SEQ ID NO:4中的n和m表示长度为5-9bp的任意短核苷酸条形码序列。

其中,步骤(2)所述的PCR扩增引物如SEQ ID NO:5和SEQ ID NO:6所示。

其中,步骤(3)中包括以下步骤:

(a)利用限制性内切酶组合EcoRI-MspI对猪基因组进行酶切;

(b)制备通用接头和条形码接头;

(c)分别将通用接头和条形码接头与酶切产物进行连接反应,获得连接产物;

(d)将连接产物等比例进行混池,获得混池后的连接产物;

(e)在混池后的连接产物中加入1.2-1.4倍体积的磁珠进行第一纯化获得第一纯化产物;

(f)在所述第一纯化产物中加入0.8-0.9倍体积的磁珠进行第二纯化获得第二纯化产物;

(g)对第二纯化产物进行PCR扩增获得PCR产物;

(h)在PCR产物中加入1.2-1.4倍体积的磁珠进行第三纯化获得第三纯化产物;

(i)在第三纯化产物中加入0.8-0.9倍体积的磁珠进行第四纯化获得简化基因组测序文库。

其中,所述第一纯化和第三纯化的步骤相同,具体包括:加入磁珠后,在旋转仪上室温孵育18-22min获得孵育后体系;孵育结束后在孵育后体系中加入0.9-1.1倍体积的70%乙醇,静置30-40s后缓慢旋转,使磁珠在罐壁上移动,待溶液澄清后,去除上清液,再重复此步骤一次获得沉淀;其中,相对于100μL所述孵育后体系,每次添加的70%乙醇的量为90-110μL;再在所获得的沉淀中加入Low TE,用移液器上下吸打后,振荡10s,离心后静置澄清获得上清液;其中,相对于100μL所述沉淀,Low TE的添加量为140-160μL。

其中,第二纯化和第四纯化的步骤相同,具体包括:加入磁珠后,在旋转仪上室温孵育13-16min;孵育结束后加入0.9-1.1倍体积 的70%乙醇,静置30-40s后缓慢旋转,使磁珠在罐壁上移动,待溶液澄清后,去除上清液,重复此步骤一次获得沉淀;再在所获得的沉淀中加入Low TE,用移液器上下吸打后,振荡10s,离心后静置澄清获得上清液;其中,相对于100μL所述沉淀,Low TE的添加量为30-50μL。

其中,步骤(c)中所述的通用接头的退火体系为:100μM SEQ ID NO:15μL;100μM SEQ ID NO:25μL,5×Annealing Buffer 10μL,无核酸酶水30μL;退火程序为:加热至95℃,并以1℃/min的速度降温至25℃,25℃保温30min后于4℃保存。

条形码接头的退火体系为:100μM SEQ ID NO:35μL;100μM SEQ ID NO:45μL,5×Annealing Buffer 10μL,无核酸酶水30μL;反应程序为:95℃3min,以1℃/min的速度降温,直至降到25℃,25℃保温30min后于4℃保存。

其中,步骤(c)中所述的连接反应的体系为:酶切产物20μL,5×DNA Ligase Reaction Buffer 8μL,DNA连接酶2μL,无核酸酶水5μL,接头混合物5μL;混匀后置于PCR上,反应程序为:22℃保温1h,65℃保温30min,降温至4℃保存。

本发明所提供的方法在PCR前通过上述磁珠纯化的方式进行片段选择,使得过大或者过小的片段都在PCR前被去除,从而提高测序数据质量。

发明人在研究中发现,当进行SNP标记位点分析时,单酶切不利于后续试验中酶切片段的筛选,而部分双酶切组合存在着酶切片段过多或过少的缺点,酶切片段过多会增加实验成本,酶切片段过少将降低SNP挖掘的密度,进而影响后续生物学分析,还有的酶切组合会由于基因组的甲基化影响酶切效率。综上诸多原因,对任何需要研究的物种,酶切组合优选的实验是必不可少的。本发明所提供的方法确定了针对目的猪基因组的特定酶切组合。该酶切组合具 有适中的酶切密度,SNP在基因组分布均匀,SNP密度适中,酶切不受到DNA修饰的影响等优点,而且EcoRI-MspI酶切组合可以获得比PorcineSNP60芯片更高的标记密度(≈200k)。

本发明所开发的方法提供了对任意猪品种进行测序分型的最有效实验方案,可以在保证准确度的前提下,使现有的分型成本降低一个数量级,具有较大应用前景。

附图说明

图1为Agilent 2100对测序文库的质控。

具体实施方式

下面将结合实施例对本发明的优选实施方式进行详细说明。需要理解的是以下实施例的给出仅是为了起到说明的目的,并不是用于对本发明的范围进行限制。本领域的技术人员在不背离本发明的宗旨和精神的情况下,可以对本发明进行各种修改和替换。

实施例1预测EcoRI-MspI双酶切猪基因组效果

本实施例用于说明EcoRI-MspI双酶切组合所获得的酶切片段数目和大小分布。通过生物信息学分析方法模拟酶切猪基因组,统计长度在100-300bp范围内的双酶切片段数目,结果显示,EcoRI-MspI双酶切猪基因组时可以获得的约135,495个大小在100-300bp双酶切片段,这些片段适合简化基因组测序文库构建被利用。

对比例1-8

对比例1-8用于说明其他双酶切组合能获得的酶切片段数目和大小分布。考虑酶切位点识别特点(如识别碱基数、GC含量)等,共设计8个双酶切组合,通过生物信息学分析方法模拟酶切猪基因组,统计长度在100-300bp范围内的双酶切片段数目,结果如表1所示。与实施例1的结果相比,各酶切组合产生的双酶切片段过多,会增加测序成本,降低本发明的实用性。

表1不同酶切组合在猪基因组中模拟酶切结果

编号酶切组合100-300bp双酶切片段数目1Pst-ApekI469,6762PstI-MseI824,0553PstI-MspI319,6314HinP1l-ApekI520,8985HinP1l-MseI554,8226HinP1l-MspI338,4447Bgl-II-ApekI300,8488EcoRI-MseI421,353

实施例2利用EcoRI-MspI酶切对多个猪品种进行简化基因组测序

本实施例用于说明利用EcoRI-MspI酶切猪基因组能够获得覆盖于全基因组SNP信息。

1、实验材料

采集长白猪、大白猪、二花脸猪、沙乌头猪、梅山猪、米猪的耳组织样品,每个品种4头,共计24头猪耳组织样品。用DNeasy Blood&Tissue Kit提取基因组DNA,并将基因组浓度稀释至50ng/μL备用。

2、根据EcoRI与MspI的酶切识别序列设计通用接头(包括oligo1和oligo2)、条形码接头(包括oligo1和oligo2)、PCR扩增引物(包括oligo1和oligo2),其中条形码接头共有24个,用于区分24个样品,使得它们可以在一起被测序。按照表2合成序列。

表2简化基因组测序文库构建所需序列

引物名称序列(5'至3')条形码接头01_oligo1ACACTCTTTCCCTACACGACGCTCTTCCGATCTAACAGT条形码接头02_oligo1ACACTCTTTCCCTACACGACGCTCTTCCGATCTCCAGTA条形码接头03_oligo1ACACTCTTTCCCTACACGACGCTCTTCCGATCTTTGCAC条形码接头04_oligo1ACACTCTTTCCCTACACGACGCTCTTCCGATCTGGTTCA条形码接头05_oligo1ACACTCTTTCCCTACACGACGCTCTTCCGATCTAACGTC条形码接头06_oligo1ACACTCTTTCCCTACACGACGCTCTTCCGATCTCCAAGT条形码接头07_oligo1ACACTCTTTCCCTACACGACGCTCTTCCGATCTTTGCAGC条形码接头08_oligo1ACACTCTTTCCCTACACGACGCTCTTCCGATCTAGTTCGT条形码接头09_oligo1ACACTCTTTCCCTACACGACGCTCTTCCGATCTGAACAAT

条形码接头10_oligo1ACACTCTTTCCCTACACGACGCTCTTCCGATCTCCTACGC条形码接头11_oligo1ACACTCTTTCCCTACACGACGCTCTTCCGATCTATCTGCC条形码接头12_oligo1ACACTCTTTCCCTACACGACGCTCTTCCGATCTTAGGCTT条形码接头13_oligo1ACACTCTTTCCCTACACGACGCTCTTCCGATCTGGAATAGC条形码接头14_oligo1ACACTCTTTCCCTACACGACGCTCTTCCGATCTCCTCACGT条形码接头15_oligo1ACACTCTTTCCCTACACGACGCTCTTCCGATCTATCTTGGC条形码接头16_oligo1ACACTCTTTCCCTACACGACGCTCTTCCGATCTTGAGGTCT条形码接头17_oligo1ACACTCTTTCCCTACACGACGCTCTTCCGATCTGAGAACTC条形码接头18_oligo1ACACTCTTTCCCTACACGACGCTCTTCCGATCTCCTTCAGT条形码接头19_oligo1ACACTCTTTCCCTACACGACGCTCTTCCGATCTATCCTTCGC条形码接头20_oligo1ACACTCTTTCCCTACACGACGCTCTTCCGATCTTGGAGGTGC条形码接头21_oligo1ACACTCTTTCCCTACACGACGCTCTTCCGATCTGAAGATGGC条形码接头22_oligo1ACACTCTTTCCCTACACGACGCTCTTCCGATCTCCTCCACGC条形码接头23_oligo1ACACTCTTTCCCTACACGACGCTCTTCCGATCTATCTTCGCC条形码接头24_oligo1ACACTCTTTCCCTACACGACGCTCTTCCGATCTTAGCGGTTC条形码接头01_oligo2AATTACTGTTAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT条形码接头02_oligo2AATTTACTGGAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT条形码接头03_oligo2AATTGTGCAAAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT条形码接头04_oligo2AATTTGAACCAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT条形码接头05_oligo2AATTGACGTTAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT条形码接头06_oligo2AATTACTTGGAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT条形码接头07_oligo2AATTGCTGCAAAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT条形码接头08_oligo2AATTACGAACTAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT条形码接头09_oligo2AATTATTGTTCAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT条形码接头10_oligo2AATTGCGTAGGAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT条形码接头11_oligo2AATTGGCAGATAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT条形码接头12_oligo2AATTAAGCCTAAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT条形码接头13_oligo2AATTGCTATTCCAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT条形码接头14_oligo2AATTACGTGAGGAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT条形码接头15_oligo2AATTGCCAAGATAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT条形码接头16_oligo2AATTAGACCTCAAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT条形码接头17_oligo2AATTGAGTTCTCAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT条形码接头18_oligo2AATTACTGAAGGAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT条形码接头19_oligo2AATTGCGAAGGATAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT条形码接头20_oligo2AATTGCACCTCCAAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT条形码接头21_oligo2AATTGCCATCTTCAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT条形码接头22_oligo2AATTGCGTGGAGGAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT

条形码接头23_oligo2AATTGGCGAAGATAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT条形码接头24_oligo2AATTGAACCGCTAAGATCGGAAGAGCGTCGTGTAGGGAAAGAGTGT通用接头oligo1CGAGATCGGAAGAGCGGGGACTTTAAGC通用接头oligo2GATCGGTCTCGGCATTCCTGCTGAACCGCTCTTCCGATCTPCR引物oligo1AATGATACGGCGACCACCGAGATCTACACTCTTTCCCTACACGACGCTCTTCCGATCTPCR引物oligo2CAAGCAGAAGACGGCATACGAGATCGGTCTCGGCATTCCTGCTGAA

3、接头的退火与混合

将oligo1序列和oligo2序列退火,即制成条形码接头和通用接头。退火体系为:100μM oligo15μL,100μM oligo25μL,5×Annealing Buffer 10μL,无核酸酶水30μL;退火程序为:加热至95℃,并以1℃/min的速度降温,直至降到25℃,25℃保温30min。

按照如下体系制备接头混合物:通用接头3.6μL,条形码接头1.2μL,无核酸酶水195.2μL,总体系200μL。

4、DNA酶切

采用EcoRI酶和MspI酶对基因组进行双酶切,酶切体系如下:基因组DNA 200ng,EcoRI酶0.5μL,MspI酶0.5μL,10×CutSmart Buffer 2μL,无核酸酶水13μL,总体系为20μL。酶切体系经混匀后,置于PCR仪中反应,PCR程序为:37℃90min,65℃30min,4℃forever。

5、连接接头

连接体系如下:酶切产物20μL,5×DNA Ligase Reaction Buffer 8μL,DNA连接酶2μL,无核酸酶水5μL,接头混合物5μL;混匀后置于PCR上,反应程序为:22℃1hour,65℃30min,4℃forever。

6、连接产物混合

从每个个体的连接产物中分别取出5μL,共120μL,混匀。

7、连接产物纯化

(1)向连接产物中加入1.2-1.4倍体积的AMPure XP Beads,置于旋转仪上,室温孵育20min;

(2)加入500μL 70%乙醇(离心管置于磁力架上),30s后慢慢旋转管子,使磁珠在管壁上移动,待溶液澄清后,去除上清液;

(3)重复步骤(2)一次;

(4)加入150μL Low TE,用枪上下吸打几次,振荡10s,短暂离心后置于磁力架上,待澄清后,将上清液转移到新的离心管中;

(5)向连接产物中加入0.8-0.9倍体积的AMPure XP Beads,置于旋转仪上,室温孵育15min;

(6)加入500μL70%乙醇(离心管置于磁力架上),30s后慢慢旋转管子,使磁珠在管壁上移动,待溶液澄清后,去除上清液;

(7)重复步骤(6)一次;

(8)加入50μL Low TE,用枪上下吸打几次,振荡10s,短暂离心后置于磁力架上,待澄清后,将上清液转移到新的离心管中;

8、PCR扩增

PCR反应体系为:高保真PCR预混液50μL,连接产物0.5μL,10μM PCR引物oligo11.2μL,10μM PCR引物oligo21.2μL,无核酸酶水7.1μL;PCR反应程序为:95℃5min,17cycles×(95℃30s,62℃30s,68℃30s),72℃5min,4℃forever。

9、PCR产物纯化

(1)向连接产物中加入1.2-1.4倍体积的AMPure XP Beads,置于旋转仪上,室温孵育20min;

(2)加入500μL 70%乙醇(离心管置于磁力架上),30s后慢慢旋转管子,使磁珠在管壁上移动,待溶液澄清后,去除上清液;

(3)重复(2)一次;

(4)加入150μL Low TE,用枪上下吸打几次,振荡10s,短暂离心后置于磁力架上,待澄清后,将上清液转移到新的离心管中;

(5)向连接产物中加入0.8-0.9倍体积的AMPure XP Beads,置于旋转仪上,室温孵育15min;

(6)加入500μL 70%乙醇(离心管置于磁力架上),30s后慢慢旋转管子,使磁珠在管壁上移动,待溶液澄清后,去除上清液;

(7)重复(6)一次;

(8)加入50μL Low TE,用枪上下吸打几次,振荡10s,短暂离心后置于磁力架上,待澄清后,将上清液转移到新的离心管中;

10、文库质检

文库通过2100检测片段大小(图1),文库大小为280bp-1000bp,通过对大片段和小片段DNA去除的干净程度判断该文库合格,适用于上机测序。

11、文库测序

本发明利用Illumina二代测序平台的Hiseq2000进行测序,采用单端100bp测序试剂盒。

12、实验结果

测序共得到56,960,040条reads,每个个体平均3.5M reads;利用Tassel软件包(版本4,所有参数为默认参数)分析,共得到238,344个SNP,高于目前的商业化芯片Porcine60K上的SNP数目,可见本发明具有很大的商业优势。表3为本发明所获得SNP在每条染色体上的分布情况,由表中可知,SNP在各个染色体上的分布相对均匀,平均分布距离为11.89kb。

表3SNP在染色体上的分布统计

染色体号染色体长度SNP数目SNP间平均距离(kb)1315,321,3222007815.702162,569,3751400911.603144,787,322148269.774143,465,9431397810.265111,506,4411090510.236157,765,593165549.537134,764,511152208.858148,491,8261295611.469153,670,1971499610.251079,102,373114366.921187,690,58199618.801263,588,57193186.82

13218,635,2341466914.9014153,851,9691484610.3615157,681,6211159113.601686,898,991833410.431769,701,58185118.191861,220,07179327.72X144,288,218822417.54Y1,637,7164734.85总计2,596,656,069238,34411.89

实验结果表明本发明所提供的方法中所使用的EcoRI-MspI酶切组合适用于所有的猪品种,利用该组合进行简化基因组测序,能够得到高于目前市场已有芯片上的SNP数目,能够用于全基因关联分析研究和基因组选择研究,同时还能保证单个个体的分型成本低于目前流行的芯片。

虽然,上文中已经用一般性说明及具体实施方案对本发明作了详尽的描述,但在本发明基础上,可以对之作一些修改或改进,这对本领域技术人员而言是显而易见的。因此,在不偏离本发明精神的基础上所做的这些修改或改进,均属于本发明要求保护的范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号