首页> 中国专利> 构建新冠病毒测序文库的方法、确定新冠病毒核酸序列的方法、测序文库和试剂盒

构建新冠病毒测序文库的方法、确定新冠病毒核酸序列的方法、测序文库和试剂盒

摘要

本发明涉及构建新冠病毒测序文库的方法、确定新冠病毒核酸序列的方法、测序文库和试剂盒。根据本发明的实施例,构建新冠病毒测序文库的方法包括:获取生物样本的RNA样本;对所述RNA样本进行反转录;利用扩增引物组,对所述cDNA样本进行扩增;对所述扩增产物进行打断处理,以便获得打断产物;以及基于所述打断产物构建测序文库,以便获得所述新冠病毒测序文库。根据本发明的实施例,本发明针对新型冠状病毒基因组设计特异性引物,通过多重PCR的方法对病毒全基因组进行富集扩增,并通过二代测序的方法对序列进行测定,实现病毒全基因组层面的分析,为疫情防控以及检测提供重要的检测方法。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-07-26

    公开

    发明专利申请公布

说明书

技术领域

本发明涉及生物医药领域,具体的,本发明涉及构建新冠病毒测序文库的方法、确定新冠病毒核酸序列的方法、测序文库和试剂盒。

背景技术

随着新型冠状病毒疫情的发展和逐步控制,如何实现对疫情的实时监测具有重要意义。目前,针对冠状病毒感染的病原学检查主要包括病毒分离、免疫学方法、病毒核酸检测等,其中,病毒核酸检测具有操作简便、周期短、灵敏度高等优势,尤其是荧光定量PCR的方法,目前已经被国内外广泛应用。但对于新型冠状病毒相关的突变、溯源等方面的分析仍然需要通过获取病毒的全基因组序列才能实现。

发明内容

本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明的一个目的在于针对新型冠状病毒基因组设计特异性引物,通过多重PCR的方法对病毒全基因组进行富集扩增,并通过二代测序的方法对序列进行测定,实现病毒全基因组层面的分析,为疫情防控以及检测提供重要的检测方法。

在本发明的一个方面,本发明提出了一种构建新冠病毒测序文库的方法,根据本发明的实施例,该方法包括:获取生物样本的RNA样本;对所述RNA样本进行反转录,以便获得cDNA样本;利用扩增引物组,对所述cDNA样本进行扩增,以便获得来源于新冠病毒基因组的扩增产物;对所述扩增产物进行打断处理,以便获得打断产物;以及基于所述打断产物构建测序文库,以便获得所述新冠病毒测序文库,其中,所述扩增引物组包括多对扩增引物,所述多对扩增引物是通过将新冠病毒参考基因组序列分割为多个窗口,并基于所述多个窗口的序列确定的,所述多个窗口的至少一部分长度为200~300bp,并且所述多个窗口共同构成了所述新冠病毒参考基因组的完整序列。根据本发明的实施例,本发明针对新型冠状病毒基因组设计特异性引物,通过多重PCR的方法对病毒全基因组进行富集扩增,并通过二代测序的方法对序列进行测定,实现病毒全基因组层面的分析,为疫情防控以及检测提供重要的检测方法。由于本发明采用的窗口长度为200~300bp,因此扩增产物的主要长度是200~300bp的核酸片段,同时还会产生多个窗口组合的产物,例如对应两个、三个、四个或者更多个窗口组合的扩增产物,这些扩增产物能够实现对新冠病毒基因组更高的覆盖率,从而利用所构建的测序文库能够有效地发现新冠病毒的突变信息。根据本发明的实施例,本发明的方法所构建的测序文库可以对新型冠状病毒的全基因组进行分析,并且不受病毒变异等因素的影响,可以有效减少检测的假阴性;本发明相比于传统的通过捕获方法构建测序文库的方法,具有富集时间周期短、检测所需样本起始量较低且检测灵敏度高的优点;另外,本发明构建测序文库的方法将多重PCR和二代测序相结合,通过设计特异性引物组对样本中的新型冠状病毒核酸进行富集,具有成本低,操作简便,特异性高的优点;另外,根据本发明的实施例,可以对临床样本中存在的新型冠状病毒核酸进行检测,并进一步对病毒来源及传播过程的监测。

在本发明的第二方面,本发明提出了一种确定新冠病毒核酸序列的方法,其包括:根据前面所述的方法,构建测序文库;对所述测序文库进行测序,以便获得所述新冠病毒核酸序列。如前所述,根据本发明的实施例,本发明针对新型冠状病毒基因组设计特异性引物,通过多重PCR的方法对病毒全基因组进行富集扩增,并通过二代测序的方法对序列进行测定,实现病毒全基因组层面的分析,为疫情防控以及检测提供重要的检测方法。由于本发明采用的窗口长度为200~300bp,因此扩增产物的主要长度是200~300bp的核酸片段,同时还会产生多个窗口组合的产物,例如对应两个、三个、四个或者更多个窗口组合的扩增产物,这些扩增产物能够实现对新冠病毒基因组更高的覆盖率,从而利用所构建的测序文库能够有效地发现新冠病毒的突变信息。根据本发明的实施例,本发明的方法所构建的测序文库可以对新型冠状病毒的全基因组进行分析,并且不受病毒变异等因素的影响,可以有效减少检测的假阴性;本发明相比于传统的通过捕获方法构建测序文库的方法,具有时间周期短、检测所需样本起始量较低且检测灵敏度高的优点;另外,本发明构建测序文库的方法将多重PCR和二代测序相结合,通过设计特异性引物组对样本中的新型冠状病毒核酸进行富集,具有成本低,操作简便,特异性高的优点;另外,根据本发明的实施例,可以对临床样本中存在的新型冠状病毒核酸进行检测,并进一步对病毒来源及传播过程的监测。

在本发明的第三方面,本发明提出了一种测序文库。根据本发明的实施例,其是根据前面所述的方法构建的。如前所述,根据本发明的实施例,本发明针对新型冠状病毒基因组设计特异性引物,通过多重PCR的方法对病毒全基因组进行富集扩增,并通过二代测序的方法对序列进行测定,实现病毒全基因组层面的分析,为疫情防控以及检测提供重要的检测方法。由于本发明采用的窗口长度为200~300bp,因此扩增产物的主要长度是200~300bp的核酸片段,同时还会产生多个窗口组合的产物,例如对应两个、三个、四个或者更多个窗口组合的扩增产物,这些扩增产物能够实现对新冠病毒基因组更高的覆盖率,从而利用所构建的测序文库能够有效地发现新冠病毒的突变信息。根据本发明的实施例,本发明的方法所构建的测序文库可以对新型冠状病毒的全基因组进行分析,并且不受病毒变异等因素的影响,可以有效减少检测的假阴性;本发明相比于传统的通过捕获方法构建测序文库的方法,具有时间周期短、检测所需样本起始量较低且检测灵敏度高的优点;另外,本发明构建测序文库的方法将多重PCR和二代测序相结合,通过设计特异性引物组对样本中的新型冠状病毒核酸进行富集,具有成本低,操作简便,特异性高的优点;另外,根据本发明的实施例,可以对临床样本中存在的新型冠状病毒核酸进行检测,并进一步对病毒来源及传播过程的监测。

在本发明的第四方面,本发明提出了一种试剂盒。根据本发明的实施例该试剂盒包括:扩增引物组,其中,所述扩增引物组包括多对扩增引物,所述多对扩增引物是通过将新冠病毒参考基因组序列分割为多个窗口,并基于所述多个窗口的序列确定的,所述多个窗口的至少一部分长度为200~300bp,并且所述多个窗口共同构成了所述新冠病毒参考基因组的完整序列。利用该试剂盒可以有效地实施前面所述构建测序文库的方法或者测序方法,如前所述,根据本发明的实施例,本发明针对新型冠状病毒基因组设计特异性引物,通过多重PCR的方法对病毒全基因组进行富集扩增,并通过二代测序的方法对序列进行测定,实现病毒全基因组层面的分析,为疫情防控以及检测提供重要的检测方法。由于本发明采用的窗口长度为 200~300bp,因此扩增产物的主要长度是200~300bp的核酸片段,同时还会产生多个窗口组合的产物,例如对应两个、三个、四个或者更多个窗口组合的扩增产物,这些扩增产物能够实现对新冠病毒基因组更高的覆盖率,从而利用所构建的测序文库能够有效地发现新冠病毒的突变信息。根据本发明的实施例,本发明的方法所构建的测序文库可以对新型冠状病毒的全基因组进行分析,并且不受病毒变异等因素的影响,可以有效减少检测的假阴性;本发明相比于传统的通过捕获方法构建测序文库的方法,具有时间周期短、检测所需样本起始量较低且检测灵敏度高的优点;另外,本发明构建测序文库的方法将多重PCR和二代测序相结合,通过设计特异性引物组对样本中的新型冠状病毒核酸进行富集,具有成本低,操作简便,特异性高的优点;另外,根据本发明的实施例,可以对临床样本中存在的新型冠状病毒核酸进行检测,并进一步实现对病毒来源及传播过程的监测。根据本发明的实施例,所述多个窗口中至少两个相邻窗口存在重叠区域,所述重叠区域的长度为50~100bp。由此,可以进一步提高扩增引物对新冠病毒基因组的覆盖率。

根据本发明的实施例,所述扩增引物组包括选自如SEQ ID NO:1~238所示序列中的至少之一,例如所述扩增引物组包括SEQ ID NO:1~238的至少10%,至少20%,至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%或者优选100%。由此,可以提高扩增引物对新冠病毒基因组扩增的效率。

本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。

附图说明

本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:

图1是根据本发明一个实施例的构建新冠病毒测序文库的方法的流程图;

图2是根据本发明一个实施例的新冠病毒测序方法的流程示意图;和

图3是根据本发明一个实施例的新冠病毒检测结果对新冠病毒基因组覆盖率的比较。

具体实施方式

下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。

需要注意的是,本文中“新冠病毒”、“新型冠状病毒”等描述均指2019新型冠状病毒(2019-nCoV)。

在本发明的一个方面,本发明提出了一种构建新冠病毒测序文库的方法,参考图1,根据本发明的实施例,该方法包括:

S100获取生物样本的RNA样本

在该步骤中,从疑似或者已知呈新冠病毒阳性的样本中分离RNA样本。这里所使用的术语“生物样本”应做广义理解,其是指已知含有病毒或者疑似含有病毒的任何样本,既可以是从人体或者其他动物分离的样本,也可以是环境样本,例如可以是从人体得到的呼吸道样本,例如所述呼吸道样本包括痰液、咽拭子、鼻拭子、肺泡灌洗液的至少之一,例如还可以是环境样品,例如下水道、空气、物体表面拭子样本等。

另外,本领域技术人员也可以采用公知的手段进行RNA分离,例如可以采用商业购买的试剂盒按照说明书进行,例如

S200对RNA样本进行反转录

在获得RNA样本之后,对所述RNA样本进行反转录,以便获得cDNA样本。

根据本发明的实施例,所述反转录(也可以称为“逆转录”,与“反转录”互换使用)是采用简并引物进行的,所述简并引物的长度为6nt。由此,可以提高对样本中的全部RNA进行均一性反转录的效率,并且有效地控制成本。本领域技术人员能够理解,如果简并引物的长度过长,则会造成简并引物的数目过多,导致反转录引物与RNA模板结合的效率降低,影响本方法对新型冠状病毒核酸检测的敏感性,并且成本显著增加。

当然,进行反转录的方法,本领域技术人员可以采用公知的方法,也可以采用商业购买的试剂盒按照说明书进行,例如Super ScriptⅡReverse Transcriptase。在此不再赘述。

S300对cDNA样本进行扩增

利用扩增引物组,对所述cDNA样本进行扩增,以便获得来源于新冠病毒基因组的扩增产物。

根据本发明的实施例,其中,所述扩增引物组包括多对扩增引物,所述多对扩增引物是通过将新冠病毒参考基因组序列分割为多个窗口,并基于所述多个窗口的序列确定的,所述多个窗口的至少一部分长度为200~300bp,并且所述多个窗口共同构成了所述新冠病毒参考基因组的完整序列。由于本发明采用的窗口长度为200~300bp,因此扩增产物的主要长度是 200~300bp的核酸片段,同时还会产生多个窗口组合的产物,例如对应两个、三个、四个或者更多个窗口组合的扩增产物,这些扩增产物能够实现对新冠病毒基因组更高的覆盖率,从而利用所构建的测序文库能够有效地发现新冠病毒的突变信息。

根据本发明的实施例,所述多个窗口中至少两个相邻窗口存在重叠区域,所述重叠区域的长度为50~100bp。根据本发明的实施例,由于多个窗口存在重叠区域,因此,可以进一步提高扩增产物对新冠病毒基因组的覆盖率。

具体的,根据本发明的实施例,所述扩增引物组包括选自下面列举SEQ ID NO:1~238 中的至少之一,例如所述扩增引物组包括如SEQ ID NO:1~238所示序列的至少10%,至少 20%,至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%或者优选100%。由此,可以提高扩增引物对新冠病毒基因组扩增的效率。

新型冠状病毒引物组序列:

SEQ ID NO:1 CCCTGGTTTCAACGAGAAAAC

SEQ ID NO:2 ACATGACCATGAGGTGCAGTT

SEQ ID NO:3 TGTTCATCAAACGTTCGGATG

SEQ ID NO:4 CATAAGGATCAGTGCCAAGCT

SEQ ID NO:5 AATACCAGTGGCTTACCGCAA

SEQ ID NO:6 GTCTTTAATGCACTCAAGAGG

SEQ ID NO:7 GAGCATGAAATTGCTTGGTAC

SEQ ID NO:8 GTGTCAATAAAGTCCAGTTGT

SEQ ID NO:9 AAAAGCTTGATGGCTTTATGG

SEQ ID NO:10 CACATTTGGTTGCATTCATTT

SEQ ID NO:11 CACTTGCGAATTTTGTGGCAC

SEQ ID NO:12 TTTTAACAACAGCATTTTGGG

SEQ ID NO:13 TGTGTGTTCTCTTATGTTGGT

SEQ ID NO:14 ACACAGCCTCCAAAGGCAATA

SEQ ID NO:15 TCTTAATGACAACCTTCTTGA

SEQ ID NO:16 ATGCCAAAATAATGGCGATCT

SEQ ID NO:17 ACAGAAATCAATACTGAGTCC

SEQ ID NO:18 GGACTCAGTATTGATTTCTGT

SEQ ID NO:19 TGATGTTCACATCTGATTTGG

SEQ ID NO:20 TAATGTAGGCCATTACAACTA

SEQ ID NO:21 GGAAATTAAGGAGAGTGTTCA

SEQ ID NO:22 AGCTTAAAGAATGTCTGAACA

SEQ ID NO:23 TTCTTAGAGGGAGAAACACTT

SEQ ID NO:24 CAACTTCCTCTGTTAACACTT

SEQ ID NO:25 GAAAAGTACTGTGCCCTTGCA

SEQ ID NO:26 TACCATCATATTAGGTGCAAG

SEQ ID NO:27 AAGGTTACTTTTGGTGATGAC

SEQ ID NO:28 CAACACAGGCGAACTCATTTA

SEQ ID NO:29 CAACCAGTATCTGAATTACTT

SEQ ID NO:30 ATGTAGCCATACTCCACTCAT

SEQ ID NO:31 AAGAAGAGCAAGAAGAAGATT

SEQ ID NO:32 AACCAATCTTCTTCTTGCTCT

SEQ ID NO:33 GGTAAAACCAACAGTGGTTGT

SEQ ID NO:34 TGCATTAACAACCACTGTTGG

SEQ ID NO:35 GAAGTTCTACTTGCACCATTA

SEQ ID NO:36 AATGTATAGGGTCAGCACCAA

SEQ ID NO:37 TGAACAAAAGATCGCTGAGAT

SEQ ID NO:38 CCTCTTTAGGAATCTCAGCGA

SEQ ID NO:39 GTTACAACAACTCTGGAAGAA

SEQ ID NO:40 GATGTCAATGTCACTAACAAG

SEQ ID NO:41 CACTACTGAAATGCTAGCGAA

SEQ ID NO:42 AGCTTTCGCTAGCATTTCAGT

SEQ ID NO:43 CACGCAAATTAATGCCTGTCT

SEQ ID NO:44 CACAGACAGGCATTAATTTGC

SEQ ID NO:45 TTCACCTGATGCTGTTACAGC

SEQ ID NO:46 CAGGTGAAGAAACAGAAACTG

SEQ ID NO:47 ATTACACTAGTAATCCTACCA

SEQ ID NO:48 GTGATAACTTCACCATCTAGG

SEQ ID NO:49 TTACCTAATGATGACACTCTA

SEQ ID NO:50 TAGTACTCAAAAGCCTCAACA

SEQ ID NO:51 ATACCCACAAGTTAATGGTTT

SEQ ID NO:52 CAGGTGGATTAAACTTCAACT

SEQ ID NO:53 AAGCTGCTAACTTTTGTGCAC

SEQ ID NO:54 TGTTGTCCACAAGTTTTACAC

SEQ ID NO:55 ACAACAGGAGTCACCTTTTGT

SEQ ID NO:56 CAGGTGGTGCTGACATCATAA

SEQ ID NO:57 TTGGATGGTGTTGTTTGTACA

SEQ ID NO:58 TAGGGTCAATTTCTGTACAAA

SEQ ID NO:59 GACTTAAATGGTGATGTGGTG

SEQ ID NO:60 CCACCACATCACCATTTAAGT

SEQ ID NO:61 CGCAGGGAATGGATAATCTTG

SEQ ID NO:62 CACTACTTCTTCAGAGACTGG

SEQ ID NO:63 CATGGTTTAGCTGCTGTTAAT

SEQ ID NO:64 GGGACACTATTAACAGCAGCT

SEQ ID NO:65 AATGTCACTATTGCAACCTAC

SEQ ID NO:66 AGCCTCTAGACAAAATTTACC

SEQ ID NO:67 TTGGATTGGCTGCAATCATGC

SEQ ID NO:68 ACCACATAAGCCAAGAATTAC

SEQ ID NO:69 ATGTGCATGTTGTAGACGGTT

SEQ ID NO:70 AGTTGTACATTCGACTCTTGT

SEQ ID NO:71 TGTCACTACAGTTTAAAAGAC

SEQ ID NO:72 GTGACAAGTCTCTCGCAACTT

SEQ ID NO:73 AGCTTATGTGTCAACCTATAC

SEQ ID NO:74 CATTTTAACTGCAACTTCCGC

SEQ ID NO:75 AGGGTTTGTTGATTCAGATGT

SEQ ID NO:76 TATCGCCAGTAACTTCTATGT

SEQ ID NO:77 AGTTGACATGTGCAACTACTA

SEQ ID NO:78 TAGTAGTTGCACATGTCAACT

SEQ ID NO:79 AATAACACCTGTTCATGTCAT

SEQ ID NO:80 ATCAATAGCCTTGTATCCTAT

SEQ ID NO:81 GTTTTGCTAACAAACATGCTG

SEQ ID NO:82 ATGGTGTGTAACAGATGTTAC

SEQ ID NO:83 GTACACTGACTTTGCAACATC

SEQ ID NO:84 AGCAACAGAACCTTCTAGTAC

SEQ ID NO:85 CTGTTGCTTATGAAAGTTTAC

SEQ ID NO:86 AAAACTCCTGGTAAAGATCTG

SEQ ID NO:87 AGAAGCTGGTGTTTGTGTATC

SEQ ID NO:88 AACTGGTGTTAAACAGAGTAC

SEQ ID NO:89 TACAGTCATGTAGTTGCCTTT

SEQ ID NO:90 ACATCACTACGCAACTTTAGA

SEQ ID NO:91 CTAAAGAGACGTGTAGTCTTT

SEQ ID NO:92 GAGGTGATAGAGGTTTGTGGT

SEQ ID NO:93 TCTGATGTTCTTTACCAACCA

SEQ ID NO:94 GAACATTACCAGCCTGTACCA

SEQ ID NO:95 TGTCCAAGACATGTGATCTGC

SEQ ID NO:96 CCACATGAACCATTAAGGAAT

SEQ ID NO:97 TTACAATGGTTCACCATCTGG

SEQ ID NO:98 TACCAGCTGCTTGTGCTGTTT

SEQ ID NO:99 CATGCACCATATGGAATTACC

SEQ ID NO:100 AATATGGTACGTCCATTCATA

SEQ ID NO:101 ACTAGGACCTCTTTCTGCTCA

SEQ ID NO:102 TTGAGTACTCTGGACTAAAAC

SEQ ID NO:103 AAGAACAATCAAGGGTACACA

SEQ ID NO:104 TTAAGTGTAAAACCCACAGGG

SEQ ID NO:105 GCCACATAGATCATCCAAATC

SEQ ID NO:106 TACACCGCAAACCCGTTTAAA

SEQ ID NO:107 GCTGTAGTTGTGATCAACTCC

SEQ ID NO:108 AATTGTCATCTTCGTCCTTTT

SEQ ID NO:109 TACTGATGTCGTATACAGGGC

SEQ ID NO:110 TAAAGCATAGACGAGGTCTGC

SEQ ID NO:111 ACCTCGTCTATGCTTTAAGGC

SEQ ID NO:112 TCAGTCCAACATTTTGCTTCA

SEQ ID NO:113 GTTGGACTGAGACTGACCTTA

SEQ ID NO:114 ATCAGCATACTCCTGATTAGG

SEQ ID NO:115 GGAGTATGCTGATGTCTTTCA

SEQ ID NO:116 ACAACATAAGAATGGTCTACG

SEQ ID NO:117 TATGTACACACCGCATACAGT

SEQ ID NO:118 CAGTAACATTATCGCTACCAA

SEQ ID NO:119 GTTTTCCATTGTGTGCTAATG

SEQ ID NO:120 TTCTCTGTCAGACAGCACTTC

SEQ ID NO:121 CAAAGCTACTGAGGAGACATT

SEQ ID NO:122 TAGTGCTCTTGTGGCACTAGT

SEQ ID NO:123 TTACCGAGGTACAACAACTTA

SEQ ID NO:124 AATGACTCTTACCAGTACCAG

SEQ ID NO:125 GAGTCATTTTGCTATTGGCCT

SEQ ID NO:126 CTATATCTGCTGTCGTCTCAG

SEQ ID NO:127 ATAGTGTATACAGCTTGCTCT

SEQ ID NO:128 ATTCTGGTTCTAGTGTGCCCT

SEQ ID NO:129 GCACATTGCTAACTAAGGGCA

SEQ ID NO:130 CTTTTCTCCAAGCAGGGTTAC

SEQ ID NO:131 AAATAGGCGTGGTAAGAGAAT

SEQ ID NO:132 TTCCTACGTGGAATTTCAAGA

SEQ ID NO:133 TCTTGAAATTCCACGTAGGAA

SEQ ID NO:134 CCATGCACGTACATGTCTTAT

SEQ ID NO:135 TGACCTATAGAAGACTCATCT

SEQ ID NO:136 ACTACATTCCAAGGAAGTCCT

SEQ ID NO:137 ATGCTACTAGAGAAGCTGTTG

SEQ ID NO:138 TATCACATAGACAACAGGTGC

SEQ ID NO:139 CTTATGGGCACATGGCTTTGA

SEQ ID NO:140 GCATTACCATGGACTTGACAA

SEQ ID NO:141 GTAATGCACATGTAGCTAGTT

SEQ ID NO:142 CCAAAATAGGCATACACCATC

SEQ ID NO:143 TCTATGATGCACAGCCTTGTA

SEQ ID NO:144 TACAAACTGCCACCATCACAA

SEQ ID NO:145 TTGGATGGTGTTGTTTGTACA

SEQ ID NO:146 CATCATGTTATAAGCATCGAG

SEQ ID NO:147 ACACGTTGCAATTTAGGTGGT

SEQ ID NO:148 GTTGCTGGTGCATGTAGAAGT

SEQ ID NO:149 CACAAAAGTTGATGGTGTTGA

SEQ ID NO:150 TGCACAAATCGTTTCAGTTGG

SEQ ID NO:151 GATTTGTGCACCACTCACTGT

SEQ ID NO:152 AAACGATATGTTCGAAGGCAT

SEQ ID NO:153 CATTAATTGGAGAAGCCGTAA

SEQ ID NO:154 ACCTGTTTGCGCATCTGTTAT

SEQ ID NO:155 TTCATAACAGATGCGCAAACA

SEQ ID NO:156 TATGCCTTTAGGTAATGTTGC

SEQ ID NO:157 GTGCAACATTACCTAAAGGCA

SEQ ID NO:158 TTGCACAATCACCAATCAAAG

SEQ ID NO:159 TTTAAGACAGTGGTTGCCTAC

SEQ ID NO:160 AAGATCAGCATTCCAAGAATG

SEQ ID NO:161 TGCAGATTCAACTTTGATTGG

SEQ ID NO:162 TTTGTTCGCGTGGTTTGCCAA

SEQ ID NO:163 TGAATGCGTCATCATCTGAAG

SEQ ID NO:164 AGAGACTAGTGGCAATAAAAC

SEQ ID NO:165 CCCTTAAATTAAGGGGTACTG

SEQ ID NO:166 CATGTATAGCATGGAACCAAG

SEQ ID NO:167 CTTGGTTCCATGCTATACATG

SEQ ID NO:168 ACTGGGTCTTCGAATCTAAAG

SEQ ID NO:169 CTACTTTAGATTCGAAGACCC

SEQ ID NO:170 CTAAATTAATAGGCGTGTGCT

SEQ ID NO:171 GCACACGCCTATTAATTTAGT

SEQ ID NO:172 GTGAAGGATTTCAACGTACAC

SEQ ID NO:173 TGCACTTGATCCTCTCTCAGA

SEQ ID NO:174 GCAACACAGTTGCTGATTCTC

SEQ ID NO:175 AGCAACTGTGTTGCTGATTAT

SEQ ID NO:176 GTTGCTGGTGCATGTAGAAGT

SEQ ID NO:177 CTTGATTCTAAGGTTGGTGGT

SEQ ID NO:178 ACATGGTGTAATGTCAAGAAT

SEQ ID NO:179 CAACAATTTGGCAGAGACATT

SEQ ID NO:180 ACCTGTAGAATAAACACGCCA

SEQ ID NO:181 TTGGCGTGTTTATTCTACAGG

SEQ ID NO:182 TGGATTGACTAGCTACACTAC

SEQ ID NO:183 CGTAGTGTAGCTAGTCAATCC

SEQ ID NO:184 TGTTCAACAGCTATTCCAGTT

SEQ ID NO:185 TTGTTGCAATATGGCAGTTTT

SEQ ID NO:186 GCCGTTAAACTTTTGTGCACA

SEQ ID NO:187 CATCAAACAATATGGTGATTG

SEQ ID NO:188 ATACCATTAAACCTATAAGCC

SEQ ID NO:189 GCAGGTGCTGCATTACAAATA

SEQ ID NO:190 CAACTTTGTCAAGACGTGAAA

SEQ ID NO:191 CAAAATGCACAAGCTTTAAAC

SEQ ID NO:192 AGTACACACTCTGACATTTTA

SEQ ID NO:193 TGTCAGAGTGTGTACTTGGAC

SEQ ID NO:194 CCAGACACAAATGTGTTGTCT

SEQ ID NO:195 TTGTCATGATGGAAAAGCACA

SEQ ID NO:196 AATGAGTCTAATTCAGGTTGC

SEQ ID NO:197 TTGCAACCTGAATTAGACTCA

SEQ ID NO:198 TCACCATTACTATGGCAATCA

SEQ ID NO:199 ATAGCTGGCTTGATTGCCATA

SEQ ID NO:200 TTGCTTCAAAGTTACAGTTCC

SEQ ID NO:201 GCTCAAAGGAGTCAAATTACA

SEQ ID NO:202 CAACAGCAAGTTGCAAACAAA

SEQ ID NO:203 TTCACTTTGTTTGCAACTTGC

SEQ ID NO:204 TTTTCAGTATAACCACCAATC

SEQ ID NO:205 TCATTACTTCAGGTGATGGCA

SEQ ID NO:206 TAGTAGTCGTCGTCGGTTCAT

SEQ ID NO:207 GTTAATCCAGTAATGGAACCA

SEQ ID NO:208 AGACTCACGTTAACAATATTG

SEQ ID NO:209 TGCTGCAATATTGTTAACGTG

SEQ ID NO:210 CCATAACAGCCAGAGGAAAAT

SEQ ID NO:211 ACAATTTGCCTATGCCAACAG

SEQ ID NO:212 GGATTGAATGACCACATGGAA

SEQ ID NO:213 TGCTATCGCAATGGCTTGTCT

SEQ ID NO:214 TCCAGCAATACGAAGATGTCC

SEQ ID NO:215 GTAATCGGAGCTGTGATCCTT

SEQ ID NO:216 AATCTCCATTGGTTGCTCTTC

SEQ ID NO:217 TGTACAGTAAGTGACAACAGA

SEQ ID NO:218 AGCGAGTGTTATCAGTGCCAA

SEQ ID NO:219 CTCGCTACTTGTGAGCTTTAT

SEQ ID NO:220 CTCTTGTCTGATGAACAGTTT

SEQ ID NO:221 ACTGTTCATCAGACAAGAGGA

SEQ ID NO:222 AGGTGCTGATTTTCTAGCTCC

SEQ ID NO:223 ACAACTGTAGCTGCATTTCAC

SEQ ID NO:224 ACAACGCACTACAAGACTACC

SEQ ID NO:225 AATTGGGTAGTCTTGTAGTGC

SEQ ID NO:226 TCTGGACTGCTATTGGTGTTA

SEQ ID NO:227 AGGTTTACCCAATAATACTGC

SEQ ID NO:228 GTAGCACGATTGCAGCATTGT

SEQ ID NO:229 TCCCTATGGTGCTAACAAAGA

SEQ ID NO:230 ACTGTTGCGACTACGTGATGA

SEQ ID NO:231 ACATTGCCAAAAGGCTTCTAC

SEQ ID NO:232 TTCCTTGGGTTTGTTCTGGAC

SEQ ID NO:233 GTCACTAAGAAATCTGCTGCT

SEQ ID NO:234 GCGTCAATATGCTTATTCAGC

SEQ ID NO:235 ATTGGCATGGAAGTCACACCT

SEQ ID NO:236 GGATTGTTGCAATTGTTTGGA

SEQ ID NO:237 CAATTGCAACAATCCATGAGC

SEQ ID NO:238 TACTTGTGCTATGTAGTTACG

其中,在SEQ ID NO:1~238中,SEQ ID NO:2n-1与SEQ ID NO:2n(n为1~119 的整数)为针对一个长度为200~300bp的窗口设计的引物对,其中,SEQ ID NO:2n-1为正向引物序列,SEQ ID NO:2n为反向引物序列。

由此,根据本发明的实施例,本发明设计了针对临床样本的新型冠状病毒基因组富集引物,通过特异性引物组扩增流程,可以对新型冠状病毒基因组具有较高的富集效果,进一步可用于对疑似新冠感染的临床样本进行检测,可实现对新型冠状病毒全基因组序列的鉴定,并且根据鉴定结果可以对病毒潜在的变异进行分析。由此,通过本发明方法获得的新型冠状病毒全基因组序列可进一步用于对病毒的变异和进化树全面分析,对病毒的溯源研究具有重要意义。

S400对扩增产物进行打断处理

对所述扩增产物进行打断处理,以便获得打断产物,该打断产物的长度大约为200~300bp。从而可以后续作为插入片段构建测序文库。

根据本发明的实施例,可以采用超声处理,如Bioruptor超声打断仪进行打断处理。

S500基于打断产物构建测序文库

基于所述打断产物构建测序文库,以便获得所述新冠病毒测序文库。

根据本发明的实施例,所述基于所述打断产物构建测序文库进一步包括:将所述打断产物进行末端修复和添加碱基A处理,以便获得携带粘性末端的双链片段;将所述双链片段与接头进行连接,以便获得携带接头的双链片段;对所述携带接头的双链片段进行扩增处理,以便获得携带接头的扩增产物,所述携带接头的扩增产物构成所述测序文库,其中,所述接头是由分别具有SEQ ID NO:239和SEQ ID NO:240的核酸分子退火形成的,所述扩增处理采用分别具有SEQ ID NO:241和SEQ ID NO:242的引物进行。

由此,根据本发明的实施例,本发明针对新型冠状病毒基因组设计特异性引物,通过多重PCR的方法对病毒全基因组进行富集扩增,并通过二代测序的方法对序列进行测定,实现病毒全基因组层面的分析,为疫情防控以及检测提供重要的检测方法。由于本发明采用的窗口长度为200~300bp,因此在扩增产物的主要长度是200~300bp的核酸片段,同时还会产生多个窗口组合的产物,例如对应两个、三个、四个或者更多个窗口组合的扩增产物,这些扩增产物能够实现对新冠病毒基因组更高的覆盖率,从而利用所构建的测序文库能够有效地发现新冠病毒的突变信息。根据本发明的实施例,本发明的方法所构建的测序文库可以对新型冠状病毒的全基因组的进行分析,并且不受病毒变异等因素的影响,可以有效减少检测的假阴性;本发明相比于传统的通过捕获方法构建测序文库的方法,具有时间周期短、检测所需样本起始量较低且检测灵敏度高的优点;另外,本发明构建测序文库的方法将多重PCR 和二代测序相结合,通过设计特异性引物组对样本中的新型冠状病毒核酸进行富集,具有成本低,操作简便,特异性高的优点;另外,根据本发明的实施例,可以对临床样本中存在的新型冠状病毒核酸进行检测,并进一步对病毒来源及传播过程的监测。

与之不同的是,常规的荧光PCR的方法只能检测新型冠状病毒的某段序列,无法对病毒的突变情况进行监测,其次,当病毒在荧光PCR检测区域发生突变时,会导致检测结果假阴性的情况,无法准确获得病毒序列信息;杂交捕获方法本身可以在基因组层面对新型冠状病毒的核酸序列进行分析,但该方法基于杂交的原理对新型冠状病毒进行富集,一方面杂交反应的时间会比较久,时效性较差,且操作繁琐;另一方面,捕获探针的合成成本较高,且捕获所需的杂交文库起始量也较大,常规样本通常无法满足。另外,通过随机引物全基因组扩增的方法也可以实现对新型冠状病毒核酸序列的分析,该方法采用随机引物对样本中的全部核酸进行扩增,本身操作比较简单,并且无偏向性,但扩增富集后的结果不仅会包括新型冠状病毒序列,还会包括样本中的人源序列,所以该方法对于临床样本中的新型冠状病毒的富集效果较差。

在本发明的第二方面,本发明提出了一种确定新冠病毒核酸序列的方法,其特征在于,包括:根据前面所述的方法,构建测序文库;对所述测序文库进行测序,以便获得所述新冠病毒核酸序列。

根据本发明的实施例,按照测序平台要求,可以对上述获得的二代测序文库进行上机测序,获得测序数据,按照生物信息学分析流程对获得的测序数据进行分析比对,得到比对结果,并计算检测结果在新型冠状病毒基因组上的覆盖率、覆盖深度等参数。根据获得的结果数据进一步对病毒基因序列的变异情况及进化树情况进行全面分析。

如前所述,根据本发明的实施例,本发明针对新型冠状病毒基因组设计特异性引物,通过多重PCR的方法对病毒全基因组进行富集扩增,并通过二代测序的方法对序列进行测定,实现病毒全基因组层面的分析,为疫情防控以及检测提供重要的检测方法。由于本发明采用的窗口长度为200~300bp,因此在扩增产物的主要长度是200~300bp的核酸片段,同时还会产生多个窗口组合的产物,例如对应两个、三个、四个或者更多个窗口组合的扩增产物,这些扩增产物能够实现对新冠病毒基因组更高的覆盖率,从而利用所构建的测序文库能够有效地发现新冠病毒的突变信息。根据本发明的实施例,本发明的方法所构建的测序文库可以对新型冠状病毒的全基因组进行分析,并且不受病毒变异等因素的影响,可以有效减少检测的假阴性;本发明相比于传统的通过捕获方法构建测序文库的方法,具有时间周期短、检测所需样本起始量较低且检测灵敏度高的优点;另外,本发明构建测序文库的方法适于将多重 PCR和二代测序相结合,通过设计特异性引物组对样本中的新型冠状病毒核酸进行富集,具有成本低,操作简便,特异性高的优点;另外,根据本发明的实施例,可以对临床样本中存在的新型冠状病毒核酸进行检测,并进一步对病毒来源及传播过程的监测。

在本发明的第三方面,本发明提出了一种测序文库。根据本发明的实施例,其是根据前面所述的方法构建的。如前所述,根据本发明的实施例,本发明针对新型冠状病毒基因组设计特异性引物,通过多重PCR的方法对病毒全基因组进行富集扩增,并通过二代测序的方法对序列进行测定,实现病毒全基因组层面的分析,为疫情防控以及检测提供重要的检测方法。由于本发明采用的窗口长度为200~300bp,因此在扩增产物的主要长度是200~300bp的核酸片段,同时还会产生多个窗口组合的产物,例如对应两个、三个、四个或者更多个窗口组合的扩增产物,这些扩增产物能够实现对新冠病毒基因组更高的覆盖率,从而利用所构建的测序文库能够有效地发现新冠病毒的突变信息。根据本发明的实施例,本发明的方法所构建的测序文库可以对新型冠状病毒的全基因组进行分析,并且不受病毒变异等因素的影响,可以有效减少检测的假阴性;本发明相比于通过传统捕获方法构建测序文库的方法,具有时间周期短、检测所需样本起始量较低且检测灵敏度高的优点;另外,本发明构建测序文库的方法将多重PCR和二代测序相结合,通过设计特异性引物组对样本中的新型冠状病毒核酸进行富集,具有成本低,操作简便,特异性高的优点;另外,根据本发明的实施例,可以对临床样本中存在的新型冠状病毒核酸进行检测,并进一步对病毒来源及传播过程的监测。

在本发明的第四方面,本发明提出了一种试剂盒。根据本发明的实施例该试剂盒包括:扩增引物组,其中,所述扩增引物组包括多对扩增引物,所述多对扩增引物是通过将新冠病毒参考基因组序列分割为多个窗口,并基于所述多个窗口的序列确定的,所述多个窗口的至少一部分长度为200~300bp,并且所述多个窗口共同构成了所述新冠病毒参考基因组的完整序列。利用该试剂盒可以有效地实施前面所述构建测序文库的方法或者测序方法,如前所述,根据本发明的实施例,本发明针对新型冠状病毒基因组设计特异性引物,通过多重PCR的方法对病毒全基因组进行富集扩增,并通过二代测序的方法对序列进行测定,实现病毒全基因组层面的分析,为疫情防控以及检测提供重要的检测方法。由于本发明采用的窗口长度为 200~300bp,因此在扩增产物的主要长度是200~300bp的核酸片段,同时还会产生多个窗口组合的产物,例如对应两个、三个、四个或者更多个窗口组合的扩增产物,这些扩增产物能够实现对新冠病毒基因组更高的覆盖率,从而利用所构建的测序文库能够有效地发现新冠病毒的突变信息。根据本发明的实施例,本发明的方法所构建的测序文库可以对新型冠状病毒的全基因组进行分析,并且不受病毒变异等因素的影响,可以有效减少检测的假阴性;本发明相比于传统捕获方法构建测序文库的方法,具有时间周期短、检测所需样本起始量较低且检测灵敏度高的优点;另外,本发明构建测序文库的方法将多重PCR和二代测序相结合,通过设计特异性引物组对样本中的新型冠状病毒核酸进行富集,具有成本低,操作简便,特异性高的优点;另外,根据本发明的实施例,可以对临床样本中存在的新型冠状病毒核酸进行检测,并进一步对病毒来源及传播过程的监测。根据本发明的实施例,所述多个窗口中至少两个相邻窗口存在重叠区域,所述重叠区域的长度为50~100bp。由此,可以进一步提高扩增引物对新冠病毒基因组的覆盖率。

根据本发明的实施例,所述扩增引物组包括选自如SEQ ID NO:1~238所示序列中的至少之一,例如所述扩增引物组包括如SEQ ID NO:1~238所示序列的至少10%,至少20%,至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%或者优选100%。由此,可以提高扩增引物对新冠病毒基因组扩增的效率。

以下实施例说明本发明提供的示例性方法。这些实施例不是为了限制本公开的范围,也不应被解释为限制本公开的范围。显然,除了本文具体描述的方法之外,可以实施所述方法。鉴于本文的教导,许多修改和变化是可能的,并且因此在本公开的范围内。

材料

本发明提供一种用于检测新型冠状病毒全基因组的检测试剂盒。试剂盒包括多重PCR 反应试剂和二代测序文库构建试剂,试剂盒组成如表1所示。

表1试剂盒组分

R1组分中的引物组序列见前SEQ ID NO:1~238;

R7组分中的接头序列是由接头Ad153_5T_N和接头Ad153Ω_Bottom等摩尔量退火组合而成,Ad153_5T_N:

5’ -/Phos/AGTCGGAGGCCAAGCGGTCTTAGGAAGACAANNNNNNNNNNCAACTCCTTGGCTCACA-3’SEQ ID NO:239

Ad153Ω_Bottom:5’-TTGTCTTCCTAAGGAACGACATGGCTACGATCCGACTT-3’SEQ ID NO:240,其中Ad153_5T_N中的NNNN为标签序列,共有96种不同的标签序列,即 Ad153_5T_1-96。

R9组分中的通用引物序列为:PCR-1:5’-/Phos/GAACGACATGGCTACGA-3’SEQ IDNO: 241;和PCR-2:5’-TGTGAGCCAAGGAGTTG-3’SEQ ID NO:242

一般方法:

参考图2,按照下列方法对新冠病毒进行测序:

(1)临床样本中RNA的提取,包括痰液、咽拭子、鼻拭子、肺泡灌洗液等呼吸道样本;

(2)将提取的RNA通过随机逆转录引物进行逆转录处理,得到cDNA;

(3)多重PCR扩增:使用新型冠状病毒的多重PCR引物组对样本中的新型冠状病毒核酸进行扩增富集,得到新型冠状病毒的核酸序列;

(4)PCR产物纯化:对(3)得到的PCR产物进行纯化,以去除产物中的剩余引物二聚体和其他干扰物质;

(5)将纯化后的PCR产物进行片段化处理;

(6)将片段化产物进行末端修复和加“A”:对(5)中得到的纯化产物进行末端修复,补平末端并在3’端添加A碱基形成粘性末端;

(7)接头连接:对(6)得到的产物进行接头连接,得到包含测序接头的文库;

(8)连接产物纯化:对连接接头以后的产物进行纯化,去除多余的接头序列和杂质;

(9)文库放大:对(8)中的纯化产物进行PCR扩增,放大文库信号,满足上机需求;

(10)文库纯化:将(9)得到的产物进行纯化,去除多余的引物和杂质;

(11)MGISEQ-2000测序:将质控后的文库按照MGISEQ-2000测序流程进行上机测序;

(12)数据分析:测序完成后的原始数据,按照信息分析流程进行处理,首先进行数据质控、数据拆分,然后将质控后的序列与新型冠状病毒序列库进行比对,按照设定的比对参数进行数据过滤,得到比对到新型冠状病毒基因组上的序列数。

(13)根据比对序列计算检测到的序列在新型冠状病毒基因组上的覆盖率及深度,并根据比对序列对新型冠状病毒基因组进行组装;

(14)将组装后的结果与参考基因组的一致率进行分析,给出病毒序列潜在的变异结果。同时,根据比对结果可以对该病毒的进化规律进行全面分析。确定样本中新型冠状病毒的来源情况。

实施例1

本实施例中选取2例临床样本,其中1例咽拭子样本和1例肺泡灌洗液样本,该2例样本均经过荧光PCR方法进行新型冠状病毒核酸检测,检测结果均为阳性,CT值分别为24.3和34.6。该2例样本按照一般方法的流程进行处理,如附图2所示,主要实验流程如下:

1、RNA核酸提取:按照“

2、逆转录:采用随机六聚体引物N6按照Super ScriptⅡReverse Transcriptase说明书进行逆转录;

3、多重PCR反应

将逆转录得到的cDNA按照以下反应体系进行多重PCR扩增

将上述反应液充分震荡混匀后放入PCR仪按照以下反应程序进行反应:99℃2min;38cyc(99℃15s,60℃2min);4℃hold

4、多重PCR反应产物纯化

将PCR反应产物用1倍体积的R1磁珠进行纯化,最终用R2溶解液回融至43μl用于下一步反应。

5、产物片段化:使用Bioruptor打断仪对上述纯化产物进行片段化处理。

6、末端修复和加“A”反应

将纯化后的PCR产物按照以下反应体系进行末端修复和加“A”反应

反应体系充分震荡混匀后,放入PCR仪按照以下程序进行反应:37℃,10min;65℃,15min;4C℃hold

7、接头连接反应

将5中得到的反应产物按照以下体系进行接头连接反应

将反应液充分震荡混匀后,按以下反应条件进行反应:23℃,20min;4C℃hold

8、连接产物纯化

将6中的连接产物用0.5倍体积(40μl)的R1磁珠进行纯化,纯化操作按照2)中操作进行,最终回融至21μl用于下一步反应。

9、文库放大

将上一步纯化产物按照以下反应体系进行反应

反应条件如下:98℃2min;10cyc(98℃15s,56℃15s,72℃30s);72℃5min; 4℃hold

10、产物纯化

将文库PCR产物用1倍体积的R1磁珠进行纯化,最终用R2溶解液回融至20μl.

11、文库定量

将构建好的文库用qubit进行定量,浓度大于3ng/μl时,视为文库合格,进一步用Agilent 2100Bioanalyzer进行检测文库片段大小,当检测到200-300bp左右有明显的峰值时,视为合格,可进行下一步测序反应。

12、MGISEQ-2000上机测序

将质控合格的文库按照MGISEQ-2000上机流程进行上机测序,详细流程参考相应试剂盒操作说明书。

13、下机数据信息分析

将2例样本下机后的数据首先按照信息分析流程进行数据过滤,然后将过滤后的数据与新型冠状病毒参考基因组序列进行比对,生成比对结果,并根据比对结果计算新型冠状病毒检出序列数、在基因组上的覆盖率及平均测序深度,如表2所示。并进一步对其在基因组上的覆盖率进行作图分析,如附图3所示。

表2:

由以上实施例结果可知,本发明方法及试剂盒可以对新型冠状病毒感染的临床样本进行新型冠状病毒核酸检测,并且通过本发明可以获得新型冠状病毒基因组序列,基因组覆盖率及深度均较高,可进一步进行突变或进化树相关分析。

在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。

尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号