公开/公告号CN114790579A
专利类型发明专利
公开/公告日2022-07-26
原文格式PDF
申请/专利号CN202110097754.3
申请日2021-01-25
分类号C40B50/06;C40B40/06;C12Q1/70;C12Q1/6869;C12N15/11;
代理机构北京清亦华知识产权代理事务所(普通合伙);
代理人肖阳
地址 518057 广东省深圳市南山区粤海街道高新区社区高新南四道025号高新工业村W2A栋、B栋A栋201203A5
入库时间 2023-06-19 16:06:26
法律状态公告日
法律状态信息
法律状态
2022-07-26
公开
发明专利申请公布
技术领域
本发明涉及生物医药领域,具体的,本发明涉及构建新冠病毒测序文库的方法、确定新冠病毒核酸序列的方法、测序文库和试剂盒。
背景技术
随着新型冠状病毒疫情的发展和逐步控制,如何实现对疫情的实时监测具有重要意义。目前,针对冠状病毒感染的病原学检查主要包括病毒分离、免疫学方法、病毒核酸检测等,其中,病毒核酸检测具有操作简便、周期短、灵敏度高等优势,尤其是荧光定量PCR的方法,目前已经被国内外广泛应用。但对于新型冠状病毒相关的突变、溯源等方面的分析仍然需要通过获取病毒的全基因组序列才能实现。
发明内容
本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明的一个目的在于针对新型冠状病毒基因组设计特异性引物,通过多重PCR的方法对病毒全基因组进行富集扩增,并通过二代测序的方法对序列进行测定,实现病毒全基因组层面的分析,为疫情防控以及检测提供重要的检测方法。
在本发明的一个方面,本发明提出了一种构建新冠病毒测序文库的方法,根据本发明的实施例,该方法包括:获取生物样本的RNA样本;对所述RNA样本进行反转录,以便获得cDNA样本;利用扩增引物组,对所述cDNA样本进行扩增,以便获得来源于新冠病毒基因组的扩增产物;对所述扩增产物进行打断处理,以便获得打断产物;以及基于所述打断产物构建测序文库,以便获得所述新冠病毒测序文库,其中,所述扩增引物组包括多对扩增引物,所述多对扩增引物是通过将新冠病毒参考基因组序列分割为多个窗口,并基于所述多个窗口的序列确定的,所述多个窗口的至少一部分长度为200~300bp,并且所述多个窗口共同构成了所述新冠病毒参考基因组的完整序列。根据本发明的实施例,本发明针对新型冠状病毒基因组设计特异性引物,通过多重PCR的方法对病毒全基因组进行富集扩增,并通过二代测序的方法对序列进行测定,实现病毒全基因组层面的分析,为疫情防控以及检测提供重要的检测方法。由于本发明采用的窗口长度为200~300bp,因此扩增产物的主要长度是200~300bp的核酸片段,同时还会产生多个窗口组合的产物,例如对应两个、三个、四个或者更多个窗口组合的扩增产物,这些扩增产物能够实现对新冠病毒基因组更高的覆盖率,从而利用所构建的测序文库能够有效地发现新冠病毒的突变信息。根据本发明的实施例,本发明的方法所构建的测序文库可以对新型冠状病毒的全基因组进行分析,并且不受病毒变异等因素的影响,可以有效减少检测的假阴性;本发明相比于传统的通过捕获方法构建测序文库的方法,具有富集时间周期短、检测所需样本起始量较低且检测灵敏度高的优点;另外,本发明构建测序文库的方法将多重PCR和二代测序相结合,通过设计特异性引物组对样本中的新型冠状病毒核酸进行富集,具有成本低,操作简便,特异性高的优点;另外,根据本发明的实施例,可以对临床样本中存在的新型冠状病毒核酸进行检测,并进一步对病毒来源及传播过程的监测。
在本发明的第二方面,本发明提出了一种确定新冠病毒核酸序列的方法,其包括:根据前面所述的方法,构建测序文库;对所述测序文库进行测序,以便获得所述新冠病毒核酸序列。如前所述,根据本发明的实施例,本发明针对新型冠状病毒基因组设计特异性引物,通过多重PCR的方法对病毒全基因组进行富集扩增,并通过二代测序的方法对序列进行测定,实现病毒全基因组层面的分析,为疫情防控以及检测提供重要的检测方法。由于本发明采用的窗口长度为200~300bp,因此扩增产物的主要长度是200~300bp的核酸片段,同时还会产生多个窗口组合的产物,例如对应两个、三个、四个或者更多个窗口组合的扩增产物,这些扩增产物能够实现对新冠病毒基因组更高的覆盖率,从而利用所构建的测序文库能够有效地发现新冠病毒的突变信息。根据本发明的实施例,本发明的方法所构建的测序文库可以对新型冠状病毒的全基因组进行分析,并且不受病毒变异等因素的影响,可以有效减少检测的假阴性;本发明相比于传统的通过捕获方法构建测序文库的方法,具有时间周期短、检测所需样本起始量较低且检测灵敏度高的优点;另外,本发明构建测序文库的方法将多重PCR和二代测序相结合,通过设计特异性引物组对样本中的新型冠状病毒核酸进行富集,具有成本低,操作简便,特异性高的优点;另外,根据本发明的实施例,可以对临床样本中存在的新型冠状病毒核酸进行检测,并进一步对病毒来源及传播过程的监测。
在本发明的第三方面,本发明提出了一种测序文库。根据本发明的实施例,其是根据前面所述的方法构建的。如前所述,根据本发明的实施例,本发明针对新型冠状病毒基因组设计特异性引物,通过多重PCR的方法对病毒全基因组进行富集扩增,并通过二代测序的方法对序列进行测定,实现病毒全基因组层面的分析,为疫情防控以及检测提供重要的检测方法。由于本发明采用的窗口长度为200~300bp,因此扩增产物的主要长度是200~300bp的核酸片段,同时还会产生多个窗口组合的产物,例如对应两个、三个、四个或者更多个窗口组合的扩增产物,这些扩增产物能够实现对新冠病毒基因组更高的覆盖率,从而利用所构建的测序文库能够有效地发现新冠病毒的突变信息。根据本发明的实施例,本发明的方法所构建的测序文库可以对新型冠状病毒的全基因组进行分析,并且不受病毒变异等因素的影响,可以有效减少检测的假阴性;本发明相比于传统的通过捕获方法构建测序文库的方法,具有时间周期短、检测所需样本起始量较低且检测灵敏度高的优点;另外,本发明构建测序文库的方法将多重PCR和二代测序相结合,通过设计特异性引物组对样本中的新型冠状病毒核酸进行富集,具有成本低,操作简便,特异性高的优点;另外,根据本发明的实施例,可以对临床样本中存在的新型冠状病毒核酸进行检测,并进一步对病毒来源及传播过程的监测。
在本发明的第四方面,本发明提出了一种试剂盒。根据本发明的实施例该试剂盒包括:扩增引物组,其中,所述扩增引物组包括多对扩增引物,所述多对扩增引物是通过将新冠病毒参考基因组序列分割为多个窗口,并基于所述多个窗口的序列确定的,所述多个窗口的至少一部分长度为200~300bp,并且所述多个窗口共同构成了所述新冠病毒参考基因组的完整序列。利用该试剂盒可以有效地实施前面所述构建测序文库的方法或者测序方法,如前所述,根据本发明的实施例,本发明针对新型冠状病毒基因组设计特异性引物,通过多重PCR的方法对病毒全基因组进行富集扩增,并通过二代测序的方法对序列进行测定,实现病毒全基因组层面的分析,为疫情防控以及检测提供重要的检测方法。由于本发明采用的窗口长度为 200~300bp,因此扩增产物的主要长度是200~300bp的核酸片段,同时还会产生多个窗口组合的产物,例如对应两个、三个、四个或者更多个窗口组合的扩增产物,这些扩增产物能够实现对新冠病毒基因组更高的覆盖率,从而利用所构建的测序文库能够有效地发现新冠病毒的突变信息。根据本发明的实施例,本发明的方法所构建的测序文库可以对新型冠状病毒的全基因组进行分析,并且不受病毒变异等因素的影响,可以有效减少检测的假阴性;本发明相比于传统的通过捕获方法构建测序文库的方法,具有时间周期短、检测所需样本起始量较低且检测灵敏度高的优点;另外,本发明构建测序文库的方法将多重PCR和二代测序相结合,通过设计特异性引物组对样本中的新型冠状病毒核酸进行富集,具有成本低,操作简便,特异性高的优点;另外,根据本发明的实施例,可以对临床样本中存在的新型冠状病毒核酸进行检测,并进一步实现对病毒来源及传播过程的监测。根据本发明的实施例,所述多个窗口中至少两个相邻窗口存在重叠区域,所述重叠区域的长度为50~100bp。由此,可以进一步提高扩增引物对新冠病毒基因组的覆盖率。
根据本发明的实施例,所述扩增引物组包括选自如SEQ ID NO:1~238所示序列中的至少之一,例如所述扩增引物组包括SEQ ID NO:1~238的至少10%,至少20%,至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%或者优选100%。由此,可以提高扩增引物对新冠病毒基因组扩增的效率。
本发明的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是根据本发明一个实施例的构建新冠病毒测序文库的方法的流程图;
图2是根据本发明一个实施例的新冠病毒测序方法的流程示意图;和
图3是根据本发明一个实施例的新冠病毒检测结果对新冠病毒基因组覆盖率的比较。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能理解为对本发明的限制。
需要注意的是,本文中“新冠病毒”、“新型冠状病毒”等描述均指2019新型冠状病毒(2019-nCoV)。
在本发明的一个方面,本发明提出了一种构建新冠病毒测序文库的方法,参考图1,根据本发明的实施例,该方法包括:
S100获取生物样本的RNA样本
在该步骤中,从疑似或者已知呈新冠病毒阳性的样本中分离RNA样本。这里所使用的术语“生物样本”应做广义理解,其是指已知含有病毒或者疑似含有病毒的任何样本,既可以是从人体或者其他动物分离的样本,也可以是环境样本,例如可以是从人体得到的呼吸道样本,例如所述呼吸道样本包括痰液、咽拭子、鼻拭子、肺泡灌洗液的至少之一,例如还可以是环境样品,例如下水道、空气、物体表面拭子样本等。
另外,本领域技术人员也可以采用公知的手段进行RNA分离,例如可以采用商业购买的试剂盒按照说明书进行,例如
S200对RNA样本进行反转录
在获得RNA样本之后,对所述RNA样本进行反转录,以便获得cDNA样本。
根据本发明的实施例,所述反转录(也可以称为“逆转录”,与“反转录”互换使用)是采用简并引物进行的,所述简并引物的长度为6nt。由此,可以提高对样本中的全部RNA进行均一性反转录的效率,并且有效地控制成本。本领域技术人员能够理解,如果简并引物的长度过长,则会造成简并引物的数目过多,导致反转录引物与RNA模板结合的效率降低,影响本方法对新型冠状病毒核酸检测的敏感性,并且成本显著增加。
当然,进行反转录的方法,本领域技术人员可以采用公知的方法,也可以采用商业购买的试剂盒按照说明书进行,例如Super ScriptⅡReverse Transcriptase。在此不再赘述。
S300对cDNA样本进行扩增
利用扩增引物组,对所述cDNA样本进行扩增,以便获得来源于新冠病毒基因组的扩增产物。
根据本发明的实施例,其中,所述扩增引物组包括多对扩增引物,所述多对扩增引物是通过将新冠病毒参考基因组序列分割为多个窗口,并基于所述多个窗口的序列确定的,所述多个窗口的至少一部分长度为200~300bp,并且所述多个窗口共同构成了所述新冠病毒参考基因组的完整序列。由于本发明采用的窗口长度为200~300bp,因此扩增产物的主要长度是 200~300bp的核酸片段,同时还会产生多个窗口组合的产物,例如对应两个、三个、四个或者更多个窗口组合的扩增产物,这些扩增产物能够实现对新冠病毒基因组更高的覆盖率,从而利用所构建的测序文库能够有效地发现新冠病毒的突变信息。
根据本发明的实施例,所述多个窗口中至少两个相邻窗口存在重叠区域,所述重叠区域的长度为50~100bp。根据本发明的实施例,由于多个窗口存在重叠区域,因此,可以进一步提高扩增产物对新冠病毒基因组的覆盖率。
具体的,根据本发明的实施例,所述扩增引物组包括选自下面列举SEQ ID NO:1~238 中的至少之一,例如所述扩增引物组包括如SEQ ID NO:1~238所示序列的至少10%,至少 20%,至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%或者优选100%。由此,可以提高扩增引物对新冠病毒基因组扩增的效率。
新型冠状病毒引物组序列:
SEQ ID NO:1 CCCTGGTTTCAACGAGAAAAC
SEQ ID NO:2 ACATGACCATGAGGTGCAGTT
SEQ ID NO:3 TGTTCATCAAACGTTCGGATG
SEQ ID NO:4 CATAAGGATCAGTGCCAAGCT
SEQ ID NO:5 AATACCAGTGGCTTACCGCAA
SEQ ID NO:6 GTCTTTAATGCACTCAAGAGG
SEQ ID NO:7 GAGCATGAAATTGCTTGGTAC
SEQ ID NO:8 GTGTCAATAAAGTCCAGTTGT
SEQ ID NO:9 AAAAGCTTGATGGCTTTATGG
SEQ ID NO:10 CACATTTGGTTGCATTCATTT
SEQ ID NO:11 CACTTGCGAATTTTGTGGCAC
SEQ ID NO:12 TTTTAACAACAGCATTTTGGG
SEQ ID NO:13 TGTGTGTTCTCTTATGTTGGT
SEQ ID NO:14 ACACAGCCTCCAAAGGCAATA
SEQ ID NO:15 TCTTAATGACAACCTTCTTGA
SEQ ID NO:16 ATGCCAAAATAATGGCGATCT
SEQ ID NO:17 ACAGAAATCAATACTGAGTCC
SEQ ID NO:18 GGACTCAGTATTGATTTCTGT
SEQ ID NO:19 TGATGTTCACATCTGATTTGG
SEQ ID NO:20 TAATGTAGGCCATTACAACTA
SEQ ID NO:21 GGAAATTAAGGAGAGTGTTCA
SEQ ID NO:22 AGCTTAAAGAATGTCTGAACA
SEQ ID NO:23 TTCTTAGAGGGAGAAACACTT
SEQ ID NO:24 CAACTTCCTCTGTTAACACTT
SEQ ID NO:25 GAAAAGTACTGTGCCCTTGCA
SEQ ID NO:26 TACCATCATATTAGGTGCAAG
SEQ ID NO:27 AAGGTTACTTTTGGTGATGAC
SEQ ID NO:28 CAACACAGGCGAACTCATTTA
SEQ ID NO:29 CAACCAGTATCTGAATTACTT
SEQ ID NO:30 ATGTAGCCATACTCCACTCAT
SEQ ID NO:31 AAGAAGAGCAAGAAGAAGATT
SEQ ID NO:32 AACCAATCTTCTTCTTGCTCT
SEQ ID NO:33 GGTAAAACCAACAGTGGTTGT
SEQ ID NO:34 TGCATTAACAACCACTGTTGG
SEQ ID NO:35 GAAGTTCTACTTGCACCATTA
SEQ ID NO:36 AATGTATAGGGTCAGCACCAA
SEQ ID NO:37 TGAACAAAAGATCGCTGAGAT
SEQ ID NO:38 CCTCTTTAGGAATCTCAGCGA
SEQ ID NO:39 GTTACAACAACTCTGGAAGAA
SEQ ID NO:40 GATGTCAATGTCACTAACAAG
SEQ ID NO:41 CACTACTGAAATGCTAGCGAA
SEQ ID NO:42 AGCTTTCGCTAGCATTTCAGT
SEQ ID NO:43 CACGCAAATTAATGCCTGTCT
SEQ ID NO:44 CACAGACAGGCATTAATTTGC
SEQ ID NO:45 TTCACCTGATGCTGTTACAGC
SEQ ID NO:46 CAGGTGAAGAAACAGAAACTG
SEQ ID NO:47 ATTACACTAGTAATCCTACCA
SEQ ID NO:48 GTGATAACTTCACCATCTAGG
SEQ ID NO:49 TTACCTAATGATGACACTCTA
SEQ ID NO:50 TAGTACTCAAAAGCCTCAACA
SEQ ID NO:51 ATACCCACAAGTTAATGGTTT
SEQ ID NO:52 CAGGTGGATTAAACTTCAACT
SEQ ID NO:53 AAGCTGCTAACTTTTGTGCAC
SEQ ID NO:54 TGTTGTCCACAAGTTTTACAC
SEQ ID NO:55 ACAACAGGAGTCACCTTTTGT
SEQ ID NO:56 CAGGTGGTGCTGACATCATAA
SEQ ID NO:57 TTGGATGGTGTTGTTTGTACA
SEQ ID NO:58 TAGGGTCAATTTCTGTACAAA
SEQ ID NO:59 GACTTAAATGGTGATGTGGTG
SEQ ID NO:60 CCACCACATCACCATTTAAGT
SEQ ID NO:61 CGCAGGGAATGGATAATCTTG
SEQ ID NO:62 CACTACTTCTTCAGAGACTGG
SEQ ID NO:63 CATGGTTTAGCTGCTGTTAAT
SEQ ID NO:64 GGGACACTATTAACAGCAGCT
SEQ ID NO:65 AATGTCACTATTGCAACCTAC
SEQ ID NO:66 AGCCTCTAGACAAAATTTACC
SEQ ID NO:67 TTGGATTGGCTGCAATCATGC
SEQ ID NO:68 ACCACATAAGCCAAGAATTAC
SEQ ID NO:69 ATGTGCATGTTGTAGACGGTT
SEQ ID NO:70 AGTTGTACATTCGACTCTTGT
SEQ ID NO:71 TGTCACTACAGTTTAAAAGAC
SEQ ID NO:72 GTGACAAGTCTCTCGCAACTT
SEQ ID NO:73 AGCTTATGTGTCAACCTATAC
SEQ ID NO:74 CATTTTAACTGCAACTTCCGC
SEQ ID NO:75 AGGGTTTGTTGATTCAGATGT
SEQ ID NO:76 TATCGCCAGTAACTTCTATGT
SEQ ID NO:77 AGTTGACATGTGCAACTACTA
SEQ ID NO:78 TAGTAGTTGCACATGTCAACT
SEQ ID NO:79 AATAACACCTGTTCATGTCAT
SEQ ID NO:80 ATCAATAGCCTTGTATCCTAT
SEQ ID NO:81 GTTTTGCTAACAAACATGCTG
SEQ ID NO:82 ATGGTGTGTAACAGATGTTAC
SEQ ID NO:83 GTACACTGACTTTGCAACATC
SEQ ID NO:84 AGCAACAGAACCTTCTAGTAC
SEQ ID NO:85 CTGTTGCTTATGAAAGTTTAC
SEQ ID NO:86 AAAACTCCTGGTAAAGATCTG
SEQ ID NO:87 AGAAGCTGGTGTTTGTGTATC
SEQ ID NO:88 AACTGGTGTTAAACAGAGTAC
SEQ ID NO:89 TACAGTCATGTAGTTGCCTTT
SEQ ID NO:90 ACATCACTACGCAACTTTAGA
SEQ ID NO:91 CTAAAGAGACGTGTAGTCTTT
SEQ ID NO:92 GAGGTGATAGAGGTTTGTGGT
SEQ ID NO:93 TCTGATGTTCTTTACCAACCA
SEQ ID NO:94 GAACATTACCAGCCTGTACCA
SEQ ID NO:95 TGTCCAAGACATGTGATCTGC
SEQ ID NO:96 CCACATGAACCATTAAGGAAT
SEQ ID NO:97 TTACAATGGTTCACCATCTGG
SEQ ID NO:98 TACCAGCTGCTTGTGCTGTTT
SEQ ID NO:99 CATGCACCATATGGAATTACC
SEQ ID NO:100 AATATGGTACGTCCATTCATA
SEQ ID NO:101 ACTAGGACCTCTTTCTGCTCA
SEQ ID NO:102 TTGAGTACTCTGGACTAAAAC
SEQ ID NO:103 AAGAACAATCAAGGGTACACA
SEQ ID NO:104 TTAAGTGTAAAACCCACAGGG
SEQ ID NO:105 GCCACATAGATCATCCAAATC
SEQ ID NO:106 TACACCGCAAACCCGTTTAAA
SEQ ID NO:107 GCTGTAGTTGTGATCAACTCC
SEQ ID NO:108 AATTGTCATCTTCGTCCTTTT
SEQ ID NO:109 TACTGATGTCGTATACAGGGC
SEQ ID NO:110 TAAAGCATAGACGAGGTCTGC
SEQ ID NO:111 ACCTCGTCTATGCTTTAAGGC
SEQ ID NO:112 TCAGTCCAACATTTTGCTTCA
SEQ ID NO:113 GTTGGACTGAGACTGACCTTA
SEQ ID NO:114 ATCAGCATACTCCTGATTAGG
SEQ ID NO:115 GGAGTATGCTGATGTCTTTCA
SEQ ID NO:116 ACAACATAAGAATGGTCTACG
SEQ ID NO:117 TATGTACACACCGCATACAGT
SEQ ID NO:118 CAGTAACATTATCGCTACCAA
SEQ ID NO:119 GTTTTCCATTGTGTGCTAATG
SEQ ID NO:120 TTCTCTGTCAGACAGCACTTC
SEQ ID NO:121 CAAAGCTACTGAGGAGACATT
SEQ ID NO:122 TAGTGCTCTTGTGGCACTAGT
SEQ ID NO:123 TTACCGAGGTACAACAACTTA
SEQ ID NO:124 AATGACTCTTACCAGTACCAG
SEQ ID NO:125 GAGTCATTTTGCTATTGGCCT
SEQ ID NO:126 CTATATCTGCTGTCGTCTCAG
SEQ ID NO:127 ATAGTGTATACAGCTTGCTCT
SEQ ID NO:128 ATTCTGGTTCTAGTGTGCCCT
SEQ ID NO:129 GCACATTGCTAACTAAGGGCA
SEQ ID NO:130 CTTTTCTCCAAGCAGGGTTAC
SEQ ID NO:131 AAATAGGCGTGGTAAGAGAAT
SEQ ID NO:132 TTCCTACGTGGAATTTCAAGA
SEQ ID NO:133 TCTTGAAATTCCACGTAGGAA
SEQ ID NO:134 CCATGCACGTACATGTCTTAT
SEQ ID NO:135 TGACCTATAGAAGACTCATCT
SEQ ID NO:136 ACTACATTCCAAGGAAGTCCT
SEQ ID NO:137 ATGCTACTAGAGAAGCTGTTG
SEQ ID NO:138 TATCACATAGACAACAGGTGC
SEQ ID NO:139 CTTATGGGCACATGGCTTTGA
SEQ ID NO:140 GCATTACCATGGACTTGACAA
SEQ ID NO:141 GTAATGCACATGTAGCTAGTT
SEQ ID NO:142 CCAAAATAGGCATACACCATC
SEQ ID NO:143 TCTATGATGCACAGCCTTGTA
SEQ ID NO:144 TACAAACTGCCACCATCACAA
SEQ ID NO:145 TTGGATGGTGTTGTTTGTACA
SEQ ID NO:146 CATCATGTTATAAGCATCGAG
SEQ ID NO:147 ACACGTTGCAATTTAGGTGGT
SEQ ID NO:148 GTTGCTGGTGCATGTAGAAGT
SEQ ID NO:149 CACAAAAGTTGATGGTGTTGA
SEQ ID NO:150 TGCACAAATCGTTTCAGTTGG
SEQ ID NO:151 GATTTGTGCACCACTCACTGT
SEQ ID NO:152 AAACGATATGTTCGAAGGCAT
SEQ ID NO:153 CATTAATTGGAGAAGCCGTAA
SEQ ID NO:154 ACCTGTTTGCGCATCTGTTAT
SEQ ID NO:155 TTCATAACAGATGCGCAAACA
SEQ ID NO:156 TATGCCTTTAGGTAATGTTGC
SEQ ID NO:157 GTGCAACATTACCTAAAGGCA
SEQ ID NO:158 TTGCACAATCACCAATCAAAG
SEQ ID NO:159 TTTAAGACAGTGGTTGCCTAC
SEQ ID NO:160 AAGATCAGCATTCCAAGAATG
SEQ ID NO:161 TGCAGATTCAACTTTGATTGG
SEQ ID NO:162 TTTGTTCGCGTGGTTTGCCAA
SEQ ID NO:163 TGAATGCGTCATCATCTGAAG
SEQ ID NO:164 AGAGACTAGTGGCAATAAAAC
SEQ ID NO:165 CCCTTAAATTAAGGGGTACTG
SEQ ID NO:166 CATGTATAGCATGGAACCAAG
SEQ ID NO:167 CTTGGTTCCATGCTATACATG
SEQ ID NO:168 ACTGGGTCTTCGAATCTAAAG
SEQ ID NO:169 CTACTTTAGATTCGAAGACCC
SEQ ID NO:170 CTAAATTAATAGGCGTGTGCT
SEQ ID NO:171 GCACACGCCTATTAATTTAGT
SEQ ID NO:172 GTGAAGGATTTCAACGTACAC
SEQ ID NO:173 TGCACTTGATCCTCTCTCAGA
SEQ ID NO:174 GCAACACAGTTGCTGATTCTC
SEQ ID NO:175 AGCAACTGTGTTGCTGATTAT
SEQ ID NO:176 GTTGCTGGTGCATGTAGAAGT
SEQ ID NO:177 CTTGATTCTAAGGTTGGTGGT
SEQ ID NO:178 ACATGGTGTAATGTCAAGAAT
SEQ ID NO:179 CAACAATTTGGCAGAGACATT
SEQ ID NO:180 ACCTGTAGAATAAACACGCCA
SEQ ID NO:181 TTGGCGTGTTTATTCTACAGG
SEQ ID NO:182 TGGATTGACTAGCTACACTAC
SEQ ID NO:183 CGTAGTGTAGCTAGTCAATCC
SEQ ID NO:184 TGTTCAACAGCTATTCCAGTT
SEQ ID NO:185 TTGTTGCAATATGGCAGTTTT
SEQ ID NO:186 GCCGTTAAACTTTTGTGCACA
SEQ ID NO:187 CATCAAACAATATGGTGATTG
SEQ ID NO:188 ATACCATTAAACCTATAAGCC
SEQ ID NO:189 GCAGGTGCTGCATTACAAATA
SEQ ID NO:190 CAACTTTGTCAAGACGTGAAA
SEQ ID NO:191 CAAAATGCACAAGCTTTAAAC
SEQ ID NO:192 AGTACACACTCTGACATTTTA
SEQ ID NO:193 TGTCAGAGTGTGTACTTGGAC
SEQ ID NO:194 CCAGACACAAATGTGTTGTCT
SEQ ID NO:195 TTGTCATGATGGAAAAGCACA
SEQ ID NO:196 AATGAGTCTAATTCAGGTTGC
SEQ ID NO:197 TTGCAACCTGAATTAGACTCA
SEQ ID NO:198 TCACCATTACTATGGCAATCA
SEQ ID NO:199 ATAGCTGGCTTGATTGCCATA
SEQ ID NO:200 TTGCTTCAAAGTTACAGTTCC
SEQ ID NO:201 GCTCAAAGGAGTCAAATTACA
SEQ ID NO:202 CAACAGCAAGTTGCAAACAAA
SEQ ID NO:203 TTCACTTTGTTTGCAACTTGC
SEQ ID NO:204 TTTTCAGTATAACCACCAATC
SEQ ID NO:205 TCATTACTTCAGGTGATGGCA
SEQ ID NO:206 TAGTAGTCGTCGTCGGTTCAT
SEQ ID NO:207 GTTAATCCAGTAATGGAACCA
SEQ ID NO:208 AGACTCACGTTAACAATATTG
SEQ ID NO:209 TGCTGCAATATTGTTAACGTG
SEQ ID NO:210 CCATAACAGCCAGAGGAAAAT
SEQ ID NO:211 ACAATTTGCCTATGCCAACAG
SEQ ID NO:212 GGATTGAATGACCACATGGAA
SEQ ID NO:213 TGCTATCGCAATGGCTTGTCT
SEQ ID NO:214 TCCAGCAATACGAAGATGTCC
SEQ ID NO:215 GTAATCGGAGCTGTGATCCTT
SEQ ID NO:216 AATCTCCATTGGTTGCTCTTC
SEQ ID NO:217 TGTACAGTAAGTGACAACAGA
SEQ ID NO:218 AGCGAGTGTTATCAGTGCCAA
SEQ ID NO:219 CTCGCTACTTGTGAGCTTTAT
SEQ ID NO:220 CTCTTGTCTGATGAACAGTTT
SEQ ID NO:221 ACTGTTCATCAGACAAGAGGA
SEQ ID NO:222 AGGTGCTGATTTTCTAGCTCC
SEQ ID NO:223 ACAACTGTAGCTGCATTTCAC
SEQ ID NO:224 ACAACGCACTACAAGACTACC
SEQ ID NO:225 AATTGGGTAGTCTTGTAGTGC
SEQ ID NO:226 TCTGGACTGCTATTGGTGTTA
SEQ ID NO:227 AGGTTTACCCAATAATACTGC
SEQ ID NO:228 GTAGCACGATTGCAGCATTGT
SEQ ID NO:229 TCCCTATGGTGCTAACAAAGA
SEQ ID NO:230 ACTGTTGCGACTACGTGATGA
SEQ ID NO:231 ACATTGCCAAAAGGCTTCTAC
SEQ ID NO:232 TTCCTTGGGTTTGTTCTGGAC
SEQ ID NO:233 GTCACTAAGAAATCTGCTGCT
SEQ ID NO:234 GCGTCAATATGCTTATTCAGC
SEQ ID NO:235 ATTGGCATGGAAGTCACACCT
SEQ ID NO:236 GGATTGTTGCAATTGTTTGGA
SEQ ID NO:237 CAATTGCAACAATCCATGAGC
SEQ ID NO:238 TACTTGTGCTATGTAGTTACG
其中,在SEQ ID NO:1~238中,SEQ ID NO:2n-1与SEQ ID NO:2n(n为1~119 的整数)为针对一个长度为200~300bp的窗口设计的引物对,其中,SEQ ID NO:2n-1为正向引物序列,SEQ ID NO:2n为反向引物序列。
由此,根据本发明的实施例,本发明设计了针对临床样本的新型冠状病毒基因组富集引物,通过特异性引物组扩增流程,可以对新型冠状病毒基因组具有较高的富集效果,进一步可用于对疑似新冠感染的临床样本进行检测,可实现对新型冠状病毒全基因组序列的鉴定,并且根据鉴定结果可以对病毒潜在的变异进行分析。由此,通过本发明方法获得的新型冠状病毒全基因组序列可进一步用于对病毒的变异和进化树全面分析,对病毒的溯源研究具有重要意义。
S400对扩增产物进行打断处理
对所述扩增产物进行打断处理,以便获得打断产物,该打断产物的长度大约为200~300bp。从而可以后续作为插入片段构建测序文库。
根据本发明的实施例,可以采用超声处理,如Bioruptor超声打断仪进行打断处理。
S500基于打断产物构建测序文库
基于所述打断产物构建测序文库,以便获得所述新冠病毒测序文库。
根据本发明的实施例,所述基于所述打断产物构建测序文库进一步包括:将所述打断产物进行末端修复和添加碱基A处理,以便获得携带粘性末端的双链片段;将所述双链片段与接头进行连接,以便获得携带接头的双链片段;对所述携带接头的双链片段进行扩增处理,以便获得携带接头的扩增产物,所述携带接头的扩增产物构成所述测序文库,其中,所述接头是由分别具有SEQ ID NO:239和SEQ ID NO:240的核酸分子退火形成的,所述扩增处理采用分别具有SEQ ID NO:241和SEQ ID NO:242的引物进行。
由此,根据本发明的实施例,本发明针对新型冠状病毒基因组设计特异性引物,通过多重PCR的方法对病毒全基因组进行富集扩增,并通过二代测序的方法对序列进行测定,实现病毒全基因组层面的分析,为疫情防控以及检测提供重要的检测方法。由于本发明采用的窗口长度为200~300bp,因此在扩增产物的主要长度是200~300bp的核酸片段,同时还会产生多个窗口组合的产物,例如对应两个、三个、四个或者更多个窗口组合的扩增产物,这些扩增产物能够实现对新冠病毒基因组更高的覆盖率,从而利用所构建的测序文库能够有效地发现新冠病毒的突变信息。根据本发明的实施例,本发明的方法所构建的测序文库可以对新型冠状病毒的全基因组的进行分析,并且不受病毒变异等因素的影响,可以有效减少检测的假阴性;本发明相比于传统的通过捕获方法构建测序文库的方法,具有时间周期短、检测所需样本起始量较低且检测灵敏度高的优点;另外,本发明构建测序文库的方法将多重PCR 和二代测序相结合,通过设计特异性引物组对样本中的新型冠状病毒核酸进行富集,具有成本低,操作简便,特异性高的优点;另外,根据本发明的实施例,可以对临床样本中存在的新型冠状病毒核酸进行检测,并进一步对病毒来源及传播过程的监测。
与之不同的是,常规的荧光PCR的方法只能检测新型冠状病毒的某段序列,无法对病毒的突变情况进行监测,其次,当病毒在荧光PCR检测区域发生突变时,会导致检测结果假阴性的情况,无法准确获得病毒序列信息;杂交捕获方法本身可以在基因组层面对新型冠状病毒的核酸序列进行分析,但该方法基于杂交的原理对新型冠状病毒进行富集,一方面杂交反应的时间会比较久,时效性较差,且操作繁琐;另一方面,捕获探针的合成成本较高,且捕获所需的杂交文库起始量也较大,常规样本通常无法满足。另外,通过随机引物全基因组扩增的方法也可以实现对新型冠状病毒核酸序列的分析,该方法采用随机引物对样本中的全部核酸进行扩增,本身操作比较简单,并且无偏向性,但扩增富集后的结果不仅会包括新型冠状病毒序列,还会包括样本中的人源序列,所以该方法对于临床样本中的新型冠状病毒的富集效果较差。
在本发明的第二方面,本发明提出了一种确定新冠病毒核酸序列的方法,其特征在于,包括:根据前面所述的方法,构建测序文库;对所述测序文库进行测序,以便获得所述新冠病毒核酸序列。
根据本发明的实施例,按照测序平台要求,可以对上述获得的二代测序文库进行上机测序,获得测序数据,按照生物信息学分析流程对获得的测序数据进行分析比对,得到比对结果,并计算检测结果在新型冠状病毒基因组上的覆盖率、覆盖深度等参数。根据获得的结果数据进一步对病毒基因序列的变异情况及进化树情况进行全面分析。
如前所述,根据本发明的实施例,本发明针对新型冠状病毒基因组设计特异性引物,通过多重PCR的方法对病毒全基因组进行富集扩增,并通过二代测序的方法对序列进行测定,实现病毒全基因组层面的分析,为疫情防控以及检测提供重要的检测方法。由于本发明采用的窗口长度为200~300bp,因此在扩增产物的主要长度是200~300bp的核酸片段,同时还会产生多个窗口组合的产物,例如对应两个、三个、四个或者更多个窗口组合的扩增产物,这些扩增产物能够实现对新冠病毒基因组更高的覆盖率,从而利用所构建的测序文库能够有效地发现新冠病毒的突变信息。根据本发明的实施例,本发明的方法所构建的测序文库可以对新型冠状病毒的全基因组进行分析,并且不受病毒变异等因素的影响,可以有效减少检测的假阴性;本发明相比于传统的通过捕获方法构建测序文库的方法,具有时间周期短、检测所需样本起始量较低且检测灵敏度高的优点;另外,本发明构建测序文库的方法适于将多重 PCR和二代测序相结合,通过设计特异性引物组对样本中的新型冠状病毒核酸进行富集,具有成本低,操作简便,特异性高的优点;另外,根据本发明的实施例,可以对临床样本中存在的新型冠状病毒核酸进行检测,并进一步对病毒来源及传播过程的监测。
在本发明的第三方面,本发明提出了一种测序文库。根据本发明的实施例,其是根据前面所述的方法构建的。如前所述,根据本发明的实施例,本发明针对新型冠状病毒基因组设计特异性引物,通过多重PCR的方法对病毒全基因组进行富集扩增,并通过二代测序的方法对序列进行测定,实现病毒全基因组层面的分析,为疫情防控以及检测提供重要的检测方法。由于本发明采用的窗口长度为200~300bp,因此在扩增产物的主要长度是200~300bp的核酸片段,同时还会产生多个窗口组合的产物,例如对应两个、三个、四个或者更多个窗口组合的扩增产物,这些扩增产物能够实现对新冠病毒基因组更高的覆盖率,从而利用所构建的测序文库能够有效地发现新冠病毒的突变信息。根据本发明的实施例,本发明的方法所构建的测序文库可以对新型冠状病毒的全基因组进行分析,并且不受病毒变异等因素的影响,可以有效减少检测的假阴性;本发明相比于通过传统捕获方法构建测序文库的方法,具有时间周期短、检测所需样本起始量较低且检测灵敏度高的优点;另外,本发明构建测序文库的方法将多重PCR和二代测序相结合,通过设计特异性引物组对样本中的新型冠状病毒核酸进行富集,具有成本低,操作简便,特异性高的优点;另外,根据本发明的实施例,可以对临床样本中存在的新型冠状病毒核酸进行检测,并进一步对病毒来源及传播过程的监测。
在本发明的第四方面,本发明提出了一种试剂盒。根据本发明的实施例该试剂盒包括:扩增引物组,其中,所述扩增引物组包括多对扩增引物,所述多对扩增引物是通过将新冠病毒参考基因组序列分割为多个窗口,并基于所述多个窗口的序列确定的,所述多个窗口的至少一部分长度为200~300bp,并且所述多个窗口共同构成了所述新冠病毒参考基因组的完整序列。利用该试剂盒可以有效地实施前面所述构建测序文库的方法或者测序方法,如前所述,根据本发明的实施例,本发明针对新型冠状病毒基因组设计特异性引物,通过多重PCR的方法对病毒全基因组进行富集扩增,并通过二代测序的方法对序列进行测定,实现病毒全基因组层面的分析,为疫情防控以及检测提供重要的检测方法。由于本发明采用的窗口长度为 200~300bp,因此在扩增产物的主要长度是200~300bp的核酸片段,同时还会产生多个窗口组合的产物,例如对应两个、三个、四个或者更多个窗口组合的扩增产物,这些扩增产物能够实现对新冠病毒基因组更高的覆盖率,从而利用所构建的测序文库能够有效地发现新冠病毒的突变信息。根据本发明的实施例,本发明的方法所构建的测序文库可以对新型冠状病毒的全基因组进行分析,并且不受病毒变异等因素的影响,可以有效减少检测的假阴性;本发明相比于传统捕获方法构建测序文库的方法,具有时间周期短、检测所需样本起始量较低且检测灵敏度高的优点;另外,本发明构建测序文库的方法将多重PCR和二代测序相结合,通过设计特异性引物组对样本中的新型冠状病毒核酸进行富集,具有成本低,操作简便,特异性高的优点;另外,根据本发明的实施例,可以对临床样本中存在的新型冠状病毒核酸进行检测,并进一步对病毒来源及传播过程的监测。根据本发明的实施例,所述多个窗口中至少两个相邻窗口存在重叠区域,所述重叠区域的长度为50~100bp。由此,可以进一步提高扩增引物对新冠病毒基因组的覆盖率。
根据本发明的实施例,所述扩增引物组包括选自如SEQ ID NO:1~238所示序列中的至少之一,例如所述扩增引物组包括如SEQ ID NO:1~238所示序列的至少10%,至少20%,至少30%,至少40%,至少50%,至少60%,至少70%,至少80%,至少90%或者优选100%。由此,可以提高扩增引物对新冠病毒基因组扩增的效率。
以下实施例说明本发明提供的示例性方法。这些实施例不是为了限制本公开的范围,也不应被解释为限制本公开的范围。显然,除了本文具体描述的方法之外,可以实施所述方法。鉴于本文的教导,许多修改和变化是可能的,并且因此在本公开的范围内。
材料
本发明提供一种用于检测新型冠状病毒全基因组的检测试剂盒。试剂盒包括多重PCR 反应试剂和二代测序文库构建试剂,试剂盒组成如表1所示。
表1试剂盒组分
R1组分中的引物组序列见前SEQ ID NO:1~238;
R7组分中的接头序列是由接头Ad153_5T_N和接头Ad153Ω_Bottom等摩尔量退火组合而成,Ad153_5T_N:
5’ -/Phos/AGTCGGAGGCCAAGCGGTCTTAGGAAGACAANNNNNNNNNNCAACTCCTTGGCTCACA-3’SEQ ID NO:239
Ad153Ω_Bottom:5’-TTGTCTTCCTAAGGAACGACATGGCTACGATCCGACTT-3’SEQ ID NO:240,其中Ad153_5T_N中的NNNN为标签序列,共有96种不同的标签序列,即 Ad153_5T_1-96。
R9组分中的通用引物序列为:PCR-1:5’-/Phos/GAACGACATGGCTACGA-3’SEQ IDNO: 241;和PCR-2:5’-TGTGAGCCAAGGAGTTG-3’SEQ ID NO:242
一般方法:
参考图2,按照下列方法对新冠病毒进行测序:
(1)临床样本中RNA的提取,包括痰液、咽拭子、鼻拭子、肺泡灌洗液等呼吸道样本;
(2)将提取的RNA通过随机逆转录引物进行逆转录处理,得到cDNA;
(3)多重PCR扩增:使用新型冠状病毒的多重PCR引物组对样本中的新型冠状病毒核酸进行扩增富集,得到新型冠状病毒的核酸序列;
(4)PCR产物纯化:对(3)得到的PCR产物进行纯化,以去除产物中的剩余引物二聚体和其他干扰物质;
(5)将纯化后的PCR产物进行片段化处理;
(6)将片段化产物进行末端修复和加“A”:对(5)中得到的纯化产物进行末端修复,补平末端并在3’端添加A碱基形成粘性末端;
(7)接头连接:对(6)得到的产物进行接头连接,得到包含测序接头的文库;
(8)连接产物纯化:对连接接头以后的产物进行纯化,去除多余的接头序列和杂质;
(9)文库放大:对(8)中的纯化产物进行PCR扩增,放大文库信号,满足上机需求;
(10)文库纯化:将(9)得到的产物进行纯化,去除多余的引物和杂质;
(11)MGISEQ-2000测序:将质控后的文库按照MGISEQ-2000测序流程进行上机测序;
(12)数据分析:测序完成后的原始数据,按照信息分析流程进行处理,首先进行数据质控、数据拆分,然后将质控后的序列与新型冠状病毒序列库进行比对,按照设定的比对参数进行数据过滤,得到比对到新型冠状病毒基因组上的序列数。
(13)根据比对序列计算检测到的序列在新型冠状病毒基因组上的覆盖率及深度,并根据比对序列对新型冠状病毒基因组进行组装;
(14)将组装后的结果与参考基因组的一致率进行分析,给出病毒序列潜在的变异结果。同时,根据比对结果可以对该病毒的进化规律进行全面分析。确定样本中新型冠状病毒的来源情况。
实施例1
本实施例中选取2例临床样本,其中1例咽拭子样本和1例肺泡灌洗液样本,该2例样本均经过荧光PCR方法进行新型冠状病毒核酸检测,检测结果均为阳性,CT值分别为24.3和34.6。该2例样本按照一般方法的流程进行处理,如附图2所示,主要实验流程如下:
1、RNA核酸提取:按照“
2、逆转录:采用随机六聚体引物N6按照Super ScriptⅡReverse Transcriptase说明书进行逆转录;
3、多重PCR反应
将逆转录得到的cDNA按照以下反应体系进行多重PCR扩增
将上述反应液充分震荡混匀后放入PCR仪按照以下反应程序进行反应:99℃2min;38cyc(99℃15s,60℃2min);4℃hold
4、多重PCR反应产物纯化
将PCR反应产物用1倍体积的R1磁珠进行纯化,最终用R2溶解液回融至43μl用于下一步反应。
5、产物片段化:使用Bioruptor打断仪对上述纯化产物进行片段化处理。
6、末端修复和加“A”反应
将纯化后的PCR产物按照以下反应体系进行末端修复和加“A”反应
反应体系充分震荡混匀后,放入PCR仪按照以下程序进行反应:37℃,10min;65℃,15min;4C℃hold
7、接头连接反应
将5中得到的反应产物按照以下体系进行接头连接反应
将反应液充分震荡混匀后,按以下反应条件进行反应:23℃,20min;4C℃hold
8、连接产物纯化
将6中的连接产物用0.5倍体积(40μl)的R1磁珠进行纯化,纯化操作按照2)中操作进行,最终回融至21μl用于下一步反应。
9、文库放大
将上一步纯化产物按照以下反应体系进行反应
反应条件如下:98℃2min;10cyc(98℃15s,56℃15s,72℃30s);72℃5min; 4℃hold
10、产物纯化
将文库PCR产物用1倍体积的R1磁珠进行纯化,最终用R2溶解液回融至20μl.
11、文库定量
将构建好的文库用qubit进行定量,浓度大于3ng/μl时,视为文库合格,进一步用Agilent 2100Bioanalyzer进行检测文库片段大小,当检测到200-300bp左右有明显的峰值时,视为合格,可进行下一步测序反应。
12、MGISEQ-2000上机测序
将质控合格的文库按照MGISEQ-2000上机流程进行上机测序,详细流程参考相应试剂盒操作说明书。
13、下机数据信息分析
将2例样本下机后的数据首先按照信息分析流程进行数据过滤,然后将过滤后的数据与新型冠状病毒参考基因组序列进行比对,生成比对结果,并根据比对结果计算新型冠状病毒检出序列数、在基因组上的覆盖率及平均测序深度,如表2所示。并进一步对其在基因组上的覆盖率进行作图分析,如附图3所示。
表2:
由以上实施例结果可知,本发明方法及试剂盒可以对新型冠状病毒感染的临床样本进行新型冠状病毒核酸检测,并且通过本发明可以获得新型冠状病毒基因组序列,基因组覆盖率及深度均较高,可进一步进行突变或进化树相关分析。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
尽管已经示出和描述了本发明的实施例,本领域的普通技术人员可以理解:在不脱离本发明的原理和宗旨的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由权利要求及其等同物限定。
机译: 组合文库,用于获得组合文库的方法,用于序列鉴定的方法,用于对寡核苷酸和/或寡核苷酸类似物文库的组合元件进行测序的方法,将连接器用于创建组合文库和用于序列鉴定的试剂盒
机译: 选择具有基因转录质量调节剂的DNA序列的方法,以鉴定具有抑制基因转录质量的DNA序列。检测序列中是否存在恒星和恒星内部元素核酸,以确定核酸序列的序列是否包含星形,并且,为了在细胞中产生基因产物,核酸分离的序列和/或重组DNA序列,序列星形,收集,DNA的构建。 DNA的构建或序列以及分离和/或重组的核酸文库的用途
机译: 腺病毒和腺病毒文库,导航质粒,核酸文库和腺病毒表达,细胞的生产方法,腺病毒的使用和试剂盒