首页> 中国专利> 用于宏基因组测序检测RNA病毒的质控品及其应用

用于宏基因组测序检测RNA病毒的质控品及其应用

摘要

本发明公开了用于宏基因组测序检测RNA病毒的质控品及其应用,属于分子生物学领域。本发明设计了拥有特殊RNA序列的质控品,包括3~5段人工序列,每段人工序列的长度为35~45bp长,每段人工序列的GC含量在45‑65%;每段人工序列在NCBI核酸数据库进行Blast比对时,均检索不到相同的序列;同时,在任何两段人工序列之间都设置6~10bp的标签序列,标签序列的GC含量是40‑60%,不得有回文结构、不得有连续4个以上相同碱基。针对一个待测病毒样品,设计三个标签序列不同的质控品。本发明通过简便的方法,就可以做到对每一批次的实验质量进行监控,保证了实验结果的可靠性。

著录项

  • 公开/公告号CN112853001A

    专利类型发明专利

  • 公开/公告日2021-05-28

    原文格式PDF

  • 申请/专利权人 浙江树人学院(浙江树人大学);

    申请/专利号CN202110165087.8

  • 发明设计人 谢广发;余作龙;严小平;孙剑秋;

    申请日2021-02-06

  • 分类号C12Q1/70(20060101);C12Q1/6869(20180101);C12N15/11(20060101);C12R1/93(20060101);

  • 代理机构23211 哈尔滨市阳光惠远知识产权代理有限公司;

  • 代理人林娟

  • 地址 312000 浙江省绍兴市柯桥区杨汛桥镇江夏路2016号

  • 入库时间 2023-06-19 11:08:20

说明书

技术领域

本发明属于分子生物学领域,具体是用于宏基因组测序检测RNA病毒的质控品及其应用。

背景技术

高通量测序技术的出现改变了传统分子生物学研究模式,随着高通量测序技术的飞速发展和测序费用的急剧下降,基因组测序已经从科学研究走向临床应用。由于高通量测序技术的测序通量高,测序时间短,测序成本低等优点,高通量测序技术已经被广泛应用于肿瘤用药检测、遗传病检测、感染微生物检测等众多领域。例如,应用高通量测序技术检测新冠病毒。

开展高通量测序,需要利用相应的检测试剂来特异性扩增目标核酸片段。市面上有很多用于环境微生物的宏基因组检测试剂,并且声称能检测各类DNA病毒、RNA病毒、细菌、真菌以及支原体衣原体等。然而,对于市面上种类繁多的建库试剂盒,如何确定其产品性能、它们是否能达到宣称的检测下限;以及当检测RNA病毒时,如果结果显示检测到0条序列,是否真的意味着样本中不存在RNA病毒,还是说在实验过程中,由于在逆转录、二链合成、后续建库环节系统出现问题,导致病毒RNA降解了,才使得检测结果为0条序列。通常,为了确认试剂盒的性能,要经过多人、多次对多样本进行重复试验,来确定试剂盒的检测性能。该方法检测成本高,同时数据量大、分析时间长、需耗费大量人力物力,并且一个实验室不可能保存足够多的阳性样本,用于测试新买的试剂盒性能。

此外,在日常检测过程中往往缺乏针对每一个样本的监测机制,样本是否可能出现漏检情况,又或者当一个样本出现一个拷贝数很低时需不需要报出,报会不会出现假阳性,不报又会不会出现假阴性。因而如何在有限的数据量情况下,确定每个样本结果的检测下限,在降低测序成本的同时,又不会发生漏检的状况。

发明内容

[技术问题]

本发明要解决的技术问题是现有技术缺少一种用于基于宏基因组或mNGS高通量测序检测RNA病毒时的质控品。

[技术方案]

本发明要解决的技术问题是提供一种用于基于宏基因组或mNGS高通量测序检测RNA病毒的质控品,用于监控每批次实验中真实的样本RNA检测灵敏度。

所述质控品是一段特殊的RNA序列,包括3~5段人工序列,每段人工序列的长度为35~45bp长,每段人工序列的GC含量在45-65%;每段人工序列在NCBI核酸数据库进行Blast比对时,均检索不到相同的序列;即,确保所设计的该段RNA序列满足以下条件:与世界上已知物种基因组均不同;同时,在相邻两段人工序列之间都设置6~10bp的标签序列(BarcodeRNA),标签序列的GC含量是40-60%,不得有回文结构、不得有连续4个以上相同碱基。标签序列正向读取和反向读取都唯一(即反向序列与反向互补序列,与其他BarcodeRNA也有3个碱基以上的差别)。

针对一个待测病毒样品,设计三个质控品,三个质控品的Barcode序列不同,人工序列相同;并且,三个质控品的标签序列,两两之间有3个以上碱基的差别。使用三个质控品时,三个质控品的拷贝数不相同并根据高通量测序时采用的试剂盒的线性范围来确定。例如,三个质控品的拷贝数成100倍、10倍、5倍或3倍梯度。

所述质控品序列(从5’-3’)如下:

三个质控品的BarcodeRNA可以分别采用如下序列:

BarcodeRNA1:CACACUCACA(SEQ ID NO:6),

BarcodeRNA2:GAGAGCAAUC(SEQ ID NO:7),

BarcodeRNA3:UACUACAGGU(SEQ ID NO:8)。

在本发明的一种实施方式中,针对某一样本,设计了三个质控品,其中,Barcode分别是BarcodeRNA1、BarcodeRNA2、BarcodeRNA3,使用BarcodeRNA1的质控品1的序列为:

使用BarcodeRNA2的质控品2的序列为:

使用BarcodeRNA3时,质控品3的序列为:

本发明还提供了上述质控品的使用方法,包括以下步骤:

1)当检测一个环境微生物样品时,在提取好核酸后,将三个质控品分别按1000拷贝数、100拷贝数、10拷贝数的比例混合后加入待测核酸中;

2)将步骤1)所得的按比例混了质控品的待测核酸样本,按mNGS检测RNA病毒的标准程序,进行逆转录、二链合成、末端修复、末尾加A、连接接头、富集扩增,构建上机前的文库;

4)将步骤2)构建所得的文库,进行Illumina nextseq上机(按微生物检测标准流程进行),每个待测核酸样本(已混入质控品)获得下机原始数据(总序列大于20M,即2千万条以上);

Python编码分别提取包含这三种质控品特异性序列的reads(同时可通过bwa等比对工具验证提取结果),并统计这些reads的总数及每个质控品特异性序列的reads数目;

4)利用步骤3)所得结果,进行判断:

分别计数得到该待测样本对应的质控品1、质控品2、质控品3的序列条数,并分为以下几种情况:

⑤三种质控品均未检出,表示实验失败,需要重做;

⑥只检测到1000拷贝的质控品,其他质控品均未检测出,说明本次实验成功,但检测灵敏度为1000拷贝,而低于1000拷贝以下的RNA病毒存在漏检可能;

⑦只检测到1000拷贝和100拷贝的质控品(大于1条序列),其他质控品未检测出,说明本次实验成功,但检测灵敏度为100拷贝,而低于100拷贝以下的RNA病毒存在漏检可能;

⑧三种质控品均检出(大于1条序列),说明本次实验成功,检测灵敏度为10拷贝。

[有益效果]

本发明的创新之处在于设计了RNA质控品,该质控品为人工合成序列,因此,质控品序列与人源及任何已知微生物序列均不同,从而可以轻易将数据区分开。即使随着时间的推移,新物种的基因序列被披露,质控品中杂夹的一些特殊的barcode序列,也能够确保质控品不与这个新的物种的序列重合。并且,样本中只加入了微量的质控品,对测序反应,建库和测序步骤,及测序成本几乎不会产生影响。通过简便的方法,就可以做到对每一批次的实验质量进行监控,保证了实验结果的可靠性。

本发明稍加变形,就可以应用于其他转录组测序,全基因组测序等领域。

本发明的质控品适配于市面上各种基于mNGS的检测试剂盒以及各种高通量测序平台(Illumina,、华大BGI平台、Proton平台等),只要在样本提取了DNA/RNA后,加入一定拷贝数的本质控品,就可以进行后续工作,不增加额外步骤,也不增加额外成本。

具体实施方式

本发明的DNA序列由杭州擎科生物公司负责合成。RNA序列则参考专利“基因DNA序列捕获探针的制备方法”,专利号ZL201410064762.8,进行合成。

实施例1质控品的设计与制备

实验方法与步骤:

1.质控品的合成

步骤1.在杭州擎科生物公司合成以下三条质控品序列(先合成DNA,再体外转录为RNA):

其中,

步骤2.然后通过PCR分别扩增这三条序列

PCR上游引物:ACTCTTAATACGACTCACTATAGGG(

PCR下游引物:CGGCTTAATACGACTCACTA(

PCR反应体系如下:

2×PCR预混液,25μl

PCR上游引物(浓度10pmol/μl),2μl

PCR下游引物(浓度10pmol/μl),2μl

dNTPs(浓度10mM),2μl

模板(浓度25ng/μl),19μl

2×PCR预混液均可从takara公司购得,货号R001A。

PCR反应程序为:94℃预变性5分钟,94℃变性30秒,62℃退火30秒,72℃延伸1分钟,共15个循环,然后72℃额外延伸10分钟,4℃保存,得到A2产物。

将步骤2得到的产物A2进行纯化,然后用NanoDrop1000进行定量。上述“纯化”利用Qiagen公司的DNA纯化试剂盒(Qiagen公司,货号28106)进行纯化。

体外转录体系如下(A2模板的起始量为5ng):

加去离子水至总体积40μl。

备注说明:酶、缓冲液及NTP可以从生命技术公司(life technology公司)购得,产品货号为AM1791

上述反应物混匀后于37℃,反应15小时。15小时后将产物利用Qiagen公司的RNA纯化试剂盒(Qiagen公司,货号为74104)进行纯化,得到我们所需要的RNA质控品。并利用qubit定量。

1ng的质控品1,拷贝数为6.02×10

将质控品1稀释为3000拷贝/μl浓度

将质控品2稀释为300拷贝/μl浓度

将质控品3稀释为30拷贝/μl浓度

将三种质控品等体积混合,每μl中含的质控品1为1000拷贝,质控品2为100拷贝,质控品3为10拷贝。备用。

实施例2质控品的应用

1、样本:(1)某医院肺泡灌洗液A,已经通过qPCR法,证实携带有A型流感病毒;(2)正常人肺泡灌洗液B,经检测未见有RNA病毒。

2、检测方法:参考广州达瑞的BY006病原微生物检测试剂盒说明书进行操作:

1)转移样本至1.5mL EP管中,每管1mL,并标记相应的样本编号。16000g离心10分钟。

2)吸取每管中的上清液至5mL或15mL EP管中并标记相应的样本编号,注意不要吸到沉淀,震荡混匀。

3)混匀后转移样本至新的1.5mL EP管中,每管1mL,并标记相应的样本编号,然后按照总核酸提取试剂盒说明书(广州达瑞公司的BY007产品)操作提取总核酸,提取完成的样本,取20μl,并加入1μl稀释好的含1000拷贝质控品1、100拷贝质控品2、10拷贝质控品3的混合质控品。继续进行下一步实验。

4)根据广州达瑞公司的BY008反转录试剂盒操作说明,将总核酸中的RNA反转录成双链DNA。

5)按照片段化试剂盒说明书(BY009)操作将核酸长度打断至160bp左右

6)按照建库试剂盒说明书(BY0010)操作将片段化后核酸加上特异性接头,并进行Q PCR定量确定上机样本浓度。

7)按照测序试剂盒说明书(BY0011)操作将文库混样、模板富集和上机测序。

3、检测结果

(1)测序结果质控

表1

如表1所示,利用质控品是对实验过程和结果进行质控,以确定实验数据的有效性;在表1中,质控品1和2都被检测到了,质控品3没检测出,说明本次测序实验的灵敏度为100拷贝,也就是说低于100拷贝的RNA病毒可能存在假阴性。

(2)肺泡灌洗液A的测序比对结果

表2

(3)肺泡灌洗液B的测序比对结果

表3

上述结果显示,肺泡灌洗液A中确实检出了流感病毒,且该病毒亚型为H1N1,序列与A/California/07/2009的一致。

而肺泡灌洗液B中未检出流感病毒。结果一致。

对比例

样本以及步骤同实例1、2,但模拟反转录酶失效的情形,在反转录操作步骤中,将BY008中的反转录酶替换为无核酶的水。

(1)测序质控结果如表4所示。

表4

(2)肺泡灌洗液A的测序比对结果

表5

(3)肺泡灌洗液B的测序比对结果

表6

对比实施例2与本对比例的实验结果,可知,本对比例中,DNA细菌检测结果与实施例2一致,而RNA病毒检测结果为阴性。说明本发明专利的RNA质控品可以对RNA病毒检测结果进行精准的质控。从而保证了实验结果的可靠性。

最后,还需要注意的是,以上列举的仅是本发明的若干个具体实施例。显然,本发明不限于以上实施例,还可以有许多变形,比如不同的质控品组合,可以同时检测多个样本,不同的拷贝数组合,可以检测不同的敏感度。本领域的普通技术人员能从本发明公开的内容直接导出或联想到的所有变形,如可以用该质控品技术应用于肿瘤靶向捕获、全基因组二代测序的样本溯源,均应认为是本发明的保护范围。

虽然本发明已以较佳实施例公开如上,但其并非用以限定本发明,任何熟悉此技术的人,在不脱离本发明的精神和范围内,都可做各种的改动与修饰,因此本发明的保护范围应该以权利要求书所界定的为准。

SEQUENCE LISTING

<110> 浙江树人学院(浙江树人大学)

<120> 用于宏基因组测序检测RNA病毒的质控品及其应用

<130> BAA210010A

<160> 16

<170> PatentIn version 3.3

<210> 1

<211> 40

<212> RNA

<213> 人工序列

<400> 1

guugaauuaa cagaugcgga uuucauuuuc ugcuguugua 40

<210> 2

<211> 36

<212> RNA

<213> 人工序列

<400> 2

uugggcucgu caaggguggc uccuggacua aaguuc 36

<210> 3

<211> 40

<212> RNA

<213> 人工序列

<400> 3

agcugauaug gaaucuaauc uucuaaggca gugcuucauu 40

<210> 4

<211> 34

<212> RNA

<213> 人工序列

<400> 4

guuguaguug aauuaaggca gugcuucauu agcu 34

<210> 5

<211> 20

<212> RNA

<213> 人工序列

<400> 5

uagugagucg uauuaagccg 20

<210> 6

<211> 10

<212> RNA

<213> 人工序列

<400> 6

cacacucaca 10

<210> 7

<211> 10

<212> RNA

<213> 人工序列

<400> 7

gagagcaauc 10

<210> 8

<211> 10

<212> RNA

<213> 人工序列

<400> 8

uacuacaggu 10

<210> 9

<211> 210

<212> RNA

<213> 人工序列

<400> 9

guugaauuaa cagaugcgga uuucauuuuc ugcuguugua cacacucaca uugggcucgu 60

caaggguggc uccuggacua aaguuccaca cucacaagcu gauauggaau cuaaucuucu 120

aaggcagugc uucauucaca cucacaguug uaguugaauu aaggcagugc uucauuagcu 180

cacacucaca uagugagucg uauuaagccg 210

<210> 10

<211> 210

<212> RNA

<213> 人工序列

<400> 10

guugaauuaa cagaugcgga uuucauuuuc ugcuguugua gagagcaauc uugggcucgu 60

caaggguggc uccuggacua aaguucgaga gcaaucagcu gauauggaau cuaaucuucu 120

aaggcagugc uucauugaga gcaaucguug uaguugaauu aaggcagugc uucauuagcu 180

gagagcaauc uagugagucg uauuaagccg 210

<210> 11

<211> 210

<212> RNA

<213> 人工序列

<400> 11

guugaauuaa cagaugcgga uuucauuuuc ugcuguugua uacuacaggu uugggcucgu 60

caaggguggc uccuggacua aaguucuacu acagguagcu gauauggaau cuaaucuucu 120

aaggcagugc uucauuuacu acagguguug uaguugaauu aaggcagugc uucauuagcu 180

uacuacaggu uagugagucg uauuaagccg 210

<210> 12

<211> 705

<212> DNA

<213> 人工序列

<400> 12

actcttaata cgactcacta taggggttga attaacagat gcggatttca ttttctgctg 60

ttgtacacac tcacattggg ctcgtcaagg gtggctcctg gactaaagtt ccacactcac 120

aagctgatat ggaatctaat cttctaaggc agtgcttcat tcacactcac agttgtagtt 180

gaattaaggc agtgcttcat tagctcacac tcacatagtg agtcgtatta agccgactct 240

taatacgact cactataggg gttgaattaa cagatgcgga tttcattttc tgctgttgta 300

gagagcaatc ttgggctcgt caagggtggc tcctggacta aagttcgaga gcaatcagct 360

gatatggaat ctaatcttct aaggcagtgc ttcattgaga gcaatcgttg tagttgaatt 420

aaggcagtgc ttcattagct gagagcaatc tagtgagtcg tattaagccg actcttaata 480

cgactcacta taggggttga attaacagat gcggatttca ttttctgctg ttgtatacta 540

caggtttggg ctcgtcaagg gtggctcctg gactaaagtt ctactacagg tagctgatat 600

ggaatctaat cttctaaggc agtgcttcat ttactacagg tgttgtagtt gaattaaggc 660

agtgcttcat tagcttacta caggttagtg agtcgtatta agccg 705

<210> 13

<211> 20

<212> DNA

<213> 人工序列

<400> 13

taatacgact cactataggg 20

<210> 14

<211> 20

<212> DNA

<213> 人工序列

<400> 14

tagtgagtcg tattaagccg 20

<210> 15

<211> 25

<212> DNA

<213> 人工序列

<400> 15

actcttaata cgactcacta taggg 25

<210> 16

<211> 20

<212> DNA

<213> 人工序列

<400> 16

cggcttaata cgactcacta 20

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号