首页> 中国专利> 诊断儿童呼吸道病毒感染的生物标志物

诊断儿童呼吸道病毒感染的生物标志物

摘要

本发明公开了诊断儿童呼吸道合胞病毒感染的生物标志物,所述生物标志物可以辅助诊断儿童呼吸道合胞病毒感染。本发明同时公开了至少两个与儿童呼吸道合胞病毒相关的生物标志物的组合,所述儿童呼吸道合胞病毒可与生物信息学方法结合使用,本发明还公开了与生物标志物相关的产品。

著录项

  • 公开/公告号CN108866246A

    专利类型发明专利

  • 公开/公告日2018-11-23

    原文格式PDF

  • 申请/专利权人 李然然;

    申请/专利号CN201811049148.9

  • 发明设计人 李然然;

    申请日2018-09-10

  • 分类号

  • 代理机构北京预立生科知识产权代理有限公司;

  • 代理人李红伟

  • 地址 271000 山东省泰安市泰山区泰山大街706号

  • 入库时间 2023-06-19 07:18:36

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-06-04

    授权

    授权

  • 2018-12-18

    实质审查的生效 IPC(主分类):C12Q1/70 申请日:20180910

    实质审查的生效

  • 2018-11-23

    公开

    公开

说明书

技术领域

本发明属于生物医药领域,涉及诊断儿童呼吸道病毒感染的生物标志物。

背景技术

呼吸道合胞病毒(Respiratory syncytial virus,RSV)是近年来临床上小儿呼吸道感染的重要病原之一,该病毒在全球范围内感染,并有明显的季节流行趋势,冬春季节高发。RSV可以引起上呼吸道感染症状(如感冒等),也可以引起下呼吸道感染症状(如细支气管炎和肺炎等)。据美国疾病控制中心(CDC)的数据显示,超过一半的儿童在1岁前都感染过RSV,到2岁几乎所有的儿童都有至少一次RSV感染。25%~40%的儿童有细支气管炎和肺炎的症状,0.5%~2%的儿童因RSV感染需要住院治疗,而严重的RSV感染者可导致死亡。RSV感染能够调节宿主基因表达,影响宿主抗病毒应答和病毒复制,但是目前仍缺乏有效的基因来分析儿童呼吸道合胞病毒感染的发病机理。

高通量测序技术的快速发展和应用,为儿童呼吸道合胞病毒感染发病机理的研究提供了更加全面和快速的分析手段,也为儿童呼吸道合胞病毒感染的进一步治疗方案提供崭新思路。RSV感染可引发全身性免疫应答。在RSV感染过程中,免疫细胞通过血液的运输在循环中发育,进入中央和周围淋巴结器官,最后迁移到感染灶。外周血作为储存免疫细胞的场所,提供了全部的反映免疫相关细胞和信号通路的素材。深入研究儿童呼吸道合胞病毒感染相关基因的调控机制,有助于了解儿童呼吸道合胞病毒感染的遗传分子机制,为呼吸道合胞病毒感染的诊断以及治疗提供理论依据和临床手段。

发明内容

为了弥补现有技术的不足,本发明的目的在于提供可用于诊断儿童呼吸道病毒感染的生物标志物,以期实现儿童呼吸道病毒感染的早期诊断。

为了实现上述目的,本发明采用如下技术方案:

本发明的第一方面提供了检测基因表达水平的试剂在制备诊断儿童呼吸道合胞病毒感染产品中的应用,所述基因包括GYG1、LMNB1的一种或两种。

本发明的第二方面提供了检测基因表达水平的试剂在制备诊断儿童呼吸道合胞病毒感染产品中的应用,所述基因包括GYG1、LMNB1、GPR84或IFI27的两种或多种。

进一步,检测基因表达水平的试剂选自:

特异性识别所述基因的探针;或

特异性扩增所述基因的引物;或

特异性结合所述基因编码的蛋白的特异性结合剂;

本发明的第三方面提供了一种产品,所述述产品包括检测基因表达水平的试剂,所述基因包括GYG1、LMNB1的一种或两种。

本发明的第四方面提供了一种产品,所述述产品包括检测基因表达水平的试剂,所述基因包括GYG1、LMNB1、GPR84或IFI27中的两种或多种。

进一步,所述产品包括芯片、试剂盒、核酸膜条。

进一步,所述试剂选自:

特异性识别所述基因的探针;或

特异性扩增所述基因的引物;或

特异性结合所述基因编码的蛋白的特异性结合剂。

本发明的第五方面提供了本发明第三方面或本发明第四方面所述的产品在制备诊断儿童呼吸道合胞病毒感染的工具中的应用。

本发明的第六方面提供了基因标志物在构建诊断儿童呼吸道合胞病毒感染的计算模型中的应用,所述基因标志物包括GYG1或LMNB1。

本发明的第七方面提供了基因标志物在构建诊断儿童呼吸道合胞病毒感染的计算模型中的应用,所述基因标志物包括GYG1、LMNB1、GPR84或IFI27中的两种或多种。

本发明的优点和有益效果:

本发明首次发现了GYG1和LMNB1与儿童呼吸道合胞病毒感染相关,通过检测受试者外周血中上述基因的表达水平,可以实现儿童呼吸道病毒感染的准确诊断。

本发明首次发现了GYG1、LMNB1、GPR84、IFI27中的几种进行联合诊断,具有较高的特异性和敏感性以及准确性。

附图说明

图1是生物标志物在呼吸道合胞病毒感染儿童中的表达情况图,其中,图A是GYG1,图B是LMNB1,图C是GPR84,图D是IFI27。

具体的实施方式

本发明经过广泛而深入的研究,通过大量筛选,首次发现了在儿童呼吸道合胞病毒感染患者中呈现差异表达的基因,为儿童呼吸道合胞病毒感染的早期检测寻找更好的途径和方法。

基因标志物

“基因标志物”也称为“分子标志物”、“生物标志物”,是在组织或细胞中的表达水平与正常或健康细胞或组织的表达水平相比发生改变的任何基因或蛋白。

本文包含用于检测分子标志物表达的现有技术中任何可用方法。本发明分子标志物的表达可在核酸水平上被检测(如,RNA转录物)或蛋白质水平。通过“检测表达”旨在确定RNA转录物或其分子标志物基因的表达产物的数量或存在。因此,“检测表达”包含一分子标志物被确定不能被表达、不能被检测表达,表达在低水平、表达在正常水平或过表达的实例。为了确定过表达,被检测的所述身体样本能够与相应的来自健康人的身体样本比较。那就是说,所述表达的“正常”水平是分子标志物的表达水平。这个样本可以以标准化形式呈现。在一些实施例中,分子标志物过表达的确定需比较身体样本和相应来自健康人的身体样本。

本领域技术人员将认识到,本发明的实用性并不局限于对本发明的标志物基因的任何特定变体的基因表达进行定量。

作为非限制性的实例,一种代表性的人GYG1、LMNB1、GPR84、IFI27基因的核苷酸序列如目前国际公共核酸数据库GeneBank中NC_000003.12(148991408..149027669)、NC_000005.10(126776623..126837020)、NC_000012.12(54362445..54365224,complement)、NC_000014.9(94110733..94116699)中所示。

本发明的多核苷酸可以是DNA形式或RNA形式。DNA形式包括cDNA、基因组DNA或人工合成的DNA。DNA可以是单链的或是双链的。DNA可以是编码链或非编码链。

本发明的多肽可以是重组多肽、天然多肽、合成多肽,优选重组多肽。本发明的多肽还可包括或不包括起始的甲硫氨酸残基。

编码本发明所述蛋白的成熟多肽的多核苷酸包括:只编码成熟多肽的编码序列;成熟多肽的编码序列和各种附加编码序列;成熟多肽的编码序列(和任选的附加编码序列)以及非编码序列。术语“编码多肽的多核苷酸”可以是包括编码此多肽的多核苷酸,也可以是还包括附加编码和/或非编码序列的多核苷酸。

本发明还涉及上述多核苷酸的变异体,其编码与本发明有相同的氨基酸序列的多肽或多肽的片段、类似物和衍生物。此多核苷酸的变异体可以是天然发生的等位变异体或非天然发生的变异体。这些核苷酸变异体包括取代变异体、缺失变异体和插入变异体。如本领域所知的,等位变异体是一个多核苷酸的替换形式,它可能是一个或多个核苷酸的取代、缺失或插入,但不会从实质上改变其编码多肽的功能。

检测方法

本发明可以使用本领域普通技术人员已知的多种核酸以及蛋白技术进行检测,这些技术包括但不限于:核酸测序、核酸杂交、核酸扩增技术、蛋白免疫技术。

本发明所述核酸扩增技术选自聚合酶链式反应(PCR)、逆转录聚合酶链式反应(RT-PCR)、转录介导的扩增(TMA)、连接酶链式反应(LCR)、链置换扩增(SDA)和基于核酸序列的扩增(NASBA)。其中,PCR需要在扩增前将RNA逆转录成DNA(RT-PCR),TMA和NASBA直接扩增RNA。

通常,PCR使用变性、引物对与相反链的退火以及引物延伸的多个循环,以指数方式增加靶核酸序列的拷贝数;RT-PCR则将逆转录酶(RT)用于从mRNA制备互补的DNA(cDNA),然后将cDNA通过PCR扩增以产生DNA的多个拷贝;TMA在基本上恒定的温度、离子强度和pH的条件下自身催化地合成靶核酸序列的多个拷贝,其中靶序列的多个RNA拷贝自身催化地生成另外的拷贝,TMA任选地包括使用阻断,部分、终止部分和其他修饰部分,以改善TMA过程的灵敏度和准确度;LCR使用与靶核酸的相邻区域杂交的两组互补DNA寡核苷酸。

DNA寡核苷酸在热变性、杂交和连接的重复多个循环中通过DNA连接酶共价连接,以产生可检测的双链连接寡核苷酸产物;SDA使用以下步骤的多个循环:引物序列对与靶序列的相反链进行退火,在存在dNTPαS下进行引物延伸以产生双链半硫代磷酸化的(hemiphosphorothioated)引物延伸产物,半修饰的限制性内切酶识别位点进行的核酸内切酶介导的切刻,以及从切口3'端进行的聚合酶介导引的物延伸以置换现有链并产生供下一轮引物退火、切刻和链置换的链,从而引起产物的几何扩增。

本发明中非扩增或扩增的核酸可通过任何常规的手段检测。

本发明中的核酸杂交技术包括但不限于原位杂交(ISH)、微阵列和Southern或Northern印迹。原位杂交(ISH)是一种使用标记的互补DNA或RNA链作为探针以定位组织一部分或切片(原位)或者如果组织足够小则为整个组织(全组织包埋ISH)中的特异性DNA或RNA序列的杂交。DNA ISH可用于确定染色体的结构。RNA ISH用于测量和定位组织切片或全组织包埋内的mRNA和其他转录本(例如,ncRNA)。通常对样本细胞和组织进行处理以原位固定靶转录本,并增加探针的进入。探针在高温下与靶序列杂交,然后将多余的探针洗掉。分别使用放射自显影、荧光显微术或免疫组织化学,对组织中用放射、荧光或抗原标记的碱基标记的探针进行定位和定量。ISH也可使用两种或更多种通过放射性或其他非放射性标记物标记的探针,以同时检测两种或更多种转录本。

将Southern和Northern印迹分别用于检测特异性DNA或RNA序列。使从样本中提取的DNA或RNA断裂,在基质凝胶上通过电泳分离,然后转移到膜滤器上。使滤器结合的DNA或RNA与和所关注的序列互补的标记探针杂交。检测结合到滤器的杂交探针。该程序的一种变化形式是反向Northern印迹,其中固定到膜的底物核酸为分离的DNA片段的集合,而探针是从组织提取并进行了标记的RNA。

蛋白免疫技术包括夹心免疫测定,例如夹心ELISA,其中使用识别生物标志物上不同表位的两种抗体进行该生物标志物的检测;放射免疫测定(RIA)、直接、间接或对比酶联免疫吸附测定(ELISA)、酶免疫测定(EIA)、荧光免疫测定(FIA)、蛋白质印迹法、免疫沉淀法和基于任何颗粒的免疫测定(如使用金颗粒、银颗粒或乳胶颗粒、磁性颗粒或量子点)。可例如在微量滴定板或条的形式中实施免疫法。

根据本发明的免疫法可基于,例如,以下方法中的任一种。

免疫沉淀法是最简单的免疫测定方法;这种方法测量沉淀物的量,在试剂抗体已与样本一起孵育并与其中存在的靶抗原反应以形成不溶性团聚体之后形成所述沉淀。免疫沉淀反应可以是定性的或是定量的。

在颗粒免疫测定中,多种抗体与该颗粒连接,且所述颗粒能够同时结合很多抗原分子。这大大地加速了可见反应的速度。这允许生物标志物的快速且灵敏的检测。

在免疫比浊法(immunonephelometry)中,抗体和生物标志物上的靶抗原的相互作用引起免疫复合物的形成,所述免疫复合物太小而不能沉淀。但是,这些复合物将散射入射光,这可使用比浊计来测量。可在反应的几分钟之内测定抗原(即生物标志物)的浓度。

放射免疫测定(RIA)法使用放射性同位素例如I125来标记抗原或抗体。所使用的同位素发射γ射线,通常在除去非结合的(游离的)放射性标记之后测量所述射线。与其它的免疫测定相比较,RIA的主要优势在于更高的灵敏度、容易的信号检测和确认的、快速的测定。主要的劣势在于由放射物的使用引起的健康和安全风险和与维护许可放射物安全和处理程序相关的时间和费用。出于该原因,在常规临床实验室实践中,RIA已很大程度上被酶免疫测定所取代。

酶免疫测定(EIA)发展为放射免疫测定(RIA)的替代物。这些方法使用酶来标记抗体或靶抗原。EIA的灵敏度接近RIA的灵敏度,且不存在由放射性同位素引起的危险。用于检测的最广泛使用的EIA方法之一是酶联免疫吸附测定(ELISA)。ELISA方法可使用两种抗体,其一对于靶抗原是特异性的,而另一与酶偶联,酶底物的添加引起化学发光信号或荧光信号的产生。

荧光免疫测定(FIA)指使用荧光标记或酶标记的免疫测定,所述荧光标记或酶标记作用在底物上以形成荧光产物。荧光测量固有地比比色(分光光度法的)测量更加灵敏。因此,FIA方法具有比利用吸收(光密度)测量的EIA方法更高的分析灵敏度。

化学发光免疫测定使用化学发光标记,当其被化学能激发时产生光;使用光检测器测量发射。

因此,可使用熟知的方法进行根据本发明的免疫法。在本发明的生物标志物的检测中可使用任何直接(如使用传感器芯片)或间接的方法。

探针

“探针”是指能够用于测量特定基因的表达情况的分子。示例性探针包括PCR引物以及基因特异性DNA寡核苷酸探针,例如固定于微阵列基底上的微阵列探针、定量核酸酶保护检验探针、与分子条形码连接的探针、以及固定于珠上的探针。

本发明中术语“探针”指能与另一分子的特定序列或亚序列或其它部分结合的分子。除非另有指出,“探针”通常指能通过互补碱基配对与另一多核苷酸(往往称为“靶多核苷酸”)结合的多核苷酸探针。根据杂交条件的严谨性,探针能和与该探针缺乏完全序列互补性的靶多核苷酸结合。探针可作直接或间接的标记,其范围包括引物。杂交方式,包括,但不限于:溶液相、固相、混合相或原位杂交测定法。

作为探针,可以使用荧光标记、放射标记、生物素标记等对癌检测用多核苷酸进行了标记的标记探针。多核苷酸的标记方法本身是公知的。可通过如下方法检查试样中是否存在受试核酸:固定受试核酸或者其扩增物,与标记探针进行杂交,洗涤,以及然后测定与固相结合的标记。备选地,还可固定癌检测用多核苷酸,使受试核酸与其杂交,然后应用标记探针等检测结合于固相上的受试核酸。在这种情况下,结合于固相上的癌检测用多核苷酸也称为探针。使用多核苷酸探针测定受试核酸的方法在本领域也是公知的。可以如下进行该方法:在缓冲液中使多核苷酸探针与受试核酸在Tm或者其附近(优选在±4℃以内)接触用于杂交,洗涤,然后测定杂交的标记探针或者与固相探针结合的模板核酸。

在作为探针使用的多核苷酸的大小优选为18个或更多个核苷酸、更优选为20个或更多个核苷酸,以及编码区域的全长或更少。作为引物使用时,该多核苷酸大小优选为18个或更多个核苷酸,以及50个或更少核苷酸。这些探针具有与靶点基因的特定的碱基序列互补的碱基序列。这里,所谓“互补”,只要是杂交即可,可以不是完全互补。这些多核苷酸通常相对于该特定的碱基序列具有80%以上、优选90%以上、更优选95%以上、特别优选100%的同源性。这些探针可以是DNA,也可以是RNA,另外,可以为在其一部分或全部中核苷酸通过PN、LNA、ENA、GNA、TNA等人工核酸置换得到的多核苷酸。

芯片、试剂盒、核酸膜条

术语“芯片”也称为“阵列”,指包含连接的核酸或肽探针的固体支持物。阵列通常包含按照不同的已知位置连接至基底表面的多种不同的核酸或肽探针。这些阵列,也称为“微阵列”,通常可以利用机械合成方法或光引导合成方法来产生这些阵列,所述光引导合成方法合并了光刻方法和固相合成方法的组合。阵列可以包含平坦的表面,或者可以是珠子、凝胶、聚合物表面、诸如光纤的纤维、玻璃或任何其它合适的基底上的核酸或肽。可以以一定的方式来包装阵列,从而允许进行全功能装置的诊断或其它方式的操纵。

“微阵列”是杂交阵列原件有序排列在基质上,所述杂交阵列原件诸如聚核苷酸探针(例如寡核苷酸)或结合剂(例如抗体)。所述基质可以是固体基质,例如,玻璃或二氧化硅玻片、珠、纤维光学粘结剂或半固态基质,例如硝酸纤维素膜。核苷酸序列可以是DNA、RNA或其中的任何排列。

各种探针阵列已经描述在文献中并且可以用于本发明上下文中检测可能与本文所述表型相关的标志物。例如,DNA探针阵列芯片或较大的DNA探针阵列晶片(否则,可以通过打断晶片而获得各个体芯片)用于本发明的一个实施方案。DNA探针阵列晶片一般包含玻璃晶片,其上放置了高密度DNA探针(短DNA片段)阵列。这些晶片各自可以保持例如约6000万个用于识别较长样品DNA序列(例如,来自个体或群体,例如,包含所关注的标志物)的DNA探针。用玻璃晶片上的DNA探针组识别样品DNA通过DNA杂交进行。当DNA样品与DNA探针阵列杂交时,样品结合于样品DNA序列互补的那些探针。通过评价个体样品DNA与那些探针更稳固地杂交,有可能确定已知的核酸序列是否存在于样品中,由此确定核酸中发现的标志物是否存在。还可以使用这一手段通过控制杂交条件以允许区别单一核苷酸,例如,用于SNP鉴定和一种或多种SNP的样品基因分型来进行ASH。阵列提供了一种同时(或串连)检测多个多态性标志物的便利性实施方案。

在本发明中,核酸膜条包括基底和固定于所述基底上的寡核苷酸探针;所述基底可以是任何适于固定寡核苷酸探针的基底,例如尼龙膜、硝酸纤维素膜、聚丙烯膜、玻璃片、硅胶晶片、微缩磁珠等。

本发明中,试剂盒可用于检测本发明所述基因或蛋白(GYG1、LMNB1、GPR84、IFI27)的表达水平,包含用于基因检测和/或定量的本发明的配体、和/或芯片。任选的与试剂盒的说明书在一起。

试剂盒包括一种或多种无菌容器,这样的容器可以是盒、安瓿、瓶子、管形瓶、管、袋、小袋、泡罩包装、或本领域已知的其它合适的容器形式。这样的容器可以由塑料、玻璃、层压纸、金属箔、或适于容器药物的其它材料。

在本发明中,术语“包括”用于指短语“包括但不限于”,并与短语“包括但不限于”可以互换使用。

特异性结合剂

在本发明的优选实施方案中,测定本发明所述基因编码的蛋白的浓度。在一个实施方案中,在体外通过使用特异性结合剂自样品中特异性测定标志物蛋白质的浓度。

特异性结合剂是例如蛋白质的受体、结合蛋白质的凝集素、针对蛋白质的抗体、针对蛋白质的肽抗体(peptidebody)、双特异性双重结合剂或双特异性抗体形式。特异性结合剂对它的对应靶分子至少具有107mol/l的亲和力。特异性结合剂对它的靶分子优选具有108mol/l或还优选109mol/l的亲和力。

特异性结合剂的例子是肽、肽模拟物、aptamer、spiegelmer、darpin、锚蛋白重复蛋白、Kunitz型域、抗体、单域抗体和单价抗体片段。

在某些实施方案中,特异性结合剂是抗体或单价抗体片段,优选自单克隆抗体衍生的单价片段。

单价抗体片段包括但不限于Fab、Fab’-SH、单域抗体、Fv、和scFv片段,如下文提供的。

术语“抗体”在本文中以最广义使用,而且明确覆盖单克隆抗体、多克隆抗体、自至少两种完整抗体形成的多特异性抗体(例如双特异性抗体)、及抗体片段,只要它们展现期望的生物学活性。在某些优选实施方案中,特异性结合剂是抗体或单价抗体片段,优选自单克隆抗体衍生的单价片段。

“单克隆抗体”指从一群基本上同质的抗体获得的抗体,即构成群体的各个抗体相同和/或结合相同表位,除了生产单克隆抗体的过程中可能产生的可能变体外,此类变体一般以极小量存在。此类单克隆抗体典型的包括包含结合靶物的多肽序列的抗体,其中靶物结合多肽序列是通过包括从众多多肽序列中选择单一靶物结合多肽序列在内的过程得到的。

单克隆抗体还包括“嵌合”抗体,其中重链和/或轻链的一部分与衍生自特定物种或属于特定抗体类别或亚类的抗体中的相应序列相同或同源,而链的剩余部分与衍生自另一物种或属于另一抗体类别或亚类的抗体中的相应序列相同或同源,以及此类抗体的片段,只要它们展现出期望的生物学活性即可。

非人(例如鼠)抗体的“人源化”形式指最低限度包含衍生自非人免疫球蛋白的序列的嵌合免疫球蛋白、免疫球蛋白链或其片段诸如Fv、Fab、Fab’、F(ab’)2或抗体的其它抗原结合子序列。

“抗体片段”包含全长抗体的一部分,一般是其抗原结合区或可变区。抗体片段的例子包括Fab、Fab′、F(ab′)2和Fv片段;双抗体;线性抗体;单链抗体分子;及由抗体片段形成的多特异性抗体。

“Fv”是包含完整抗原识别和结合位点的最小抗体片段。该片段由紧密、非共价结合的一个重链可变域和一个轻链可变域的二聚体组成。从这两个结构域的折叠结构中散发出六个高变环(重链和轻链各3个环),促成结合抗原的氨基酸残基并赋予抗体以抗原结合特异性。然而,即使是单个可变域(或是只包含对抗原特异的三个CDR的半个Fv)也可具有识别和结合抗原的能力,只是亲和力低于完整结合位点。

本发明的抗体的“功能性片段”指那些保留与衍生它们的完整全链分子以基本上相同的亲和力结合多肽且在至少一种测定法中有活性(例如抑制TH2诱导的哮喘途径,诸如在小鼠模型中,或在体外抑制抗体片段结合的抗原的生物学活性)的片段。

多克隆抗体包含对产生人抗体的动物(例如,小鼠)免疫所述蛋白质而得的抗体。当制备了嵌合抗体或人源化抗体之后,可以将可变区(例如,FR)和/或恒定区中的氨基酸用其他氨基酸替换等。

标志物组合

本发明涉及基因标志物进行评估儿童呼吸道合胞病毒感染的用途,此类标志物包括GYG1、LMNB1、GPR84、IFI27的一种或多种。

正如熟练技术人员会领会的,有多种方式使用两种或更多种标志物的测量来改进调查中的诊断问题。

生化标志物可以个别测定,或者在本发明的一个实施方案中,它们可以同时测定,例如使用芯片或基于珠的阵列技术。然后独立解读生物标志物的浓度,例如使用每种标志物的个别截留,或者它们组合进行解读。

正如熟练技术人员会领会的,可以以不同方式实施和实现将标志物水平与某种可能性或风险关联起来的步骤。优选地,在数学上组合蛋白质和一种或多种其它标志物的测定浓度,并将组合值与根本的诊断问题关联起来。可以通过任何适宜的现有技术数学方法将标志物值的测定组合。

优选地,在标志物组合中应用的数学算法是一种对数函数。优选地,应用此类数学算法或此类对数函数的结果是单一值。根据根本的诊断问题,能容易地将此类值与例如个体关于儿童呼吸道合胞病毒感染的风险或与有助于评估儿童呼吸道合胞病毒感染患者的其它有意诊断用途关联起来。以一种优选的方式,此类对数函数是如下获得的:a)将个体分类入组,例如正常人、有儿童呼吸道合胞病毒感染风险的个体、具有儿童呼吸道合胞病毒感染的患者等等,b)通过单变量分析来鉴定在这些组之间差异显著的标志物,c)对数回归分析以评估标志物的可用于评估这些不同组的独立差别值,并d)构建对数函数来组合独立差别值。在这种类型的分析中,标志物不再是独立的,而是代表一个标志物组合。

用于将标志物组合与疾病关联起来的对数函数优选采用通过应用统计方法开发和获得的算法。例如,适宜的统计方法是判别分析(DA)(即线性、二次、规则DA)、Kernel方法(即SVM)、非参数方法(即k-最近邻居分类器)、PLS(部分最小二乘)、基于树的方法(即逻辑回归、CART、随机森林方法、助推/装袋方法)、广义线性模型(即对数回归)、基于主分量的方法(即SIMCA)、广义叠加模型、基于模糊逻辑的方法、基于神经网络和遗传算法的方法。熟练技术人员在选择适宜的统计方法来评估本发明的标志物组合并由此获得适宜的数学算法方面不会有问题。在一个实施方案中,用于获得评估儿童呼吸道合胞病毒感染中使用的数学算法的统计方法选自DA(即线性、二次、规则判别分析)、Kernel方法(即SVM)、非参数方法(即k-最近邻居分类器)、PLS(部分最小二乘)、基于树的方法(即逻辑回归、CART、随机森林方法、助推方法)、或广义线性模型(即对数回归)。

接受者操作曲线下面积(=AUC)是诊断规程的性能或精确性的一项指标。诊断方法的精确性由它的接受者操作特征(ROC)描述得最好。ROC图是源自在观察的整个数据范围上连续改变决策阈的所有灵敏度/特异性对的线图。

实验室测试的临床性能取决于它的诊断精确性,或将受试者正确分类入临床有关亚组的能力。诊断精确性测量测试正确辨别所调查的受试者的两种不同状况的能力。此类状况是例如健康和疾病或者疾病进展对无疾病进展。

在每种情况中,ROC线图通过对于决策阈的整个范围将灵敏度对1-特异性绘图来描绘两种分布之间的交叠。y轴上是灵敏度,或真阳性分数[定义为(真阳性测试结果的数目)/(真阳性的数目+假阴性测试结果的数目)]。这也称作疾病或状况的存在的阳性。它仅仅自受影响亚组来计算。x轴上是假阳性分数,或1-特异性[定义为(假阳性结果的数目)/(真阴性的数目+假阳性结果的数目)]。它是特异性的一项指标,而且完全自不受影响的亚组来计算。因为真和假阳性分数通过使用来自两个不同亚组的测试结果完全分开计算,所以ROC线图不依赖于样品中疾病的流行程度。ROC线图上的每个点代表一个对应于特定决策阈的灵敏度/1-特异性对。一项具有完美区分(两种结果分布没有交叠)的测试具有通过左上角的ROC线图,那里真阳性分数为1.0,或100%(完美灵敏度),且假阳性分数为0(完美特异性)。一项不区分(两个组的结果分布相同)的测试的理论线图是从左下角到右上角的45°对角线。大多数线图落在这两种极端之间。(如果ROC线图完全落在45°对角线以下,那么这容易通过将“阳性”的标准从“大于”颠倒成“小于”或反之来矫正。)定性地,线图越接近左上角,测试的整体精确性越高。

量化实验室测试的诊断精确性的一项便利目标是通过单一数值来表述它的性能。最常见的全局度量是ROC曲线下面积(AUC)。常规地,此面积总是≥0.5(如果不是这样,那么可以颠倒决策规则来使之这样)。数值范围介于1.0(完美分开两个组的测试值)和0.5(两个组的测试值之间没有明显分布差异)之间。面积不仅取决于线图的特定部分诸如最接近对角线的点或90%特异性处的灵敏度,而且还取决于整个线图。这是ROC线图如何接近完美者(面积=1.0)的一种定量、描述性表述。

整体测定法灵敏度会取决于实施本文公开的方法要求的特异性。在某些优选设置中,特异性75%可能是充分的,而且统计方法和所得算法可以基于此特异性要求。在一个优选实施方案中,用于评估有儿童呼吸道合胞病毒感染风险的个体的方法基于特异性80%、85%、或还优选90%或95%。

某些标志物组合在筛选儿童呼吸道合胞病毒感染中会是有利的。

在一个实施方案中,本发明致力于通过生化标志物评估儿童呼吸道合胞病毒感染的体外方法,包括测定样品中GYG1、LMNB1、GPR84、IFI27中的一种或多种,其中显著差异于参照浓度指示儿童呼吸道合胞病毒感染的存在。

作为优选的实施方案,所述的基因标志物为GYG1、LMNB1、GPR84的一种或几种与IFI27的组合;在一个优选的实施方案中,所述基因标志物为GYG1和IFI27;在又一个优选的实施方案中,所述基因标志物为LMNB1和IFI27;在又一个实施方案中,所述基因标志物为GPR84和IFI27;在又一个实施方案中,所述基因标志物为GYG1、LMNB1和IFI27;在又一个实施方案中,所述基因标志物为GYG1、GPR84和IFI27;在又一个实施方案中,所述基因标志物为LMNB1、GPR84和IFI27;在又一个实施方案中,所述基因标志物为GYG1、LMNB1、GPR84和IFI27。

下面结合实施例对本发明作进一步详细的说明。

以下实施例仅用于说明本发明而不用于限制本发明的范围。

实施例1筛选与儿童呼吸道合胞病毒感染相关的基因标志物

1、样品收集

各收集5例正常儿童血液和儿童呼吸道合胞病毒感染患者的血液样本,写明样本名称、编号、取样日期、样本处理过程等情况,上述所有标本的取得均通过伦理委员会的同意。

2、RNA样品的制备

利用Invitrogen的血液RNA提取试剂盒提取RNA样品,具体操作详见说明书。

3、RNA样品的质量分析

将上述提取的RNA进行琼脂糖凝胶电泳,利用Nanodrop2000对所提RNA的浓度和纯度进行检测,琼脂糖凝胶电泳检测RNA完整性,Agilent2100测定RIN值。单次建库要求RNA总量5ug,浓度≥200ng/μL,OD260/280介于1.8~2.2之间。

4、构建cDNA文库

使用Ribo-Zero试剂盒除去总RNA中的核糖体RNA,利用Illumina TruseqTM RNA sample Prep Kit进行cDNA文库的构建,具体操作按说明书进行。

5、上机测序

使用Illumina x-ten测序平台对cDNA文库进行测序,具体操作按说明书进行。

6、高通量转录组测序数据分析

对测序结果进行生物信息学分析,利用TopHat v1.3.1进行RNA-seq读段定位,将有效数据比对到人参考基因组上,采用metaMA包分析,meta分析中p值合并所用方法为inverse normal method。当FDR<0.05,|Combined.ES|>0.8,认为基因显著差异表达

7、结果

测序结果显示,GYG1、LMNB1、GPR84与IFI27在儿童呼吸道病毒感染患者中呈现显著性上调。

实施例2QPCR测序验证基因的差异表达

1、根据高通量测序的检测结果对差异表达基因进行大样本QPCR验证。按照实施例1中的样本收集方式选择呼吸道合胞病毒感染的患者血液45例和正常儿童血液18例。

2、RNA提取

利用Invitrogen的血液RNA提取试剂盒提取RNA样品,具体操作详见说明书。

3、逆转录:

使用TAKARA公司的反转录试剂盒进行操作。具体步骤如下:

(1)取总RNA2μg进行逆转录,加入Oligo(dT)2μl,充分混匀。70℃水浴5分钟后立即冰浴2-3分钟。

(2)构建25μl反应体系,其中包括5×逆转录缓冲液5μl,dNTP(2.5mM)5μl,RNasin 40U/μl,M-MLV 200U/μl,补无核酶水至预期体积。

(3)42℃水浴60分钟后,95℃水浴5分钟以灭活M-MLV。

(4)-20℃储存备用。

4、QPCR扩增

(1)引物设计

根据Genbank中基因和GAPDH基因的编码序列设计QPCR扩增引物,由上海生工生物工程技术服务有限公司合成。具体引物序列如下:

GYG1基因:

正向引物为5’-ACTGCTGGTCGCTTACAC-3’(SEQ ID NO.1);

反向引物为5’-TGCTGCTGACAATTCTTCTCT-3’(SEQ ID NO.2);

LMNB1基因:

正向引物为5’-GAGTAGTAGTGTTAGCATCT-3’(SEQ ID NO.3);

反向引物为5’-TGTTCTTCAAGCGGATAA-3’(SEQ ID NO.4);

GPR84基因:

正向引物为5’-GAAGGTGACTCGAATGTG-3’(SEQ ID NO.5);

反向引物为5’-ATGTTGAGCAGCAAGAAG-3’(SEQ ID NO.6);

IFI27基因:

正向引物为5’-ACTGGGAGCAACTGGACT-3’(SEQ ID NO.7);

反向引物为5’-CAATGACAGCCGCAATGG-3’(SEQ ID NO.8);

GAPDH基因:

正向引物为5’-TTTAACTCTGGTAAAGTGGATAT-3’(SEQ ID NO.9);

反向引物为5’-GGTGGAATCATATTGGAACA-3’(SEQ ID NO.10)。

(2)PCR反应体系:正向引物和反向引物各0.6μl,2×SuperReal PreMix Plus 10μl,DNA模板2μl,ddH2O>△2μl,灭菌蒸馏水4.8μl。

(3)PCR反应条件:95℃15min,(95℃10s,55℃30s,72℃32s)×40个循环,95℃15s,60℃60s,95℃15s。在ABI 7300型荧光定量PCR仪上进行PCR反应,通过融解曲线分析和电泳确定目的条带,ΔΔCT法进行相对定量。

5、统计学方法

实验采用3次重复实验,结果数据都是以平均值±标准差的方式来表示,使用SPSS13.0统计软件来进行统计分析的,两者之间的差异采用t检验,认为当P<0.05时具有统计学意义。

6、结果

结果如图1所示,与正常儿童相比,GYG1、LMNB1、GPR84与IFI27在呼吸道合胞病毒感染儿童血液中的表达显著上调,差异具有统计学意义(P<0.05),同RNA-sep结果一致。

实施例3差异表达基因的ROC分析

对上面筛选差异表达的4个基因进行组合,采用ROC曲线法以及计算曲线下面积(AUC)以评价有意义的影响因素对于儿童呼吸道合胞病毒感染的诊断价值,AUC及其95%可信区间通过MedCalc进行评估,根据AUC值不同可以划分为无预测性能(AUC<0.5),低预测性能(0.5≤AUC≤0.7),中度预测性能(0.7≤AUC≤0.9)和高预测性能(0.9≤AUC≤1),P<0.05为差异有统计学意义。

结果如表1所示,基因联合检测诊断儿童呼吸道合胞病毒感染曲线下面积为0.878~0.986;提示GYG1、LMNB1、GPR84与IFI27应用于诊断儿童呼吸道合胞病毒感染具有较高准确性。

表1差异表达基因的曲线下面积

基因AUCGYG10.895LMNB10.878GRP840.907IFI270.941GYG1+LMNB10.896GYG1+GRP840.916GYG1+IFI270.979LMNB1+GRP840.919LMNB1+IFI270.968GRP84+IFI270.986GYG1+LMNB1+GRP840.924GYG1+LMNB1+IFI270.975GYG1+GRP84+IFI270.982LMNB1+GRP84+IFI270.977GYG1+LMNB1+GRP84+IFI270.974

上述实施例的说明只是用于理解本发明的方法及其核心思想。应当指出,对于本领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也将落入本发明权利要求的保护范围内。

序列表

<110> 李然然

<120> 诊断儿童呼吸道病毒感染的生物标志物

<160> 10

<170> SIPOSequenceListing 1.0

<210> 1

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 1

actgctggtc gcttacac 18

<210> 2

<211> 21

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 2

tgctgctgac aattcttctc t 21

<210> 3

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 3

gagtagtagt gttagcatct 20

<210> 4

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 4

tgttcttcaa gcggataa 18

<210> 5

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 5

gaaggtgact cgaatgtg 18

<210> 6

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 6

atgttgagca gcaagaag 18

<210> 7

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 7

actgggagca actggact 18

<210> 8

<211> 18

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 8

caatgacagc cgcaatgg 18

<210> 9

<211> 23

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 9

tttaactctg gtaaagtgga tat 23

<210> 10

<211> 20

<212> DNA

<213> 人工序列(Artificial Sequence)

<400> 10

ggtggaatca tattggaaca 20

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号