首页> 中国专利> 与阻塞性睡眠呼吸暂停相关的组合物和方法

与阻塞性睡眠呼吸暂停相关的组合物和方法

摘要

本发明的技术涉及用于诊断一种在儿童中观察到的常见病即阻塞性睡眠呼吸暂停的方法和组合物。在一些实施方案中,提供涉及使用新的生物标志物来诊断阻塞性睡眠呼吸暂停的方法和组合物。

著录项

  • 公开/公告号CN105229165A

    专利类型发明专利

  • 公开/公告日2016-01-06

    原文格式PDF

  • 申请/专利权人 芝加哥大学;

    申请/专利号CN201480026312.8

  • 发明设计人 大卫·戈扎尔;莱芙·贝克尔;

    申请日2014-03-07

  • 分类号C12Q1/37(20060101);G01N33/68(20060101);G01N33/573(20060101);H01J49/26(20060101);

  • 代理机构北京柏杉松知识产权代理事务所(普通合伙);

  • 代理人王春伟;刘继富

  • 地址 美国伊利诺斯州

  • 入库时间 2023-12-18 13:28:42

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-10-18

    授权

    授权

  • 2016-02-17

    实质审查的生效 IPC(主分类):C12Q1/37 申请日:20140307

    实质审查的生效

  • 2016-01-06

    公开

    公开

说明书

相关申请的交叉引用

本申请要求2013年3月7日提交的美国临时申请第61/773,936号的优先权权益,所述临时申请通过引用完整地并入本文。

发明背景

I.技术领域

本发明一般涉及阻塞性睡眠呼吸暂停的领域。更具体地,其涉及用于诊断阻塞性睡眠呼吸暂停的方法和组合物。

II.背景技术

阻塞性睡眠呼吸暂停(OSA)是影响最多达到2%至3%儿童的普遍疾病。其导致大量的神经认知、行为、代谢和心血管的发病率(LumengandChervin,2008;Capdevila等人,2008)。该病情的特征在于在睡眠期间上呼吸道的部分或完全阻塞的重复事件,这导致整个夜晚期间血碳酸过多、血氧过少和觉醒的重复发作(Muzumdar和Arens,2008)。儿科睡眠呼吸暂停是常见疾病,其主要由增大的扁桃体和腺样体在睡眠期间在上呼吸道的开口上撞击引起。导致在之后进展为阻塞性睡眠呼吸暂停的儿童中扁桃体和腺样体增殖和增大的机制仍是未知的。扁桃体腺样体肥大是儿童OSA的主要病理生理学因素(Arens等人,2003;Katz和D'Ambrosio,2008)。然而,对良性滤泡性淋巴增殖、肥大、和增生的调节的潜在机制理解得差,严重限制了预测有风险进展成扁桃体腺样体增大和OSA的儿童。一些流行病学研究已经证明如吸烟环境、过敏和并发的呼吸系统感染的因素与打鼾儿童的上呼吸道中淋巴结样组织的暂时性或持续性肥大有关(Kaditis等人,2004;Teculescu等人,1992;Ersu等人,2004)。令人关注地,这些风险因素全部都涉及炎症反应的产生,这表明炎症反应会促进到淋巴结样组织的增殖信号的发生和维持。

用于OSA的金标准诊断方法是整夜睡眠研究或多导睡眠图。尽管该方法是可靠的,但该方法具有与其在临床环境中的执行有关的问题。实际上,多导睡眠图是劳动密集型的、不方便且昂贵,这导致长的等待时间和不必要的诊断与治疗的推迟。因此,需要全新的诊断策略。

发明内容

实施方案涉及提供用于解决OSA的诊断应用的组合物和方法。

在一些方面,实施方案提供用于识别患有阻塞性睡眠呼吸暂停(OSA)的对象的方法,其包括测量来自对象的生物样品的由表1中所列出一种或更多种基因编码的一种或更多种蛋白质的表达水平,和基于一种或更多种蛋白质的表达水平识别患有OSA的对象。在一些实施方案中,方法包括将一种或更多种蛋白质的表达水平与对照或参考水平进行比较。在一些实施方案中,与对照或参考水平相比一种或更多种蛋白质的升高的表达水平表明对象可能患有OSA。在一些实施方案中,与对照或参考水平相比一种或更多种蛋白质的较低的表达水平表明对象可能患有OSA。对照可以是任何合适的标准物。在一些实施方案中,对照是来自已知未患有OSA的对象的对照样品中的一种或更多种蛋白质的表达水平。在一些实施方案中,相对于样品中相应标准蛋白质的表达水平对一种或更多种蛋白质的表达水平进行标准化。在一些实施方案中,标准蛋白质是由表1中所列出一种或更多种基因编码的蛋白质。

在一些实施方案中,测试至少2、3、4、5、6、7、8、9或10种蛋白质的表达水平。在一些实施方案中,一种或更多种蛋白质是由表1中所列出基因编码的。在一些实施方案中,一种或更多种蛋白质是由选自CD14、CTSB、HPX、DPP4、TTR、DEFB1|HBD1、FABP3、CP和AZGP1的基因编码的。在一些实施方案中,一种或更多种蛋白质是由选自HPX、DPP4、CP和AZGP1的一种或更多种基因编码的。

在一些实施方案中,方法还包括从对象获得生物样品。样品可以是任何合适的样品。在一些实施方案中,样品是尿样品。在一些实施方案中,相应标准蛋白质是尿肌酸酐。在一些实施方案中,可以在一天的特定时间收集样品。在一些实施方案中,在晨间收集样品,这是指在中午12点之前收集。在一些实施方案中,在醒来的1或2小时内收集样品。在一些实施方案中,在晚上收集样品。在一些实施方案中,在晚上收集样品,这是指在对对象而言在下午4点之后收集。在其他实施方案中,在对象已经醒来至少8小时或至少12小时后收集样品。在一些实施方案中,在对象已经醒来小于1小时后收集样品。在一些实施方案中,对象疑似患有OSA。

在一些实施方案中,对象为男性。在一些实施方案中,对照是对照男性中一种或更多种蛋白质的表达水平。在一些实施方案中,已知对照男性患有OSA。在一些实施方案中,已知对照男性未患有OSA。在一些实施方案中,对象为女性。在一些实施方案中,对照是对照女性中一种或更多种蛋白质的表达水平。在一些实施方案中,已知对照女性患有OSA。在一些实施方案中,已知对照女性未患有OSA。

在一些实施方案中,方法还包括使用计算机算法来评价所测量的选自表1的一种或更多种基因的表达水平。在一些实施方案中,方法还包括确定对象患有OSA的风险评分。在一些实施方案中,方法还包括测量RNA转录物的表达水平。在一些实施方案中,使用与RNA转录物互补的DNA来测量RNA转录物的表达水平。在一些实施方案中,使用扩增或杂交分析来测量RNA转录物的表达水平。在一些实施方案中,测量蛋白质的表达水平。在一些实施方案中,使用一种或更多种结合多肽来测量蛋白质的表达水平。在一些实施方案中,一种或更多种结合多肽是抗体。

在一些实施方案中,方法还包括对对象进行睡眠研究。在一些实施方案中,睡眠研究包括以下的一种或更多种:使用多导睡眠图(PSG),进行多次睡眠潜伏期试验(MSLT),或进行清醒度维持测试(MWT)。在一些实施方案中,睡眠研究包括测量对象睡眠时的一种或更多种生理特征。在一些实施方案中,生理特征包括以下的一种或更多种:脑活动、心率、心律、血压、呼气中呼出的二氧化碳、和血含氧量。在一些实施方案中,睡眠研究包括使用活动记录器。在一些实施方案中,在测量对象中的表达水平之后进行睡眠研究。

在一些实施方案中,实施方案提供用于确定对象是否患有阻塞性睡眠呼吸暂停(OSA)的方法,其包括分析来自对象的生物样品的由表1中所列出基因编码的一种或更多种蛋白质的表达水平,和计算生物样品的风险评分,所述风险评分指示对象患有OSA的可能性。在一些实施方案中,计算风险评分包括使用计算机和算法。在一些实施方案中,计算风险评分包括对表达水平中的每一个应用模型系数。在一些实施方案中,方法还包括识别具有指示50%可能性或更大可能性患有OSA的风险评分的患者。在具体的实施方案中,计算风险评分涉及在计算机上使用或运行计算机算法或程序。在其他实施方案中,报道了风险评分。在其他实施方案中,对象被识别为具有指示患有OSA的风险评分。

在一些方面,本发明提供用于确定男性对象是否患有阻塞性睡眠呼吸暂停(OSA)的方法,其包括测量来自对象的生物样品的由表1中所列出基因编码的一种或更多种蛋白质的表达水平,和基于一种或更多种蛋白质的表达水平评估对象是否患有OSA。在一些实施方案中,一种或更多种蛋白质是由选自DPP4、HPX和CP的基因编码的。在一些实施方案中,方法还包括从对象获得生物样品。样品可以是任何合适的样品。在一些实施方案中,样品是尿样品。在一些实施方案中,相应标准蛋白质是尿肌酸酐。在一些实施方案中,可以在一天的特定时间收集样品。在一些实施方案中,在晨间收集样品,这是指在中午12点之前收集。在一些实施方案中,在醒来的1或2小时内收集样品。在一些实施方案中,在晚上收集样品。在一些实施方案中,在晚上收集样品,这是指在对对象而言在下午4点之后收集。在其他实施方案中,在对象已经醒来至少8小时或至少12小时后收集样品。在一些实施方案中,在对象已经醒来小于1小时后收集样品。在一些实施方案中,对象疑似患有OSA。在一些实施方案中,与对照相比一种或更多种蛋白质的较低的表达水平表明对象可能患有OSA。在一些实施方案中,对照是对照男性中一种或更多种蛋白质的表达水平。在一些实施方案中,已知对照男性患有OSA。在一些实施方案中,已知对照男性未患有OSA。在一些实施方案中,对照是对照女性中一种或更多种蛋白质的表达水平。

在一些方面,实施方案提供用于确定女性对象是否患有阻塞性睡眠呼吸暂停(OSA)的方法,其包括确定来自对象的生物样品的由表1中所列出基因编码的一种或更多种蛋白质的表达水平,和基于一种或更多种蛋白质的表达水平评估对象是否患有OSA。在一些实施方案中,一种或更多种蛋白质是由AZGP1编码的。在一些实施方案中,方法还包括从对象获得生物样品。样品可以是任何合适的样品。在一些实施方案中,样品是尿样品。在一些实施方案中,相应标准蛋白质是尿肌酸酐。在一些实施方案中,可以在一天的特定时间收集样品。在一些实施方案中,在晨间收集样品,这是指在中午12点之前收集。在一些实施方案中,在醒来的1或2小时内收集样品。在一些实施方案中,在晚上收集样品。在一些实施方案中,在晚上收集样品,这是指在对对象而言在下午4点之后收集。在其他实施方案中,在对象已经醒来至少8小时或至少12小时后收集样品。在一些实施方案中,在对象已经醒来小于1小时后收集样品。在一些实施方案中,对象疑似患有OSA。在一些实施方案中,与对照相比一种或更多种蛋白质的升高的表达水平表明对象可能患有OSA。在一些实施方案中,对照是对照女性中一种或更多种蛋白质的表达水平。在一些实施方案中,已知对照女性患有OSA。在一些实施方案中,已知对照女性未患有OSA。在一些实施方案中,对照是对照男性中一种或更多种蛋白质的表达水平。

在一些方面,实施方案提供用于评估对象的阻塞性睡眠呼吸暂停的方法,其包括在基于测量从对象获得的尿样品中表1所列出一种或更多种基因的表达水平确定对象患有睡眠呼吸暂停后对对象进行睡眠研究。在一些实施方案中,睡眠研究包括以下的一种或更多种:使用多导睡眠图(PSG),进行多次睡眠潜伏期试验(MSLT),或进行清醒度维持测试(MWT)。在一些实施方案中,睡眠研究包括测量对象睡眠时的一种或更多种生理特征。在一些实施方案中,生理特征包括以下的一种或更多种:脑活动、心率、心律、血压、呼气中呼出的二氧化碳、和血含氧量。在一些实施方案中,睡眠研究包括使用活动记录器。

在一些方面,提供用于识别患有高危型阻塞性睡眠呼吸暂停(OSA)的对象的方法,其包括a)测量来自对象的生物样品的表1或表2中所列出一种或更多种基因的一种或更多种产物的表达水平,和b)基于一种或更多种产物的表达水平识别患有高危型OSA的对象。在一些方面,提供用于识别有风险患有高危型阻塞性睡眠呼吸暂停(OSA)的对象的方法,其包括a)测量来自对象的生物样品的表1或表2中所列出一种或更多种基因的一种或更多种产物的表达水平,和b)基于一种或更多种产物的表达水平识别有风险患有高危型OSA的对象。高危型OSA应理解为与以下有关的OSA:神经认知损伤,如记忆损伤、陈述性记忆缺陷、学习延迟、和学业表现的问题;情绪相关的病症,如抑郁症;行为问题,如ADHD、攻击行为、注意迟钝、易冲动和过度嗜睡;心血管危险,包括高血压、动脉粥样硬化、肺动脉高血压和左心室功能障碍;代谢障碍,如血脂异常和胰岛素抗性。在一些方面,提供用于识别有增加的风险患有以下疾病的对象的方法:神经认知损伤,如记忆损伤、陈述性记忆缺陷、学习延迟、和学业表现的问题;情绪相关的疾病,如抑郁症;行为问题,如ADHD、攻击行为、注意迟钝、易冲动和过度嗜睡;心血管危险,包括高血压、动脉粥样硬化、肺动脉高血压、左心室功能障碍;代谢障碍;如血脂异常和胰岛素抗性,所述方法包括a)测量来自对象的生物样品的表1或表2中所列出一种或更多种基因的一种或更多种产物的表达水平,和b)基于一种或更多种产物的表达水平识别有增加的风险患有以下疾病的对象:神经认知损伤,如记忆损伤、陈述性记忆缺陷、学习延迟、和学业表现的问题;情绪相关的疾病,如抑郁症;行为问题,如ADHD、攻击行为、注意迟钝、易冲动和过度嗜睡;心血管危险,包括高血压、动脉粥样硬化、肺动脉高血压、左心室功能障碍;代谢障碍,如血脂异常和胰岛素抗性。

在一些实施方案中,将一种或更多种产物的表达水平与对照或参考水平进行比较。对照或参考水平可以是任何合适的水平。在一些实施方案中,与对照或参考水平相比一种或更多种产物的升高的表达水平表明对象可能患有具有陈述性记忆缺陷的OSA。在一些实施方案中,与对照或参考水平相比一种或更多种产物的较低的表达水平表明对象可能患有具有陈述性记忆缺陷的OSA。在一些实施方案中,对照是来自已知未患有OSA的对象的对照样品中一种或更多种产物的表达水平。在一些实施方案中,对照是来自已知患有OSA的对象的对照样品中一种或更多种产物的表达水平。在一些实施方案中,相对于样品中相应标准产物的表达水平对一种或更多种产物的表达水平进行标准化。

在一些实施方案中,测试至少2、3、4、5、6、7、8、9或10种蛋白质的表达水平。在一些实施方案中,一种或更多种蛋白质是由表1或表2中所列出基因编码的。在一些实施方案中,一种或更多种产物是由选自以下的基因编码的一种或更多种蛋白质:RNASE1、COL12A1、RNASE2、CD59、FN1、AMBP、FBN1、PIK3IP1、CDH1、CDH2、PLG、SLURP1、FN1cDNAFLJ53292、TNC、C1RL、A1BG、PGLYRP2、OSCAR、AZGP1、CEL、CFI、CILP2、VASN、PLAU、SERPINA1、CD14、LRP2、CLU、FGA、NID1、APOD、SERPING1、CADM4、CP、IGHA1、PGLYRP1、ROBO4、SERPINA5、MASP2、HPX、IGHV4-31、IGHG1、MXRA8、AMY1C、AMY1A、AMY1B、AMY2A、COL6A1、EGF、PROCR、PIGR、ITIH4、CUBN、LMAN2、TF和KNG1。在一些实施方案中,一种或更多种产物是由选自以下的一种或更多种基因编码的一种或更多种蛋白质:KNG1、PIGR、PROCR、HPX、CP、RNASE1、COL12A1、CD59、APOH和CTBS。在一些实施方案中,一种或更多种产物是由选HPX和CP的一种或更多种基因编码的一种或更多种蛋白质。

在一些实施方案中,方法还包括从对象获得生物样品。样品可以是任何合适的样品。在一些实施方案中,样品是尿样品。在一些实施方案中,相应标准蛋白质是尿肌酸酐。在一些实施方案中,可以在一天的特定时间收集样品。在一些实施方案中,在晨间收集样品,这是指在中午12点之前收集。在一些实施方案中,在醒来的1或2小时内收集样品。在一些实施方案中,在晚上收集样品。在一些实施方案中,在晚上收集样品,这是指在对对象而言在下午4点之后收集。在其他实施方案中,在对象已经醒来至少8小时或至少12小时后收集样品。在一些实施方案中,在对象已经醒来小于1小时后收集样品。在一些实施方案中,对象疑似患有OSA。

在一些实施方案中,已知对象患有OSA。在一些实施方案中,方法还包括通过实施调查问卷来确定作为用于本文所公开方法的评价的候选者的对象。在一些实施方案中,方法还包括使用计算机算法来评价所测量的选自表1或表2的一种或更多种基因的表达水平。在一些实施方案中,方法还包括确定对象患有具有陈述性记忆缺陷的OSA的风险评分。在一些实施方案中,测量RNA转录物的表达水平。在一些实施方案中,使用与RNA转录物互补的DNA来测量RNA转录物的表达水平。在一些实施方案中,使用扩增或杂交分析来测量RNA转录物的表达水平。在一些实施方案中,测量蛋白质的表达水平。在一些实施方案中,使用一种或更多种结合多肽来测量蛋白质的表达水平。在一些实施方案中,一种或更多种结合多肽是抗体。在一些实施方案中,方法还包括治疗确定患有高危型OSA的对象。在一些实施方案中,治疗对象包括用皮质类固醇、白三烯拮抗剂、局部鼻腔类固醇、鼻内类固醇和/或孟鲁司特(montelukast)的药物治疗,腺样体和扁桃体的手术去除,应用气道正压通气治疗(PAP),或应用口腔装置。

在一些方面,提供用于确定对象是否患有具有陈述性记忆缺陷的阻塞性睡眠呼吸暂停(OSA)的方法,其包括a)分析来自对象的生物样品的由表1或表2中所列出基因编码的一种或更多种蛋白质的表达水平;和b)计算生物样品的风险评分,所述风险评分指示对象患有具有陈述性记忆缺陷的OSA的可能性。在一些实施方案中,计算风险评分包括使用计算机和算法。在一些实施方案中,计算风险评分包括对表达水平的每一个应用模型系数。在一些实施方案中,方法还包括识别具有指示50%可能性或更大可能性患有具有陈述性记忆缺陷的OSA的风险评分的患者。在一些方方面,提供用于治疗对象的高危型阻塞性睡眠呼吸暂停(OSA)的方法,其包括在基于测量从对象获得的尿样品中表1或表2所列出一种或更多种基因的表达水平确定对象患有睡眠呼吸暂停后,利用皮质类固醇、白三烯拮抗剂、局部鼻腔类固醇、鼻内类固醇和/或孟鲁司特的药物治疗,腺样体和扁桃体的手术去除,应用气道正压通气治疗(PAP),或应用口腔装置。

在一些实施方案中,对象为儿童或未成年人。在一些实施方案中,儿童或未成年人为、为至少、或为至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、或18岁。

一些方法还涉及将至少一种蛋白质的表达水平与来自样品的对照的表达水平进行比较。在其他实施方案中,方法涉及将至少一种蛋白质的表达水平与标准化样品中该蛋白质的表达水平进行比较。将评价表达水平的升高或降低。在一些实施方案中,可以使用1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50种(或其中可得到的任何范围)比较蛋白质来与蛋白质的表达水平进行比较。在其他实施方案中,测量至少或至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50种比较蛋白质。在具体的实施方案中,将至少或至多1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49或50种比较蛋白质与一种或更多种蛋白质进行比较。

在其他实施方案中,对每一个蛋白质表达水平应用系数值。系数值反映该具体蛋白质的表达水平在评估对象是否患有OSA中具有的权重。在一些实施方案中,系数值是针对其表达水平被测量的多个蛋白质而言的。多个可以为、为至少或为至多这些蛋白质中的1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26种,以及本文中讨论的任何蛋白质。方法和计算机可读介质可以利用系数值来实施。

在一些实施方案中,方法会涉及基于与一种或更多种蛋白质的表达水平有关的数据确定或计算诊断评分,这表明一种或更多种蛋白质的表达水平是评分所基于的因素中的至少一种。诊断评分会提供关于生物样品的信息,如对象患有OSA的总概率。在一些实施方案中,诊断分数代表对象患有OSA或不患有OSA的概率。在一些实施方案中,概率值表示为代表0%可能性至100%可能性患有OSA的概率的整数或数。在一些实施方案中,概率值表示为代表患者患有OSA的0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99或100%可能性(或其中可得到的任何范围)概率的整数或数。或者,概率一般地可以被表示为百分位数、四分位数或十分位数。

在一些实施方案中,方法包括使用评分算法评价一种或更多种蛋白质来产生OSA的诊断评分,其中基于评分确定患者患有或不患有OSA。本领域技术人员应理解的是评分是关于OSA分级的预测值。在一些实施方案中,产生和/或提供确定诊断评分或者作为因素算入这类分数的数值的报告。在一些实施方案中,采用划界分数来表征可能患有OSA的样品。在一些实施方案中,将患者的风险评分与划界分数进行比较以表征关于OSA的患者的生物样品。在一些实施方案中,使用所测量蛋白质表达水平的每一个的权重系数来计算诊断评分。权重系数一般会反应具体蛋白质的表达水平用于确定OSA风险的重要性。

本文描述的方法中的任一种可以在包括计算机可读代码的有形计算机可读介质上实施,当由计算机执行时,所述计算机可读代码使计算机执行一个或更多个操作。在一些实施方案中,存在包括计算机可读代码的有形计算机可读介质,当由计算机执行时,所述计算机可读代码使计算机执行包括以下的操作:a)接收与来自患者的样品中至少一种蛋白质的表达水平相对应的信息;和b)使用与至少一种蛋白质相对应的信息和与对照的表达水平相对应的信息来确定蛋白质表达水平值。在一些实施方案中,接收信息包括从有形数据存储装置接收与来自患者的样品中至少一种蛋白质的表达水平相对应的信息。在其他实施方案中,使用与对照的表达水平相对应的信息。在其他实施方案中,介质还包括计算机可读代码,当由计算机执行时,所述计算机可读代码使计算机执行包括以下的一个或更多个另外的操作:将与至少一种蛋白质的表达水平相对应的信息发送至有形数据存储装置。在具体的实施方案中,其还包括计算机可读代码,当由计算机执行时,所述计算机可读代码使计算执行包括以下的一个或更多个另外的操作:将与至少一种蛋白质的表达水平相对应的信息发送至有形数据存储装置。在一些实施方案中,接收信息包括从有形数据存储装置接收与来自患者的样品中至少一种蛋白质的表达水平相对应的信息。在更进一步的实施方案中,有形计算机可读介质具有计算机可读代码,当由计算机执行时,所述计算机可读代码使计算机执行还包括以下的操作:c)计算样品的诊断评分,其中诊断评分指示对象患有OSA的概率。预期的是,上述方法中的任一种都可以利用具有计算机可读代码的有形计算机可读介质来实施,当由计算机执行时,所述计算机可读代码使计算机执行关于测量、比较和/或计算与对象患有OSA的概率相关的诊断评分的操作。

在由本文公开的示例性有形计算机可读介质驱动的操作的执行中可以使用一个或更多个处理器。或者,一个或更多个处理器可以在硬件控制下、或在硬件控制与软件控制的结合下执行这些操作。例如,处理器可以是特别地配置为执行一个或更多个这些操作的处理器,如专用集成电路(ASIC)或现场可编程门阵列(FPGA)。一个或更多个处理器的使用允许在没有一个或更多个处理器的帮助的情况下不能进行的信息(例如数据)的处理。这类操作的执行的一些实施方案可以在一定量的时间内、如比在不使用计算机系统、一个或更多个处理器的情况下执行要花费的时间少的时间内完成,包括不超过1小时、不超过30分钟、不超过15分钟、不超过10分钟、不超过1分钟、不超过1秒、和不超过一秒和一小时之间以秒计的每个时间间隔。

本发明的有形计算机可读介质的一些实施方案可以是例如CD-ROM、DVD-ROM、闪存盘、硬盘或任何其他物理存储装置。本发明方法的一些实施方案可以包括使用当由计算机执行时使计算机执行本文讨论的操作中的任一种的计算机可读代码来刻录有形计算机可读介质,所述操作包括与本发明的有形计算机可读介质有关的那些。刻录有形计算机可读介质可以包括例如将数据烧录到CD-ROM或DVD-ROM上、或将数据填入物理存储装置。

实施例部分的实施方案应理解为适用于本发明的所有方面、包括组合物和方法的本发明的实施方案。

当在权利要求和/或说明书中与术语“包含”一起使用时,单数名词可以表示“一个”,但是其也符合“一个或更多个”、“至少一个”和“一个或多于一个”的意思。

术语“或”在权利要求中的使用用于表示“和/或”,除非明确地说明是仅指替代选择,或替代选择是相互排斥的,但是本公开支持仅指替代选择和“和/或”的定义。还预期使用术语“或”所列出的任何事物也可以特别地排除在外。

在本申请全文中,术语“约”用于表明数值包含装置误差、确定数值所采用的方法、或研究对象中存在的变化的固有变差。

术语“包含”、“具有”和“包括”为开放性连系动词。这些动词的一种或更多种的任何形式或时态,例如一般现在时、现在进行时也是开放性的。例如,“包含”、“具有”或“包括”一个或更多个步骤的任何方法都不限于仅具备所述一个或更多个步骤,还涵盖其他未列出的步骤。

如本说明书和/或权利要求中所使用的术语,术语“有效的”表示足以实现期望的、预期的或想要的结果。

如在本文中使用的,术语“患者”或“对象”指的是活的哺乳生物,例如人类、猴子、牛、绵羊、山羊、狗、猫、小鼠、大鼠、豚鼠、或其转基因物种。在一些实施方案中,患者或对象为灵长目动物。人类对象的非限制性实例为成人、少年、婴儿和胎儿。

本发明的其它目的、特征和优点通过以下详细的描述会变得明显。然而,应理解,详细说明和具体实施例在表明本发明的具体实施方案时仅通过举例说明的方式给出,因为对本领域技术人员而言,在本发明的精神和范围内的各种变化和修改通过该详细说明会变得明显。

附图说明

以下附图形成本说明书的一部分,并被包含以进一步证实本发明的特定方面。通过参照一个或更多个这些附图结合本文所提供的具体实施方案的详细说明可以更好地理解本发明。

图1A-1E.通过LC-MS/MS发现尿生物标志物的流程。板块a:用于尿的蛋白质组学分析的最佳流程。板块b-c:免疫球蛋白(IgG)和白蛋白(ALB)移除。通过Bradford(板块b)对移除的程度进行定量并通过SDS-PAGE(板块c)使其可视化。通过比较移除(+)样品和未移除(-)样品中的血清铁传递蛋白(TRF)水平来评估IgG和ALB去除的特异性(板块c)。IgG,全抗体;HC,重链;LC,轻链;**,ALB的非特异性检测。板块d:用TCA/DOC沉淀尿样品并测定10个对象的蛋白质水平。以箱线图(5%至95%置信区间)示出结果(N=6/对象)。板块e:通过质谱检测的所有尿蛋白的基因本体分析。存在的所有功能注释基于用Benjamini-Hochberg校正的超几何检验都是统计上显著的(p<0.05)。

图2A-2D.关于健康儿童的尿蛋白组的性别和昼夜的影响。从健康男孩(N=7)和女孩(N=6)收集晨间(am)和睡前(pm)的尿样品,并对样品进行LC-ESI-MS/MS分析。通过谱计数对蛋白质进行定量,并使用t检验和G检验来检测差异表达蛋白质。板块a:证明男孩和女孩之间晨间样品中蛋白质组学差异的代表性统计分析。红色,男孩中上调;绿色,男孩中下调。通过置换分析确立置信区间(虚线部分;G>1.5或G<-1.5和α=0.05)和FDR(<5%)。在男孩中下调的蛋白质在G检验中被指定为负值。板块b:在晨间和睡前样品中男孩的(相对于女孩)差异表达蛋白质的比较。板块c-d:受到性别和昼夜二者调节的蛋白质的实例(TRF和REG1A)。结果是均值±平均值标准误差(SEM),统计显著性(**)是通过t检验和G检验的组合评价的。

图3A-3E.儿科OSA的候选生物标志物的识别。从患有和未患有OSA的儿童收集晨间(am)和睡前(pm)的样品,并对样品进行LC-MS/MS分析。板块a:蛋白质组学数据的分析按以下进行:水平1(L1),将晨间和睡前的测量值进行平均并且合并男孩和女孩;水平2(L2),独立地进行晨间和睡前的样品的分析;水平3(L3),在男孩和女孩中都独立地进行晨间和睡前的样品的分析。在每个水平识别的候选生物标志物的数量在括号中示出。板块b:将水平3中检测的生物标志物根据收集时间和性别分开。板块c:根据晨间尿样品的全蛋白质组学分析(基于t检验和G检验)证明“性别影响”。红色,OSA上调;绿色,OSA下调;虚线,置信区间(FDR<5%)。板块d:二肽基肽酶4(DPP4)作为在男孩晨间样品中用于OSA的特异性生物标志物的实例。通过谱计数确定蛋白质水平(均值±平均值标准误差)。**,基于t检验和G检验是统计上显著的。

图4A-4C.通过ELISA进行的质谱数据的验证。使用6g可商购的ELISA分析在晨间(am)和睡前(pm)的样品中验证通过蛋白质组学分析识别的差异表达蛋白质。板块a:通过质谱(MS/MS)和ELISA(ng/mg肌酸酐)定量的血液结合素(HPX)水平的比较。线性回归分析(直线)检测到两种技术之间的强的正相关性(R2=0.52,p<0.0001)。板块b:通过ELISA的DPP4水平的测量证明在晨间尿样品中二肽基肽酶4(DPP4)的特异性下调(与图3d相比)。板块c:通过MS/MS和ELISA定量的HPX(ng/mg肌酸酐)、血浆铜蓝蛋白(CP;ng/mg肌酸酐)、和锌-α-2-糖蛋白(AZGP1;ng/mg肌酸酐)的水平的比较。将测量值相对于对照样品进行标准化。在适用情况下的结果是均值±平均值标准误差。#,基于t检验(p<0.05)和G检验(G>1.5)是统计上显著的。**,基于t检验(p<0.05)是统计上显著的。

图5.儿科OSA的生物标志物与病理生理学模块的映射。192个候选生物标志物的基因本体分析识别了许多在患有OSA的儿童中较多的功能模块(p<0.05,利用Benjamini-Hochberg校正的超几何检验)。在每个功能模块中呈现6种代表性蛋白质作为实例。

图6A-6D.患有OSA的儿童显示记忆回忆损伤的异质性。在芝加哥大学招募健康对象(N=13)和患有OSA的儿童(N=20)。A:记忆回忆测试的进行识别了患有OSA的儿童的两个群体:具有正常记忆回忆(OSA-N)和损伤的记忆回忆(OSA-I)的那些。B-D:OSA-N和OSA-I患者之间的差异不能归因于OSA严重程度(B)、肥胖(C)或年龄(D)的差异性。

图7A-7B.患有OSA的儿童中记忆损伤的候选尿生物标志物的识别。从健康对象(CTRL)和具有正常记忆(OSA-N)或损伤记忆(OSA-I)的患有OSA的儿童收集的晨间尿样品的蛋白质组学分析。A:使用t检验和G检验识别候选生物标志物(红线,置信区间FDR=0.1%)。黄色=OSA-I相对OSA-N高,蓝色=OSA-I相对OSA-N低。B:两种候选生物标志物的蛋白质丰度水平(谱计数)。

图8A-8C.ELISA分析使得能够进行HPC和CP的高通量测量。通过质谱(MS/MS)和ELISA对血液结合素(HPX;A)、血浆铜蓝蛋白(CP;B)和尿调节素(UMOD;C)的尿水平进行定量。关于ELISA,将数值相对于尿肌酸酐(CR)水平进行标准化。注意两个测量之间的强一致性。

图9.记忆回忆测试:用于本研究的陈述性记忆测试的示意图。NSPG:整夜多导睡眠图。

具体实施方式

阻塞性睡眠呼吸暂停(OSA)是儿童中非常普遍(2%至3%)的疾病,其特征在于睡眠期间上呼吸道的部分或全部阻塞的重复事件。该频繁的病情导致整个夜间血碳酸过多、血氧过少和觉醒的重复发生,并明显增加进展为心血管问题、代谢问题、神经行为问题和认知问题的风险。

大量证据表明,间歇性低氧和睡眠片段化负面影响患OSA儿童的学业成绩。实际上,本发明人先前已经证明了患有OSA的儿童更有可能显示陈述性记忆的获取、巩固或检索方面的损伤。此外,研究已经确认陈述性记忆是在OSA的情况下存在或不存在整体认知缺陷的稳定指示物。另外,已经报道在OSA治疗后学业表现和认知缺陷的显著改善。因此,易患有更严重记忆损伤的儿科OSA患者的(早期)检测具有特别的临床意义。然而,识别已经进展为与OSA相关的认知问题的儿童因为需要费劲的神经认知测试而变复杂,在多数临床环境中神经认知测试不可用,因此,这类评估不被常规地采用。

尿蛋白质组的内在差异限制了蛋白质组学分析的辨别力并使生物标志物检测变复杂。利用用于尿的基因组分析的最佳流程,本发明人证明了性别和昼夜的影响构成健康儿童中两个重要的差异来源。实际上,通过以取决于性别和昼夜的方式进行生物标志物发现,本发明人识别了约在儿童中非常普遍(2%至3%)的病情即儿童阻塞性睡眠呼吸暂停(OSA)的30倍更多的候选生物标志物,所述阻塞性睡眠呼吸暂停的特征在于睡眠期间在重复的上呼吸道阻塞事件的情况下间歇性低氧和血碳酸过多、和睡眠片段化的重复发生。值得注意的是,由于在男孩和女孩中通过晨间和睡前的样品识别的蛋白质中观察到低重叠(约3%),所以生物标志物对于性别和取样时间是高度特异的。

因为解释OSA或健康儿童中性别特异性影响的临床基础并不明确,所以数据支持将情境化生物标志物策略实施到宽范围的人类疾病。例如,这些发现表明除了提供疾病生物标志物的丰富的库,尿蛋白质组还包括涉及疾病相关的病理过程的大量信息。

A.阻塞性睡眠呼吸暂停

患有阻塞性睡眠呼吸暂停(OSA)的人会在睡觉中周期性的停止呼吸短的时间(通常少于60秒);其与可能被阻塞的上呼吸道有关,被阻塞的上呼吸道阻止空气到达肺。该病情的诊断目前涉及物理检查和调查患者的困睡度、睡眠质量和睡前习惯。如果涉及儿童,则会询问父母或看护者。会要求并进行睡眠研究以进一步评估病情的存在。可以进行的其他测试包括动脉血气体评测、心电图(ECG)、超声心电图和/或甲状腺功能研究。

炎症/免疫中断、脂质、血管生成和止血通路在患有OSA的患者中都有报道(Adedayo,2012;Chorostowska-Wynimko,2005;Slupsky,2007;vonKanel,2007),并且被提议为OSA中高度普遍的相关并存病如肥胖、糖尿病和动脉粥样硬化的机理基础。

OSA是儿童中与广范的并存病有关的高度普遍的疾病。阻塞性睡眠呼吸暂停(OSA)是儿童中的常见疾病(2%至3%),其特征在于在睡眠期间上呼吸道的部分或完全阻塞的重复事件,这导致血碳酸过多、血氧过少和觉醒的重复发作(Lumeng&Chervin,2008)。当前证据表明,由于重复觉醒而形成的睡眠片段化和表征OSA的间歇性血液气体异常(低氧和碳酸过多)(Gozal&Kheirandish-Gozal,2008;Kaemingk等人,2003;Kheirandish等人,2005)二者共同使患者易遭受多种病态结果。病态结果包括降低的认知能力和学业表现和记忆力,包括注意力缺陷多动症类疾病、攻击性和差的冲动控制的行为缺陷,以及发育不良、尿床和心血管及代谢功能紊乱(Gozal&Kheirandish-Gozal,2008;Gozal&Kheirandish-Gozal,2008;Gozal等人,2010;Kim等人,2011;Spruyt等人,2011;Blunden等人,2000;Ellenbogen等人,2005;Gottlieb等人,2004;Kheirandish&Gozal,2006;O’Brien等人,2003;O’Brien等人,2004;Rhodes等人,1995;Gozal等人,2007;SansCapdevila等人,2008)。OSA的适当治疗改善或逆转这些并存病,并还与改善的整体生活质量(Baldassari等人,2008)和降低的医疗成本(Tarasiuk等人,2004)有关。

患有OSA的儿童显示降低的记忆力和学业表现。保存快速眼动(REM)睡眠和非REM睡眠完整对于巩固陈述性(真实回忆)和非陈述性(程序技能)是非常重要的(Stickgold等人,2005)。因此,这些睡眠阶段的中断可能会妨碍或降低决定记忆巩固的过程的效力。另外,已经表明在成人(Ellenbogen等人,2006)和儿童(Hill等人,2007)中睡眠强化记忆并使记忆更加耐受干扰。多项研究现已经表明在成人和儿童中睡眠后对词组的记忆力显著增加,并证明睡眠提高对脸的记忆表现(Stickgold&Walker等人,2007;Walker&Stickgold,2006;Backhaus等人,2008;Wagner等人,2007)。相似地,不被中断的睡眠导致改善的记忆回忆表现,和仅在良好的夜间睡眠后才看到记忆表现的提高(Ellenbogen等人,2006;Hill等人,2007;Gais&Born,2004;Ellenbogen等人,2006)。研究表明患有OSA的儿童更有可能显示记忆的获取、巩固或检索方面的损伤(Kheirandish-Gozal等人,2010)。

除本文公开的诊断标志物外,调查问卷可有助于识别为本文公开的方法的候选者的那些对象。除了关于对象的睡眠的更具体的问题之外,该调查问卷还可以询问如对象的信息如年龄、性别、体重、身高和种族与民族。问题可以包括对象在睡眠期间是否停止呼吸、在睡着时挣扎着呼吸、在睡眠期间是否曾经需要身体动作来使对象再次呼吸、打鼾的频率和音量和关于睡着时对象的呼吸的问题。在一些情况下,对象或对象的父母可以完成这类调查问卷,并且基于那些答案可建议通过本文公开的方法评估对象。

B.生物标志物和诊断方法

在一些实施方案中,有涉及OSA或具有陈述性记忆缺陷的OSA的诊断方法。诊断方法是基于来自对象的样品中生物标志物的识别。“生物标志物”是可用作对象的生物状态的指示剂的分子。

遗传和环境扰动对个体中蛋白质表达模式施加强的差异性。表观遗传学、转录组学、代谢组学和蛋白组学研究已经突出了健康人群中基因表达的动态调控(Slupsky,2007;Christensen,2009)。例如,在健康人类组织中DNA甲基化模式对年龄和环境因素高度敏感(Christensen,2009)。相似地,发现涉及线粒体能量代谢的代谢物在健康成人中因性别和年龄而有所差异(Slupsky,2007)。此外,基于蛋白质组学的生物标志物发现策略因尿中低的蛋白质浓度和高水平的干扰物质(例如,盐和氮碱)而是复杂的。在疾病的情况下,复杂的病理生理学扰动使这些蛋白质组学差异放大并因此需要情境化的生物标志物分析。

在避免这些问题的尝试中,本发明人在儿童OSA的尿蛋白组和生物标志物发现方法中研究了差异性的两个可能的重要来源(性别和昼夜的影响)。为了有助于该方法,本发明人根据液相色谱串联质谱法(LC-MS/MS)将用于生物标志物发现的蛋白质组学流程最佳化,LC-MS/MS是允许较低丰度蛋白质的更深的蛋白质组覆盖和研究的方法。当前发现证明与昼夜和性别相关的影响在健康儿童中用作尿蛋白组的有力调节者。

发现证明OSA的生物标志物存在强的性别和昼夜的影响,这表明旨在以情境化的方式识别生物标志物的基于发现的蛋白质组学方法可以极大地促进可靠检测人类疾病的能力。通过将差异性的这些组成决定因素并入到分析中,在从患有OSA的儿童收集的尿中事先识别192个假定候选生物标志物。此外,本发明人表明只有当在它们的收集情境化设置下(即,男孩晨间,或女孩睡前)实施其使用时,这些生物标志物即便不是全部也是大多数(约97%)保留其预测能力,通过ELISA测量验证了该结果。然而,一些生物标志物可以显示其预测能力而不管它们的情境化设置或者可以显示与关于这些97%所见的那些不同的情境化设置效应。这些结果突出了生物标志物发现方法的复杂性,并表明会必须需要经仔细情境化的生物标志物发现策略来有效地在广泛人群中检测人类疾病。

本文公开的OSA生物标志物可以是显示表达或状态的变化的多肽,其可以与对象中OSA的存在相关。预期OSA生物标志物组成表1中指示的标志物。在一些实施方案中,预期表1中的具体生物标志物。在一些实施方案中,在本文描述的实施方案中可以使用表1中生物标志物的1、2、3、4、5、6、7、8、9、10种、或其中可得到的范围。另外,本文公开的生物标志物可以包括编码生物标志物多肽的信使RNA(mRNA),因为测量mRNA的表达的变化可以与由mRNA编码的多肽的表达的变化有关。表达的变化可以是与对照细胞相比OSA细胞中表达的增加(上调)或OSA细胞中表达的降低(下调)。具体生物标志物是增加还是降低在表1中示出。因此,确定生物样品中感兴趣的基因的表达水平包括通过直接或间接(例如,通过测量从mRNA合成的互补DNA(cDNA))测定mRNA来确定多肽生物标志物的量和/或编码多肽生物标志物的mRNA的量。

高危型OSA与多种相关疾病和缺陷有关,因此,其更需要治疗。高危型OSA应理解为与以下有关:神经认知损伤,如记忆损伤、陈述性记忆缺陷、学习延迟、和学业表现的问题;情绪相关的障碍,如抑郁症;行为问题,如ADHD、攻击行为、注意迟钝、易冲动和过度嗜睡;心血管危险,包括高血压、动脉粥样硬化、肺动脉高血压、左心室功能障碍;代谢障碍,如血脂异常和胰岛素抗性。综述:CapdevilaOS,Kheirandish-GozalL,DayyatE,GozalD.Pediatricobstructivesleepapnea:complications,management,andlong-termoutcomes.ProcAmThoracSoc.2008年2月15日;5(2):274-82.doi:10.1513/pats.200708-138MG.Review.PubMedPMID:18250221;PubMedCentralPMCID:PMC2645258。相关治疗包括用皮质类固醇、白三烯拮抗剂、局部鼻腔类固醇、鼻内类固醇和/或孟鲁司特的药物治疗,腺样体和扁桃体的手术去除,应用气道正压通气治疗(PAP)或应用口腔装置。Kheirandish-GozalL,BhattacharjeeR,BandlaHP,GozalD.Anti-InflammatoryTherapyOutcomesforMildOSAinChildren.Chest.2014年2月6日.doi:10.1378/chest.13-2288.[在印刷出版之前的电子出版]PubMedPMID:24504096;MarcusCL,BrooksLJ,DraperKA,GozalD,HalbowerAC,JonesJ,SchechterMS,WardSD,SheldonSH,ShiffmanRN,LehmannC,SpruytK;AmericanAcademyofPediatrics.Diagnosisandmanagementofchildhoodobstructivesleepapneasyndrome.Pediatrics.2012Sep;130(3):e714-55.doi:10.1542/peds.2012-1672.电子出版2012年8月27日.Review.PubMedPMID:22926176.

在一些实施方案中,预期用于高危型OSA的生物标志物组成表2中指示的标志物。

表2:高危型OSA的候选生物标志物。

1.核酸

实施方案涉及在诊断应用中与OSA或高危型OSA生物标志物核酸序列有关的多核苷酸或核苷酸分子。一些实施方案特别地涉及可以用来根据OSA生物标志物的检测诊断OSA或高危型OSA的核酸。核酸或多核苷酸可以是DNA或RNA,且在一些实施方案中它们可以是寡核苷酸(100个残基或更少)。此外,它们可以是重组产生的或合成产生的。

其他实施方案涉及可以用来识别和/或定量OSA生物标志物、特别是在诊断方案中的引物或可杂交片段的使用。方法和组合物与在OSA生物标志物的情况下的诊断应用有关,预期以下讨论与涉及这类方法和组合物的实施方案有关。

这些多核苷酸或核酸分子可以是从细胞可分离和可纯化的,或者它们可以是合成制备的。在一些实施方案中,核酸靶标或识别OSA生物标志物。在其他实施方案中,核酸是抑制剂,如核糖酶、siRNA或shRNA。

如在本申请中所使用的,术语“多核苷酸”指的是已经从总的基因组核酸中分离的核酸分子、RNA或DNA。因此,“编码OSA或高危型OSA生物标志物的多核苷酸”指的是含有OSA生物标志物编码序列、还可以从总基因组DNA和蛋白质分离出或纯化出且不含总基因组DNA和蛋白质的核酸序列(RNA或DNA)。OSA生物标志物抑制剂指的是OSA生物标志物的抑制剂。

术语“cDNA”意在指使用RNA作为模板制备的DNA。与基因组DNA或RNA转录物相反地,使用cDNA的优势是稳定性和使用重组DNA技术操纵序列的能力(参见Sambrook,2001;Ausubel,1996)。有时可以使用全基因组序列或部分基因组序列。或者,cDNA可以是有优势的,因为其代表多肽的编码区并消除内含子和其他调节区。在一些实施方案中,核酸与cDNA编码序列的全部或部分互补或一致。

术语“基因”为简单起见用于指功能蛋白质、多肽或肽编码的核酸单元。如本领域技术人员会理解的,该功能术语包括基因组序列、cDNA序列和表达或可以被修改以表达蛋白质、多肽、结构域、肽、融合蛋白和突变体的更小的改造基因片段。与核酸序列的全部或部分杂交的核酸分子可以包括以下长度或至少以下长度的连续核酸序列:5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、441、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000、1010、1020、1030、1040、1050、1060、1070、1080、1090、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、4100、4200、4300、4400、4500、4600、4700、4800、4900、5000、5100、5200、5300、5400、5500、5600、5700、5800、5900、6000、6100、6200、6300、6400、6500、6600、6700、6800、6900、7000、7100、7200、7300、7400、7500、7600、7700、7800、7900、8000、8100、8200、8300、8400、8500、8600、8700、8800、8900、9000、9100、9200、9300、9400、9500、9600、9700、9800、9900、10000、10100、10200、10300、10400、10500、10600、10700、10800、10900、11000、11100、11200、11300、11400、11500、11600、11700、11800、11900、12000或更长的(或其中可得到的任何范围)核苷酸、核苷或序列的碱基对。

因此,预期具有或者具有至少或至多70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%或99%和其中可得到的任何范围的核酸作为本发明的部分,所述核酸与所识别生物标志物的以下长度连续碱基(或其中可得到的任何范围)的核酸序列一致或互补:5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、54、55、56、57、58、59、60、61、62、63、64、65、66、67、68、69、70、71、72、73、74、75、76、77、78、79、80、81、82、83、84、85、86、87、88、89、90、91、92、93、94、95、96、97、98、99、100、101、102、103、104、105、106、107、108、109、110、111、112、113、114、115、116、117、118、119、120、121、122、123、124、125、126、127、128、129、130、131、132、133、134、135、136、137、138、139、140、141、142、143、144、145、146、147、148、149、150、151、152、153、154、155、156、157、158、159、160、161、162、163、164、165、166、167、168、169、170、171、172、173、174、175、176、177、178、179、180、181、182、183、184、185、186、187、188、189、190、191、192、193、194、195、196、197、198、199、200、210、220、230、240、250、260、270、280、290、300、310、320、330、340、350、360、370、380、390、400、410、420、430、440、441、450、460、470、480、490、500、510、520、530、540、550、560、570、580、590、600、610、620、630、640、650、660、670、680、690、700、710、720、730、740、750、760、770、780、790、800、810、820、830、840、850、860、870、880、890、900、910、920、930、940、950、960、970、980、990、1000、1010、1020、1030、1040、1050、1060、1070、1080、1090、1100、1200、1300、1400、1500、1600、1700、1800、1900、2000、2100、2200、2300、2400、2500、2600、2700、2800、2900、3000、3100、3200、3300、3400、3500、3600、3700、3800、3900、4000、4100、4200、4300、4400、4500、4600、4700、4800、4900或5000。

“与其他编码序列基本分离”是指所关注基因形成核酸片段编码区的部分,片段不含有大部分的天然存在的编码核酸,如大的染色体片段或其他功能基因或cDNA编码区。当然,这指的是最初分离的核酸片段,而不排除通过人工操纵后来添加到片段的基因或编码区。

C.样品

尿是用于诊断测试的相当理想的生物流体,这是因为尿易于收集并在临床实验室广泛使用。然而,在尿中的生物标志物发现策略已经受阻于与蛋白质组学方案的重复性和不足的标准化有关的问题。尽管有这些顾虑,已经利用尿蛋白质组学分析来识别广泛人类疾病的大量候选生物标志物,疾病包括但不限于肾疾病、糖尿病、动脉粥样硬化、阿尔茨海默氏病和癌症(Soggiu,2012;Zimmerli,2008;Riaz,2010;Zengi,2012;Huttenhain,2012;Zoidakis,2012;Zurbig,2012;Siwy,2011)。在一些实施方案中,样品可以是尿、唾液、眼泪或血清/血浆的样品。

D.实施例

包括以下实施例以说明本发明的优选实施方案。本领域技术人员应理解以下实施例中所公开的技术能代表本发明人发现的在本发明的实践中发挥良好作用的技术,因此能够认为其构成用于其实践的优选实施方式。然而,根据本公开,本领域技术人员应理解,在不脱离本发明的精神和范围的情况下,在所公开的具体实方案中可以做许多改变,并仍获得相同或相似的结果。

实施例1

材料和方法

患者信息—用于OSA评估的临床所指的儿童(2至12岁大)在芝加哥大学小儿睡眠实验室经历整夜多导睡眠图评估。健康儿童从学校或幼儿保健诊所招募。所有对象的排除标准包括存在明显的遗传或颅面综合征、糖尿病、囊胞性纤维症、癌症或在用口服皮质类固醇、抗生素或抗炎药物进行治疗。所有父母完成详细的摄入临床调查问卷。记录每个儿童的身高、体重和生命体征,并更具CDC2000生长标准(www.cdc.gov/growthcharts)并使用在线软件(www.cdc.gov/epiinfo)计算身体质量指数(BMI)z分数。认为超过1.65(第.95个百分位)的BMIz分数达到肥胖的标准。该研究得到芝加哥大学的机构审查委员会的批准(IRB10-708A);获得知情同意和适当时的未成年人同意书。

整夜多导睡眠记录—所有对象经历使用标准方法的整夜多导睡眠记录。根据用于对睡眠和相关事件进行打分的2007年美国睡眠医学协会指南对PSG研究进行打分。阻塞性呼吸暂停-低通气指数(AHI)被定义为总睡眠时间中每小时阻塞性呼吸暂停和低通气的次数。

尿收集—在晚上正要睡前收集中段尿和在晨间醒来后收集首次排尿。将样品(20mL)收集到含有苯甲基磺酰氟(PMSF,2mM最终浓度)的管中,并立即在-80℃储存直至分析。

制备可溶性尿蛋白用于质谱分析(MS)—在37℃快速解冻尿(10mL),涡旋90秒,然后离心(500×g,4℃)5分钟。将上清液在12000×g,4℃下离心20分钟以去除尿沉淀,与1mL蛋白G磁珠(Millipore)在20℃下孵育30分钟。根据制造商的方案进行IgG的移除。使用如前所述的TCA/DOC(Thongboonkerd,2006;Becker,2010)沉淀经IgG移除的尿样品。简言之,在尿中补充入0.02%脱氧胆酸钠和20%三氯乙酸,在4℃在振动下孵育过夜。通过离心(在4℃下18000×g60分钟)获得蛋白质。用冰冷却的丙酮清洗蛋白质小球两次,在0.1%RapiGest(Waters公司)、250mM碳酸氢铵、pH8.8中重构。通过Bradford分析利用白蛋白作为标准物确定蛋白质浓度。将样品(90μg)与α-人类白蛋白耦合的磁珠(90μL,Millipore)孵育,并根据制造商的方案进行移除。将样品还原、烷基化并利用测序级胰蛋白酶在37℃消化过夜(1:50,重量/重量,胰蛋白酶/蛋白质;Promega)。根据制造商的方案,将胰蛋白酶消化物与乙酸混合(1:1,体积/体积),并根据制造商的方案在C18柱(HLB,1mL,Waters公司)上对其进行固相提取。在真空下干燥含肽的部分,并将其重悬在0.3%甲酸、5%乙腈(0.4mg/mL)中以用于LC-MS/MS分析。

液相色谱-电喷雾电离-串联质谱分析(LC-ESI-MS/MS)-将胰蛋白酶消化物(1.5μg)直接装载到(室内包装的)2cmC18捕捉柱上,用10μl溶剂A(5%乙腈,0.1%甲酸)冲洗,在15cm长、75μM反相毛细管柱(ProteoPepTMIIC18,5μm大小,NewObjective,WoburnMA)上进行洗脱。在ProxeonEasyn-LCII(ThermoScientific,SanJose,CA)上以300nL/分钟经过180分钟的从5%至35%缓冲液B(95%乙腈,0.1%甲酸)的线性梯度分离肽。使用电喷雾电离和线性离子阱质谱仪(LTQOrbitrapThermoScientific,SanJose,CA)以阳离子模式获得质谱。以数据相关模式操作质谱仪,对于每个MS1前体离子扫描,通过CID(碰撞诱导解离)从碎片选择十个最大强度的离子。用于质谱分析的其他参数包括:MS1的分辨率设为60000,标准化碰撞能量35%,激活时间10ms,分离宽度1.5,淘汰+1和+4及更的高电荷状态。

肽和蛋白质识别—使用(versionv.3.5,)针对国际蛋白质索引人类(v3.87,91464个条目)主序列数据库(Kersey,2004)对MS/MS谱进行检索(Sage-NResearch,Milpitas,CA)。检索参数包括以最高2个漏切用胰蛋白酶(在Arg或Lys后)的半酶切。在固定的Cys烷基化和可变的Met氧化下,在50ppm的母离子公差和1amu的碎片离子质量公差下,进行检索。利用PeptideProphet(Keller,2002)和ProteinProphet(Nesvizhskii,2003),使用对于肽≥0.90和对于蛋白质≥0.96的调整概率,进一步验证SEQUEST结果。在统计分析之前用计算机蛋白质组学分析系统(CPAS)(Rauch,2006)进一步处理检索结果(见下文)。考虑用于分析的蛋白质必须在至少一个患者组(例如,健康女孩或患OSA的男孩)中在至少70%的个体中被识别的。当MS/MS谱不能区别蛋白质亚型时,全部都被包含在分析中。

蛋白质定量和统计分析—通过谱计数(检测的蛋白质的MS/MS谱的总数;(Liu,2007))对由LC-MS/MS检测的蛋白质进行定量。利用t检验和G检验对相对蛋白质丰度的差异进行评估(Becker,2010;Becker,2012;Old,2005)。使用置换分析来经验地估计FDR(Benjamini,1995)。使用PepC(Heinecke,2010)即一种使对于给定FDR识别的差异表达的蛋白质的数量最大化的软件包来确定G检验和t检验的显著性界值。

ELISA—在37℃迅速解冻尿样品并通过在500×g离心10分钟使其澄清。使用可商购的用于DPP4(Abnova;KA0141)、AZGP1(Abnova;KA1689)、CP(Assaypro;EC4101-1)、HPX(InnovativeResearch,Inc.;IRKTAH2562)、和肌酐(Abcam;ab65340)的ELISA根据制造商的方案来定量所得上清液中的蛋白质水平。将所有蛋白质水平标准化为尿肌酐水平(Gardfe,2004)并通过双尾学生t检验来评估组之间的统计显著性。

功能注释—使用Cytoscape(V2.8.2)中的Bingo2.0插件来识别尿蛋白组或差异表达的假定的尿生物标志物(相对于整个人类基因组)中基因本体注释的功能性富集(Maere,2005)。使用利用Benjamini-Hochberg校正的超几何检验(p<0.05)评估统计显著性并考虑具有≥5种蛋白质的功能分类。

实施例2

用于尿生物标志物发现的蛋白质组学工作流程

本发明人开发了4步骤过程,其包括:i)离心以去除颗粒物质和尿沉淀,ii)移除IgG和白蛋白(ALB)以有利于更深层的基因组覆盖,iii)沉淀蛋白质以浓缩尿蛋白质并去除干扰物质,和iv)通过LC-MS/MS进行质谱分析(图1a)

ALB和IgG是高丰度尿蛋白(总尿蛋白的40%至60%),其干扰低丰度物质的检测并且使无标记蛋白质组学方法中的定量复杂化(Kushnir,2009)。仔细滴定磁珠以使ALB和IgG的移除最大化(图1b,c),并使不相关蛋白质的非特异性损失最小化,如通过血清铁传递蛋白(TRF)水平的损失所评估的(图1c)。由于在经浓缩的溶液中更有效地沉淀蛋白质(因为分子聚集),本发明人在蛋白质沉淀后移除ALB。然而,存在用来使蛋白质小球溶解的缓冲液(0.1%RapiGest)的情况下IgG移除是不完全的,并因此再沉淀之前进行IgG移除。

本发明人引入了包括三氯乙酸和脱氧胆酸盐(TCA/DOC;(Thongboonkerd,2006;Becker;2010))的方法,因为其很适合于使蛋白质从稀溶液中沉淀出。通过沉淀从10个对象的每一个收集的相同尿样品的6小份来检查样品内和样品间该方法的重复性。该方法在宽范围的尿蛋白浓度下得到高度可重复的结果(6%CV,样品间)(图1d)。

为了检测蛋白质组学工作流程的重复性,处理来自28个儿童的尿样品并对其进行LC-MS/MS分析。基于每种蛋白质最少2种独特肽的识别,该方法每个样品可靠地识别505±10种蛋白质。此外,样品深度的变化,每轮高质量肽识别的数量是最小的(10053±237肽),这表明方法是稳定且可重复的。

实施例3

性别和昼夜的影响引入到健康儿童的尿蛋白质组中的差异性

本发明人收集来自健康男孩(N=7)和女孩(N=6)的晨间和睡前的样品。通过预先排除患有遗传或颅面综合征、糖尿病、囊胞性纤维症或癌症的参与者来选择健康儿童(2岁至12岁大)。另外的排除标准包括药物、类固醇或免疫治疗药物的长期使用。

通过蛋白质组学工作流程(参见图1)处理样品,并对其进行LC-MS/MS分析。通过谱计数定量蛋白质(Liu,2004),并使用t检验和G检验的组合(Becker,2010;Becker,2012;Old,2005)来识别蛋白质水平的统计显著性变化,t检验和G检验使用使假发现率最小化的界值(Benjamini,1995;Heinecke,2010)。图2a中提供代表性分析,其演示在应用严格统计标准(G检验:G≥1.5或G≤-1.5;t检验:α=0.05;FDR<0.05)后在晨间尿样品中性别调节的蛋白质的检测。

使用该方法,本发明人在健康男孩和女孩的尿蛋白质组中、在晨间样品(约7%;750种蛋白质中的50种)和睡前样品(8%;750种蛋白质中的41种)中均检测到明显差异(图2a和2b,表2A和2B)。表2A和2B指示说明性别和昼夜对健康儿童的尿蛋白组的影响的数据。在表3A和B中示出健康儿童的晨间和睡前尿样品中检测到的统计显著的、性别调节的蛋白质。还示出t检验和G检验的结果。

令人关注地,本发明人在晨间和睡前样品中的差异表达蛋白质之间观察到很少的重复(<10%),这表明性别调节的差异也对昼夜影响十分敏感(图2b)。例如,女孩睡前的TRF水平升高,而从男孩收集的晨间尿样品中胰岛细胞再生因子(REG1A)特别地增加(图2c)。

一般而言,相对于昼夜影响性别对尿蛋白组成的影响更显著。与该发现一致,健康儿童中性别调节的尿蛋白质组的基因本体分析显示通常与性别不相关的功能注释的显著富集(细胞黏附,p=6.0×10-7;模式结合,p=7.0×10-3;补体和凝血级联p=4.2×10-3)。明显不同地,该方法没有在更多直观方面如女性怀孕(p=0.11)或胚胎植入(p=0.11)识别出显著性。

实施例4

儿童OSA的尿生物标志物发现高度依赖于性别和昼夜的影响

与年龄和性别相配的对照一起招募通过多导睡眠记录派生的呼吸暂停低通气指数的标准(总睡眠时间中AHI>5个事件/小时)所评估的患有中度至重度OSA的儿童(2至12岁大)。他们的人口学特征为不存在年龄、性别、种族或BMI分布的统计上的显著差异(表4)。

表4:对象的人口学和多导睡眠记录的特征

缩写:BMI:身体质量指数;AHI:阻塞性呼吸暂停-低通气指数;OSA=阻塞性睡眠呼吸暂停。在适用情况下,结果表示为平均值±平均值标准误差。

使用严格的质量和蛋白质检测重复性的标准,尿样品的质谱分析在所有患者样品中识别出742种尿蛋白质。

为了研究性别和昼夜变化对生物标志物发现的影响,本发明人以三种方式进行了统计分析(使用t检验和G检验;(Becker,2010;Old,2005;Heinecke,2010))(图3a)。在水平1分析中,将晨间和睡前样品中的蛋白质水平进行平均并且不根据性别来区分组。水平2分析独立地研究晨间和睡前样品,而水平3分析按收集时间和性别依赖的方式处理样品(图3a)。

在水平1分析中识别了儿童OSA的六种候选生物标志物(表5A)。特别地,在该分析中也检测到了血清类黏蛋白1(ORM1),一种在之前的OSA生物标志物筛选中最初识别的蛋白质(Gozal,2009)。然而,ORM1的统计显著性水平几乎不超出统计阈值,且之后的ELISA测量没能验证这个发现。当独立地处理晨间和睡前样品时检测到的生物标志物的数量的大幅增加是明显的(水平2,45种蛋白质),当在分析中也考虑性别时看到了进一步的、更为显著的增加(水平3,192种蛋白质)(图3a,表5A-D)。表5A-D公开了儿童OSA的尿生物标志物的识别。相对于对照样品在OSA中差异表达的尿蛋白质的识别。示出水平1(所有样品)、水平2(校正昼夜影响)和水平3(校正昼夜和性别的影响两者)的生物标志物分析的结果以及相应的t检验和G检验的值。

一般而言,晨间尿样品的差异表达蛋白过多,这是主要基于OSA对男孩尿蛋白组的强烈影响的结果(图3b)。该观察结果并不令人意外,因为OSA是以夜间的重复呼吸事件为特征的睡眠疾病,因此这些事件更有可能会表现在晨间尿中;然而,在女孩中出现相反的结果,其中睡前尿样品产生更高数量的候选生物标志物(图3b)。此外,因为在男孩和女孩中通过晨间和睡前样品识别的候选生物标志物中观察到低重叠(约3%),所以差异表达蛋白对于性别和取样时间是高度特异的。重要地,所检测生物标志物的性别差异不能用年龄、疾病严重度或肥胖(BMIz分数)来解释,因为这些参数在组之间没有显著差异(图3c)。

综上,结果表明没能解释取样时间和性别基本上掩盖了与疾病状态如OSA相关的蛋白质表达的显著差异。利用t检验和G检验通过晨间尿样品的全蛋白质组学分析清楚地说明了这个概念,其显示生物标志物识别的数量和统计显著性的大幅提高(图3d)。利用二肽基肽酶4(DPP4)作为实例(图3e),在个体蛋白质水平上出现相似的结论。

实施例5

验证通过蛋白质组学分析识别的候选生物标志物

为了验证发现,本发明人使用可商购的ELISA分析来测量4种候选生物标志物的尿水平。因为尿中蛋白质水平是高度变化的,并且受体液量影响,所以所有的测量值均针对相应的尿肌酐水平进行标准化(Garde,2004)。ELISA测量值通常与通过MS/MS的无标记定量很好地相关(例如,HPX,p<0.0001,R2=0.52;图4a),并提供蛋白质水平的性别调节和昼夜调节的有力验证(例如,DPP4,比较图3d和4b)。总体上,ELISA分析提供在蛋白质组学分析中检测的四种候选生物标志物的蛋白质水平改变的独立确认:DPP4(p=0.02),HPX(p=0.02),和CP(p=0.01)作为男孩中OSA的可靠指示剂出现,而在女孩中识别了AZGP1(p=0.07)(图4b,c)。此外,因为ELISA分析涉及尿样品的最少处理(离心),而蛋白质组学分析需要大量处理(离心、IgG和ALB移除、蛋白质沉淀、样品消化等),这两种方法之间的强相关性进一步表明用于尿生物标志物发现的该经优化的蛋白质学工作流程方法是稳定的。

实施例6

儿科OSA的尿生物标志物映射到病理生理学模块

在从患有OSA的儿童收集的尿中已经识别了多种候选生物标志物,本发明人接下来尝试确定这些蛋白质是否与特定功能途径相对映。为此,本发明人使用基因本体分析来根据生物过程和分子功能将192种蛋白质整理成功能模块(图5)。该策略在许多功能注释中识别出显著的富集(相对于整个人类基因组),功能注释包括急相蛋白(p=8.4×10-5)、血管生成(p=2.7×10-3)、止血(p=4.2×10-8)、白细胞免疫(p=2.4×10-2)和脂质结合(p=2.3×10-4)。在先的研究提供全部这些途径在OSA中受影响的证据。例如,炎症/免疫的中断、脂质、血管生成和止血途径在患有OSA的患者中都有报道(Adedayo,2012;Chorostowska-Wynimko,2005;Slupsky,2007;vonKanel,2007)。

实施例7

患有OSA的儿童显示记忆损伤的异质性

被充分证实的是患有OSA的儿童显示神经认知缺陷和降低的学业表现(Gozal等人,2010;Blunden等人,2000;Gottlieb等人,2004;Kheirandish&Gozal,2006;O’Brien等人,2004;Rhodes等人,1995;Gozal&Kheirandish-Gozal,2007;Gozal,1998)。陈述性记忆功能是学业表现中的重要构成,研究表明OSA儿童获取、巩固和检索记忆的能力降低(Keirandish-Gozal等人,2010)。为了继续该在先工作,本发明人招募患有中度至重度OSA的儿童(5至12岁大)以及年龄和性别相配的对照。本发明人通过多导睡眠记录来评估它们的睡眠结构,并使用之前用来在患有OSA的患者中识别神经认知缺陷的常规使用的陈述性记忆测试(Keirandish-Gozal等人,2010)来定量他们的记忆功能。

总计,招募了33个儿童,其中20个对象在OSA组,13个对象在对照组。平均年龄是约7.5岁。两组的年龄、性别、种族、母亲的教育水平和通过BMIz分数确定的肥胖是相配的。另外,医生诊断的哮喘的发病率在两组之间是相似的。患有OSA的儿童具有显著更高的呼吸暂停-低通气指数(AHI;p<0.0001),呼吸暂停-低通气指数是一种睡眠呼吸暂停的严重度的量度(Grigg-Damberger等人,2007;Redline等人,2007)。

表6:患者人口学特征

N性别(男/女)年龄AHIBMI-zCTRL13(7/6)7.8±0.50.6±0.11.2±0.3OSA20(10/10)7.4±0.613.1±2.61.3±0.3

OSA组显示在晨间降低的自由记忆回忆的趋势(p=0.1)。在更仔细检查数据后,明显的是OSA患者,而非对照对象,在其晨间测试表现得分中显示显著的异质性(图6A)。基于该异质性,本发明人将OSA儿童分成两个表型—一个具有正常陈述性记忆(OSA-N,>7个回忆),一个具有受损的陈述性记忆(OSA-I,≤7个回忆)。重要地,OSA-N和OSA-I患者不显示OSA严重度(图6B)、潜在的肥胖(图6C)、年龄(图6D)或性别(OSA-N和OSA-I的50%男性)的显著差异。因此,不能将OSA-N和OSA-I患者中晨间记忆回忆的差异归因于睡眠中断的严重度或任何其他可能的混杂因素。

尿蛋白质组学识别患OSA儿童中受损记忆的候选生物标志物。本发明的发现证明根据获取、巩固或检索记忆的相关受损的严重度可以将患有OSA的儿童分成两个表型。在分子水平上,这个观察到的表型异质性可以通过对OSA的变化全身响应来解释,这在儿童中已有报道(Gozal等人,2007;Bhattacharjee等人,2010)。尿蛋白质组大部分来源于全身隔室,本发明人之前已经证明尿蛋白质的变化可以报告OSA的情况下的病理生理学(Gozal等人,2009)。

为了使患OSA的儿童中记忆受损的候选生物标志物明确,本发明人使用液相色谱质谱(LC-MS/MS)来研究从健康儿童(N=13)、OSA-N(N=8)和OSA-I(N=12)患者收集的晨间尿样品(首次排尿)。使用严格且可重复的工作流程处理尿以用于蛋白质组学分析来识别所有对象中的745种尿蛋白质。通过谱计数来定量蛋白质水平(Liu等人,2004),并使用G检验和t检验的组合来识别组间不同丰度的蛋白质(Becker等人,2010;Becker等人,2010;Heinecke等人,2010;Almendros等人,2014)。使用非常严格的双重统计标准(G检验:G统计量>10,t检验:p<0.01)和随机置换分析来确保假发现率(FDR)<0.1%,本发明人识别了相对OSA-N患者在OSA-I中改变显著的65种蛋白质。(图7A)。执行相同的方法来识别相对对照对象在OSA-I中改变显著的93种蛋白质(数据未示出)。候选生物标志物被定义为相对于OSA-N和对照对象二者在OSA-I中一致增加(或减少)的那些蛋白质。该分析产生了患OSA的儿童中52种记忆受损的候选生物标志物的列表(表7);提供丛生蛋白(CLU)和磷酸肌醇-3-激酶相互作用蛋白质1(PIK3IP1)作为满足这些非常严格的标准的蛋白质的两个实例(图7B)。

表7:患有阻塞性睡眠呼吸暂停的儿童中记忆受损的候选生物标志物

蛋白质是通过谱计数定量的。

通过t检验(p<0.01)和G检验(G统计量>10或<-10)来评价统计显著性;正G=在第一个样品中相对第二个上调,负G=在第一个样品中相对第二个下调。

令人关注地,候选生物标志物的信息学分析识别了炎症反应的显著富集(p=10-6;用Benjamini-Hochberg校正的Fisher精确检验)。这些发现与证明血浆C反应蛋白水平(炎症的一种标志物)与患OSA儿童的神经认知功能之间强相关的在先研究(Gozal等人,2007)一致。综上,这些数据表明OSA相关的炎症的存在会使儿童易患记忆缺陷和神经认知损伤。

ELISA分析验证蛋白质组学数据并使得能够进行高通量临床筛选。为了验证质谱发现,本发明人使用可商购的ELISA分析来测量患OSA儿童中2种记忆损伤的候选生物标志物血液结合素(HPX)和血浆铜蓝蛋白(CP)的尿水平。作为对照,本发明人还对在对照、OSA-I和OSA-N对象中水平未改变的蛋白质,即尿调节素的尿水平进行定量。因为尿中蛋白质水平是高度变化的,并且受体液量影响,所以所有的测量值均针对相应的尿肌酐水平进行标准化(Garde等人,2004)。ELISA分析重现通过质谱分析预测的HPX、CP和UMOD的调节模式(图8A-C)。这些发现提供对蛋白质组学和统计方法用于识别患OSA儿童中记忆受损的候选生物标志物的有力验证。此外,用于HPX和CP的ELISA分析的开发使得能够进行高通量临床筛选。

实施例8

开发用于患OSA儿童中陈述性记忆缺陷的候选尿生物标志物的高通量ELISA分析

使用基于发现的蛋白质组学,本发明人在患OSA儿童中识别了52种陈述性记忆缺陷的候选生物标志物,并通过ELISA进一步验证了这些蛋白质中两种(HPX和CP)的蛋白质丰度(通过质谱测量)变化。经验证的候选生物标志物将被用于开发多变量分类器(组合板),使用高通量ELISA分析在更大的独立患者群中研究其预测能力。

实验设计。研究会使用经蛋白质组学分析的先已存在的尿样品来验证将OSA-I患者与对照和OSA-N对象区别的候选生物标志物(参见图6-8)。基于统计显著性和尿蛋白水平变化的量级(通过t检验和G检验评估)、ELISA相容的抗体和/或试剂盒的可用性、和生物功能,本发明人已经选择了10种候选者用于最初测试(表8)。

表8:用于ELISA分析开发的候选者

蛋白质G检验*t检验功能KNG1-9110-6凝血PIGR-4610-7免疫PROCR-4210-9凝血HPX**-2910-6铁代谢CP**-1810-8铁代谢RNASE110110-6核苷酸代谢COL12A14610-7细胞外基质CD592910-9补体激活APOH1710-6脂质代谢CTBS1510-8碳水化合物代谢

*,负的G检验=在OSA-I中相对于OSA-N减少

**,已经开发的尿ELISA分析

通过ELISA定量尿蛋白质。根据制造商的方案使用可商购的用于CP、PROCR、APOH、KNG1(Assaypro),HPX(InnovativeResearch,Inc.),PIGR、RNASE1、COL12A1、CTBS(USCNLifeScience),CD59(Neobiolab)和肌酐(Abcam)的ELISA来定量尿蛋白质。为了说明变化的水合状态,所有蛋白质水平会被标准化为尿肌酐水平(Gardfe等人,2004),并会通过双尾学生t检验来评价组之间的统计显著性。这会证明先前识别的案例与对照样品(即OSA-I和OSA-N)之间的差异在使用独立的技术(即ELISA)测量候选生物标志物时仍然存在。本发明人已经证实了关于先前分析过的患者中的HPX、CP和UMOD的蛋白质组学发现。

实施例9

确定候选尿生物标志物在患OSA儿童的更大的独立群体中的预测能力

通过芝加哥大学的儿童睡眠实验室研究的儿童会经历多导睡眠记录、记忆测试、并提供尿样品用于生化分析。最初的测量会集中在HPX和CP,它们是本发明人已经通过ELISA验证过的。另外的候选生物标记会在实施例8中进行ELISA分析时进行测试。

实验设计。会根据人类研究机构指南招募满足该研究的入选标准的儿童。所有参与的儿童都会进入芝加哥大学儿童睡眠实验室留下过夜。会通过多导睡眠记录评估OSA严重度,会通过经验证的图像记忆测试(Kheirandish-Gozal等人,2010)来评估陈述性记忆,并会收集晨间尿样品用于生化分析(图9)。最初的测量会集中在HPX和CP,因为本发明人已经开发了用于这些候选生物标志物的ELISA分析。随着ELISA分析的开发会测试另外的候选生物标记。

患者选择。该研究的目标人群由在芝加哥大学睡眠医学中心临床评估打鼾的5至12岁大的儿童组成。该机构每年评价超过1250名儿童,这些中约80%患有作为其临床推荐的主要原因的打鼾和疑似睡眠障碍性呼吸。会从学校或幼儿保健诊所招募健康儿童(n=50)。患OSA儿童的入选标准会包括使用经广泛验证的调查问卷打鼾频率>3次/周的儿童。对照和OSA儿童的排除标准会包括存在明显的遗传或颅面综合征、糖尿病、囊胞性纤维症、癌症,或在用口服皮质类固醇、抗生素或抗炎药物进行治疗。另外,如果参与者患有任何慢性精神疾病、患有已知影响认知能力的遗传综合征、或正在接受已知干扰记忆或入睡开始或睡眠结构的药物,则他们会被排除。

整夜多导睡眠记录。所有参与的儿童会经历使用现有技术方法(Montgomery-Downs,2006)的整夜多导睡眠记录(PSG)。会用阻塞性呼吸暂停-低通气指数(AHI)来定量OSA的严重度,AHI被定义为总睡眠时间中每小时阻塞性呼吸暂停和低通气的次数(Grigg-Damberger等人,2007;Redline等人,2007)。

记忆回忆测试。为了评估记忆回忆,不知情的研究者会实施常规方法(Kheirandish-Gozal等人,2010)来评价患OSA的儿童(图9)。会给儿童示出一系列26幅有色的动物图片,这些图片都是儿童熟悉的(例如狗、猫、鸡、狮子、大象、长颈鹿、马、牛、骆驼、鱼、蝴蝶等)。会允许对象看每个动物图片10秒。儿童最初会识别动物,然后研究者也会说出每个动物(同时指出它们)作为对每个图片中动物的充分认知的进一步确认。在示出所有图片后,会合上书,给对象2分钟来自由回忆他们在不看图片的情况下可以记得的任何动物。每个正确的答案会得一分,错误的答案不会被扣分,对象会被告知允许他们重复动物的名字如果他们希望这样做。在初次试验后,会允许对象再看一次图片并复习动物名字。该过程会在晚上重复总计四次(获取阶段),然后在四次试验完成后10分钟进行第一次回忆测试。在该10分钟间隔期间,会允许儿童看电视。在睡眠研究后的上午,在醒来的10至15分钟内,会要求对象回忆他们在之前的夜间试验中记住的图片,并计算晨间分数。

尿收集和处理。在上午醒来后或在晚上收集中段尿样本作为首次排尿。为了使蛋白质降解最小化,会将样品(20mL)立即转移到含有丝氨酸蛋白酶抑制剂PMSF(最终浓度2mM)的管中,并在-80℃储存直至分析(Gozal等人,2009)。

开发多变量分类器。使用按顺序并入经验证的蛋白质以评价它们对分类器性能的互补贡献的ELISA测量来建立不同的多变量分类器(候选生物标志物的组)。使用线性判别分析(McLachlan,2004)来构建这些多变量分类器,线性判别分析对每个生物标志物分配反应其贡献的数值权重(在合计的分类器分数中)以共同地将OSA-I与OSA-N对象区分开。

评价候选生物标志物和分类器性能。会基于将正确和不正确分类的样品(即OSA-I相对于OSA-N)的数量制表来计算每种单独的候选生物标志物或每个多变量的分类器(生物标志物的组)的灵敏度和特异性。通过将所有可获得的阈值的所有灵敏度值绘制在y轴而将其当量(1-特异性)值绘制在x轴上来获得受试者工作特征(ROC)图。通过曲线下面积来评价每个测试的整体准确度,因为其提供不依赖于特定阈值的单个测量(Fawcett等人,2006)。会基于自然对数转换后的强度和近似t分布的高斯分布来计算上调的p值。通过Reiner及其同事描述的方法(Reiner等人,2003)来进行多个检验的统计调整。

**************

本文中所公开和要求保护的所有组合物和/或方法可以根据本公开制成和实现而不需要不合适的实验。尽管本发明的组合物和方法已经按照一些实施方案进行了描述,但是对于本领域技术人员明显的是,在不脱离本发明的概念、精神和范围的情况下可以对所述组合物和方法以及在本文所描述方法的步骤或步骤的顺序中实施变化。更具体地,明显地,化学和生理两方面都相关的特定试剂可以替代本文所描述的试剂,同时会实现相同或相似的结果。所有对本领域技术人员明显的这类相似的替代和改变都被视为在如由所附权利要求限定的本发明的精神、范围和概念内。

参考文献

以下参考文献和本文所列出的任何其他文献在一定程度上提供示例性程序或对本文所陈述细节补充的其他细节,它们通过引用完整地明确地并入本文。

Adachi等人,GenomeBiol.7(9):R80,2006.

Adedayo等人,“Obstructivesleepapneaanddyslipidemia:evidenceandunderlyingmechanism.Sleep&Breathing,2012.

Becker等人,CellMetab.11(2):125-135,2010.

Becker等人,PLoSONE.7(3):e33297,2012.

Benjamini等人,JRoyStatSocBMet.57(1):289-300,1995.

Chen等人,Proteomics:ClinApps.1:577,2007.

Chorostowska-Wynimko等人,JPhysiolPharmacol.56(Suppl4):71,2005.

Christensen等人,PLoSGenet.5(8):e1000602,2009.

Escudero等人,“Machinelearning-basedmethodforpersonalizedandcost-effectivedetectionofAlzheimer’sdisease.”IEEEtransactionsonbiomedicalengineering.2012.

Garde等人,AnnOccupHyg.48(2):171-9,2004.

Gozal等人,AmJRespirCritCareMed.177(10):1142-1149,2008.

Gozal等人,AmJRespirCritCareMed.177(4):369-75,2008.

Gozal等人,AmJRespirCritCareMed.180(12):1253-1261,2009.

Gozal等人,AnnNYAcadSci.1264(1):135-141,2012.

Gozal等人,CurrOpPed.20(6):654-8,2008.

Gozal等人,Pediatrics.126(5):e1161-7,2010.

Gozal等人,SleepMed.11(7):708-13,2010.

Heinecke等人,Bioinformatics.26(12):1574-5,2010.

Huttenhain等人,SciTranslMed.4(142):142ra94,2012.

Iber等人,TheAASMmanualforthescoringofsleepandassociatedevents:rules,terminology,andtechnicalspecifications.2007.

Keller等人,AnalChem.74(20):5383-92,2002.

Kentsis,PedInt:OffJJapanPedSoc.53(1):1-6,2011.

Kersey等人,Proteomics.4:1985-8,2004.

Kim等人,RespirPhysiolNeurobiol.178(3):465-74,2011.

Kushnir等人,JBiomolTech.20(2):101-8,2009.

LaThangue等人,NatRevClinOncol.8(10):587-96,2011.

Leary等人,SciTranslMed.2:20ra14,2010.

Liu,etal.AnalChem.76(14):4193-201,2004.

Maere等人,Bioinformatics.21(16):3448-9,2005.

Montgomery-Downs等人,Pediatrics.117(3):741-53,2006.

Nesvizhskii等人,AnalChem.75(17):4646-58,2003.

Old,etal.MolCellProteomics.4:1487,2005.

Rauch等人,JProteomeRes.5:112,2006.

Riaz,etal.DiabetesTechThera.12(12):979-88,2010.

Siwy等人,Proteomics.5(5-6):367-74,2011.

Slupsky等人,AnalChem.79(18):6995-7004,2007.

Soggiu等人,“Adiscovery-phaseurineproteomicsinvestigationintype1diabetes”ActaDiabetol.(Inpress),2012.

Stratz等人,CardiolRev.20:111,2012.

Thongboonkerd等人,JProteomeRes.5(1):183-91,2006.

Verrills等人,AmJRespirCritCareMed.183(12):1633-43,2011.

VonKanel等人,Chest.131(3):733-9.

Zengi等人,ClinChemLabMed:CCLM/FESCC.50:529,2012.

Zimmerli等人,MolCellProteomics.7(2):290-8,2007.

Zoidakis等人,MolCellProteomics.11(4):M111.009449,2012.

Zurbig等人,Diabetes.61(12):3304-13,2012.

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号