首页> 中国专利> 用于预测妊娠期高血压疾病的DNA甲基化区段组合及应用

用于预测妊娠期高血压疾病的DNA甲基化区段组合及应用

摘要

本发明提供一种用于预测妊娠期高血压疾病的DNA甲基化区段组合及应用、妊娠期高血压疾病的预测方法及装置,其中所述方法利用筛选出的外周血DNA甲基化区段,采用逻辑回归方法,构建针对妊娠期高血压疾病的风险预测模型,计算妊娠期高血压疾病的发病风险值,从而能够有效预测妊娠期高血压疾病的发病风险。

著录项

  • 公开/公告号CN115521981A

    专利类型发明专利

  • 公开/公告日2022-12-27

    原文格式PDF

  • 申请/专利权人 国家卫生健康委科学技术研究所;

    申请/专利号CN202211290598.3

  • 申请日2022-10-21

  • 分类号C12Q1/6883(2018.01);G16H50/30(2018.01);G16B20/30(2019.01);

  • 代理机构北京盈权知识产权代理事务所(普通合伙) 16022;

  • 代理人路传亮

  • 地址 100081 北京市海淀区大慧寺路12号

  • 入库时间 2023-06-19 18:14:35

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-01-13

    实质审查的生效 IPC(主分类):C12Q 1/6883 专利申请号:2022112905983 申请日:20221021

    实质审查的生效

  • 2022-12-27

    公开

    发明专利申请公布

说明书

技术领域

本发明涉及生殖生育健康领域,特别是涉及一种用于预测妊娠期高血压疾病的DNA甲基化区段组合及应用、妊娠期高血压疾病的预测方法及装置、计算机设备及计算机可读存储介质。

背景技术

妊娠期高血压疾病(Hypertensive disorders of pregnancy,HDP)是妊娠与血压升高并存的一组疾病,其分类包括慢性高血压合并的妊娠(孕前存在高血压或者孕周在20周之前出现的血压升高)、单纯妊娠期高血压(pregnancy-induced hypertension,PIH)和子痫前期(Preeclampsia,PE)。单纯妊娠期高血压(PIH)是指发生于妊娠20周以后,以血压升高(收缩压≥140mmHg和/或舒张压≥90mmHg)、蛋白尿、浮肿为特征的一系列综合性疾病,严重时可伴随抽搐、昏迷、心肾功能衰竭甚至导致母婴死亡。子痫前期是指妊娠20周后发病,以高血压和蛋白尿为主要表现的临床综合征,发病率为2%~3%,可伴有脑、心、肝、肾等重要脏器的功能损害,也是导致母儿围生期死亡的重要原因,子痫前期与子痫占所有孕产妇死亡的10%~15%。

妊娠期高血压疾病(HDP)严重影响母婴健康,病因和发病机制十分复杂,目前这方面的国内外研究也尚无定论,诊断个体差异大,而且尚无有效治愈方法,临床上通过采取休息、镇静、解痉、降压、有指征的利尿、密切监测母胎情况等措施对症处理以控制病情,而终止妊娠是唯一的治愈手段。这就需要尽早识别可能发生HDP的高危孕妇人群,帮助临床医生提前对高危孕妇和胎儿进行监测,及时地采取有效的干预措施,控制疾病的发展,降低疾病严重程度,从而改善预后。但是目前尚无公认有效的方法可以预测HDP的发生。

发明内容

为解决上述技术问题,本发明提出一种用于预测妊娠期高血压疾病的DNA甲基化区段组合及应用、妊娠期高血压疾病的预测方法及装置、计算机设备及计算机可读存储介质,能够有效预测妊娠期高血压疾病的发病风险。

本发明的一个方面提供一种用于预测妊娠期高血压疾病的DNA甲基化区段组合,所述DNA甲基化区段组合为以下6个DNA甲基化区段的组合,该6个DNA甲基化区段的扩增子、对应的基因和染色体上具体位置为:

(1)Amplicon7、HMGB1、Chr13:31040015-31040215;

(2)Amplicon18、JMJD6、Chr17:74722858-74723058;

(3)Amplicon22、CTSA、Chr20:44519758-44519958;

(4)Amplicon36、PTEN、Chr10:89622381-89622581;

(5)Amplicon42、LIN28B、Chr6:105404737-105404937;

(6)Amplicon70、FADS2、Chr11:61583590-61583790。

优选地,所述6个DNA甲基化区段是通过对妊娠妇女孕早期的空腹血清样本进行甲基化分析并使用Lasso回归方法筛选对妊娠期高血压疾病影响最大的扩增子而得到的。

本发明的另一个方面提供一种上述的DNA甲基化区段组合在预测妊娠期高血压疾病中的应用。

本发明的又一个方面提供一种妊娠期高血压疾病的预测方法,利用上述的DNA甲基化区段组合,预测妊娠期高血压疾病的发病风险,所述方法包括:

计算步骤:根据待测样本的所述6个DNA甲基化区段的表达情况,使用以下逻辑回归模型计算待测样本的妊娠期高血压疾病的发病风险值:

其中,Y为发病风险值,x

判断步骤:当待测样本的发病风险值Y大于阈值时,则样本判断为妊娠期高血压疾病高危;当待测样本的发病风险值Y小于阈值时,则样本判断为妊娠期高血压疾病低危。

优选地,所述6个DNA甲基化区段的扩增子、对应的基因和回归系数如下:

(1)Amplicon7、HMGB1、51.27;

(2)Amplicon18、JMJD6、5.81;

(3)Amplicon22、CTSA、-10.31;

(4)Amplicon36、PTEN、5.50;

(5)Amplicon42、LIN28B、5.35;

(6)Amplicon70、FADS2、32.93。

优选地,根据如下公式计算发病风险值Y:logit(Y)=ln(Y/(1-Y))。

优选地,所述风险阈值P为0.421。

本发明的又一个方面提供一种妊娠期高血压疾病的预测装置,利用上述的DNA甲基化区段组合,预测妊娠期高血压疾病的发病风险,所述装置包括:

计算模块,构成为根据待测样本的所述6个DNA甲基化区段的表达情况,使用以下逻辑回归模型计算妊娠期高血压疾病的发病风险值:

其中,Y为发病风险值,x

判断模块,构成为当待测样本的发病风险值Y大于阈值时,则样本判断为妊娠期高血压疾病高危;当待测样本的发病风险值Y小于阈值时,则样本判断为妊娠期高血压疾病低危。

本发明的又一个方面提供一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述的方法的步骤。

本发明的又一个方面提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述的方法的步骤。

根据本发明上述方面的用于预测妊娠期高血压疾病的DNA甲基化区段组合及应用、妊娠期高血压疾病的预测方法及装置、计算机设备及计算机可读存储介质,能够有效预测妊娠期高血压疾病的发病风险。

参考以下描述,本申请的这些和其他特征、方面和优点将变得更好理解。并入于本说明书中且构成本说明书的一部分的附图说明本申请的实施例,且连同所述描述一起用于解释本申请的原理。

附图说明

本说明书中针对所属领域的技术人员来阐述本申请的完整和启发性公开内容,包括其最佳实施方式,本说明书参考了附图,在附图中:

图1是本发明一种实施方式的妊娠期高血压疾病的预测方法的流程图。

图2是本发明一种实施方式的妊娠期高血压疾病的预测方法的ROC曲线。

图3是本发明一种实施方式的妊娠期高血压疾病的预测装置的构成图。

图4是本发明一种实施方式的计算机设备的结构图。

具体实施方式

现将详细参考本申请的实施例,在图中说明本申请的实施例的一个或多个实例。每个实例是为了解释本申请而提供,而非限制本申请。实际上,所属领域的技术人员将清楚,在不脱离本申请的范围或精神的情况下可在本申请中进行各种修改和变化。举例来说,说明或描述为一个实施例的一部分的特征可与另一实施例一起使用以产生再一实施例。因此,希望本申请涵盖此类修改和变化,所述修改和变化处于所附权利要求书及其等效物的范围内。如本说明书中所使用,术语“第一”、“第二”等可互换使用以区分一部件与另一部件而并非意图表示各个部件的位置或重要性。如说明书中所使用,除非上下文另外明确指出,否则术语“一”,“一个”、“该”和“所述”旨在表示存在一个或多个元件。术语“包括”,“包括”和“具有”旨在是包括性的,并且意味着除列出的要素外可能还有其他要素。其中在所有附图中相同的数字表示相同的元件,下面结合具体的实施方式对本发明做进一步的解释说明。

本发明的实施方式提供一种用于预测妊娠期高血压疾病的DNA甲基化区段组合。本发明的发明人基于表观遗传学以及DNA甲基化相关研究,收集妊娠妇女孕早期的空腹血清样本,根据是否患有HDP对样本进行分装处理,构建妊娠期高血压疾病前瞻性妊娠队列生物样本库,利用例如Infinium Human Methylation EPIC BeadChip(Illumina)850K芯片进行分析,获得其DNA甲基化区段,采用Lasso回归方法(least absolute shrinkage andselection operator,最小绝对值收敛和选择算子算法)筛选对疾病影响最大的扩增子,从而进行有预测价值的DNA甲基化区段的筛选,确定了一种优化的待测DNA甲基化区段组合,作为本发明的用于预测妊娠期高血压疾病的DNA甲基化区段组合。该DNA甲基化区段组合为以下6个DNA甲基化区段的组合,该6个DNA甲基化区段的扩增子、对应的基因和染色体上具体位置如下表1所示。

表1:用于预测妊娠期高血压疾病的DNA甲基化区段组合

本发明的实施方式还提供一种上述实施方式的DNA甲基化区段组合在预测妊娠期高血压疾病中的应用。

本发明的实施方式还提供一种妊娠期高血压疾病的预测方法,利用上述实施方式的DNA甲基化区段组合,预测妊娠期高血压疾病的发病风险。图1是本发明一种实施方式的妊娠期高血压疾病的预测方法的流程图。如图1所示,本发明实施方式的妊娠期高血压疾病的预测方法方法包括计算步骤S1和判断步骤S2。

在计算步骤S1中,根据待测样本的所述6个DNA甲基化区段的表达情况,使用以下逻辑回归模型计算待测样本的妊娠期高血压疾病的发病风险值Y:

公式(1)可看作使用直线去拟合Logit函数,通过极大似然估计求出式中x

优选地,所述6个DNA甲基化区段的扩增子、对应的基因和回归系数如下表2所示。

表2:DNA甲基化区段的回归系数

再根据以下公式(2)计算出发病风险值Y:

logit(Y)=ln(Y/(1-Y)) (2)

根据表2和公式(2),所建立的妊娠期高血压疾病发病风险预测公式如下:

ln(Y_HDP/(1-Y_HDP))=-2.00+51.27×Amplicon7+5.81×Amplicon18-10.31×Amplicon22+5.50×Amplicon36+5.35×Amplicon42+32.93×Amplicon70 (公式3)。

在计算步骤S1中得到待测样本的发病风险值Y后,在判断步骤S2中,当待测样本的发病风险值Y大于阈值时,则样本判断为妊娠期高血压疾病高危;当待测样本的发病风险值Y小于阈值时,则样本判断为妊娠期高血压疾病低危。

其中,可以根据预测模型曲线中最靠近左上方的点确定妊娠期高血压疾病的风险阈值。妊娠期高血压疾病最优风险阈值P为0.421。

以下通过实施例说明本发明实施方式的妊娠期高血压疾病的预测方法。

实验样本:训练组包含189例妊娠期高血压疾病样本,199例健康对照;验证组包含94例妊娠期高血压疾病样本,99例健康对照。

按照本发明实施方式的妊娠期高血压疾病的预测方法进行操作,统计预测方法的准确性、敏感性和特异性。

结果显示,本发明实施方式的妊娠期高血压疾病的预测方法在训练组和验证组中均能在早期发病前有效判断妊娠期高血压疾病患者。

计算结果示例如下:

样本1(已确诊妊娠期高血压疾病孕妇的发病前样本):

ln(Y

Y

样本数值大于妊娠期高血压疾病阈值P(0.421),判断为妊娠期高血压疾病高危样本。结果准确。

样本2(健康样本):

ln(Y

Y

样本数值小于妊娠期高血压疾病阈值P(0.421),判断为妊娠期高血压疾病低危样本。结果准确。

表3是本发明实施方式的妊娠期高血压疾病的预测方法在训练组和验证组判断妊娠期高血压疾病患者的相关指标。图2是本发明实施方式的妊娠期高血压疾病的预测方法的ROC曲线(receiver operating characteristic curve,受试者工作特征曲线)。

在表3中,函数下曲线面积(AUC)为分别随机从数据中抽取一个健康样本、一个患病样本,患病样本的预测值大于健康样本的概率。常见的预测模型中有如下描述性变量:预测正确患病(TP),预测错误患病(FP),预测正确健康(TN),预测错误健康(FN),准确性计算方法为:(TP+TN)/(TP+TN+FP+FN),准确性为测量结果与真实结果最接近的程度。敏感性计算方法为:TP/(TP+TN+FP+FN),敏感性反映本模型对于患病情况的预测情况。特异性计算方法为:TN/(TP+TN+FP+FN),特异性反映本模型对于健康患者的预测情况。

表3:本发明实施方式判断妊娠期高血压疾病患者的相关指标

图2为ROC曲线的直观表现,在图1中,从(0,0)开始至(1.0,1.0)结束,计算其函数下AUC来反映模型的综合效能,其中横坐标为1-特异性(Specificity),纵坐标为敏感性(Senseitivity)。

综上所述,本发明通过利用筛选出的患者外周血DNA甲基化区段来构建新发妊娠期高血压疾病风险预测模型,该预测模型快捷、方便、准确度高、设计合理可行,为早期预测、防治HDP病情进展提供理论依据,从而能够及早发现并严格管理高危人群,减轻病情、延长孕周、改善预后,最终降低母婴病死率。

本发明实施方式还提供一种妊娠期高血压疾病的预测装置,利用上述本发明实施方式的DNA甲基化区段组合,预测妊娠期高血压疾病的发病风险。图3是本发明一种实施方式的妊娠期高血压疾病的预测装置的构成图,如图3所示,本发明实施方式的妊娠期高血压疾病的预测装置包括:

计算模块101,构成为根据待测样本的所述6个DNA甲基化区段的表达情况,使用以下逻辑回归模型计算妊娠期高血压疾病的发病风险值:

其中,Y为发病风险值,x

判断模块102,构成为当待测样本的发病风险值Y大于阈值时,则样本判断为妊娠期高血压疾病高危;当待测样本的发病风险值Y小于阈值时,则样本判断为妊娠期高血压疾病低危。

本实施方式的妊娠期高血压疾病的预测装置的具体实施例可以参见上文中对于妊娠期高血压疾病的预测方法的限定,在此不再赘述。上述妊娠期高血压疾病的预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。

本发明的实施方式还提供一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图2所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储各个框架的运行参数数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现本实施方式的妊娠期高血压疾病的预测方法的步骤。

本领域技术人员可以理解,图2中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。

本发明的实施方式还提供一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现本发明实施方式的妊娠期高血压疾病的预测方法的步骤。

以上所述为本发明的优选实施方式,对于本领域的技术人员而言,基于本发明公开的技术方案和发明实质,还可以做出其他的变形和改进,但这些基于本发明的变形和改进,均应涵盖于本发明的保护范围。本说明书使用实施例来公开本申请,包括最佳实施例,并且还使所属领域的技术人员能够实践本申请,包括制造和使用任何装置或系统以及执行任何所并入的方法。本申请的可获专利的范围由权利要求书限定,且可包括所属领域的技术人员所想到的其他实施例。如果此类其他实施例包括并非不同于权利要求书的字面语言的结构要素,或如果它们包括与权利要求书的字面语言无实质差异的等效结构要素,那么它们既定在权利要求范围内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号