首页> 中国专利> 基于代谢组学数据的急性冠脉综合征预警方法及装置

基于代谢组学数据的急性冠脉综合征预警方法及装置

摘要

本发明公开了一种基于代谢组学数据的急性冠脉综合征预警方法及装置,其中该方法包括:获取正常冠状动脉生物个体和急性冠脉综合征生物个体的代谢物数据;筛选出差异代谢物数据;根据差异代谢物数据,对LightGBM模型进行机器学习,得到急性冠脉综合征预警模型,该急性冠脉综合征预警模型中包含:用于诊断急性冠脉综合征的多种生物标志物;根据急性冠脉综合征预警模型,获取待诊断生物个体对应每种生物标志物的指标值,并判断每种生物标志物的指标值是否超过预设正常取值范围,根据判断结果,输出待诊断生物个体的急性冠脉综合征预警信息。本发明能够根据患者的代谢物数据对患者进行急性冠脉综合征预警,实现无创预警。

著录项

说明书

技术领域

本发明涉及机器学习应用领域,尤其涉及一种基于代谢组学数据的急性冠脉综合征预警方法及装置。

背景技术

本部分旨在为权利要求书中陈述的本发明实施例提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

冠心病(Coronary artery disease,CAD)又称冠状动脉粥样硬化性心脏病,是一种由基因和环境共同作用的代谢紊乱性疾病,已成为发达国家和发展中国家的首要致死原因之一。根据其临床症状、动脉阻塞和心肌损伤程度,CAD可分为不同的类别:稳定型冠心病(stable coronary artery disease,sCAD)、不稳定心绞痛(unstable angina pectoris,UA)和急性心肌梗死(acute myocardial infarction,AMI),其中UA和AMI又被称为急性冠脉综合征(acute coronary syndrome,ACS)。ACS大多由于动脉粥样硬化(Atherosclerosis,AS)斑块破裂或侵蚀导致的突发性腔内血栓形成引起。动脉粥样硬化属于一种脂质驱动的动脉内膜炎症性疾病,由于高血脂、高胆固醇等危险因素使得氧化低密度脂蛋白(LDL)水平升高,导致动脉内膜损伤,内膜皮上的单核细胞吞噬脂质成为泡沫细胞,形成粥样硬化病变——脂质条纹,之后在多种生长因子、促炎症介质的作用下,产生病变,形成纤维斑块,当斑块不稳定时发生破裂,从而引起急性血栓。由于冠心病的动态性和复杂性,炎性不稳定斑块的形成、发展和移位的机制仍不清楚,因此识别ACS患者的冠状动脉斑块发生破裂的生物标志物对于预防其从稳定状态转变为不稳定状态以及防止血栓形成至关重要。

目前基因组学研究在鉴定影响胆固醇水平等主要危险因素的遗传变异方面取得了很大的成功,但仍需要发现新的特异性易感基因、药物作用靶点及预测 ACS 风险的生物标志物,来增加医务人员对ACS病理机制的理解。现有冠心病诊断方法存在敏感性、特异性差、具有侵入性和有创性等缺点,难以实现ACS的早期诊断。

代谢组学是继基因组学、转录组学和蛋白质组学后出现的新的组学技术,已成为代谢过程研究、生物标志物识别以及揭示代谢机制的强有力工具,因此运用代谢组学手段深入挖掘冠心病的动态调控网络,探索关键信号通路基础,寻找分子标志物,建立冠心病的早期诊疗方法,对于降低冠心病的发生率和病死率具有重要意义。

随着代谢组学分析仪器和分析方法的进步,从生物样本中检测到的代谢物数量越来越多,数据量也日益庞大。因而,如何充分考虑急性冠脉综合征患者的新陈代谢特征,确定一个根据代谢物数据对急性冠脉综合征进行预警的模型,是目前亟待解决的技术问题。

发明内容

本发明实施例中提供了一种基于代谢组学数据的急性冠脉综合征预警方法,用以解决现有技术无法实现基于代谢物数据对急性冠脉综合征进行预警的技术问题,该方法包括:获取正常冠状动脉生物个体和急性冠脉综合征生物个体的代谢物数据;根据正常冠状动脉生物个体和急性冠脉综合征生物个体的代谢物数据,筛选出差异代谢物数据;根据差异代谢物数据,对LightGBM模型进行机器学习,得到急性冠脉综合征预警模型,其中,急性冠脉综合征预警模型中包含:用于诊断急性冠脉综合征的多种生物标志物;根据急性冠脉综合征预警模型,获取待诊断生物个体对应每种生物标志物的指标值,并判断待诊断生物个体对应每种生物标志物的指标值是否超过预设正常取值范围,根据判断结果,输出待诊断生物个体的急性冠脉综合征预警信息。

本发明实施例中还提供了一种基于代谢组学数据的急性冠脉综合征预警装置,用以解决现有技术无法实现基于代谢物数据对急性冠脉综合征进行预警的技术问题,该装置包括:代谢物数据获取模块,用于获取正常冠状动脉生物个体和急性冠脉综合征生物个体的代谢物数据;差异代谢物筛选模块,用于根据正常冠状动脉生物个体和急性冠脉综合征生物个体的代谢物数据,筛选出差异代谢物数据;模型学习模块,用于根据差异代谢物数据,对LightGBM模型进行机器学习,得到急性冠脉综合征预警模型,其中,急性冠脉综合征预警模型中包含:用于诊断急性冠脉综合征的多种生物标志物;急性冠脉综合征预警模块,用于根据急性冠脉综合征预警模型,获取待诊断生物个体对应每种生物标志物的指标值,并判断待诊断生物个体对应每种生物标志物的指标值是否超过预设正常取值范围,根据判断结果,输出待诊断生物个体的急性冠脉综合征预警信息。

本发明实施例中还提供了一种计算机设备,用以解决现有技术无法实现基于代谢物数据对急性冠脉综合征进行预警的技术问题,该计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述基于代谢组学数据的急性冠脉综合征预警方法。

本发明实施例中还提供了一种计算机可读存储介质,用以解决现有技术无法实现基于代谢物数据对急性冠脉综合征进行预警的技术问题,该计算机可读存储介质存储有执行上述基于代谢组学数据的急性冠脉综合征预警方法的计算机程序。

本发明实施例中,在获取到正常冠状动脉生物个体和急性冠脉综合征生物个体的代谢物数据后,根据正常冠状动脉生物个体和急性冠脉综合征生物个体的代谢物数据,筛选出差异代谢物数据,进而根据筛选出的差异代谢物数据,对LightGBM模型进行机器学习,得到一个包含多种生物标志物的急性冠脉综合征预警模型,以便基于该急性冠脉综合征预警模型,采集待诊断生物个体对应每种生物标志物的指标值,并判断待诊断生物个体对应每种生物标志物的指标值是否超过预设正常取值范围,根据判断结果,输出相应的预警信息。

通过本发明实施例,能够提供一种无创的急性冠脉综合征预警方法,根据患者的代谢物数据对患者进行急性冠脉综合征预警。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:

图1为本发明实施例中提供的一种基于代谢组学数据的急性冠脉综合征预警方法流程图;

图2为本发明实施例中提供的一种机器学习流程图;

图3为本发明实施例中提供的一种代谢物数据获取流程图;

图4为本发明实施例中提供的一种急性冠脉综合征预警模型的AUROC曲线图;

图5为本发明实施例中提供的一种基于代谢组学数据的急性冠脉综合征预警结果示意图;

图6为本发明实施例中提供的一种基于代谢组学数据的急性冠脉综合征预警装置示意图;

图7为本发明实施例中提供的一种可选的基于代谢组学数据的急性冠脉综合征预警装置示意图;

图8为本发明实施例中提供的一种计算机设备示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚明白,下面结合附图对本发明实施例做进一步详细说明。在此,本发明的示意性实施例及其说明用于解释本发明,但并不作为对本发明的限定。

本发明实施例中提供了一种基于代谢组学数据的急性冠脉综合征预警方法,图1为本发明实施例中提供的一种基于代谢组学数据的急性冠脉综合征预警方法流程图,如图1所示,该方法包括如下步骤:

S101,获取正常冠状动脉生物个体和急性冠脉综合征生物个体的代谢物数据。

需要说明的是,上述正常冠状动脉生物个体是指未患有急性冠脉综合征的人群(即正常人群);上述急性冠脉综合征生物个体是指患有急性冠脉综合征的人群(即患者);本发明实施例中的代谢物数据是指对研究对象的血浆样本进行分析得到的各种生物代谢物的数据。

S102,根据正常冠状动脉生物个体和急性冠脉综合征生物个体的代谢物数据,筛选出差异代谢物数据。

需要说明的是,通过分析正常冠状动脉生物个体和急性冠脉综合征生物个体的代谢物数据,可以筛选出存在差异的一种或多种代谢物。

S103,根据差异代谢物数据,对LightGBM模型进行机器学习,得到急性冠脉综合征预警模型,其中,急性冠脉综合征预警模型中包含:用于诊断急性冠脉综合征的多种生物标志物。

需要说明的是,上述急性冠脉综合征预警模型是指对机器学习模型进行训练,得到一个能够根据代谢物数据对急性冠脉综合征进行预警的模型。

在具体实施时,可以根据实验条件、生物样本差异以及适用条件,可以采用不同的机器学习算法,例如,线性回归、随机森林等。本发明实施例中选择LightGBM(LightGradient Boosting Machine)模型来进行机器学习训练,该模型具有更快的训练效率,低内存使用,更高的准确率,支持并行化学习,可处理大规模数据等优点。

S104,根据急性冠脉综合征预警模型,获取待诊断生物个体对应每种生物标志物的指标值,并判断待诊断生物个体对应每种生物标志物的指标值是否超过预设正常取值范围,根据判断结果,输出待诊断生物个体的急性冠脉综合征预警信息。

需要说明的是,上述待诊断生物个体是指未知是否具有急性冠脉综合征的人群。本发明实施例中提供的基于代谢组学数据的急性冠脉综合征预警方法,可以通过文字、语音等任意一种形式输出待诊断生物个体的急性冠脉综合征预警信息。

通过本发明实施例中提供的基于代谢组学数据的急性冠脉综合征预警方法,得到的急性冠脉综合征预警包含如下生物标志物:2-羟基丁酸、二氢尿嘧啶、琥珀酸、2,3-二羟基丁酸、水杨酸、赖氨酸、鼠李-1,4-内酯、多巴醌、乌头酸、N-乙酰-L-苯丙氨酸、羟乙基赖氨酸、泛酸、3-羟基-L-犬尿氨酸、N-甲酰犬尿氨酸、6-磷酸葡萄糖、前酪氨酸、6-磷酸-2-脱氢葡糖酸、视黄酸、氯吡格雷羧酸、白三烯B4、半乳糖、7α-羟基胆固醇、4-磷酸泛酰半胱氨酸。

如图2所示,本发明实施例中提供的基于代谢组学数据的急性冠脉综合征预警方法,还可以通过如下步骤来实现急性冠脉综合征预警模型的训练:

S201,将差异代谢物数据,按照预设比例划分为训练数据和测试数据;

S202,根据训练数据,对LightGBM模型进行训练,得到急性冠脉综合征预警模型;

S203,根据测试数据,对训练得到的急性冠脉综合征预警模型进行验证。

在具体实施时,可将代谢组学数据样本中70%的数据作为训练数据,将30%的数据作为测试数据。

需要说明的是,本发明实施例中提供的基于代谢组学数据的急性冠脉综合征预警方法,在对LightGBM模型进行机器学习的过程中,可采用GridSearchCV算法和Hyperopt算法对模型参数进行调整。

在一个实施例中,如图3所示,本发明实施例中提供的基于代谢组学数据的急性冠脉综合征预警方法,还可以通过如下步骤来获取正常冠状动脉生物个体和急性冠脉综合征生物个体的代谢物数据:

S301,采集正常冠状动脉生物个体和急性冠脉综合征生物个体的血浆样本;

S302,使用液相色谱-质谱联用分析方法,对正常冠状动脉生物个体和急性冠脉综合征生物个体的血浆样本进行分析,得到正常冠状动脉生物个体和急性冠脉综合征生物个体的代谢物数据。

在本发明实施例中,使用液相色谱-质谱联用分析方法,对正常冠状动脉生物个体和急性冠脉综合征生物个体的血浆样本进行分析,可得到正常冠状动脉生物个体和急性冠脉综合征生物个体的代谢物数据。

在一个实施例中,本发明实施例中提供的基于代谢组学数据的急性冠脉综合征预警方法,还可以包括:采用Boruta算法确定急性冠脉综合征预警模型中不同生物标志物的重要程度。

需要说明的是,Boruta的目标就是选择出所有与因变量相关的特征集合,而不是针对特定模型选择出可以使得模型cost function最小的特征集合。Boruta算法的意义在于可以更全面的理解因变量的影响因素,从而更好、更高效地进行特征选择。Boruta是python中的一个特征选择包,安装该包后输入差异代谢物相对丰度历史信息,可以得到适合建模的重要特征。其具体算法步骤为:(1)创建阴影特征 (shadow feature) : 对每个真实特征R,随机打乱顺序,得到阴影特征矩阵S,拼接到真实特征后面,构成新的特征矩阵N =[R, S];(2)用新的特征矩阵N作为输入,训练模型,得到真实特征和阴影特征;(3)取阴影特征的最大值,真实特征中大于该值的,记录一次命中;(4)使用(3)中记录的真实特征累计命中,标记特征重要或不重要;(5)删除不重要的特征,重复(1)~(4),直到所有特征都被标记。

本发明实施例中提供的基于代谢组学数据的急性冠脉综合征预警方法,在具体实施时,可包括如下步骤:

一、代谢组学样本前处理:收集血液样本,并在一小时内离心取血浆,立即放入-80℃冰箱储存。进行样本前处理时精密吸取100 μl血浆至10 ml 玻璃管中,加入20μl混标,加入3ml MeOH: MTBE(1:1,V/V)沉淀蛋白,在2500 rpm下涡旋5 min,后4200 rpm,4℃条件下离心10 min,吸取上清液至另一个玻璃管。加入3 ml MTBE和1.2 ml H

二、LC-HRMS分析条件:使用液相色谱-质谱联用分析方法进行代谢组学数据采集,其中色谱柱选择Waters ACQUITY UPLC HSS T3 色谱柱(2.1×100 mm,1.8 µm);进样量为10 μL;柱温为35℃;流速为0.25 ml/min。流动相A: H

表1 流动相梯度

表2 质谱条件

三、代谢组学数据处理及差异代谢物筛选:将LC-HRMS分析获得的原始数据导入Progenesis QI中进行峰识别、峰对齐、数据归一化,得到包含质荷比、保留时间、原始峰面积、归一化峰面积等信息的二维数据矩阵,采用QC样本进行数据质量评估。对于质控后的数据采用基于

四、基于LightGBM机器学习算法,构建预测模型及使用外部数据进行模型验证:

(1)采用Boruta算法进行特征选择。

(2)GridSearchCV(网格搜索)调整参数,即在指定的参数范围内,按步长依次调整参数,利用调整的参数训练学习器,从所有的参数中找到在验证集上精度最高的参数,这其实是一个循环和比较的过程。

(3)LightGBM建模;LightGBM是比Xgboost更强大、速度更快的模型,性能上有很大的提升,与传统算法相比具有的优点:更快的训练效率、低内存使用、更高的准确率、支持并行化学习、可处理大规模数据。

(4)选择该模型中重要特征,重新建模;

(5)采用Hyperopt对新模型进一步参数调优,Hyperopt是一种通过贝叶斯优化来调整参数的工具,该方法较快的速度,并有较好的效果。此外,Hyperopt结合MongoDB可以进行分布式调参,快速找到相对较优的参数;

(6)LightGBM 建模预测;

(7)重新获取一批从未参与建模的外部数据,将构建好的模型用于预测这批数据,通过AUROC来判断预测模型的好坏。

五、基于上述算法,获得针对正常人群的急性冠脉综合征预警模型,模型所采用的标志物信息如表3所示。

表3 生物标志物信

上述表3中,“*”代表已通过LC-MS

图4示出了急性冠脉综合征预警模型的AUROC曲线图,如图4所示,训练数据的AUROC为0.98491,测试数据的AUROC为0.97166。图5示出了从代谢组学数据中筛选出的多个急性冠脉综合征生物标志物及其重要程度。

下面结合一个具体的例子,来对本发明实施例进行说明:

(一)临床入组标准:依据冠状动脉粥样硬化性心脏病的临床特点,将参与者分为2组,包括: ①ST段抬高急性心肌梗死(STEMI,不稳定斑块破裂组,心肌坏死);非ST段抬高急性心肌梗死(NSTEMI,不稳定斑块部分破裂组,心肌少量坏死)和不稳定心绞痛(UAP,斑块濒临破裂或破裂前不稳定组,心肌微量坏死),即ACS组,N=102;②无动脉粥样硬化斑块的正常对照组,即normal coronary artery组,NCA,N=93。在临床信息收集的基础上,采集各组人群血液样本,离心得到血浆后进行代谢组学分析。

(1)研究对象:

入选标准:稳定性冠心病(陈旧心梗、PCI史、稳定性心绞痛或无临床缺血症状的“健康人”,同时冠脉CT/造影发现有冠脉狭窄病变>50%)。

排除标准:

1)根据国际通用心肌梗死定义诊断为2-5型心肌梗死;

2)严重心力衰竭/心源性休克(Killip>2级或NYHA>2级);

3)存在机械并发症(室间隔穿孔、游离壁破裂、乳头肌断裂等);

4)发病后曾发生心脏骤停和/或心肺复苏;

5)3月内口服或使用静脉任何抗生素≥1周;

6)3月内急性冠状动脉综合征(ACS)或冠状动脉血管重建(包括PCI和CABG);

7)3月内创伤或手术;

8)3月内脑血管病史(包括脑梗死或脑出血);

9)3月内上消化道或下消化道出血;

10)3月内明确感染(包括消化道、呼吸道、体表感染等);

11)慢性肠道疾病(如克劳恩病、溃疡性结肠炎等等);

12)任何肿瘤;

13)风湿免疫性疾病;

14)慢性肾脏疾病,包括肾脏移植术后。

(2)研究对象入选及病例信息收集过程

1)知情同意书;

2)入选/排除标准;

3)患者生活方式问卷临床资料;

4)在临床信息收集的基础上,采集各组人群的血液、新鲜或妥善冷冻的粪便,进行组学分析。

(3)本临床研究遵守《世界医学大会赫尔辛基宣言》和国家相关法规的要求实施,所有参与实验的临床患者均已签署本项目《知情同意书》。

(二)实施方法:

(1)临床样本采集及前处理:采集195名参与者(生物个体)的代谢组学数据。根据诊断指南和排除标准将采集的代谢组学数据分为以下两组:NCA组(N = 93),ACS组(N =102)。

采集各个参与者在上午且空腹时间大于10小时条件下的血液样本,由医院完成相关临床常规生物标志物检测,所有检测均按照国际标准方法进行。在检测后将样品收集在含有肝素钠的试管中,冷却至4℃,1小时内离心取血浆(1,350 rpm,离心12分钟),分成等分试样后保存于在-80℃冰箱。

对采集的样本进行代谢组学分析前的样本前处理,前处理步骤如下:

精密吸取100 μl血浆至10 ml 玻璃管中,加入20μl混标,加入3ml MeOH: MTBE(1:1,V/V)沉淀蛋白,在2500 rpm下涡旋5 min,后4200 rpm,4℃条件下离心10 min,吸取上清液至另一个玻璃管。加入3 ml MTBE和1.2 ml H

(2)LC-HRMS分析条件:使用液相色谱-质谱联用分析方法进行代谢组学数据采集,其中液相色谱系统选择Waters二维 ACQUITY UPLC 系统,包括二元超高压梯度泵、四元超高压梯度泵、在线脱气机、自动进样器、柱温箱、4-40 °C 恒温箱、二极管阵列检测器和蒸发光散射检测器,并配有 EmpowerTM 工作站软件,色谱柱选择Waters ACQUITY UPLC HSS T3色谱柱(2.1×100 mm,1.8 µm);进样量为10 μL;柱温为35℃;流速为0.25 ml/min。流动相A: H

表4 流动相梯度

液相分析后,采用Q-Orbitrap高分辨质谱仪(Q-Exactive型)在全扫描采集模式对所测样本进行质谱检测,其配有Xcalibur 3.0数据采集系统,详细参数设置如表5所示。

表5设置参数信息

(3)代谢组学数据处理及差异代谢物筛选:

将LC-MS分析获得的原始数据导入Progenesis QI中进行峰识别、峰对齐、数据归一化,得到包含质荷比、保留时间、原始峰面积、归一化峰面积等信息的二维数据矩阵,采用QC样本进行数据质量评估。对于质控后的数据采用基于

(4)采用机器学习的方法建立预测模型:采用LightGBM的机器学习方法建模及十乘十交叉验证的方法,将差异代谢物数据随机分成训练集和测试集。首先采用Boruta算法进行特征选择。采用GridSearchCV(网格搜索)和Hyperopt不断调整参数,选择最优的参数。重新获取一批从未参与建模的外部数据,将构建好的模型用于预测这批数据,通过AUROC来判断预测模型的好坏。特征的重要性用其对模型的贡献度表示。所有的分析采用Python的Scikit-learn包。

由上可知,本发明实施例中提供的基于代谢组学数据的急性冠脉综合征预警方法,针对目前冠心病诊断方法的敏感性、特异性差,具有侵入性和有创性,难以实现ACS早期诊断的问题,应用LC-HRMS技术获取正常冠状动脉及急性冠脉综合征患者的代谢组学数据,筛选差异代谢物后基于机器学习方法,从复杂、繁冗的生物大数据中筛选可用于预测及监测急性冠脉综合征的生物标志物,能够提供一种无创的筛查与预警手段,弥补急性冠脉综合征临床预警的空白。基于代谢组学生物大数据,利用机器学习方法筛选生物标志物,使筛选得到的生物标志物更加可靠。

基于同一发明构思,本发明实施例中还提供了一种基于代谢组学数据的急性冠脉综合征预警装置,如下面的实施例。由于该装置解决问题的原理与基于代谢组学数据的急性冠脉综合征预警方法相似,因此该装置的实施可以参见基于代谢组学数据的急性冠脉综合征预警方法的实施,重复之处不再赘述。

图6为本发明实施例中提供的一种基于代谢组学数据的急性冠脉综合征预警装置示意图,如图6所示,该装置包括:代谢物数据获取模块61、差异代谢物筛选模块62、模型学习模块63和急性冠脉综合征预警模块64。

其中,代谢物数据获取模块61,用于获取正常冠状动脉生物个体和急性冠脉综合征生物个体的代谢物数据;差异代谢物筛选模块62,用于根据正常冠状动脉生物个体和急性冠脉综合征生物个体的代谢物数据,筛选出差异代谢物数据;模型学习模块63,用于根据差异代谢物数据,对LightGBM模型进行机器学习,得到急性冠脉综合征预警模型,其中,急性冠脉综合征预警模型中包含:用于诊断急性冠脉综合征的多种生物标志物;急性冠脉综合征预警模块64,用于根据急性冠脉综合征预警模型,获取待诊断生物个体对应每种生物标志物的指标值,并判断待诊断生物个体对应每种生物标志物的指标值是否超过预设正常取值范围,根据判断结果,输出待诊断生物个体的急性冠脉综合征预警信息。

可选地,上述代谢物数据获取模块61还用于:获取正常冠状动脉生物个体和急性冠脉综合征生物个体的血浆样本;使用液相色谱-质谱联用分析方法,对正常冠状动脉生物个体和急性冠脉综合征生物个体的血浆样本进行分析,得到正常冠状动脉生物个体和急性冠脉综合征生物个体的代谢物数据。

在一个实施例中,本发明实施例中提供的基于代谢组学数据的急性冠脉综合征预警装置中,模型学习模块63还用于在对LightGBM模型进行机器学习的过程中,采用GridSearchCV算法和Hyperopt算法对模型参数进行调整。

在一个实施例中,如图7所示,本发明实施例中提供的基于代谢组学数据的急性冠脉综合征预警装置中,模型学习模块63具体包括:样本数据划分模块631、模型训练模块632和模型验证模块633。

其中,样本数据划分模块631,用于将差异代谢物数据,按照预设比例划分为训练数据和测试数据;模型训练模块632,用于根据训练数据,对LightGBM模型进行训练,得到急性冠脉综合征预警模型;模型验证模块633,用于根据测试数据,对训练得到的急性冠脉综合征预警模型进行验证。

在一个实施例中,如图7所示,本发明实施例中提供的基于代谢组学数据的急性冠脉综合征预警装置还包括:生物标志物分析模块65,用于采用Boruta算法确定急性冠脉综合征预警模型中不同生物标志物的重要程度。

基于同一发明构思,本发明实施例中还提供了一种计算机设备,用以解决现有技术无法实现基于代谢物数据对急性冠脉综合征进行预警的技术问题,图8为本发明实施例中提供的一种计算机设备示意图,如图8所示,该计算机设备80包括存储器801、处理器802及存储在存储器801上并可在处理器802上运行的计算机程序,处理器802执行计算机程序时实现上述基于代谢组学数据的急性冠脉综合征预警方法。

基于同一发明构思,本发明实施例中还提供了一种计算机可读存储介质,用以解决现有技术无法实现基于代谢物数据对急性冠脉综合征进行预警的技术问题,该计算机可读存储介质存储有执行上述基于代谢组学数据的急性冠脉综合征预警方法的计算机程序。

综上所述,本发明实施例中提供了一种基于代谢组学数据的急性冠脉综合征预警方法、装置、计算机设备及计算机可读存储介质,在获取到正常冠状动脉生物个体和急性冠脉综合征生物个体的代谢物数据后,根据正常冠状动脉生物个体和急性冠脉综合征生物个体的代谢物数据,筛选出差异代谢物数据,进而根据筛选出的差异代谢物数据,对LightGBM模型进行机器学习,得到一个包含多种生物标志物的急性冠脉综合征预警模型,以便基于该急性冠脉综合征预警模型,采集待诊断生物个体对应每种生物标志物的指标值,并判断待诊断生物个体对应每种生物标志物的指标值是否超过预设正常取值范围,根据判断结果,输出相应的预警信息。

通过本发明实施例,能够提供一种无创的急性冠脉综合征生物标志物筛选方法,根据患者的代谢物数据对患者进行急性冠脉综合征预警。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号