首页> 中国专利> 基于CNN及电子病历预测心衰并发症的方法、系统及预警设备、存储介质

基于CNN及电子病历预测心衰并发症的方法、系统及预警设备、存储介质

摘要

本发明涉及心力衰竭并发症预测领域,特别是基于CNN及电子病历预测心衰并发症的方法、系统及预警设备、存储介质。所述方法包括:采集心脏衰竭患者入院数据的电子病历,标记心衰伴有并发症及心衰无并发症的数据记录;将所述数据记录输入CNN进行深度学习,输出心衰伴有并发症特征的预测结果;基于卡方检验的特征分析,识别关键特征,解释CNN的预测结果;预测心衰并发症产生的可能性及特征,实现心衰并发症预警。通过本发明识别有高风险并发症的患者可以帮助卫生保健提供者将资源和服务直接提供给这些患者,以防止可避免的再入院,降低发病风险,减少突发事件,以更好的预后,提高患者生存率。

著录项

  • 公开/公告号CN112951432A

    专利类型发明专利

  • 公开/公告日2021-06-11

    原文格式PDF

  • 申请/专利权人 太原理工大学;

    申请/专利号CN202110341237.6

  • 发明设计人 郝晓燕;李灯熬;赵菊敏;马美坤;

    申请日2021-03-30

  • 分类号G16H50/30(20180101);G16H50/70(20180101);G06N3/04(20060101);G06N3/08(20060101);

  • 代理机构11762 北京一品慧诚知识产权代理有限公司;

  • 代理人张宇

  • 地址 030600 山西省太原市迎泽西大街79号太原理工大学

  • 入库时间 2023-06-19 11:21:00

说明书

技术领域

本发明涉及心力衰竭并发症预测领域,特别是基于CNN及电子病历预测心衰并发症的方法、系统及预警设备、存储介质。

背景技术

心衰是多种原因导致心脏结构和或功能的异常改变,使心室收缩和或舒张功能发生障碍,从而引起的一组复杂临床综合征,主要表现为呼吸困难、疲乏和液体潴留(肺淤血、体循环淤血及外周水肿)等。根据左心室射血分数(LVEF),分为射血分数降低的心衰(HFrEF)、射血分数保留的心衰(HFpEF) 和射血分数中间值的心衰(HFmrEF)。根据心衰发作的时间以及进展的速度,分为慢性心衰和急性心衰。多数急性心衰患者经住院治疗后症状部分缓解,而转入慢性心衰;慢性心衰患者常因各种诱因急性加重而需住院治疗。心衰是各种心脏疾病的严重表现或晚期阶段,死亡率和再住院率居高不下。我国人口老龄化加剧,冠心病、高血压、糖尿病、肥胖等慢性病的发病呈上升趋势,医疗水平的提高使心脏疾病患者生存期延长,导致我国心衰患病率呈持续升高趋势。

心力衰竭的发病率逐年在增长,所带来危害也不断的加大。这种疾病的治疗难度大,并且稍微不注意会引起严重并发症。这些并发症会对身体健康造成极大的影响,也会给治疗增加难度。心力衰竭的并发症之一是心律失常,比较常见的心律失常便是房颤。如果患心律失常,可能会并发呼吸道感染,如支气管炎和肺炎。此外,血栓形成和栓塞、心源性肝硬化及电解质紊乱也是心力衰竭常见并发症。

心衰并发症治疗是医疗保健的一大负担。如何预测并预防心衰并发症一直是预后研究中的一个重大挑战。

发明内容

本发明的目的在于提供一种基于CNN及电子病历预测心衰并发症的方法、系统及预警设备、存储介质,以实现预测心衰并发症产生的可能性及相关特征,实现心衰并发症的预测、预警,减少突发事件,以更好的预后,提高患者生存率。

为实现上述技术目的,达到上述技术效果,本发明提供了一种基于CNN 及电子病历预测心衰并发症的方法,所述方法包括:

采集心脏衰竭患者入院数据的电子病历,标记心衰伴有并发症及心衰无并发症的数据记录;

将所述数据记录输入CNN进行深度学习,输出心衰伴有并发症特征的预测结果;

基于卡方检验的特征分析,识别关键特征,解释CNN的预测结果;

预测心衰并发症产生的可能性及特征,实现心衰并发症预警。

进一步地,所述方法还包括,

识别电子病历的诊断代码,将诊断代码中出现ICD-9代码的数据标记为心衰入院,所述ICD-9代码包括398.91、402.01、402.11、402.91、404.11、 404.13、404.91、404.93、428.0、428.1、428.20、428.21、428.22、428.23、 428.30、428.31、428.32、428.33、428.40、428.41、428.42、428.43和428.9。

进一步地,所述方法还包括:

将心脏衰竭患者的电子病历作为样本,心衰伴有并发症患者被标记为阳性,心衰无并发症患者标记为阴性。

进一步地,所述方法包括:

将电子病历的数据记录输入CNN,填充到相同长度的单词序列中,所述数据记录中的每个词表示为一个词向量;

使用在预先训练的公开可用的word2vec向量进行初始化,未出现在预先训练的单词集合中的单词被随机初始化。

进一步地,所述方法包括:

嵌入文本输入卷积层,在卷积层中,每个卷积操作对输入窗口应用一个过滤器产生新的特征,所述过滤器应用于单词序列中的多个单词窗口,生成特征映射;

对特征映射应用随时间增加的最大池操作,获得最大值作为过滤器的特征,捕获单词序列的最重要特征;

采用单词窗口大小为1、2和3的不同长度滤波器来获得若干特征;将所述若干特征传递到一个完全连接的softmax层,通过所述softmax层在标签上输出概率。

进一步地,所述方法包括:不同长度的滤波器的组合产生多个输出,形成倒数第二层。

进一步地,所述方法包括:

利用卡方特征选择来计算单词在区分正样本和负样本时的权重;

对正确预测的样本应用卡方评分来识别最重要的单词特征,提供与心衰患者并发症相关医疗内容的见解。

作为本发明的又一方面,提供一种基于CNN及电子病历预测心衰并发症的系统,所述系统包括:

数据采集模块,用于采集心脏衰竭患者入院数据的电子病历,标记心衰伴有并发症及心衰无并发症的数据记录;

训练学习模块,用于将所述数据记录输入CNN进行深度学习,输出心衰伴有并发症特征的预测结果;

特征分析模块,用于基于卡方检验的特征分析,识别关键特征,解释CNN 的预测结果;

预测警示模块,用于预测心衰并发症产生的可能性及特征,实现心衰并发症预警。

作为本发明的再一方面,提供一种预警设备,所述预警设备包括:存储器、处理器,通信总线以及存储在所述存储器上的基于CNN及电子病历预测心衰并发症的程序,

所述通信总线用于实现处理器与存储器间的通信连接;

所述处理器用于执行所述基于CNN及电子病历预测心衰并发症的程序,以实现如上述任一项所述的基于CNN及电子病历预测心衰并发症的方法的步骤。

作为本发明的另一方面,提供一种存储介质,所述存储介质上存储有基于CNN及电子病历预测心衰并发症的程序,所述基于CNN及电子病历预测心衰并发症的程序被处理器执行时实现如上述任意一项所述基于CNN及电子病历预测心衰并发症的方法的步骤。

本发明实施例至少部分实现了如下技术效果:

本发明方法提出了一种深度学习方法来预测心衰并发症的临床记录。与使用结构化数据进行预测的传统方法不同,本发明利用非结构化临床记录来训练基于卷积神经网络(CNN)的深度学习模型;再使用训练过的模型来分类和预测潜在高风险并发症。通过本发明能够有效识别有高风险并发症的患者,并提前进行预警,实现帮助卫生保健提供者将资源和服务直接提供给这些患者,以防止可避免的再入院,降低发病风险,节约医疗资源。

本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所记载的结构来实现和获得。

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

附图说明

附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:

图1为本发明一实施例基于CNN及电子病历预测心衰并发症的方法的流程图;

图2为本发明一实施例CNN预测架构的示意图;

图3为本发明一实施例基于CNN及电子病历预测心衰并发症的系统的示意图。

具体实施方式

为了使本发明的目的、技术方案及优点更加清楚明白,以下结合实施例,对本发明进行进一步详细说明。

本发明提供了一种基于CNN及电子病历预测心衰并发症的方法,如图1 所示,所述方法包括:

S11采集心脏衰竭患者入院数据的电子病历,标记心衰伴有并发症及心衰无并发症的数据记录;

S12将所述数据记录输入CNN进行深度学习,输出心衰伴有并发症特征的预测结果;

S13基于卡方检验的特征分析,识别关键特征,解释CNN的预测结果;

S14预测心衰并发症产生的可能性及特征,实现心衰并发症预警。

在本实施例中,利用词嵌入来表示电子病历中的词,而不需要任何特征工程,首先确认心脏衰竭的入院情况,标记严重并发症存在的情况;使用卷积神经网络CNN架构自动生成特征图,并训练模型来预测产生心衰并发症的可能性得出相应心力衰竭并发症产生的重要特征,CNN建模输入数据,卡方特征分析,得出关键特征,预测心衰并发症产生得可能性,实现心衰并发症预警的结果。识别有高风险并发症的患者可以帮助卫生保健提供者将资源和服务直接提供给这些患者,以防止可避免的再入院,以更好的预后,提高患者生存率。

在一个实施例中,所述方法还包括,

识别电子病历的诊断代码,将诊断代码中出现ICD-9代码的数据标记为心衰入院,所述ICD-9代码包括398.91、402.01、402.11、402.91、404.11、 404.13、404.91、404.93、428.0、428.1、428.20、428.21、428.22、428.23、 428.30、428.31、428.32、428.33、428.40、428.41、428.42、428.43和428.9。在本实施例中,使用合格ICD-9代码来识别充血性心力衰竭入院。如果上述 ICD9代码中的任何一个出现在诊断代码中,将其标记为心衰入院。

优选地,所述方法还包括:

将心脏衰竭患者的电子病历作为样本,心衰伴有并发症患者被标记为阳性,心衰无并发症患者标记为阴性。

在一个实施例中,所述方法包括:

将电子病历的数据记录输入CNN,填充到相同长度的单词序列中,所述数据记录中的每个词表示为一个词向量;

使用在预先训练的公开可用的word2vec向量进行初始化,未出现在预先训练的单词集合中的单词被随机初始化。

本实施例为CNN建模输入数据,CNN是一种使用前馈多层神经网络的深度学习方法,它不需要领域专家进行劳动密集型的特性工程;附图2为CNN预测架构,输入到CNN的是一组电子病历记录,这些记录被填充到一组相同长度的单词序列中,记录中的每个词都表示为一个词向量。在基于深度学习的自然语言处理中,通常使用从无监督语言模型中获得的词向量进行初始化,本实施例使用在预先训练的公开可用的word2vec向量,未出现在预先训练的单词集合中的单词被随机初始化。

优选地,所述方法包括:

嵌入文本输入卷积层,在卷积层中,每个卷积操作对输入窗口应用一个过滤器产生新的特征,所述过滤器应用于单词序列中的多个单词窗口,生成特征映射;

对特征映射应用随时间增加的最大池操作,获得最大值作为过滤器的特征,捕获单词序列的最重要特征;

采用单词窗口大小为1、2和3的不同长度滤波器来获得若干特征;将所述若干特征传递到一个完全连接的softmax层,通过所述softmax层在标签上输出概率。

具体地,嵌入的文本被用作卷积层的输入,在卷积层中,每个卷积操作都对输入窗口应用一个过滤器去产生新的特征,该过滤器应用于单词序列中的多个单词窗口,生成特征映射,然后,对特征映射应用随时间增加的最大池操作,以获得最大值作为过滤器的特征。池化方案能够捕获单词序列的最重要特征,而不考虑其长度。

优选地,所述方法包括:不同长度的滤波器的组合产生多个输出,形成倒数第二层。

在一个实施例中,所述方法包括:

利用卡方特征选择来计算单词在区分正样本和负样本时的权重;

对正确预测的样本应用卡方评分来识别最重要的单词特征,提供与心衰患者并发症相关医疗内容的见解。

在本实施例中,使用一种基于卡方检验的特征分析来解释CNN的预测结果。卡方最初是一种用于机器学习的特征选择方法,本实施例重新利用卡方特征选择来计算单词在区分正样本和负样本时的权重;并对正确预测的样本应用卡方评分来识别最重要的特征(单词)。这些特性提供了与心衰患者并发症有关的医疗内容的见解。

上述实施例提出的方法为基于卷积神经网络(CNN)的NLP深度学习框架来预测心衰并发症,具体为基于CNN的从电子病历中对心衰并发症进行分类预测,首先采集心脏衰竭的入院数据,标记严重并发症存在的数据,CNN建模输入数据,利用CNN深度学习模型进行学习,输出高风险并发症存在的患者;再通过卡方特征分析,得出关键特征,预测心衰并发症产生得可能性及相关特征,实现心衰并发症预警的结果。

基于同一发明构思,本发明实施例还提供了一种基于CNN及电子病历预测心衰并发症的系统、一种预警设备及存储介质,其所解决问题的原理与前述实施例的一种基于CNN及电子病历预测心衰并发症的方法相似,因此该一种基于CNN及电子病历预测心衰并发症的系统、一种预警设备及存储介质的实施可以参见前述实施例的方法的实施,重复之处不再赘述。

在一个实施例中,提供一种基于CNN及电子病历预测心衰并发症的系统,所述系统包括:

数据采集模块11,用于采集心脏衰竭患者入院数据的电子病历,标记心衰伴有并发症及心衰无并发症的数据记录;

训练学习模块12,用于将所述数据记录输入CNN进行深度学习,输出心衰伴有并发症特征的预测结果;

特征分析模块13,用于基于卡方检验的特征分析,识别关键特征,解释 CNN的预测结果;

预测警示模块14,用于预测心衰并发症产生的可能性及特征,实现心衰并发症预警。

在一个实施例中,提供一种预警设备,所述预警设备包括:存储器、处理器,通信总线以及存储在所述存储器上的基于CNN及电子病历预测心衰并发症的程序,

所述通信总线用于实现处理器与存储器间的通信连接;

所述处理器用于执行所述基于CNN及电子病历预测心衰并发症的程序,以实现如上述任一项所述的基于CNN及电子病历预测心衰并发症的方法的步骤。

在一个实施例中,提供一种存储介质,所述存储介质上存储有基于CNN 及电子病历预测心衰并发症的程序,所述基于CNN及电子病历预测心衰并发症的程序被处理器执行时实现如上述任意一项所述基于CNN及电子病历预测心衰并发症的方法的步骤。

本领域内的技术人员应明白,本发明的实施例可提供为方法、装置、装置、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(装置)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号