首页> 中国专利> 冠状动脉粥样硬化性心脏病诊断推荐的方法

冠状动脉粥样硬化性心脏病诊断推荐的方法

摘要

本发明公开了冠状动脉粥样硬化性心脏病诊断推荐的方法,包括以下步骤:步骤一,病例数据挖掘;步骤二,信息结构化抽取;步骤三,数据集处理;步骤四,数据探索性分析;步骤五,变量自动筛选;步骤六,机器学习建模;步骤七,建模过程评估;步骤八,模型部署;本发明利用患者的病例作为训练数据集带入到机器学习模型中进行迭代学习,形成冠状动脉粥样硬化性心脏病诊断模型,从而利用模型对患者的疾病进行诊断和推荐,避免了人为诊断出现的误诊的情况出现,同时诊断过程中根据临床指南的规则进行自动化判断,提升了诊断的准确性,并且本发明生产流程由众多环节配合,同时本发明的实用性强,具有高复用性。

著录项

  • 公开/公告号CN116189876A

    专利类型发明专利

  • 公开/公告日2023-05-30

    原文格式PDF

  • 申请/专利权人 华东医院;

    申请/专利号CN202211597678.3

  • 申请日2022-12-12

  • 分类号G16H50/20(2018.01);G16H50/70(2018.01);G16H10/60(2018.01);G06N20/00(2019.01);

  • 代理机构上海创开专利代理事务所(普通合伙) 31374;

  • 代理人马正红

  • 地址 200040 上海市静安区延安西路221号

  • 入库时间 2023-06-19 19:40:14

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2023-06-16

    实质审查的生效 IPC(主分类):G16H50/20 专利申请号:2022115976783 申请日:20221212

    实质审查的生效

  • 2023-05-30

    公开

    发明专利申请公布

说明书

技术领域

本发明涉及疾病诊断技术领域,具体为冠状动脉粥样硬化性心脏病诊断推荐的方法。

背景技术

医疗数据通常以电子病历的形式储存,其中记录了大量以患者为中心的各种信息,例如:主诉、病史、检查、实验室检验、医嘱等,对于特定病症的诊断,医生通常参考各种检查检验指标,依靠临床指南和临床经验对患者进行诊断,随着计算机科学、数据科学在医疗信息化领域的发展,海量的历史临床数据可以作为辅助医生进行诊断的工具,从而能够及时、准确的诊断特定疾病,或者预测疾病发生的风险,是为患者提供及时、有效的干预措施或者治疗的基础,这对保障患者的健康,挽救生命,以及降低医疗成本有重要的意义。

现有的医生综合患者反馈的信息,实验室检查,病例报告等各种信息,参考临床指南,医学量表结果等等,进行综合的判断,靠人力难以时刻关注所有患者,可能不能及时发现风险,对不熟悉的领域的疾病判断可能不准确,可能造成误诊,无法精确地捕捉到大量信息和疾病发生之间的量化关系,基于临床指南中的规则开发程序,自动化进行判断,临床指南中的规则,并没有充分的考虑人群的差异性,并不能保证对所有群体都有很好的准确性,基于传统医学量表进行风险评估,医学规则无法表现变量之间的交互作用。

发明内容

本发明的目的在于提供冠状动脉粥样硬化性心脏病诊断推荐的方法,以解决上述背景技术中提出的问题。

为实现上述目的,本发明提供如下技术方案:冠状动脉粥样硬化性心脏病诊断推荐的方法,包括以下步骤:步骤一,病例数据挖掘;步骤二,信息结构化抽取;步骤三,数据集处理;步骤四,数据探索性分析;步骤五,变量自动筛选;步骤六,机器学习建模;步骤七,建模过程评估;步骤八,模型部署;

其中在上述步骤一中,首先利用扫描设备对患者的病例进行扫描,将病例扫描成电子文档,随后利用NLP技术对电子文档中的病例进行结构化抽取,继而对病例中的术语实体数据进行挖掘和分析,数据挖掘完成后备用;

其中在上述步骤二中,当步骤一中的病例信息结构化抽取完成后,随后对步骤一中抽取之后的信息利用有上下文逻辑性的信息进行进一步的结构化抽取,将步骤一中无法精准提取的消息进行进一步的挖掘推断,得到完备的电子病历信息;

其中在上述步骤三中,当步骤二中的电子病历中的信息挖掘提取完成后,再次利用NLP技术对临床参考指南、医学量表结果、患者反馈信息进行提取,同时对步骤二中精确提取的信息、临床参考指南、医学量表结果和患者反馈信息等多个来源的信息进行预处理,形成训练数据集;

其中在上述步骤四中,当步骤三中的数据预处理完成后,随后利用异常数据检测算法对训练数据集中的异常数据进行识别,随后将训练数据集中的异常数据进行剔除,保证了训练数据集的正常;

其中在上述步骤五中,当步骤四中的数据集中的异常数据剔除完成后,随后对训练集中的数据中的变量进行挑选,选取得到对模型重要的数据训练集备用;

其中在上述步骤六中,当步骤五中的重要数据筛选完成后,选取机器学习的模型,将步骤五中挑选的数据训练集带入到机器学习的模型中利用机器学习算法进行迭代训练,随后将训练数据集带入到模型中不停进行迭代,直至数据收敛完成,从而完成模型的训练;

其中在上述步骤七中,当步骤六中的模型训练完成后,将测试集中的数据迭代到步骤六中的训练完成的模型中,随后对变量效果和模型效果进行评估,然后对模型上线效果进行模拟分析,判断变量和预测目标的关系是否符合医学认知,了解模型的效果是否达到应用需求;

其中在上述步骤八中,当步骤七中的模型评价完成后,将模型以web api形式输出计算能力,支持和其他的产品对接,从而利用模型对冠状动脉粥样硬化性心脏病进行诊断。

优选的,所述步骤一中,病例中的术语实体包括用药、病史、检查、化验结果、姓名和性别等。

优选的,所述步骤三中,信息进行预处理包括:数据分类、数据增强以及标签生成。

优选的,所述步骤四中,异常数据检测算法为:3sigma、Grubbs假设检验、boxplot、Z-score和One-Class SVM其中一种或者多种。

优选的,所述步骤五中,变量选取算法为DON抓取算法。

优选的,所述步骤六中,机器学习算法为Logistic Regression、决策树、Xgboost、RandomForest和SVM其中一种或者多种。

与现有技术相比,本发明的有益效果是:本发明利用患者的病例作为训练数据集带入到机器学习模型中进行迭代学习,形成冠状动脉粥样硬化性心脏病诊断模型,从而利用模型对患者的疾病进行诊断和推荐,避免了人为诊断出现的误诊的情况出现,同时诊断过程中根据临床指南的规则进行自动化判断,提升了诊断的准确性,并且本发明生产流程由众多环节配合,同时本发明的实用性强,具有高复用性。

附图说明

图1为本发明的方法流程图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

请参阅图1,本发明提供的一种实施例:冠状动脉粥样硬化性心脏病诊断推荐的方法,包括以下步骤:步骤一,病例数据挖掘;步骤二,信息结构化抽取;步骤三,数据集处理;步骤四,数据探索性分析;步骤五,变量自动筛选;步骤六,机器学习建模;步骤七,建模过程评估;步骤八,模型部署;

其中在上述步骤一中,首先利用扫描设备对患者的病例进行扫描,将病例扫描成电子文档,随后利用NLP技术对电子文档中的病例进行结构化抽取,继而对病例中的术语实体数据进行挖掘和分析,数据挖掘完成后备用,且病例中的术语实体包括用药、病史、检查、化验结果、姓名和性别等;

其中在上述步骤二中,当步骤一中的病例信息结构化抽取完成后,随后对步骤一中抽取之后的信息利用有上下文逻辑性的信息进行进一步的结构化抽取,将步骤一中无法精准提取的消息进行进一步的挖掘推断,得到完备的电子病历信息;

其中在上述步骤三中,当步骤二中的电子病历中的信息挖掘提取完成后,再次利用NLP技术对临床参考指南、医学量表结果、患者反馈信息进行提取,同时对步骤二中精确提取的信息、临床参考指南、医学量表结果和患者反馈信息等多个来源的信息进行预处理,形成训练数据集,且信息进行预处理包括:数据分类、数据增强以及标签生成;

其中在上述步骤四中,当步骤三中的数据预处理完成后,随后利用异常数据检测算法对训练数据集中的异常数据进行识别,随后将训练数据集中的异常数据进行剔除,且异常数据检测算法为:3sigma、Grubbs假设检验、boxplot、Z-score和One-Class SVM其中一种或者多种,保证了训练数据集的正常;

其中在上述步骤五中,当步骤四中的数据集中的异常数据剔除完成后,随后对训练集中的数据中的变量进行挑选,选取得到对模型重要的数据训练集备用,且变量选取算法为DON抓取算法;

其中在上述步骤六中,当步骤五中的重要数据筛选完成后,选取机器学习的模型,将步骤五中挑选的数据训练集带入到机器学习的模型中利用机器学习算法进行迭代训练,随后将训练数据集带入到模型中不停进行迭代,直至数据收敛完成,且机器学习算法为Logistic Regression、决策树、Xgboost、RandomForest和SVM其中一种或者多种,从而完成模型的训练;

其中在上述步骤七中,当步骤六中的模型训练完成后,将测试集中的数据迭代到步骤六中的训练完成的模型中,随后对变量效果和模型效果进行评估,然后对模型上线效果进行模拟分析,判断变量和预测目标的关系是否符合医学认知,了解模型的效果是否达到应用需求;

其中在上述步骤八中,当步骤七中的模型评价完成后,将模型以web api形式输出计算能力,支持和其他的产品对接,从而利用模型对冠状动脉粥样硬化性心脏病进行诊断。

基于上述,本发明的优点在于,本发明相较于传统的诊疗方法,采用机器学习的算法对患者的病例中的各项数据进行挖掘,形成训练数据集,并且将患者的病例作为训练数据集带入到机器学习模型中进行迭代学习,形成冠状动脉粥样硬化性心脏病诊断模型,从而利用模型对患者的疾病进行诊断和推荐,避免了人为诊断出现的误诊的情况出现,同时诊断过程中根据临床指南的规则进行自动化判断,提升了诊断的准确性,避免了人为判断的问题导致的诊疗不准确的情况出现,并且本发明生产流程由众多环节配合,同时本发明的实用性强,具有高复用性。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化囊括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号