首页> 中国专利> 基于人工智能自学习的心电图自动分析方法和装置

基于人工智能自学习的心电图自动分析方法和装置

摘要

本发明实施例涉及一种基于人工智能自学习的心电图自动分析方法和装置,所述方法包括数据的预处理,心搏特征检测,基于深度学习方法的干扰信号检测和心搏分类,信号质量评估与导联合并,心搏的审核,心电图事件和参数的分析计算,最终自动输出报告数据,实现了一个完整快速流程的自动化分析方法。本发明的心电图自动分析方法,还可以记录对自动分析结果的修改信息,并收集这些修改的数据反馈给深度学习模型继续训练,不断地改进和提升自动分析方法的准确率。

著录项

  • 公开/公告号CN107837082A

    专利类型发明专利

  • 公开/公告日2018-03-27

    原文格式PDF

  • 申请/专利权人 乐普(北京)医疗器械股份有限公司;

    申请/专利号CN201711203259.6

  • 申请日2017-11-27

  • 分类号A61B5/0402(20060101);

  • 代理机构11539 北京慧诚智道知识产权代理事务所(特殊普通合伙);

  • 代理人李楠

  • 地址 102200 北京市昌平区昌平科技园区超前路37号3号楼

  • 入库时间 2023-06-19 04:52:29

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-05-29

    专利权的转移 IPC(主分类):A61B5/0402 登记生效日:20200509 变更前: 变更后: 申请日:20171127

    专利申请权、专利权的转移

  • 2020-04-24

    授权

    授权

  • 2019-07-05

    专利申请权的转移 IPC(主分类):A61B5/0402 登记生效日:20190617 变更前: 变更后: 申请日:20171127

    专利申请权、专利权的转移

  • 2019-01-25

    专利申请权的转移 IPC(主分类):A61B5/0402 登记生效日:20190108 变更前: 变更后: 申请日:20171127

    专利申请权、专利权的转移

  • 2018-04-20

    实质审查的生效 IPC(主分类):A61B5/0402 申请日:20171127

    实质审查的生效

  • 2018-03-27

    公开

    公开

查看全部

说明书

技术领域

本发明涉及人工智能数据分析的技术领域,尤其涉及一种基于人工智能自学习的心电图自动分析方法和装置。

背景技术

1908年Einthoven开始应用心电图(Electrocardiography,ECG)监测心脏的电生理活动,目前无创心电图检查已成为临床心血管领域针对心脏疾病诊断和筛查的重要方法之一。心电图检查根据临床使用情况,可以分成:静态心电图,动态心电图,和运动心电图等几大类。静态心电图采用Einthoven-Wilson-Goldberger发明的12导联体系(标准导联体系),记录8-30秒的心电图信号进行分析,对各种心律失常和传导阻滞的诊断分析具有肯定价值,是冠心病诊断中最早、最常用和最基本的诊断方法;动态心电图可连续记录24小时到多天的心电活动全过程,包括休息、活动、进餐、工作、学习和睡眠等不同情况下的心电图信息,能够发现常规心电图检查不易发现的非持续性心律失常,确定患者的心悸、头晕、昏厥等症状是否与心律失常有关,如极度心动过缓、心脏停搏、传导阻滞、室性心动过速等,提高对一过性心律失常及短暂的心肌缺血发作的检出率,是临床分析病情,确立诊断,判断疗效重要的客观依据。Holter于1957把动态心电图检查引进临床后,一般采用简化改进的标准导联体系(Mason-Likar体系),测量的导联数量可以是12,6或者3导联,甚至单导联心贴片,极大地改进了动态心电图的实用性;运动心电图,是心电图的运动负荷试验,记录分析通过一定量的运动来增加心脏负荷而引起的心电图变化情况,它是目前冠心病临床评估常用的一种辅助手段。

虽然市场上大多数的心电图分析软件都可以对数据进行自动分析,但由于心电图信号本身的复杂与变异性,很容易受到戴机过程中各种干扰,目前自动分析软件的准确率远远不够,无法帮助求医生在比较短的时间内正确分析心电图数据并且给出正确的分析报告。

利用人工智能的深度学习中成熟的方法,来提高传统心电图分析算法的准确率,特别是把卷积神经网络(Convolutional Neural Network,CNN)图像识别技术应用到心电图特征的自动提取与分类,是当前人工智能(Artificial Intelligence,AI)医疗领域中一个重要研究方向。2017年7月,著名的人工智能专家吴恩达教授带领的斯坦福大学团队,在arXiv上发表了该领域一个最新的研究成果。他们使用了一个34层的CNN模型对单导联Holter数据进行了心律失常的检测,具体的说,训练数据来自29,163个病人的64,121样本,每个样本是一个30秒长度200Hz采样率的单导联数据,每秒钟的数据都对应于有认证资格的心电图专家标注审核的心律类型(Rhythm Type),总共标注有14种类型,包括12种常见的心律失常事件,一个正常的窦性心律和噪音类型;训练好的模型使用相同采样率的单导联金标准标注数据,对每秒的数据输入进行14种类型事件识别,同时,与6位心电图专家的标注结果进行对照分析,结论是人工智能方法在敏感性(Sensitivity)和精确性(Precision)两个统计值上都超过了心电图专家的平均水平。然而,这个方法存在一些需要进一步解决的问题:(a)识别的心律事件类型不够完善,也没有专门处理低电压,停搏等情形;(b)模型是针对单导联Holter训练的,而实际使用中,有大量的多导联心电图检查,特别是标准的12导联,动态心电图普遍使用的3导联等设备,多导联分析可以更加全面正确地分析心律失常,传导阻滞和定位ST段和T波改变,这些功能在单导联模型分析中是无法体现的;(c)该方法虽然考虑了噪音,但仅仅把噪音当成一种特殊的心律事件处理,不太符合医学规律,没有从噪音的本质进行分析识别,排除噪音对后续分析的影响;(d)该方法没有自动生成报告的能力,特别是对所有数字信号进行分析后,自动截取最典型的和信号质量最佳的片段生成图像报告;(e)另外,该方法也没有说明如何应用到8-30秒的静态心电图分析和24小时的动态心电图分析全流程中,与现有技术的结合,提高临床分析工作者的总体工作质量与效率,而这些都是目前心电图分析中最常见和最紧迫的需求。

因此,如何帮助医院,特别是广大的各级基础医院,在没有足够多的专业医生解读心电图的困难条件下,通过使用最前沿的科技方法-人工智能技术,有效提高心电图的自动分析水平,是本发明所要解决的难题和挑战。

发明内容

本发明的目的是提供一种基于人工智能自学习的心电图自动分析方法和装置,能够对心电图设备输出的测量数据进行自动、快速、完整的分析,得到所需的报告数据。

为实现上述目的,本发明实施例第一方面提供了一种基于人工智能自学习的心电图自动分析方法,包括:

接收心电监测设备输出的心电图数据;所述心电图数据为单导联或多导联的时间序列数据;

将所述心电图数据的数据格式经过重采样转换为预设标准数据格式,并对转换后的预设标准数据格式的心电图数据进行第一滤波处理;

对所述第一滤波处理后的心电图数据进行心搏检测处理,识别所述心电图数据包括的多个心搏数据;每个所述心搏数据对应一个心搏周期,包括相应的P波、QRS波群、T波的幅值数据和起止时间数据;

根据训练得到的干扰识别二分类模型对所述心搏数据进行干扰识别,确定所述心搏数据是否存在干扰噪音,以及用于判断干扰噪音的一个概率值;

根据心搏数据的导联参数和所述心搏数据,基于所述干扰识别的结果和时间规则合并生成心搏时间序列数据;根据所述心搏时间序列数据生成心搏分析数据;

对所述心搏分析数据进行信号质量分析,评估所述心搏分析数据的信号质量,得到所述心搏分析数据的信号质量评价参数;

根据训练得到的心搏分类模型对所述心搏分析数据进行幅值和时间表征数据的特征提取和分析,得到所述心搏分析数据的一次分类信息;

对所述一次分类信息结果中的特定心搏的心搏分析数据输入到训练好的ST段和T波改变模型进行识别,确定ST段和T波评价信息;

对所述心搏分析数据在所述一次分类信息下根据所述心电图基本规律参考数据以及所述ST段和T波评价信息进行二次分类处理,最终得到心搏分类信息;

将所述心搏分析数据根据所述心搏分类信息和心电图基本规律参考数据生成心电图事件数据;根据所述信号质量评价参数对心电图事件数据进行筛选,得到相应的报告结论数据和报告表项数据;根据每种心电图事件数据中的典型数据片段,生成报告图形数据;并且输出所述报告表项数据、报告图形数据和报告结论数据。

优选的,对所述第一滤波处理后的心电图数据进行心搏检测处理还包括:

根据所述QRS波群确定RR间期并计算所述RR间期内噪声的估计值;

根据所述噪声的估计值和每个QRS波群中的最大幅值确定每个QRS波群的检测置信度。

优选的,所述根据训练得到的干扰识别二分类模型对所述心搏数据进行干扰识别,具体包括:

以第一数据量对所述心搏数据进行切割采样,并将切割采样得到的数据输入到干扰识别二分类模型进行干扰识别;

识别心搏数据中,心搏间期大于等于预设间期判定阈值的数据片段;

对所述心搏间期大于等于预设间期判定阈值的数据片段进行信号异常判断,确定是否为异常信号;

如果不是异常信号,则以预设时间宽度,根据设定时值确定所述数据片段中滑动取样的起始数据点和终止数据点,并由所述起始数据点开始对所述数据片段进行滑动取样,至所述终止数据点为止,得到多个取样数据段;

对每个所述取样数据段进行所述干扰识别。

优选的,所述根据训练得到的心搏分类模型对所述心搏分析数据进行幅值和时间表征数据的特征提取和分析,得到所述心搏分析数据的一次分类信息具体包括:

对于单导联的心搏分析数据,将所述心搏分析数据输入到训练得到的对应所述单导联心搏分类模型,以第二数据量进行幅值和时间表征数据的特征提取和分析,得到所述单导联的一次分类信息。

优选的,所述根据训练得到的心搏分类模型对所述心搏分析数据进行幅值和时间表征数据的特征提取和分析,得到所述心搏分析数据的一次分类信息具体包括:

根据训练得到的各导联对应的心搏分类模型对各导联的心搏分析数据以第三数据量进行幅值和时间表征数据的特征提取和分析,得到各导联的分类信息;

根据各导联的分类信息和导联权重值参考系数进行分类投票决策计算,得到所述一次分类信息。

优选的,所述根据训练得到的心搏分类模型对所述心搏分析数据进行幅值和时间表征数据的特征提取和分析,得到所述心搏分析数据的一次分类信息具体包括:

根据训练得到的多导联同步关联分类模型对各导联的心搏分析数据以第四数据量进行同步幅值和时间表征数据的特征提取和分析,得到心搏分析数据的一次分类信息。

优选的,所述对所述一次分类信息结果中的特定心搏的心搏分析数据输入到训练好的ST段和T波改变模型进行识别,确定ST段和T波评价信息,具体包括:

将所述一次分类信息中的特定心搏数据,按导联依次输入到根据训练得到的ST段和T波改变模型,对各导联的特定心搏数据进行幅值和时间表征数据的特征提取和分析,得到各导联的ST段和T波改变信息,确定ST段和T波评价信息;所述ST段和T波评价信息具体为所述心搏片段数据对应的ST段和T波发生改变的导联位置信息。

优选的,所述根据每种心电图事件数据中的典型数据片段,生成报告图形数据,具体包括:

根据所述信号质量评价参数,对每种心电图事件的数据片段进行评估,选择信号质量评价参数最高的数据片段为所述心电图事件中的典型数据片段。

优选的,所述方法还包括:

接收对所述心搏分类信息的修改信息;

将修改后的数据作为训练样本数据,用于所述基于人工智能自学习的心电图自动分析方法中的模型训练。

本发明实施例提供的基于人工智能自学习的心电图自动分析方法,包括数据的预处理,心搏特征检测,基于深度学习方法的干扰信号检测和心搏分类,信号质量评估与导联合并,心搏的审核,心电图事件和参数的分析计算,最终自动输出报告数据的一个完整快速流程的自动化分析方法。本发明的自动分析方法,还可以记录对自动分析结果的修改信息,并收集这些修改的数据反馈给深度学习模型继续训练,不断地提升自动分析方法的准确率。

本发明实施例第二方面提供了一种设备,该设备包括存储器和处理器,存储器用于存储容器,处理器用于执行第一方面及第一方面的各实现方式中的方法。

本发明实施例第三方面提供了一种包含指令的计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行第一方面及第一方面的各实现方式中的方法。

本发明实施例第四方面提供了一种计算机可读存储介质,计算机可读存储介质上存储有计算机程序,计算机程序被处理器执行时实现第一方面及第一方面的各实现方式中的方法。

附图说明

图1为本发明实施例提供的基于人工智能自学习的心电图自动分析的系统结构图;

图2为本发明实施例提供的基于人工智能自学习的心电图自动分析方法的流程图;

图3为本发明实施例提供的干扰识别二分类模型的示意图;

图4为本发明实施例提供的心搏分类模型的示意图;

图5为本发明实施例提供的ST段和T波改变模型的示意图;

图6为本发明实施例提供的基于人工智能自学习的心电图自动分析的设备结构示意图。

具体实施方式

下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。

为便于理解本发明的技术方案,首先对人工智能模型尤其是卷积神经网络模型的基本原理进行介绍。

人工智能卷积神经网络(CNN)模型是深度学习中的监督学习方法,就是一个模拟神经网络的多层次网络(隐藏层hidden layer)连接结构,输入信号依次通过每个隐藏层,在其中进行一系列复杂的数学处理(Convolution卷积、Pooling池化、Regularization正则化、防止过拟合、Dropout暂时丢弃、Activation激活、一般使用Relu激活函数),逐层自动地抽象出待识别物体的一些特征,然后把这些特征作为输入再传递到高一级的隐藏层进行计算,直到最后几层的全连接层(Full Connection)重构整个信号,使用Softmax函数进行逻辑(logistics)回归,达到多目标的分类。

CNN属于人工智能中的监督学习方法,在训练阶段,输入信号经过多个的隐藏层处理到达最后的全连接层,softmax逻辑回归得到的分类结果,与已知的分类结果(label标签)之间会有一个误差,深度学习的一个核心思想就是通过大量的样本迭代来不断地极小化这个误差,从而计算得到连接各隐藏层神经元的参数。这个过程一般需要构造一个特别的损失函数(cost function),利用非线性优化的梯度下降算法和误差反向传播算法(backpropagation algorithm,BP),快速有效地极小化整个深度(隐藏层的层数)和广度(特征的维数)都十分复杂的神经网络结构中所有连接参数。

深度学习把需要识别的数据输入到训练模型,经过第一隐藏层、第二隐藏层、第三隐藏层,最后是输出识别结果。每一层提取不同抽象程度的特征,最终识别出原始数据具体是什么类别,例如车、人或者动物。

深度学习的算法模型在数学上十分复杂。开发一个完整的算法程序需要极强的专业背景知识和丰富的工作经验。近年来,Google、微软、百度、Facebook等公司和一些著名大学(比如加州伯克利大学、加拿大蒙特利尔大学)也都相继开发推出了各具特色的人工智能开发开源平台,帮助在深度学习领域的一些研发公司迅速掌握这个前沿技术。其中,伯克利的Caffe和Google的Tensorflow是目前使用最为广泛的两个框架工具。

由于深度学习模型极端复杂,而需要的训练数据从几十万、几百万到几千万,再加上反复循环迭代,导致非线性优化计算量非常庞大。对于实际的项目,使用普通计算机的中央处理器计算,耗时经常是从十几小时到数天,甚至更久。这种情况下,改用图形处理器(Graphics Processing Unit,GPU)计算可以极大地加快计算速度。目前,Nvidia公司提供的GPU卡,由于强大的图形与计算机视觉计算能力,大量的线性代数等计算库,支持并行处理,可以满足深度学习需要的各类方法计算,成为当前人工智能高性能训练与推理的基础硬件。

本发明的基于人工智能自学习的心电图自动分析方法,是基于CNN模型来实现的。

本发明实施例提供的基于人工智能自学习的心电图自动分析方法,基于图1所示的系统架构来实现。其系统架构包括心电监测设备1、数据存储传输装置2、分析系统硬件模块3、模型训练模块4和分析系统执行模块5,其中分析系统执行模块5所涉及的工作方法和流程运行于分析系统硬件模块3中。通过系统架构中的分析系统硬件模块3、模型训练模块4和分析系统执行模块5实现人工智能自学习的心电图自动分析过程。

下面结合图2所示,对本发明的基于人工智能自学习的心电图自动分析方法进行说明。本方法主要包括如下步骤:

步骤100,接收心电监测设备输出的心电图数据;

具体的,心电监测设备将电信号转换为数字信号输出,具体可以是单导联或多导联的时间序列数据,通过数据存储传输装置进行原始数据的存储,并可以通过WIFI、蓝牙,USB,3G/4G/5G移动通信网络,物联网等方式传输至分析系统硬件模块,并作为输入信号输入到分析系统执行模块。

步骤110,将心电图数据的数据格式经过重采样转换为预设标准数据格式,并对转换后的预设标准数据格式的心电图数据进行第一滤波处理;

具体的,心电图数据的格式适配读取、重采样、滤波以及标准数据格式保存。心电图数据的格式适配读取,对不同的设备有不同的读取实现,读取后,需要调整基线、根据增益转换成毫伏数据。心电数据重采样,把数据转换成全流程能够处理的采样频率。然后通过滤波去除高频,低频的噪音干扰和基线漂移,提高人工智能分析准确率。将处理后的心电图数据以预设标准数据格式保存。

通过本步骤可以解决不同心电图设备在使用的导联,采样频率和传输数据格式的差异,以及通过数字信号滤波去除高频,低频的噪音干扰和基线漂移。

在一个具体的例子中,重采样频率可以200Hz,保证每个固定时间范围的数据长度一致,进行计算、训练和推理,可以获得比较满意的分析结果而不会过分增加计算训练的复杂程度和时间。当然,随着心电图设备本身的采样率在逐渐的增大,GPU计算性能的不断跃升和成本下降,以及人工智能算法的不断创新优化,采样率还可以提高。

数字信号滤波可以分别采用高通滤波器,低通滤波器和中值滤波,把工频干扰、肌电干扰和基线漂移干扰消除,避免对后续分析的影响。

更具体的,可以采用低通、高通巴特沃斯滤波器进行零相移滤波,以去除基线漂移和高频干扰,保留有效的心电图信号;中值滤波则可以利用预设时长的滑动窗口内数据点电压幅值的中位数替代窗口中心序列的幅值。可以去除低频的基线漂移。

步骤120,对第一滤波处理后的心电图数据进行心搏检测处理,识别心电图数据包括的多个心搏数据;

每个心搏数据对应一个心搏周期,包括相应的P波、QRS波群、T波的幅值数据和起止时间数据;心搏检测包括QRS波群检测和P波,T波检测;

QRS波群检测由两个过程构成,一是信号处理过程,从所述第一滤波处理后的心电图数据中提取QRS波群的特征频段;二是通过设置合理的阈值确定QRS波群的发生时间。在心电图中,一般会包含P波、QRS波群、T波成分以及噪声成分。一般QRS波群的频率范围在5到20Hz之间,可以通过一个在此范围内的带通滤波器提出QRS波群信号。然而P波、T波的频段以及噪声的频段和QRS波群频段有部分重叠,因此通过信号处理的方法并不能完全去除非QRS波群的信号。因此需要通过设置合理的阈值来从信号包络中提取QRS波群位置。具体的检测过程是一种基于峰值检测的过程。针对信号中每一个峰值顺序进行阈值判断,超过阈值时进入QRS波群判断流程,进行更多特征的检测,比如RR间期、形态等。

由于心电图,尤其是长时程记录过程中心搏信号的时域不平稳特性,心搏信号的幅度和频率时时刻刻都在变化,并且在疾病状态下,这种特性会表现的更强。在进行阈值设定时,需要根据数据特征在时域的变化情况动态的进行阈值调整。为了提高检测的准确率和阳性率,QRS波群检测大多采用双幅度阈值结合时间阈值的方式进行,高阈值具有更高的阳性率,低阈值具有更高的敏感率,在RR间期超过一定时间时(时间阈值),使用低阈值进行检测,减少漏检情况。而低阈值由于阈值较低,容易受到T波、肌电噪声的影响,容易造成多检,因此优先使用高阈值进行检测。在心搏检测的过程中,根据QRS波群的幅度以及RR间期内噪声信号的幅度比例可以提供针对QRS波群检测置信度的估计值。

在本步骤对心搏信号的分析中,P波、T波以及QRS波群中的各项特征也是心电图分析中的重要依据。通过计算QRS波群中切分点位置,以及P波和T波的切分点位置,来提取P波、T波以及QRS波群中的各项特征。可以分别通过QRS波群切分点检测、单导联PT检测算法和多导联PT检测算法来实现。

QRS波群切分点检测:根据QRS波群检测算法提供的QRS波群段功率最大点以及起止点,寻找单个导联中QRS波群的R点,R’点,S点以及S’点。在存在多导联数据时,计算各个切分点的中位数作为最后的切分点位置。

单导联P波、T波检测算法:P波和T波相对QRS波群幅度低、信号平缓,容易淹没在低频噪声中,是检测中的难点。本方法依据QRS波群检测的结果,在消除QRS波群对低频频段的影响后,对信号进行低通滤波,使PT波相对幅度增高。之后通过峰值检测的方法在两个QRS波群之间寻找T波。因为T波是心室复极产生的波群,因此T波和QRS波群之间有明确的锁时关系。以检测到的QRS波群为基准,在每个QRS波群到下一个QRS波群间期取中点(比如限制在第一个QRS波群后400ms到600ms之间的范围)作为T波检测结束点,在此区间内选取最大的峰作为T波。再在剩余的峰值内选择幅度最大的峰为P波。优选的,低通滤波的截止频率设置为10-30Hz之间。

多导联P波、T波检测算法:在多导联的情况中,由于心搏中各个波的产生时间相同,空间分布不同,而噪声的时间空间分布不同,可以通过溯源算法来进行P、T波的检测。首先对信号进行QRS波群消除处理并进行低通滤波以去除干扰。之后通过独立成分分析算法计算原始波形中的各个独立成分。在分离出的各个独立成分中,依据其峰值的分布特征以及QRS波群位置,选取相应的成分作为P波和T波信号。

步骤130,根据训练得到的干扰识别二分类模型对心搏数据进行干扰识别,得到心搏数据是否存在干扰噪音,以及用于判断干扰噪音的一个概率值;

因为心电图检测记录过程中易受多种影响出现干扰现象,导致获取数据无效或不准确,不能正确反映受测者的状况,同时也增加医生诊断难度及工作量;同时,干扰数据也是导致智能分析工具无法有效工作的主要因素。因此,将干扰降到最低显得尤为重要。

本步骤基于以深度学习算法为核心的端到端二分类识别模型,具有精度高,泛化性能强的特点,可有效地解决电极片脱落、运动干扰和静电干扰等主要干扰来源产生的扰动问题,克服了传统算法因干扰数据变化多样无规律而导致的识别效果差的问题。

具体的,干扰识别过程的主要步骤可以包括:

步骤131,对心搏数据使用干扰识别二分类模型进行干扰识别;

步骤132,识别心搏数据中,心搏间期大于等于预设间期判定阈值的数据片段;

步骤133,对心搏间期大于等于预设间期判定阈值的数据片段进行信号异常判断,确定是否为异常信号;

其中,异常信号的识别主要包括是否为电极片脱落、低电压等情况。

步骤134,如果不是异常信号,则以预设时间宽度,根据设定时值确定数据片段中滑动取样的起始数据点和终止数据点,并由起始数据点开始对数据片段进行滑动取样,至终止数据点为止,得到多个取样数据段;

步骤135,对每个取样数据段进行干扰识别。

以一个具体的例子对上述步骤131-135进行说明。对每个导联的心搏数据以第一数据量进行切割采样,然后分别输入到干扰识别二分类模型进行分类,获得干扰识别结果和对应结果的一个概率值;对心搏间期大于等于2秒的心搏数据,先判断是否是信号溢出,低电压,电极脱落;如果不是上述情况,就按照第一数据量,从左边心搏开始,向右连续以第一数据量不重叠滑动取样,进行识别。

输入可以是任一导联的第一数据量心搏数据,然后采用干扰识别二分类模型进行分类,直接输出是否为干扰的分类结果,获得结果快,精确度高,稳定性好,可为后续分析提供更有效优质的数据。

上述干扰识别二分类模型的结构,是基于人工智能深度学习卷积神经网络LeNet-5和AlexNet等模型启发构建的一个端到端二分类识别系统。

对于该模型的训练,我们采用了来源于30万病人近400万精确标注的数据片段。标注分为两类:正常心电图信号或者是有明显干扰的心电图信号片段。我们通过定制开发的工具进行片段标注,然后以自定义标准数据格式保存干扰片段信息。

在训练过程,使用两台GPU服务器进行几十次轮循训练。在一个具体的例子中,采样率是200Hz,数据长度是300个心电图电压值(毫伏)的一个片段D[300],输入数据是:InputData(i,j),其中,i是第i个导联,j是导联i第j个片段D。输入数据全部经过随机打散才开始训练,保证了训练过程收敛,同时,控制从同一个病人的心电图数据中收集太多的样本,提高模型的泛化能力,既真实场景下的准确率。训练收敛后,使用100万独立的测试数据进行测试,准确率可以到达99.3%。另有具体测试数据如下表1。

干扰正常敏感率(Sensitivity)99.14%99.32%阳性预测率(Positive Predicitivity)96.44%99.84%

表1

因为干扰数据往往是由外界扰动因素的作用而引起的,主要有电极片脱落、低电压、静电干扰和运动干扰等情况,不但不同扰动源产生的干扰数据不同,而且相同扰动源产生的干扰数据也是多种多样;同时考虑到干扰数据虽然多样性布较广,但与正常数据的差异很大,所以在收集干扰的训练数据时也是尽可能的保证多样性,同时采取移动窗口滑动采样,尽可能增加干扰数据的多样性,以使模型对干扰数据更加鲁棒,即使未来的干扰数据不同于以往任何的干扰,但相比于正常数据,其与干扰的相似度也会大于正常数据,从而使模型识别干扰数据的能力增强。

本步骤中采用的干扰识别二分类模型可以如图3所示,网络首先使用2层卷积层,卷积核大小是1x5,每层后加上一个最大值池化。卷积核数目从128开始,每经过一次最大池化层,卷积核数目翻倍。卷积层之后是两个全连接层和一个softmax分类器。由于该模型的分类数为2,所以softmax有两个输出单元,依次对应相应类别,采用交叉熵做为损失函数。

步骤140,根据心搏数据的导联参数和心搏数据,生成一个合并的心搏时间序列数据,根据心搏时间序列数据生成心搏分析数据;

由于心电图信号的复杂性以及每个导联可能受到不同程度的干扰影响,依靠单个导联检测心搏会存在多检和漏检的情况,不同导联检测到心搏结果的时间表征数据没有对齐,所以需要对所有导联的心搏数据根据干扰识别结果和时间规则进行合并,生成一个完整的心搏时间序列数据,统一所有导联心搏数据的时间表征数据。其中,时间表征数据用于表示每个数据点在心电图数据信号时间轴上的时间信息。根据这个统一的心搏时间序列数据,在后续的分析计算时,可以使用预先设置好的阀值,对各导联心搏数据进行切割,从而生成具体分析需要的各导联的心搏分析数据。

上述每个导联的心搏数据在合并前,需要根据步骤120中获得的检测置信度确定心搏数据的有效性。

具体的心搏数据合并过程如下:根据心电图基本规律参考数据的不应期获取不同导联心搏数据的时间表征数据组合,丢弃其中偏差较大的心搏数据,对上述时间表征数据组合投票产生合并心搏位置,将合并心搏位置加入合并心搏时间序列,移动到下一组待处理的心搏数据,循环执行直至完成所有心搏数据的合并。

其中,心电图活动不应期可以优选在200毫秒至280毫秒之间。获取的不同导联心搏数据的时间表征数据组合应满足以下条件:心搏数据的时间表征数据组合中每个导联最多包含一个心搏数据的时间表征数据。在对心搏数据的时间表征数据组合进行投票时,使用检出心搏数据的导联数占有效导联数的百分比来决定;若心搏数据的时间表征数据对应导联的位置为低电压段、干扰段以及电极脱落时认为该导联对此心搏数据为无效导联。在计算合并心搏具体位置时,可以采用心搏数据的时间表征数据平均值得到。在合并过程中,本方法设置了一个不应期来避免错误合并。

在本步骤中,通过合并操作输出一个统一的心搏时间序列数据。该步骤同时能够降低心搏的多检率和漏检率,有效的提高心搏检测的敏感度和阳性预测率。

步骤150,对心搏分析数据进行信号质量分析,评估心搏分析数据的信号质量,得到心搏分析数据的信号质量评价参数;

具体的,可以包括如下步骤:

步骤151,提取心搏分析数据中QRS波群的位置信息和宽度信息;

步骤152,提取相邻两个QRS波群信号之间的RR间期的信号;

步骤153,对RR间期的信号进行滤波处理,并对滤波处理后的信号进行包络计算,得到RR间期的噪声信号的平均功率;

其中,RR间期的噪声信号的平均功率为RR间期内包络幅度的均值。

步骤154,根据噪声信号的平均功率和QRS波群信号的功率得到信号质量评价参数。

进一步具体的,信号质量评价参数可以由RR间期内相对于QRS波群的噪声水平来表征。具体通过根据QRS波群的功率和噪声信号的平均功率计算得到。

以公式表示为:

其中,Si为第i个QRS波群的幅度,Ni,t为第i个RR间期区间内第t个样本点的幅值,T为RR间期长度。

步骤160,根据训练得到的心搏分类模型对心搏分析数据进行幅值和时间表征数据的特征提取和分析,得到心搏分析数据中各心搏数据的一次分类信息;

具体的,不同心电图设备在信号测量、采集或者输出的导联数据等方面存在的差异,以及实际应用场景的不同,本发明的心搏的分类方法,可以根据具体情况,使用简单的单导联分类方法,或者是多导联分类方法。多导联分类方法又包括导联投票决策分类方法和导联同步关联分类方法两种。单导联分类方法就是对单导联设备的心搏分析数据,直接使用对应导联模型进行分类,没有投票决策过程。导联投票决策分类方法是基于各导联的心搏分析数据进行导联独立分类,再把结果投票融合确定分类结果的投票决策方法;导联同步关联分类方法则采用对各导联的心搏分析数据进行同步关联分析的方法。一般来讲,针对导联数量比较少的动态心电图,可以选择投票决策方法;对标准12导联静态心电图,可以使用导联同步关联方法,下面对以上所述几种分类方法分别进行说明。

单导联分类方法包括:

根据心搏时间序列数据,以第二数据量将单导联心搏数据进行切割生成单导联的心搏分析数据,并输入到训练得到的对应该导联的心搏分类模型进行幅值和时间表征数据的特征提取和分析,得到单导联的所述一次分类信息。

导联投票决策分类方法可以具体包括:

步骤1、根据心搏时间序列数据,以第三数据量对各导联心搏数据进行切割,从而生成各导联的心搏分析数据;

步骤2、根据训练得到的各导联对应的心搏分类模型对各导联的心搏分析数据进行幅值和时间表征数据的特征提取和分析,得到各导联的分类信息;

步骤3、根据各导联的分类信息和导联权重值参考系数进行分类投票决策计算,得到所述一次分类信息。具体的,导联权重值参考系数是基于心电数据贝叶斯统计分析得到各导联对不同心搏分类的投票权重系数。

导联同步关联分类方法可以具体包括:

根据心搏时间序列数据,以第四数据量对各导联心搏数据进行切割,从而生成各导联的心搏分析数据;然后根据训练得到的多导联同步关联分类模型对各导联的心搏分析数据进行同步幅值和时间表征数据的特征提取和分析,得到心搏分析数据的一次分类信息。

心搏数据的同步关联分类方法输入是心电图设备所有导联数据,按照心搏分析数据统一的心搏位点,截取各导联上相同位置和一定长度的数据点,同步输送给经过训练的人工智能深度学习模型进行计算分析,输出是每个心搏位置点综合考虑了所有导联心电图信号特征,以及心搏在时间上前后关联的心律特征的准确心搏分类。

本方法充分考虑了心电图不同导联数据实际上就是测量了心脏电信号在不同的心电轴向量方向传递的信息流,把心电图信号在时间和空间上传递的多维度数字特征进行综合分析,极大地改进了传统方法仅仅依靠单个导联独立分析,然后把结果汇总进行一些统计学的投票方式而比较容易得出的分类错误的缺陷,极大地提高了心搏分类的准确率。

本步骤中的心搏分类模型,我们采用了训练集包含30万病人的1700万数据样本进行训练。这些样本是根据心电图分析诊断的要求对数据进行准确的标注产生的,标注主要是针对常见心律失常,传导阻滞以及ST段和T波改变,可满足不同应用场景的模型训练。具体以预设标准数据格式保存标注的信息。在训练数据的预处理上,为增加模型的泛化能力,对于样本量较少的分类做了小幅的滑动来扩增数据,具体的说,就是以每个心搏为基础,按照一定步长(比如10-50个数据点)移动2次,这样就可以增加2倍的数据,提高了对这些数据量比较少的分类样本的识别准确率。经过实际结果验证,泛化能力也得到了改善。

在一个实际训练过程使用了两台GPU服务器进行几十次轮循训练,训练收敛后,使用500万独立的测试数据进行测试,准确率可以到达91.92%。

其中,训练数据的截取的长度,可以是1秒到10秒。比如采样率是200Hz,以2.5s为采样长度,取得的数据长度是500个心电图电压值(毫伏)的一个片段D[500],输入数据是:InputData(i,j),其中,i是第i个导联,j是导联i第j个片段D。输入数据全部经过随机打散才开始训练,保证了训练过程收敛,同时,控制从同一个病人的心电图数据中收集太多的样本,提高模型的泛化能力,既真实场景下的准确率。训练时候,同步输入所有导联对应的片段数据D,按照图像分析的多通道分析方法,对每个时间位置的多个空间维度(不同心电轴向量)的导联数据进行同步学习,从而得到一个比常规算法更准确的分类结果。

本步骤中采用的心搏分类模型可以如图4所示,具体可以为基于人工智能深度学习的卷积神经网络AlexNet,VGG16,Inception等模型启发的端对端多标签分类模型。具体的讲,该模型的网络是一个7层的卷积网络,每个卷积之后紧跟一个激活函数。第一层是两个不同尺度的卷积层,之后是六个卷积层。七层卷积的卷积核分别是96,256,256,384,384,384,256。除第一层卷积核有两个尺度分别是5和11外,其他层卷积核尺度为5。第三、五、六、七层卷积层后是池化层。最后跟着两个全连接层。

步骤170,将一次分类信息结果中的特定心搏的心搏分析数据输入训练好的ST段和T波改变模型进行识别,确定ST段和T波评价信息。

其中,一次分类信息的特定心搏数据是指包含窦性心搏(N)和其它可能包含ST段和T波改变的心搏类型的心搏数据。将一次分类信息结果的特定心搏数据输入训练好的ST段和T波改变模型进行ST段和T波改变识别,来识别一次分类信息中的特定心搏数据是否带有ST段和T波改变数据,其具体方法可以是:把一次分类信息中结果是窦性心搏的各导联数据,输入给ST段和T波改变模型,对窦性心搏数据进行逐一识别判断,以确定窦性心搏是否存在ST段和T波改变特征以及发生的具体导联位置信息,确定ST段和T波评价信息。

其中,ST段和T波评价信息具体为心搏片段数据对应的ST段和T波发生改变的导联位置信息。因为临床诊断要求对于ST段和T波的改变,需要定位到具体的导联。该方法就是把一次分类识别的特定心搏数据,按照每个导联数据依次输入到一个为识别ST段和T波改变的人工智能深度学习训练模型,进行独立计算分析,输出的结果说明导联片段的特征是否符合ST段和T波改变的结论,这样就可以确定ST段和T波改变发生的在具体那些导联的信息。

带有ST段和T波改变的心搏在所有心搏中的占比较低,为了兼顾训练数据的多样性及各个类别数据量的均衡性,选取无ST段和T波改变以及有ST段和T波改变的训练数据比例约为2:1,保证了模型在分类过程中良好的泛化能力且不出现对训练数据占比较多一类的倾向性。由于心搏的形态多种多样,不同个体表现的形态不尽相同,因此,为了模型更好估计各分类的分布,能有效提取特征,训练样本从不同年龄,体重,性别和居住地区的个体收集;另外,因为单个个体在同一时间段内的心电图数据往往是高度相似的,所以为了避免过度学习,在获取单个个体的数据时,从所有数据中随机选取不同时间段的少量样本;最后,由于患者的心搏形态存在个体间差异大,而个体内相似度高的特点,因而在划分训练、测试集时,把不同的患者分到不同的数据集,避免同一个体的数据同时出现在训练集与测试集中,由此,所得模型测试结果最接近真实应用场景,保证了模型的可靠性和普适性。

本步骤中采用的ST段和T波改变模型可以如图5所示,具体可以为基于人工智能深度学习的卷积神经网络AlexNet和VGG16等模型启发的端对端分类模型。具体的讲,该模型是一个7层的网络,模型包含了7个卷积,5个池化和2个全连接。卷积使用的卷积核均为1x5,每层卷积的滤波器个数各不相同。第1层卷积滤波器个数为96;第2层卷积和第3层卷积连用,滤波器个数为256;第4层卷积和第5层卷积连用,滤波器个数为384;第6层卷积滤波器个数为384;第7层卷积滤波器个数为256;第1、3、5、6、7层卷积层后是池化。随后是两个全连接,最后还采用Softmax分类器将结果分为两类。为了增加模型的非线性,提取数据更高维度的特征,故采用两个卷积连用的模式。

步骤180,对心搏分析数据在一次分类信息下根据心电图基本规律参考数据以及ST段和T波评价信息进行二次分类处理,最终得到心搏分类信息;

具体的,心电图基本规律参考数据是遵循权威心电图教科书中对心肌细胞电生理活动和心电图临床诊断的基本规则描述生成的,比如两个心搏之间最小的时间间隔,P波与R波的最小间隔等等,用于心搏分类的投票决策计算和将心搏分类后的一次分类信息再进行细分;主要根据是心搏间RR间期以及不同心搏信号在各导联上的医学显著性;依据心电图基本规律参考数据结合一定连续多个心搏的分类识别将室性心搏分类拆分更细的心搏分类,包括:室性早搏(V)、室性逸搏(VE)、加速性室性早搏(VT),将室上性类心搏细分为室上性早搏(S)、房性逸搏(SE)、交界性逸搏(JE)和房性加速性早搏(AT)等等。

此外,通过二次分类处理,还可以纠正一次分类中发生的不符合心电图基本规律参考数据的错误分类识别。将细分后的心搏分类按照心电图基本规律参考数据进行模式匹配,找到不符合心电图基本规律参考数据的分类识别,根据RR间期及前后分类标识纠正为合理的分类。

具体的,经过二次分类处理,可以输出多种心搏分类,比如:正常窦性心搏(N)、完全性右束支阻滞(N_CRB)、完全性左束支阻滞(N_CLB)、室内阻滞(N_VB)、一度房室传导阻滞(N_B1)、预激(N_PS)、室性早搏(V)、室性逸搏(VE)、加速性室性早搏(VT)、室上性早搏(S)、房性逸搏(SE)、交界性逸搏(JE)、加速性房性早搏(AT)、房扑房颤(AF)、伪差(A)等分类结果。

通过本步骤,还可以完成基础心率参数的计算。其中基础计算的心率参数包括:RR间期、心率、QT时间、QTc时间等参数。

步骤190,将心搏分析数据根据心搏分类信息和心电图基本规律参考数据生成心电图事件数据;根据信号质量评价参数对心电图事件数据进行筛选,得到相应的报告结论数据和报告表项数据;根据每种心电图事件数据中的典型数据片段,生成报告图形数据,并且输出所述报告表项数据、报告图形数据和报告结论数据;

在本步骤中,首先根据心搏二次分类结果,按照心电图基本规律参考数据进行模式匹配,从而得到心搏分析数据中的心电图事件数据。同时参考信号质量评价参数,剔除不可信事件,计算各种心率参数,统计事件的数量和发生时间等,得到报告结论数据和报告表项数据。

具体的心率参数计算包括计算平均心率、及最大、最小心率等。在计算最大和最小心率时,以固定长度片段为统计单位,逐个心搏进行全程扫描和统计比较。片段的长度一般为8-10秒,也可以根据需要自由设定。计算心率时,针对窦性心率占主体和异位心率占主体采用不同的心搏类型统计计算方法。在计算最大最小心率时:针对窦性心率占主体的心电图,仅计算窦性分类心搏;针对房扑房颤类占主体的心电图,仅计算房扑房颤类心搏及窦性心搏;针对非房扑房颤的其他异位心搏占主体的心电图,除伪差外所有类型心搏均参与计算。

对心电图事件数据,根据信号质量评价参数进行质量评估,选取数据信号质量最高的事件片段,同时分析片段中的包含的事件种类数量,优先选取最具代表性的片段,优选片段的开始位置,尽量保证事件心搏位于所选取片段的中部,生成报告图形数据。

在优选的方案中,心电图事件的选择规则可以具体如下例子所述:

对于一般心电图事件,选取单个片段。当片段第一个心搏心率大于等于100时,片段起始点位置距离第一个心搏距离为0.3秒。当片段第一个心搏心率小于等于45时,片段起始点位置距离第一个心搏距离为0.37秒。

对于有多个片段的心电图事件,需要对多个片段进行质量评估,依据信号质量评价参数计算截取片段的无干扰信号占比,当无干扰信号占比达到设定的阈值(优选的在60%-95%范围中确定阈值),片段符合筛选条件,从中获得最优典型数据段。

最后,输出报告表项数据、报告图形数据和报告结论数据。

在上述过程之外,本发明还可以基于得到的分类结果,进行人工检验,并将检验出与自动分析输出的分类结果不符的心搏分类数据再进行修正,作为训练样本反馈输入给训练好的模型,用于人工智能自学习。深度学习的模型可以通过输入新的训练数据进行不断的迭代循环训练,从而持续改进本发明所使用的3个分类模型(干扰二分类模型,心搏分类模型,ST段和T波改变模型)的准确率。

需要说明,在上述执行步骤的过程中虽然对3个分类模型的具体实现方式进行了具体说明,但并不限定其具体的实现方式只能采用所例举的方式实现。三个模型均可采用LeNet-5模型,AlexNet模型、VGG16模型、Inception模型中的一个或多个来实现,也可以使用其它一些模型,比如,ResNet模型,RNN相关的模型,Auto-Encoding模型或者SeqToSeq等模型进行训练和分类推理,同时,也不限定模型分类的类别数量。

图6为本发明实施例提供的一种设备结构示意图,该设备包括:处理器和存储器。存储器可通过总线与处理器连接。存储器可以是非易失存储器,例如硬盘驱动器和闪存,存储器中存储有软件程序和设备驱动程序。软件程序能够执行本发明实施例提供的上述方法的各种功能;设备驱动程序可以是网络和接口驱动程序。处理器用于执行软件程序,该软件程序被执行时,能够实现本发明实施例提供的方法。

需要说明的是,本发明实施例还提供了一种计算机可读存储介质。该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时,能够实现本发明实施例提供的方法。

本发明实施例还提供了一种包含指令的计算机程序产品。当该计算机程序产品在计算机上运行时,使得处理器执行上述方法。

本发明实施例提供的基于人工智能自学习的心电图自动分析方法及设备,通过数据的预处理,心搏特征检测,干扰信号检测,信号质量评估与导联合并,心搏分类,心搏审核的二次分类,心电图事件分类和心电图参数的分析计算,最终自动输出报告数据的一个完整快速流程的自动化分析方法。本发明的自动分析方法,还可以记录对自动分析结果的修改信息,并收集这些修改的数据反馈给深度学习模型继续训练,不断地改进和提升自动分析方法的准确率。

专业人员应该还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

结合本文中所公开的实施例描述的方法或算法的步骤可以用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。

以上所述的具体实施方式,对本发明的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号