首页> 中国专利> 基于深度神经网络的两步骤心律失常分类方法

基于深度神经网络的两步骤心律失常分类方法

摘要

本发明公开了一种基于深度神经网络的两步骤心律失常分类方法。属于计算机、软件类领域;具体步骤:1、预处理;2、初始化;3、Bi‑LSTM分类N,SV,F和Q;4、GAN生成不平衡心跳数据;5、Bi‑LSTM分类S和V;本发明适用于收集到的ECG心跳数据不足的心律失常的分类;可以保证较高的分类准确率;此外采用的两步骤分类框架充分考虑了医学事实,因此本发明可以保证较高的分类准确率,具有实际意义。

著录项

  • 公开/公告号CN112686091A

    专利类型发明专利

  • 公开/公告日2021-04-20

    原文格式PDF

  • 申请/专利权人 南京信息工程大学;

    申请/专利号CN202011319283.8

  • 发明设计人 孙乐;王逸琳;吴进;

    申请日2020-11-23

  • 分类号G06K9/00(20060101);G06K9/62(20060101);G06N3/04(20060101);G16H50/70(20180101);

  • 代理机构32204 南京苏高专利商标事务所(普通合伙);

  • 代理人曹坤

  • 地址 210044 江苏省南京市江北新区宁六路219号

  • 入库时间 2023-06-19 10:41:48

说明书

技术领域

本发明涉及计算机、软件类领域,具体涉及一种基于深度神经网络的两步骤心律失常分类方法。

背景技术

传感器是把自然界的非电量变成可利用的电信号的装置或者器件。随着时代的变迁和技术的进步,它的定义也被不断更新。现阶段我们认为,传感器是把自然界的物理量、化学量、生物量变成可利用的信号的装置或者器件。它的特点包括:微型化、数字化、智能化、多功能化、系统化、网络化。传感器是物联网和互联网的关键硬件,可以用来收集实时数据,给人们带来了极大的便利,使得人们可以在第一时间获取相关的数据信息,并对其进行分析。传感器是智能化设备的信息入口,是大数据的重要组成部分。在我们的生产生活中,它是极为重要的信息和数据来源,是信息化和工业化深度融合的关键技术之一。传感器市场规模正呈现高速的增长态势,处于突破和创新发展的状态。

如今,传感器已经渗透到我们生活和生产的方方面面。未来,随着感知技术的不断发展和需求的不断增多,智能传感器将越来越多地应用到不同的领域,满足不同细节的需求。现阶段,传感器在医学方面应用广泛。其中较为普遍的是可穿戴的传感器,可以用于收集人们的生理数据,特别是医学上心电信号的收集。全世界每年会有数百万人死于心律失常。而心脏疾病常常具有突发性及不确定性,急性发作甚至会导致猝死。因此,诊断时间越短,越快出诊断结果,就越有利于患者的健康;细小的差错也可能将会导致非常严重的后果,有时甚至会威胁到患者的生命。人工进行数据分析耗时耗力,得出的结果往往具有主观性,易遗漏重要的信息,诊断低效且准确率不高。而利用分析收集到的实时心电数据,借助计算机来实现心律失常的自动检测,可以尽快判断出这个人的心脏有没有出现心律失常的问题以及出现的是什么类型的心律失常。它具有诊断高效且准确性高等优点。

发明内容

针对上述问题,本发明提供了一种基于深度神经网络的两步骤心律失常分类方法;本发明利用生成对抗网络(Generative Adversarial Nets,简称GAN)和堆叠的双向长短时记忆循环神经网络(Bi-directional Long Short-Term Memory,简称Bi-LSTM)建立了一个基于深度神经网络的两步骤心跳分类框架;按照标准,将心跳分为这五大类:正常心跳(normal beat,简称N)、室上异位心跳(supraventricular ectopic beat,简称S)、心室异位心跳(ventricular beat,简称V)、融合心跳(fusion beat,简称F)以及不可分心跳(unclassifiable beat,简称Q);该框架的第一步先将S类和V类作为一大类SV类,将心跳分成四个类别,第二步再对S类和V类进行划分,从而完成心跳的分类。

本发明的技术方案是:基于深度神经网络的两步骤心律失常分类方法,具体操作步骤如下:

步骤(1.1)、对收集到的ECG信号进行预处理,定位QRS波收集N、SV、F和Q类心跳对应的前一个RR间期并截取出ECG信号中的心拍;从而确定心拍的类型及各类型心拍对应的数据量;

步骤(1.2)、将收集到的所有的RR间期与截取到的ECG信号中的心拍分别按类别进行编码,得到所对应的类别标签;

步骤(1.3)、再将收集到的所有的RR间期与对应的标签按相同的顺序打乱,划分出训练集与测试集,对RR间期的Bi-LSTM分类模型进行训练,得到训练好的RR间期Bi-LSTM分类模型;

步骤(1.4)、对于数据量在一定区间的心拍类型,使用生成对抗网络GAN生成不平衡心拍数据,即使用GAN生成该类型的心拍,并将生成的心拍按照类别编码,得到对应的类别标签;

步骤(1.5)、将得到的所有的心拍数据与对应的标签按相同的顺序打乱,并划分训练集与测试集,对心拍的Bi-LSTM分类模型进行训练,得到训练好的心拍的Bi-LSTM分类模型;

步骤(1.6)、利用训练好的基于深度神经网络的两步骤心律失常分类模型对未知类别的ECG心拍进行分类。

进一步的,在步骤(1.1)中,所述对收集到的ECG信号进行预处理的具体操作方法如下:

(1.1.1)、收集N、SV、F和Q类心拍对应的前一个RR间期,将所有心拍对应的RR间期序列构成的集合表示为S,所述S={S

式中,R

(1.1.2)、定位QRS波截取SV类中S类和V类的心拍,将收集到的原始ECG信号时间序列分割成m段子序列,所述m段子序列构成的集合为X,则X={X

进一步的,在所述步骤(1.3)中,对RR间期的Bi-LSTM分类模型进行训练的具体操作方法如下:采用十折交叉验证的方法对Bi-LSTM模型进行训练,即将全部的所有的心拍数据分成十个相等的部分,使用其中的任意一个部分用于测试,剩余的九个部分用于训练,通过移动选择测试部分重复十次训练操作。

进一步的,在所述步骤(1.4)中,使用生成对抗网络GAN生成不平衡心拍数据的具体操作方法如下:其中,生成对抗网络GANGAN由生成器和判别器两个部分组成;其具体操作过程如下:

(1.4.1)、将需要扩充数据的类型的心拍X

(1.4.2)、GAN中生成器的输入为一组噪声信号Z

进一步的,在所述步骤(1.5)中,采用十折交叉验证的方法对Bi-LSTM模型进行训练,即,将全部的ECG心拍序列分成十个相等的部分,使用其中的任意一个部分用于测试,剩余的九个部分用于训练,通过移动选择测试部分重复十次训练操作。

进一步;的在步骤(1.1)与(1.2)中,所述的所有的RR间期的个数在35-50个之间。

为了使计算机能够进行自动、高效、准确地诊断心律失常的类型,在现有的心律失常自动分类中还有一些问题亟待解决;本发明旨在解决以下问题:

1、分类模型不具备普遍性:在对心电图(Electrocardiogram,简称ECG)信号进行分类时,使用的分类模型只适用于特定心电数据集中的数据,而无法区分来自其他心电数据集的心跳;

2、无法准确诊断出数据量少的心律类别:存在不常见的心律类型,该类型所对应的数据非常少,计算机得不到足够的数据进行训练。在分析ECG信号的片段时,如果遇到这种不常见的心律类型,计算机可能会无法准确判断出该ECG片段所属的类别。

3、准确率不高:目前大多数利用计算机进行心跳分类所取得的分类准确率都不够高;如果不能实现非常准确的分类就不能对医生的诊断起到真正辅助作用。

本发明的有益效果是:本发明考虑医学事实,具有实际意义;1、本发明提出了一个基于深度神经网络的两步骤心跳分类框架;首先根据N类心跳的前一个RR间期比S类和V类的短的事实,将S类和V类心跳作为一个大类SV类,通过RR间期来区分N类和SV类;然后根据S类心跳与V类心跳ECG信号的波形有差异的事实将S类和V类心跳区分开;由于F类心跳和Q类心跳的区分没有实际意义,所以不考虑这两类心跳的分类效果;因此本发明具有实际意义;2、本发明适用于数据不平衡条件下的心律失常分类:本发明适用于收集到的ECG心跳数据不足的心律失常的分类;针对收集到的数据不足的情况,GAN可以生成和输入数据具有相同概率分布的数据,我们利用GAN对数据量少的类别的心跳进行数据的扩充;GAN生成足够数量对应的心跳数据后,就可以解决因为数据量不足所带来的问题,则不存在因为数据缺乏所导致的分类准确率低的情形;GAN生成的数据可以使原本不平衡的数据变得平衡,则分类模型能够取得足够大的训练集,从而有利于模型参数的最优化;因此本发明可以实现数据不平衡条件下的心律失常分类;3、本发明可以保证较高的分类准确率:本发明一方面利用GAN进行数据的扩充,来获取足够量的ECG数据用于训练,另一方面又使用了Bi-LSTM构建分类模型;Bi-LSTM是一种特殊的循环神经网络(Recurrent Neural Network,简称RNN),它可以全面地学习到输入数据的之间的前后关系,并避免梯度消失和梯度爆炸问题的发生;在实现分类之前,需要先对基于Bi-LSTM的分类模型进行训练,训练完成后该分类模型取得的参数可以准确提取出输入数据前后时序之间的关系;此外采用的两步骤分类框架充分考虑了医学事实,因此本发明可以保证较高的分类准确率。

附图说明

图1是本发明的结构流程图;

图2是本发明中RR间期分类模型的结构示意图;

图3是本发明中GAN中生成器和判别器的结构示意图;

图4是本发明中心跳分类模型的结构示意图。

具体实施方式

为了更清楚地说明本发明的技术方案,下面结合附图对本发明的技术方案做进一步的详细说明:

本发明叙述了整个分类心律失常运行的过程,本发明的两步骤心跳分类框架如图1所示。

步骤1、预处理:

(1.1)、对收集到的ECG信号进行预处理,定位QRS波收集N、SV、F和Q类心跳对应的前一个RR间期;使用Pan-Tompkins算法完成QRS波的定位后,计算当前R峰与前一个R峰之间的时间间隔;将所有心跳对应的RR间期序列构成的集合表示为S,且S={S

(1.2)、定位QRS波截取ECG信号中SV类的S类和V类的心跳;将一段收集到的原始ECG信号时间序列分割成m段子序列,这m个子序列构成的集合为X,则X={X

步骤2、初始化:

(2.1)、将收集到的所有的RR间期按照类别进行编码;N、SV、F和Q这四类RR间期编码的类别标签分别为:0,1,2,3;

(2.2)、将截取到的ECG心跳按照类别进行编码;其中S和V这两类心跳进行编码后的类别标签分别为:0和1;从而得到所对应的类别标签;

步骤3、Bi-LSTM分类N,SV,F和Q:

(3.1)、按相同的顺序打乱RR间期数据集与对应标签;为了使基于Bi-LSTM的分类模型能够更全面地学习到输入的RR间期序列之间的关系,所有的数据在混合后需要打乱顺序,并且按相同的顺序打乱对应的标签,从而避免数据分布不均匀的情况发生;

(3.2)、划分RR间期数据集;将90%的数据划分为训练集,剩余10%的数据用作测试集,并将训练集中的20%用作验证集,此外还采用十折交叉验证的方法将全部的RR间期数据集分成十个相等的部分,一个部分用于测试,剩余的九个部分用于训练,通过移动测试部分重复这个操作10次;

(3.3)、将RR间期训练集的数据输入到搭建好的Bi-LSTM的模型中进行训练,获取模型最优参数;本发明提出的RR间期分类模型的整体结构如图2所示,第一层和第二层LSTM神经元的个数都为54,第三层、第四层和第五层Dense层对应的神经元的个数分别为:64、32、4,每一个防止过拟合的dropout层设置的dropout rate为0.3;每一次训练设置的轮数为100轮,训练时使用的优化器为Adam,损失函数是sparse categorical cross entropy;最后获得的评价指标的值是十次训练取得的评价指标的平均值;

(3.4)、训练完成后保留模型参数,输入RR间期测试集进行测试,此时的模型可以输入未知类别的RR间期数据实现N、SV、F和Q的自动分类;

步骤4、GAN生成不平衡心跳数据:

(4.1)、使用GAN生成数据量在一定区间(具体是指该类型的心跳的数量明显少于其余类型的心跳数量)内的类别的心跳;在此阶段,GAN会扩充数据量不足的类型的心跳对应的数据,以消除因为数据缺乏而对分类结果造成的不良影响;GAN由生成器和判别器两个部分组成,它的框架结构如图3所示;其中,生成器的全连接层神经元的个数为50*128,经过Reshape层后数据的维度为50*128,四个卷积层卷积核的个数分别为128、64、32和1,卷积核的尺寸都为6,步长都为2,批标准化层的批处理大小设置为0.8;判别器中卷积层卷积核的个数为32,卷积核的尺寸为6,步长为3,批标准化层的批处理大小也设置为0.8,最大池化层池化的尺寸为2,最后一个全连接层中神经元的个数为1;且判别器的学习率设为0.0002,生成器的学习率设为0.0001,一共训练10000轮;从步骤1中提取到的S和V的心跳个数可以发现,S和V这两类心跳所对应的个数相差较大,而F和Q这两类心跳没有实际的意义,类似于噪声,所以只用GAN生成3000条S类数据而不考虑F和Q;GAN具体生成不平衡传感器数据的过程如下:

第一步:将需要扩充数据的类型的心跳X

第二步:GAN中生成器的输入为一组噪声信号Z

(4.2)、将生成的ECG心跳按照类别进行编码:将生成的S类心跳编码为0;

步骤5、Bi-LSTM分类S和V:

(5.1)、将GAN生成的心跳与截取到的原始心跳按照类别混合;将生成的X′

(5.2)、按相同的顺序打乱心跳数据集与对应标签;为了使基于Bi-LSTM的分类模型能够更全面地学习到输入的心跳的时间序列之间的关系,与步骤3相同,所有的数据在混合后需要打乱顺序,并且按相同的顺序打乱对应的标签以避免数据中各个类型的心跳分布不均匀的情况发生;

(5.3)、划分数据集:将90%的数据划分为训练集,剩余10%的数据用作测试集,并将训练集中的20%用作验证集,此外还采用十折交叉验证的方法;即将全部的ECG心跳序列分成十个相等的部分,一个部分用于测试,剩余的九个部分用于训练,我们通过移动测试部分重复这个操作10次;

(5.4)、将训练集的数据输入到搭建好的基于Bi-LSTM分类模型中进行训练,从而获取模型的最优参数;提出的分类模型的整体结构如图4所示,第一层和第二层LSTM神经元的个数都为170,第三层、第四层和第五层Dense层对应的神经元的个数分别为:64、32、2,每一个防止过拟合的dropout层设置的dropout rate为0.3;每一次训练设置的轮数为50轮,训练时使用的优化器为Adam,损失函数是sparse categorical cross entropy;最后获得的评价指标的值是十次训练取得的评价指标的平均值;

(5.5)、模型训练好后将最后取得的最优参数保留,输入测试集进行测试,此时该模型可以实现对S和V的自动分类。

具体实例:

给定一段传感器收集到的ECG信号,先使用Pan-Tompkins算法进行QRS波的定位来收集所有心跳对应的RR间期以及心拍数据;

接着将待分类心跳的RR间期序列输入RR间期的Bi-LSTM分类模型进行分类。如果输出的类别是N、F或者Q,则该心跳完成分类;如果输出的是SV,则需要进行下一步以做进一步的划分;

针对上述输出为SV的心跳,将心拍数据输入心拍的Bi-LSTM分类模型,从而将S与V类心跳区分开。

最后,应当理解的是,本发明中所述实施例仅用以说明本发明实施例的原则;其他的变形也可能属于本发明的范围;因此,作为示例而非限制,本发明实施例的替代配置可视为与本发明的教导一致;相应地,本发明的实施例不限于本发明明确介绍和描述的实施例。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号