首页> 中国专利> 一种阻塞性睡眠呼吸暂停症严重程度的分类方法

一种阻塞性睡眠呼吸暂停症严重程度的分类方法

摘要

本发明涉及一种阻塞性睡眠呼吸暂停症严重程度的分类方法,包括S1:对原始阻塞性睡眠呼吸暂停症语音文件进行特征提取;得到包括HFE的特征矩阵;S2:对S1得到的特征矩阵进行降维;S3:构建朴素贝叶斯分类模型,用经S2降维后的特征矩阵训练并测试朴素贝叶斯分类模型,直至朴素贝叶斯分类模型分类误差值符合要求;S4:将待测阻塞性睡眠呼吸暂停症患者的语音原始文件输入S3中训练并测试好的朴素贝叶斯分类模型进行分类。本发明可提高OSA严重程度的分类的准确度。

著录项

  • 公开/公告号CN112190253A

    专利类型发明专利

  • 公开/公告日2021-01-08

    原文格式PDF

  • 申请/专利权人 广东工业大学;

    申请/专利号CN202010981626.0

  • 申请日2020-09-17

  • 分类号A61B5/08(20060101);A61B5/00(20060101);

  • 代理机构44102 广州粤高专利商标代理有限公司;

  • 代理人张金福

  • 地址 510062 广东省广州市越秀区东风东路729号

  • 入库时间 2023-06-19 09:29:07

说明书

技术领域

本发明涉及病理语音分析领域,更具体地,涉及一种阻塞性睡眠呼吸暂停症严重程度的分类方法。

背景技术

阻塞性睡眠呼吸暂停症(Obstructive sleep apnea,OSA)是人类特有且常见的睡眠呼吸障碍性疾病。除了先天性头骨畸形以外,年龄的增长、过度肥胖等因素都会增加患有阻塞性睡眠呼吸暂停症(OSA)的风险。患有阻塞性睡眠呼吸暂停症时,由于反复发作的低血氧、高碳酸血症,可致神经功能失调,儿茶酚胺、内皮素及肾素-血管紧张素系统失调,内分泌功能紊乱及血液动力改变,造成全身多器官多系统损害,严重影响人体健康。研究发现:约80%的OSA患者有明显的心动过缓,57%-74%的患者出现室性早搏,10%的患者发生二度房室传导阻滞。这种心律失常是引起患者猝死的主要原因。我们在Karl A.Franklin的研究中发现男性的OSA发病率是22%,女性的是17%。根据国家统计局2019年1月21日发布中国人口最新统计数据,2018年末中国大陆总人口139538万人,男性人口71351万人,女性人口68187万人,换而言之,中国大约有15697万男性、11592万女性(共2亿7千万人)患有阻塞性睡眠呼吸暂停症,以上数据表明,对阻塞性睡眠呼吸暂停症的检测与治疗是很有必要的。

现在,诊断OSA的黄金标准是多导睡眠测试(Polysomnography,PSG)。PSG通过分析患者的睡眠生理数据来计算脑电图、眼电图、呼吸流量、胸腹运动、心电图、血含氧度等。医生们可以从多导睡眠图中找出有关呼吸暂停的事件(包括OSA、中央性睡眠呼吸暂停Central sleep apnea等等),从而计算出呼吸中止指数(Apnea Hypopnea Index(AHI):睡眠期间平均每小时发生的呼吸暂停事件),并使用呼吸中止指数来衡量阻塞性睡眠呼吸暂停症的严重程度。然而PSG并不是每个患者都能接受的,其主要问题在于很多人在装上感应装置后会有不适感,影响睡眠质量,从而导致多导睡眠测试失败。另一方面,多导睡眠图必须要由多导睡眠技师(Registered Polysomnography Technologist,RPSGT)来收集和处理,才能得出AHI结果,运作成本十分高。基于以上问题,人们开始寻求一种新的检测方法。自上世纪80年代初以来,研究人员致力于研发分析患者清醒时的声音来筛选出OSA患者的方法。其中主要的计算机分析技术依赖于傅里叶变换的特征,例如频率模式、频宽、谐振峰,但是这些工具是针对正常语音开发的,对OSA声音信号进行分析是不准确的,因为OSA声音信号是病理语音,无论音域、频率变化度、共振峰轨迹都跟一般语音信号存在很大的不同,所以传统的语音处理/识别方法对此应用并不适合。

有研究表明,OSA与上呼吸道的解剖形状和功能异常有关。经过长期的阻塞性睡眠呼吸暂停之后,患者的上呼吸道组织会变得跟正常人有差别。这种差别会在患者的声音上体现出来,故通过对患者的声音进行检测可以预测其OSA的严重程度。近期很多研究人员开始使用语音来预测OSA的严重程度,并且验证了使用语音检测来预测OSA的严重程度的可行性。他们大多是选择构造一个常见的语音特征集(里面包含谐振峰,基频,梅尔倒谱系数,能量等)放进特征选择模块(如序列前向特征选择),然后再把选择出来的特征放进分类器里,得到预测的结果,然而这些特征都是传统语音特征,主要的关注点都在6kHz以下的频率,并不一定适合病理语音或者并不能最好地区分出OSA与正常人的区别。

现有的OSA分类主要使用传统的语音特征集(包括谐振峰,倒谱梅尔系数,基频,抖动,线性预测系数),这些语音特征一般用于正常语音分类或者语音识别,主要关注的频谱范围为6kHz以下的,但它未必适用于病理语音,所以这就导致分类的精度不高。其次,传统的语音特征集的许多特征都是通过估计的方式来实现的,例如formant的计算通常就是使用线性预测系数(LPC)来做的,受到参数的影响很大,LPC的系数一旦改变,那么谐振峰的位置也就跟着改变,对精度影响也很大,我们不可能对每个参数都求其最优系数。

发明内容

本发明为克服上述现有技术所述的OSA严重程度的分类精度不高的缺陷,提供一种阻塞性睡眠呼吸暂停症严重程度的分类方法。

所述方法包括以下步骤:

S1:对原始阻塞性睡眠呼吸暂停症语音文件进行特征提取;得到包括高频能量系数(HFE)特征的特征矩阵;

S2:对S1得到的特征矩阵进行降维;

S3:构建朴素贝叶斯分类模型,用经S2降维后的特征矩阵训练并测试朴素贝叶斯分类模型,直至朴素贝叶斯分类模型分类误差值符合要求;

S4:将待测阻塞性睡眠呼吸暂停症患者的语音原始文件输入S3中训练并测试好的朴素贝叶斯分类模型进行分类。阻塞性睡眠呼吸暂停症严重程度的分类一般可以分为四类:正常,轻微,中度,严重。

优选地,S1提取的特征包括:时域特征、倒谱特征、频谱特征。

优选地,时域特征包括:对数能量;

倒谱特征包括:梅尔倒谱系数(MFCC),梅尔倒谱速度系数ΔMFCC,梅尔倒谱加速度系数ΔΔMFCC;

频谱特征包括:谐振峰,谐振峰带宽,线性预测系数,谐波噪声比,高频能量系数。

优选地,为了消除个体差异,我们引入高频能量系数,即是高频能量与所有能量得比值,因为有些人声量高,能量大,导致他可能没有OSA,高频能量也很大,这样会导致误差,所以选择使用高频能量系数能减轻这种情况。高频能量系数的计算方法如下:

其中g(n,k)是将原语音信号经过希尔伯特黄变换得到的函数,里面包含两部分,一部分是频率函数f

优选地,S2具体为:

首先对S1特征提取得到的特征矩阵进行主成分分析,得到一个降维的矩阵X1,然后再对X1进行前向序列特征选择,得到一个维度更低的特征矩阵X2。

优选地,前向序列特征选择包括以下步骤:

(1)包含:特征子集X从空集开始,每次选择一个特征x加入特征子集X;

(2)测试:测试评价函数的取值是否达到最优;

(3)删除:若测试评价函数的取值达到最优,则保留特征x,并删除其余特征。

优选地,S3包括以下步骤:

S3.1:构建分类模型;所述分类模型为朴素贝叶斯分类模型;

S3.2:把S2所得的特征矩阵分为训练集和测试集;

S3.3:然后把训练集放进分类模型中进行训练,得到训练误差函数与训练精度,然后用梯度下降对参数调优,直至得到好的训练模型,然后再把测试集放入已经训练好的分类模型中进行测试,得到一个预测类别,然后再和真实的类别相比较,得到预测精度,若预测精度太差,则继续调节分类模型的参数,直至调出更好的参数为止。

优选地,朴素贝叶斯模型的表示形式如下:

优选地,S3.3中对已训练好的分类模型使用留一法进行测试。

优选地,留一法具体为:从M个样本中随机挑选一个为测试集,其余皆为训练集,重复M次,再计算其误差值。

与现有技术相比,本发明技术方案的有益效果是:

本发明基于阻塞性睡眠呼吸暂停症患者频谱图中高频能量的发现,增加了高频能量系数,能够帮助我们将阻塞性睡眠呼吸暂停症严重程度分类出来,也能让分类的效果更加精确,也能让这件技术更快的融入使用。本发明使用朴素贝叶斯分类器,可以提高阻塞性睡眠呼吸暂停症严重程度的分类的准确性。

附图说明

图1为实施例1所述阻塞性睡眠呼吸暂停症严重程度的分类方法流程题。

图2为朴素贝叶斯模型训练流程图。

图3为朴素贝叶斯模型测试流程图。

图4为阻塞性睡眠呼吸暂停症不同严重患者元音/a/的频谱图。

具体实施方式

附图仅用于示例性说明,不能理解为对本专利的限制;

为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;

对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。

实施例1:

本实施例提供一种阻塞性睡眠呼吸暂停症严重程度的分类方法,如图1所示,所述方法包括以下步骤:

S1:构建自回归移动平均(ARMA)模型,并(这里是错的,同上说的一样)输入原始阻塞性睡眠呼吸暂停症语音文件进行特征提取;得到包括HFE的特征矩阵的特征矩阵。

关于特征提取。

OSA患者与正常人的发声构造不同,是呼吸道的解剖形状和功能异常造成的。为了能将OSA患者与正常人区分开来,一个能传达了生理上的和知觉差异的特征矩阵被构建了出来,如表1所示。

表1:

(1)传统特征

OSA患者和正常人之间的结构和功能变化会影响广泛的声学特征。线性预测编码代表语音信号的频谱包络;因此,线性预测编码中的声道形状差异可能很明显。共振峰频率也应受到影响。例如,共振峰受管道长度影响,这对于OSA患者而言更为严重。共振峰值的这种差异可能被认为是共振障碍。带宽的差异可能是由于软组织特征的改变而引起的,通常在OSA患者中发现。有证据表明,患有OSA的患者可能会减弱神经肌肉反应以维持上呼吸道张力,这可能导致关节活动障碍。神经肌肉异常以及结构变化可导致鼻-口耦合的改变,这也可引起共振障碍。鼻-口耦合差异的主张促使人们使用自回归移动平均(ARMA)模型。该模型表征了鼻音素。夜间打可能会影响喉部并引起语音障碍;谐波噪声比或音调动态变化(抖动)可以预测这些语音异常。梅尔倒谱系数是信号频谱的感知表示;因此,感知性语音障碍可能会影响此功能。神经肌肉异常刺激了信号能量的一阶和二阶导数的使用,这可以代表长时间说话时的肌肉疲劳。

(2)新特征——高频能量系数

在以往的研究中,语音数据通常用收音机(采样率为44.1kHz)来进行收集,然后对收集到的语音进行下采样,降低到16kHz以下,以进行有效处理。传统语音处理方法在5-6kHz以下运行,因为普通人语音的最大频率通常在6kHz以下。因此,以前的研究往往会忽略了高频特性。但是,我们可以清楚地看到OSA患者的声音在从频谱图开始高于6kHz的频率上以不同的严重程度显示出不同的特征,如图4所示。我们可以观察到,随着严重性的增加,存在更多具有变化带宽的混合共振峰,同样,检测到的峰值通常在声音产生期间波动。相比之下,正常人的/a/声音呈现出更清晰,更稳定的共振峰轨迹。我们推测,睡眠呼吸暂停事件会导致发声器官在清醒时产生更多的高频成分,因此可以从OSA患者的声音中检测到。传统的语音信号处理都是在5kHz以下,因为人类的说话声音的频率就在5kHz以下,所以人们对于高频部分并不关注,但是通过观察OSA患者的频谱图(如图4所示),我们可以发现OSA患者频谱图的高频的阴影部分是比较重的,这就代表OSA患者的语音在高频部分的能量也很大。由于考虑个体差异,因此我们就计算高频能量与所有能量的比值。计算方法如下:

其中g(n,k)是将原语音信号经过希尔伯特黄变换得到的函数,里面包含两部分,一部分是频率函数f

简而言之,这些特征就能分为以下三类:

时域特征:对数能量。

倒谱特征:MFCC,ΔMFCC,ΔΔMFCC。

频谱特征:谐振峰,谐振峰带宽,线性预测系数,谐波噪声比,高频能量系数。

具体而言,S1的具体操作为:

输入:原始的语音文件(元音/a/)共66个样本。

输出:特征矩阵。

对每个样本进行特征提取,(如表1所示)共提取一百零一个特征Xi,然后构造特征矩阵,每一行表示一个样本,因而特征矩阵的维度就是66*101。

S2:对S1得到的特征矩阵进行降维。

关于特征选择:

在机器学习的实际应用中,特征数量可能较多,其中可能存在不相关的特征,特征之间也可能存在相关性,容易导致如下的后果:

1).特征个数越多,分析特征、训练模型所需的时间就越长,模型也会越复杂。

2).特征个数越多,容易引起“维度灾难”,其推广能力会下降。

.特征个数越多,容易导致机器学习中经常出现的特征稀疏的问题,导致模型效果下降。

4).对于模型来说,可能会导致不适应的情况,即是解出的参数会因为样本的微小变化而出现大的波动。

特征选择,能剔除不相关、冗余、没有差异刻画能力的特征,从而达到减少特征个数、减少训练或者运行时间、提高模型精确度的作用。在本发明中,我们首先主成分分析(PCA)来对特征空间进行重构以及选择,然后我们在对重构过的特征空间使用前向序列特征选择(SFFS)。前向序列特征选择(SFFS)可以归为三步:1.包含。2.测试。3.删除。特征子集X从空集开始,每次选择一个特征x加入特征子集X,使得特征函数最优,其余的就会移除。简单说就是,每次都选择一个使得评价函数的取值达到最优的特征加入,其本质就是一种简单的贪心算法。

具体而言,S2的具体操作为:

特征选择:输入:特征矩阵。

输出:降维后的特征矩阵。

首先我们对第一步特征提取得到的特征矩阵进行主成分分析,得到一个降维的矩阵X1,然后再对X1进行前向序列特征选择,得到一个维度更低的特征矩阵。

S3:构建朴素贝叶斯分类模型,用经S2降维后的特征矩阵训练并测试朴素贝叶斯分类模型,直至朴素贝叶斯分类模型分类误差值符合要求。

关于分类器:

分类器本实施例选择简单的分类器(朴素贝叶斯分类器)来实现。朴素贝叶斯是一种简单但极为强大的预测建模算法。之所以称为朴素贝叶斯,是因为它假设每个输入变量是独立的。

朴素贝叶斯模型的表示形式如下:

为了训练朴素贝叶斯模型,我们需要先给出训练数据,以及这些数据对应的分类。那么上面这两个概率,也就是类别概率和条件概率。他们都可以从给出的训练数据中计算出来。一旦计算出来,概率模型就可以使用贝叶斯原理对新数据进行预测。

具体而言,S3的具体操作为:

把步骤2所得的特征矩阵分为训练集和测试集,然后把训练集放进分类模型中进行训练,如图2所示,然后再把测试集放入已经训练好的分类模型中测试,得到一个预测类别,如图3所示,然后再和真实的类别相比较,得到预测精度。关于预测方法,我们主要使用留一法,即是从66个样本中随机挑选一个为测试集,其余皆为训练集,重复66次,再计算其误差值。

S4:将待测阻塞性睡眠呼吸暂停症患者的语音原始文件输入S3中训练并测试好的朴素贝叶斯分类模型进行分类。

本实施例在于基于OSA患者频谱图中高频能量的发现,研发了新的特征,能够帮助我们将OSA严重程度分类出来,也能让分类的效果更加精确,也能让这件技术更快的融入使用。在该发明中,我们在传统特征矩阵的基础上加上了新特征-高频能量系数,与传统特征矩阵比较。然后基于主成分分析(PCA)的序列前向特征选择被用作特征选择。我们使用66位OSA患者的语音信号进行的模拟,使用朴素贝叶斯分类器提出的功能集可达到84.85%的准确性,比不加高频能量系数的传统语音特征矩阵要高约10%。

附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制;

显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号