首页> 中国专利> 胎儿生长发育异常数据识别方法、系统及可读存储介质

胎儿生长发育异常数据识别方法、系统及可读存储介质

摘要

本发明涉及胎儿生长发育异常数据识别方法、系统及可读存储介质,该方法利用已知数据正常数据建模,通过模型训练来划定一个可以反映地域特殊性的数据相关的超空间界线,然后将新加入数据投入模型中进行对比判断,当监测到某异常数据值与参考数据发生背离,则认为该背离数据点为异常数据点。本发明对历史胎儿生长发育指标相关的超声数据进行综合建模,结合各项其他临床指标,筛选确定有代表性的模型特征,并利用不断更新升级的动态模型以匹配地域的特异性,对新产生数据进行统计分析,从海量的超声数据中筛查异常点,在保证发现异常数据灵敏度和准确性的同时,减少现有评价方式下医生经验性的人工诊断,加强模型使用的适应性。

著录项

  • 公开/公告号CN113314219A

    专利类型发明专利

  • 公开/公告日2021-08-27

    原文格式PDF

  • 申请/专利权人 四川大学华西第二医院;

    申请/专利号CN202110706227.8

  • 申请日2021-06-24

  • 分类号G16H50/20(20180101);G16H50/50(20180101);G06N20/10(20190101);

  • 代理机构51263 成都熠邦鼎立专利代理有限公司;

  • 代理人李晓英

  • 地址 610000 四川省成都市人民南路3段20号

  • 入库时间 2023-06-19 12:21:13

说明书

技术领域

本发明涉及超声数据处理技术领域,尤其涉及胎儿生长发育异常数据识别方法、系统及可读存储介质。

背景技术

近几年,随着生育政策的变化,多胎政策的落地实施,高质量的孕期胎儿生长发育指标数据监测是实施优生优育的保障。胎儿的发育由于受到遗传因素、宫内环境、母体因素和营养保障等多种不确定因素的影响,孕期个别胎儿会出现生长发育指标异常。超声作为重要的孕期监测手段,已广泛地用于孕期胎儿生长发育指标和解剖结构的检查和评估。

随着超声技术的不断发展和产科超声检查人次的迅速增加,超声图像数据量近年来急速增长。加之目前基于超声生长发育指标的评价公式繁多且差异明显,不同医生的经验性判断标准也有一定差异,孕期一些胎儿生长发育指标的客观评估存在困难,正常胎儿和异常胎儿的生长发育指标很难完全通过现有评价方式来评估鉴别。

代表生长发育指标异常胎儿的异常点若不加审核或仔细评估,将极大的影响诊断数据的准确性,从而无法在胎儿发育过程中给出合适的孕期指导,进一步还可能使孕妇及胎儿错过必要的诊治窗口期。这些准确性不够的评估数据对后续的临床研究和政策制定将产生消极的影响。

目前,通常是医生通过对超声图像进行经验性的查看、生长发育指标的手工测量校准、生长发育指标现有评价公式比对、数据人工审核等方法确保数据质量。这样的方法无法全面的考虑胎儿基于父母遗传因素、营养状态等的实际发育情况,并无法根据历史超声数据动态地调整模型。这些胎儿生长发育指标数据甚至可能因当前可用的评价判断方式没有实时更新,其滞后性导致对异常数据判断不够灵敏,而引入更多的误差。

发明内容

本申请为了解决上述技术问题提供胎儿生长发育异常数据识别方法、系统及可读存储介质。

本申请通过下述技术方案实现:

本发明的基本原理是超声孕期诊断数据相关联的且不同地区(医院)产生数据具有各自的特点,胎儿发育随着时间推移呈现出一定的普遍趋势,因此某地区(医院)数据应当具有该地区和该孕期时段的特点,一方面,随着父母的个体差异,评级标准应当相应发生改变;另一方面,胎儿生长发育指标数据具有一定的稳定性,在相似孕期内的超声数据不会发生特别剧烈的变化,故一定时间段的监测数据具有规律性。

基于上述原理,本发明多方面地考虑数据产生地区和历史数据的具体情况,获取现有监测数据,通过现有监测数据建立模型,通过模型训练来划定一个可以反映地域特殊性的数据相关的超空间界线,然后将新加入数据投入模型中进行对比判断,在特征维度上通过界线的数值为正常值,未通过界线的数值判定为异常值。

与现有技术相比,本申请具有以下有益效果:

1,本发明对历史胎儿生长发育指标相关的超声数据进行综合建模,结合各项其他临床指标,筛选确定有代表性的模型特征,并利用不断更新升级的动态模型以匹配地域的特异性,对新产生数据进行统计分析,从海量的超声数据中筛查异常点,在保证发现异常数据灵敏度和准确性的同时,减少现有评价方式下医生经验性的人工诊断,加强模型使用的适应性。

2,本发明利用单分类支持向量机模型算法参考训练数据设定正常数据点范围,规划界线,综合建模,可快速进行胎儿超声数据异常点的检测;本发明对超声监测数据进行单分类支持向量机建模,综合考虑动态数据、父母生理指标及超声数据在空间时间上的变化规律,当发现某个监测数据变化规律超出边界阈值时认为是异常数据,该方法提高了模型可靠性,保证了异常数据发现的准确性。

3,与传统的设置固定阈值或采用移动平均法进行计算的方法对比,本发明所设定的阈值是根据目标孕期所监测超声数据的变化量动态计算而来,且不断地吸收新加入的正常值优化模型,提高边界划定的精度,以达到更好的可靠性,避免模型滞后,以保证数据监测准确性和可靠性。

附图说明

此处所说明的附图用来提供对本申请实施方式的进一步理解,构成本申请的一部分,并不构成对本发明实施方式的限定。

图1是本发明所的流程图;

图2是本发明在第一主成分和第二主成分构成的二维图像上展示模型边界的界定和异常值识别的示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚,下面将结合实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述。显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。

因此,以下对在附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。

需要说明的是,在不冲突的情况下,本发明中的实施方式及实施方式中的特征可以相互组合。需要说明的是,本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。对于装置类实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

本发明的基本原理是超声数据是与胎儿发育相关联的且生长发育指标正常胎儿的超声数据具有相似的特点,因此超声诊断数据具有反映胎儿生长发育指标情况的代表性,一方面,而随着孕期变化等因素,评级标准应当相应发生改变;另一方面,同一阶段数据具有一定的稳定性和相似性,在一定孕期范围内的不同胎儿的超声数据不应产生特别明显的差异。本发明是基于上述原理监测数据,建立动态模型来预判的胎儿生长发育指标异常的情况。

本发明通过软件开发实现该方法,通过现有生长发育指标正常胎儿的超声数据建立模型,通过模型训练来划定一个可以反映生长发育指标正常胎儿应具有的超声数据范围的超空间界线,将新加入数据投入模型中进行对比判断,确定偏离模型划定范围的离群点为异常数据。

如图1所示,本发明公开的胎儿生长发育异常数据识别方法具体包括以下步骤:

S1,初始化建模数据点。获取一段时间内,已知生长发育指标正常胎儿的历史数据T

S2,建立模型,步骤如下:

S2.1,设定参数,主要包括设定核函数k、距离算法d、惩罚参数v、松弛变量ζ、异常点比例r和最小误差tol等单分类支持向量机相关参数等。其中,核函数k确定方法可包括但不限于:线性核函数,多项式核函数,高斯核函数,拉普拉斯核函数、sigmoid核函数、自定义核函数等。

S2.2模型训练,具体如下:

根据所设定参数规划出数据点T

将已知生长发育指标正常的的历史数据T

在模型的训练过程中,训练目的是期望最后的模型对于输入样本而言,在异常点比例满足设定比例r的同时计算结果误差e≤最小误差tol。

步骤2.3,确定正常样本空间及正常-异常边界阈值。将现有正常样本的超声数据及父母身高数据,代入S2.2步骤中优化好的模型,获得所有正常样本的计算输出Y={y

S3,将若干新加入未知胎儿生长发育指标情况的数据点R

S4,判断离群点。判断数据R

S5,动态调整。利用模型边界内的新加入正常值R

其中,所述步骤S2.1至步骤S2.3的具体计算如下:

对于T

f(t)=W

而每个数据点t到特征空间原点的距离可表示为:

需要每个数据点t到原点的距离尽可能大,即:

支持向量机算法的目标就是要最大化这个几何间隔1/||w||。在数学上,最大化该间隔,可以视为最小化||w||,故可构建等价函数如下:

为了确定模型边界,支持向量机为每个样本点引入了一个松弛变量ζ≥0,使得每个样本点在间隔的基础上再加上松弛变量,最终能大于等于设定距离原点的距离即可。故需要训练的目标函数可表示为:

本专利所使用单分类支持向量机中的v类似于二分类支持向量机模型中的惩罚参数,ζ(ζ≥0)为松弛变量,通过迭代找到一个最优的超平面满足上述函数达到最小值,使得所创建的超平面与特征空间中的原点距离最大,并且将原点与样本点分隔开。超平面以上的每个数据点t满足设定比例r个点满足W

步骤S2.1中提及参数的具体计算过程如下:

对于核函数参数k,在上述求解过程中涉及tj,tj映射到特征空间的内积ψ(ti)Tψ(tj)的计算,特征空间可能维度很高,导致直接求解该内积变得越来越困难,因此采用核函数来解决此类问题:

k(ti,tj)=<ψ(ti),ψ(tj))>=ψ(ti)T·ψ(tj)

其中,此步骤对核函数k的求解包括且不限于常见的核函数类型,比如线性核、多项式核、高斯核、拉普拉斯核、Sigmoid核、自定义核等。

对于参数异常点比例r,表示最优模型所对应的超平面上,W

对于参数最小误差tol,指定使算法优化过程停止的最小误差tol,当优化结果的误差e小于该数值时,停止计算。

其中,步骤S3和步骤S5中的空间边界由训练好的模型和松弛变量(对应异常点比例r、惩罚函数v、松弛变量ζ等参数)所设定的宽松程度确定,若新加入数据点未超出空间边界且满足所设定误差值(e≤tol),则标记当前超声数据对应的预判结论为胎儿生长发育指标正常,反之则为胎儿生长发育指标异常。

基于上述胎儿生长发育异常数据识别方法,本发明还公开胎儿生长发育异常数据识别系统,包括:

数据接收模块,用于接收超声数据构成的训练样本;

模型构建模块,用于根据所述训练样本,采用单分类支持向量机学习方法进行学习,获得训练好的单分类支持向量机模型;

输入模块,用于将待识别超声数据输入所述单分类支持向量机模型;

识别模块,利用所述单分类支持向量机模型对输入的待识别超声数据进行判断;

输出模块,用于输出判断结果。

一种设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述胎儿生长发育异常数据识别方法。

一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现胎儿生长发育异常数据识别方法。

基于上述胎儿生长发育异常数据识别方法,本发明公开一具体的实施例,具体如下:

实施例1

本实施例中的数据集采用我国四川省成都市成华区妇幼保健院采集的已知生长发育指标正常胎儿在胎儿中孕期(20-22周)的历史数据信息,利用胎儿的6项超声指标,结合2项父母信息,共计8项特征对胎儿生长发育指标情况进行预测,筛查生长发育指标异常的胎儿样本。其中,6项超声指标分别为:双顶径(Biparietaldiameter,BPD),头围(Headcircumference,HC),腹围(Abdomencircumference,AC),股骨长(Femurlength,FL),胎儿体重(Estimated fetal weight,EFW)和胎儿孕周;选用的2项父母信息为:胎儿父亲身高和母亲身高。本实施例共涉及医院已累积的302例样本。

其中,200例中孕期生长发育指标正常胎儿数据组成训练集,用于单分类支持向量机模型构建及识别边界;100例中孕期生长发育指标正常胎儿数据及2例中孕期生长发育指标异常胎儿,共计102例,正常样本用于测试模型区分效果,异常样本用于测试模型识别异常值的能力。利用单分类支持向量机模型,选择所有特征进行异常值识别,为了便于展示,最终数据被主成分分析后降维成2维,本实施例选择了第一主成分和第二主成分构成的二维图像以展示模型对边界的界定和异常值的识别。

本实施例的主要步骤如下:

步骤S1,初始化建模数据点。获取历史数据作为训练数据及若干新产生数据作为测试数据。

本实施例中,历史数据集有200个数据点(已知中孕期生长发育指标正常胎儿),测试数据集有102个数据点(已知100例正常、2例生长发育指标异常胎儿)。

步骤S2,设定参数。设定核函数k、距离算法d、惩罚参数v、松弛变量ζ、异常点比例r和最小误差tol参数。

本实施例中,核函数k采用径向基函数(高斯核函数);异常点比例r设置为0.5,r的取值范围为(0,1];若训练集中的异常点很少,r可使用较小的数值,使最后优化的边界更为准确。最小误差tol设置为0.001,当优化结果的误差小于该数值时,停止计算。

于本实施例中,其核函数k公式为:

步骤S3,模型训练。根据所设定参数规划出历史数据点在特征空间中形成样本空间;将历史数据投入模型框架,迭代至模型与训练数据间误差e小于设定最小误差tol,确定模型相关参数。

本实施例中,根据以下公式进行迭代计算:

当95%的的数据点满足:

W

步骤S4,确定对应样本空间。重复步骤S3,直到模型满足步骤S3中训练目的,确定对应的样本空间和边界。根据所确定参数规划出历史数据在特征空间中形成样本空间,以及该空间对应的范围数据。

本实施例中,如图2中白色点所示,红色框线为单分类支持向量机的模型计算边界(y=0);圈内数据为计算输出为正值的样本空间(y>0);外层的圈为计算输出为负值的样本空间(y<0),每个圈依次分别代表一倍于最大y值的负值(-y

步骤S5,模型运用。输入新加入的102个测试数据,图2中100个绿色点为超声监测生长发育指标正常胎儿样本点,2个红色点为超声监测生长发育指标异常胎儿样本点。其中79号和73号样本距离红色圈层较远,但尚未达到判断为异常的黄色圈层,根据步骤S4可判定样本异常的“概率较大”。

而临床事实也显示,79号和73号样本胎儿的母亲在临床诊断中存在一定程度的异常情况。79号胎儿孕母被诊断为“亚临床甲减、慢性HBV感染”,73号胎儿孕母被诊断为“地中海贫血”诊断(具体特征水平见图2注释框)。该临床事实与模型预判结论相吻合。

步骤S6,判断离群点。判断测试数据中超出边界阈值点(图2中红色点)为异常值R

在边界阈值中的点(图2中绿色点)为正常值R

最后的输出结果中包含102个测试集样本的预测结果(正常/异常)。若为标签值为“正常”,则判断该样本点为正常数据点(+),若为“异常”,则判断该样本点为异常点(-)。结果如图2所示,其中x轴第一主成分,y轴为第二主成分。

步骤S7,动态调整。利用模型边界内的新加入正常值R

需说明的是,由于本实施例样本量有限,划分单分类支持向量机边界的过程中,确定有效红色框线阈值有一定难度,故在确定模型判断边界时,设定了相对宽松边界阈值(黄色框线),以保证模型预测的结果对临床诊断的参考价值。通过后续实施步骤S7新加入训练集样本动态优化模型,实施步骤S2,S3对模型训练调整,并在实施步骤S4中根据具体情况调整边界阈值,可使模型预测能力和准确性进一步提升。

本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。

另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。

所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

以上所述的具体实施方式,对本申请的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明的具体实施方式而已,并不用于限定本发明的保护范围,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号