首页> 中国专利> 使用心率预测排卵期和月经期的装置、方法及生物标志物

使用心率预测排卵期和月经期的装置、方法及生物标志物

摘要

本发明涉及一种使用心率预测排卵期和月经期的装置,数据获取模块收集受试者的连续心率数据;数据预处理模块从连续心率数据确定夜间静息态数据,将夜间静息态数据求平均作为日均心率;标志物提取模块将日均心率导数曲线的峰点相位作为评估受试者进入排卵期的第一生物标志物和/或将日均心率导数曲线的谷点相位作为评估受试者进入月经期的第二生物标志物;评估模块基于第一生物标志物评估受试者进入排卵期的可能性指标;和/或基于第二生物标志物评估受试者进入月经期的可能性指标。本发明仅使用心率数据作为特征提取的输入,不需要另外收集其他生理参数作为特征,具有无创、便捷、可长时间持续测量的优点。

著录项

  • 公开/公告号CN114678119A

    专利类型发明专利

  • 公开/公告日2022-06-28

    原文格式PDF

  • 申请/专利权人 苏州大学;

    申请/专利号CN202210225146.0

  • 发明设计人 杨凌;徐璎;王瑶;董莺莺;周飞;

    申请日2022-03-07

  • 分类号G16H50/20;G16H50/70;A61B10/00;

  • 代理机构苏州市中南伟业知识产权代理事务所(普通合伙);

  • 代理人李柏柏

  • 地址 215000 江苏省苏州市吴中区石湖西路188号

  • 入库时间 2023-06-19 15:47:50

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2022-06-28

    公开

    发明专利申请公布

说明书

技术领域

本发明涉及女性生理卫生技术领域,尤其是指一种使用心率预测排卵期和月经期的装置、方法及生物标志物。

背景技术

女性的月经期和排卵期的预测对于育龄女性的避孕或者备孕具有重要意义,人们对确定排卵天数和月经开始日期的方法的发展给予了相当大的关注。目前已经有很多方法用于检测或预测女性的月经期和排卵,例如超声波检查法、尿黄体生成素、血清孕酮、尿孕二醇3-葡糖苷酸、基础体温、宫颈粘液等方法。

通过超声检查可以观察到优势卵泡的最大生长和随后大小的减小,从而可以确定介于这两者之间的排卵时间。因为这个时间可以这样明确定义,所以被公认为排卵检测的标准参考检查,主要用于人工生殖技术。尿黄体生成素(LH)的检测,无论是在血清还是在尿液中,都对排卵非常敏感和特异性,并为确定受孕能力提供了很高的准确性。在黄体生成素激增之前,血清雌激素水平升高,体液成分出现一些变化,包括宫颈粘液和唾液,观察这些差异可以更好地了解生育窗口。孕酮仅在排卵后由黄体分泌,检测孕酮或其代谢物可以回顾性地证实排卵的发生。因为孕酮会引起基础体温(BBT)的升高,测量基础体温对确定排卵也很有用。由于卵母细胞在排卵后不久死亡,与孕激素及其作用相关的方法确定了生育窗口关闭。但是这些方法的执行过程或者无法持续测量、或者不是无创的、或者受试者无法自行操作完成。因此开发一种新的生物标志物检测或预测月经期和排卵期的系统极其重要。

可穿戴式传感器技术正在迅速发展。这些设备主要提供洞察用户的身体活动的信息,越来越多地用于医疗保健机构,近年来,有很多学者开始使用可穿戴设备测得的数据研究人的生理节律。例如Lan Luo等提出了一种无创的可穿戴生育监测设备,每隔一段时间测量耳道温度,并提出了具有高温和低温两种隐藏状态的隐马尔可夫模型(HMM)来识别更大的排卵概率的统计学习算法,利用该设备捕获的数据检测和预测排卵。Mohaned Sh i l ai h等研究了可穿戴传感器测量的手腕皮肤温度(WST)与排卵期尿液测试的相关性,并以此作为一种生育跟踪方法。但是上述的体温监测中,无论是手腕温度还是耳道温度,其受外部温度变化的影响比较大,会影响体温监测的准确率,从而直接影响预测结果的准确性。

发明内容

为此,本发明所要解决的技术问题在于克服现有技术存在的问题,提出一种使用心率预测排卵期和月经期的装置、方法及生物标志物,本发明仅使用心率数据作为特征提取的输入,不需要另外收集其他生理参数作为特征,具有无创、便捷、可长时间持续测量的优点。

为解决上述技术问题,本发明提供一种使用心率预测排卵期和月经期的装置,包括:

数据获取模块,所述数据获取模块用于使用能够收集连续心率的设备收集受试者的连续心率数据;

数据预处理模块,所述数据预处理模块用于将受试者的连续心率数据按天分割确定夜间静息态时间段,得到夜间静息态数据,去除夜间静息态数据中干扰因素造成的波动的峰,并将夜间静息态数据求平均作为日均心率;

标志物提取模块,所述标志物提取模块用于获取日均心率导数曲线的峰点相位和日均心率导数曲线的谷点相位,将日均心率导数曲线的峰点相位作为评估受试者进入排卵期的第一生物标志物,和/或将日均心率导数曲线的谷点相位作为评估受试者进入月经期的第二生物标志物;

评估模块,所述评估模块用于基于第一生物标志物评估受试者进入排卵期的可能性指标;和/或基于第二生物标志物评估受试者进入月经期的可能性指标。

在本发明的一个实施例中,该装置为可操作地附接到计算设备的输入设备和可穿戴设备中的至少一种。

在本发明的一个实施例中,所述可穿戴设备为带心率模块能够收集连续心率的可穿戴设备。

在本发明的一个实施例中,所述标志物提取模块包括:

滤波子模块,所述滤波子模块用于对所述日均心率进行滤波处理,得到滤波后的日均心率曲线;

求导子模块,所述求导子模块用于对日均心率曲线进行求导,计算导数曲线上所有的峰点相位,和/或计算导数曲线上所有的谷点相位。

在本发明的一个实施例中,所述评估模块包括:

预测子模块,所述预测子模块用于基于日均心率导数曲线的峰点相位,结合日均心率曲线导数和二阶导数作为特征数据,使用以前的特征数据和机器学习方法训练得到模型,利用训练好的模型以当前特征为输入可输出下一天受试者进入排卵期的可能性指标;和/或基于日均心率导数曲线的谷点相位,结合当前及以前的日均心率曲线导数和二阶导数作为特征数据,使用以前的特征数据和机器学习方法训练得到模型,利用训练好的模型以当前特征为输入可输出下一天受试者进入月经期的可能性指标。

此外,本发明还提供一种使用心率预测排卵期和月经期的方法,包括:

使用能够收集连续心率的设备收集受试者的连续心率数据;

将受试者的连续心率数据按天分割确定夜间静息态时间段,得到夜间静息态数据,去除夜间静息态数据中干扰因素造成的波动的峰,并将夜间静息态数据求平均作为日均心率;

获取日均心率导数曲线的峰点相位和日均心率导数曲线的谷点相位,将日均心率导数曲线的峰点相位作为评估受试者进入排卵期的第一生物标志物,和/或将日均心率导数曲线的谷点相位作为评估受试者进入月经期的第二生物标志物;

基于第一生物标志物评估受试者进入排卵期的可能性指标;和/或基于第二生物标志物评估受试者进入月经期的可能性指标。

在本发明的一个实施例中,获取日均心率导数曲线的峰点相位和日均心率导数曲线的谷点相位的方法包括:

对所述日均心率进行滤波处理,得到滤波后的日均心率曲线;

对日均心率曲线进行求导,计算导数曲线上所有的峰点相位,和/或计算导数曲线上所有的谷点相位。

在本发明的一个实施例中,基于第一生物标志物评估受试者进入排卵期的可能性指标;和/或基于第二生物标志物评估受试者进入月经期的可能性指标,包括:

基于日均心率导数曲线的峰点相位,结合日均心率曲线导数和二阶导数作为特征数据,使用以前的特征数据和机器学习方法训练得到模型,利用训练好的模型以当前特征为输入可输出下一天受试者进入排卵期的可能性指标;和/或基于日均心率导数曲线的谷点相位,结合当前及以前的日均心率曲线导数和二阶导数作为特征数据,使用以前的特征数据和机器学习方法训练得到模型,利用训练好的模型以当前特征为输入可输出下一天受试者进入月经期的可能性指标。

并且,本发明还提供一种用于预测排卵期和月经期的生物标志物,该生物标志物应用在如上述所述的使用心率预测排卵期和月经期的装置中,所述生物标志物包括将日均心率导数曲线的峰点相位作为评估受试者进入排卵期的第一生物标志物,和/或将日均心率导数曲线的谷点相位作为评估受试者进入月经期的第二生物标志物。

还有,本发明还提供一种如上述所述的生物标志物在制备用于评估受试者进入排卵期和月经期的可能性指标的装置中的用途,包括第一生物标志物在制备用于评估受试者进入排卵期可能性指标的装置中的用途,和/或第二生物标志物在制备用于评估受试者进入月经期可能性指标的装置中的用途。

本发明的上述技术方案相比现有技术具有以下优点:

1、本发明仅使用心率数据作为特征提取的输入,不需要另外收集其他生理参数作为特征,使得在数据收集过程中具有无创、便捷、可长时间持续测量的优点。

2、本发明将月经期预测的生物标志物和排卵期预测的生物标志物显著区分,可有效提高预测的准确率。

3、本发明将生物标志物作为检测或预测月经期和排卵期的重要指标,该生物标志物的公开对生育窗口的预测具有重要意义。

附图说明

为了使本发明的内容更容易被清楚的理解,下面根据本发明的具体实施例并结合附图,对本发明作进一步详细的说明。

图1为本发明一种使用心率预测排卵期和月经期的方法的流程示意图。

图2为心率数据,其中a-b表示原始分钟级心率;c表示提取自夜间静息心率的日均心率。

图3为标志物提取方法的流程图。

图4为心率分析结果示意图,细线条表示原始心率曲线;连续粗线条表示滤波后的曲线;虚线表示全局cos拟合得到的曲线;黑色六角星表示全局拟合曲线最低点;×表示局部谷点;*表示局部峰点;两侧加粗线段表示入睡和醒来时的心率曲线,日均心率取入睡和醒来之间的心率的均值。

图5为生物标志物数据切分流程图。

图6为日均心率滤波结果,图中折线为日均心率,曲线为滤波结果。

图7为日均心率曲线求导结果,图中星号为真实排卵标记,五角星号为真实的月经首日标记。

图8为真实的平均相位后的排卵标记在统一周期长度的日均心率曲线导数的峰点位置,其中细线表示统一长度的心率导数,阴影表示导数±标准差,圆点表示平均相位的排卵日,粗线表示排卵日±标准差。

图9为真实的平均相位后的月经首日标记在统一周期长度的日均心率曲线导数的谷点位置,其中细线表示统一长度的心率导数,阴影表示导数±标准差,圆点表示平均相位的月经首日,粗线表示月经首日±标准差。

图10为预测流程图。

图11为一名受试者的排卵预测结果,a.阴影表示真实排卵日及前后各两天,点表示预测结果,点的值为1表示不排卵,点的值为2表示预测为排卵期;b.横线为阈值k,曲线表示模型预测排卵得到的可能性指标的值,阴影表示同图a。

图12为一名受试者的月经预测结果。a.阴影表示真实月经首日及前后各两天,点表示预测结果,点的值为1表示不是月经,点的值为2表示预测为月经期;b.横线为阈值k,曲线表示模型预测月经得到的可能性指标的值,阴影表示同图a。

具体实施方式

下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以更好地理解本发明并能予以实施,但所举实施例不作为对本发明的限定。

本申请中,单数形式“一种”、“该”包括复数对象,除非上下文另外清楚规定。

如本文所用,术语“受试者”优选的是人类未绝经女性,且受试者存在月经周期节律。

如本文所用,术语“静息态数据”也称为“夜间静息态数据”,是指通过校准时间、数据划分和滤波后,并除去了睡眠周期、起夜活动等干扰数据之后获得的夜间睡眠期间时间段的心率数据。术语“夜间静息态时间段”是指通过校准时间、数据划分和滤波后获得的夜间睡眠状态的时间段。本发明中所述的夜间静息态数据是经过了数据预处理后的数据。

如本文所述,术语“夜间静息心率导数的峰点的相位”是指夜间静息态心率预处理之后并进行滤波和求导,再计算的极大值点处的时间;术语“夜间静息心率导数的谷点的相位”是指夜间静息态心率预处理之后并进行滤波和求导,再计算的极小值点处的时间。

如本文所用,术语“可穿戴设备”是指直接穿戴在用户身上带心率模块能够收集连续心率的一种便携式设备。可穿戴设备可以是一种硬件设备,所述设备可通过软件支持以达到数据交互、云端交互或数据分析的目的。

下述实施例中的实验方法,如无特殊说明,均为常规方法。将参照下述非限制性实验实施例进一步理解本发明。

本发明提供一种使用心率预测排卵期和月经期的装置,包括:

数据获取模块,所述数据获取模块用于使用能够收集连续心率的设备收集受试者的连续心率数据;

数据预处理模块,所述数据预处理模块用于将受试者的连续心率数据按天分割确定夜间静息态时间段,得到夜间静息态数据,去除夜间静息态数据中干扰因素造成的波动的峰,并将夜间静息态数据求平均作为日均心率;

标志物提取模块,所述标志物提取模块用于获取日均心率导数曲线的峰点相位和日均心率导数曲线的谷点相位,将日均心率导数曲线的峰点相位作为评估受试者进入排卵期的第一生物标志物,和/或将日均心率导数曲线的谷点相位作为评估受试者进入月经期的第二生物标志物;

评估模块,所述评估模块用于基于第一生物标志物评估受试者进入排卵期的可能性指标;和/或基于第二生物标志物评估受试者进入月经期的可能性指标。

本发明仅使用心率数据作为特征提取的输入,不需要另外收集其他生理参数作为特征,使得在数据收集过程中具有无创、便捷、可长时间持续测量的优点。

在本发明的一个实施例中,该装置为可操作地附接到计算设备的输入设备和可穿戴设备中的至少一种。

在本发明的一个实施例中,所述可穿戴设备为带心率模块能够收集连续心率的可穿戴设备。

在本发明的一个实施例中,所述标志物提取模块包括:

滤波子模块,所述滤波子模块用于对所述日均心率进行滤波处理,得到滤波后的日均心率曲线;

求导子模块,所述求导子模块用于对日均心率曲线进行求导,计算导数曲线上所有的峰点相位,和/或计算导数曲线上所有的谷点相位。

在本发明的一个实施例中,所述评估模块包括:

预测子模块,所述预测子模块用于基于日均心率导数曲线的峰点相位,结合日均心率曲线导数和二阶导数作为特征数据,使用以前的特征数据和机器学习方法训练得到模型,利用训练好的模型以当前特征为输入可输出下一天受试者进入排卵期的可能性指标;和/或基于日均心率导数曲线的谷点相位,结合当前及以前的日均心率曲线导数和二阶导数作为特征数据,使用以前的特征数据和机器学习方法训练得到模型,利用训练好的模型以当前特征为输入可输出下一天受试者进入月经期的可能性指标。

相应于上述装置的实施例,请参阅图1所示,本发明还提供一种使用心率预测排卵期和月经期的方法,包括:

S11:使用能够收集连续心率的设备收集受试者的连续心率数据;

S12:将受试者的连续心率数据按天分割确定夜间静息态时间段,得到夜间静息态数据,去除夜间静息态数据中干扰因素造成的波动的峰,并将夜间静息态数据求平均作为日均心率;

S13:获取日均心率导数曲线的峰点相位和日均心率导数曲线的谷点相位,将日均心率导数曲线的峰点相位作为评估受试者进入排卵期的第一生物标志物,和/或将日均心率导数曲线的谷点相位作为评估受试者进入月经期的第二生物标志物;

S14:基于第一生物标志物评估受试者进入排卵期的可能性指标;和/或基于第二生物标志物评估受试者进入月经期的可能性指标。

具体地,在步骤S11中,使用能够收集连续心率的设备诸如带心率模块的可穿戴设备收集受试者的连续心率数据,其中心率数据密度常规为每分钟1个数据点,选取每天的夜间静息态部分做均值生成每天1个点的日均心率。

具体地,在步骤S13中,选取合适的滤波参数,使用巴特沃兹滤波器(ButterworthFilter)对所述日均心率进行滤波处理,滤波曲线呈现明显的月节律;对日均心率曲线进行求导,计算导数曲线上所有的峰点(和/或谷点)相位,即曲线的极大值(和/或极小值)点,进而可以用峰点相位(和/或谷点相位)检测排卵期(和/或月经期)。

具体地,在步骤S14中,基于日均心率导数曲线的峰点相位,结合日均心率曲线导数和二阶导数作为特征数据,使用以前的特征数据和机器学习方法训练得到模型,利用训练好的模型以当前特征为输入可输出下一天受试者进入排卵期的可能性指标;和/或基于日均心率导数曲线的谷点相位,结合当前及以前的日均心率曲线导数和二阶导数作为特征数据,使用以前的特征数据和机器学习方法训练得到模型,利用训练好的模型以当前特征为输入可输出下一天受试者进入月经期的可能性指标。

作为示例地,若输出的可能性指标为probability1=model_kde1(x),x∈R

相应于上述装置的实施例,本发明还提供一种用于预测排卵期和月经期的生物标志物,该生物标志物应用在如上述所述的使用心率预测排卵期和月经期的装置中,所述生物标志物包括将日均心率导数曲线的峰点相位作为评估受试者进入排卵期的第一生物标志物,和/或将日均心率导数曲线的谷点相位作为评估受试者进入月经期的第二生物标志物。

相应于上述生物标志物的实施例,本发明还提供一种如上述所述的生物标志物在制备用于评估受试者进入排卵期和月经期的可能性指标的装置中的用途,包括第一生物标志物在制备用于评估受试者进入排卵期可能性指标的装置中的用途,和/或第二生物标志物在制备用于评估受试者进入月经期可能性指标的装置中的用途。

下面通过具体实施方式及实验数据对本发明作进一步的说明。

实施例1心率数据分析处理

本发明中分析方法使用的是连续记录的心率数据,可以来源于带心率模块的可穿戴设备,心率数据密度常规为每分钟1个数据点,见图2a和图2b。

具体的一共招募了91名未绝经女性志愿者,志愿者需佩戴智能手环至少一个月进行数据采集,同时志愿者每个月记录月经时间,共记录月经周期603个,其中27名志愿者通过试纸测量记录排卵日期。可穿戴设备从两家独立供应商处购买。智能腕带采集的1分钟频率的心率HR数据在用户授权后通过应用程序接口从厂商云服务器上检索,并存储在本地数据库中。

由于白天心率数据受运动、工作强度、社交等多种主观因素及外部因素影响,不能客观反映个体当天的生物节律,因此选取夜间静息态的心率数据作为获取节律参数的数据来源。经过预处理去除了夜间静息态数据中睡眠周期、起夜活动等干扰之后使用三角函数拟合获取核心全局参数。此外,还使用巴特沃兹滤波器(Butterworth Filter)滤波获取了夜间静息态数据中小的峰谷参数。总体流程示意图参见图3,具体包含以下步骤:

1)获取静息态数据时间段:

1-1)校准时间

时间数据是后续处理的基准,考虑到不同软件对时间数据存储的特殊性与差异性,在工作开始之前需对初始时间进行校准。

1-2)数据划分

以每天14点为分割点,以天为单位,对时间序列数据进行划分。同时,对残缺数据进行筛选。

1-3)滤波

将每天的心率数据做成曲线图,该曲线是由宏观的生物钟曲线和许多细小的噪声(抖动)叠加形成,即分别由低频成分与高频成分组成。其中低频成分对应的曲线变化缓慢,高频成分对应的曲线变化剧烈。

为了研究睡眠阶段的生物钟曲线,需要过滤掉高频噪声,故使用低频滤波器过滤或者大幅度衰减曲线的高频成分,让低频成分通过。此处使用Butterworth低通滤波器,得到滤波后的数据。

1-4)获取睡眠数据(静息态)

a.利用滤波后的数据smooth_f i lter,计算全天的心率均值B_mean以及全天的心率中位数B_prct i l e,取两者最小值作为临界值B_i nf。

b.求睡眠数据起始点:取长度i nterva l(1)=240(单位:分钟),计算时间区间[1:i nterva l(1)]内,有多少点对应的心率小于B_i nf,即位于B_i nf下方的点的个数,记为count_poi nt。

c.若count_poi nt=0,时间区间向右滑动i nterva l(1),对新的时间区间做类似b的操作。

若0

若count_poi nt=i nterva l(1),将对应时间区间的左端点标记为睡眠数据起始点,循环结束。

d.求睡眠数据终止点:

原理与a相同,改为从右向左判断。

e.若count_poi nt=0,时间区间向左滑动i nterva l(1),对新的时间区间重复d的操作。

若0

若count_poi nt=i nterva l(1),将对应时间区间的右端点标记为睡眠数据终止点,循环结束。

针对夜间睡眠时间过短的情况,上述方法可能未能有效获取所需数据,此时,将区间长度由i nterva l(1)=240改为i nterva l(2)=120(单位:分钟),重复相关步骤。

f.为了获取更完善的睡眠数据,考虑对两端略微进行延伸。

对于左端(起始端),若有延伸余量,则考虑将起始点向左移动cont i nue_l en=60(单位:分钟)。若出现溢出,即此时起点超出实际记录范围,则取0<=移动量

对于延伸的这段数据,做一阶差分。定义上升数为差分数据中大于零的个数,定义下降数为差分数据中小于零的个数。计算上升数与下降数,若下降数>=2倍的上升数,则认为有必要进行延伸,更改起始点坐标,否则无需延伸,即不必修改坐标。

g.对于右端(终止端),若有延伸余量,则考虑将终止点向右移动cont i nue_l en=60(单位:分钟)。若出现溢出,即此时终点超出实际记录范围,则取0<=移动量

对于延伸的这段数据,做一阶差分,按前述定义计算上升数与下降数,若上升数>=2倍的下降数,则认为有必要进行延伸,更改起始点坐标,否则无需延伸,即不必修改坐标。

h.根据由f和g确定的坐标,切分出睡眠数据。

2)在静息态时间段内,去除波动的峰(被认为是睡眠周期、起夜活动等干扰因素)进而获得经过预处理后的夜间静息态数据:

对获取的睡眠数据,因为整个睡眠阶段会包含许多小的睡眠周期,反映在心率曲线上就是许多小的波动,为获得宏观的睡眠静息态数据,使用滑动窗口对数据进行遍历比较,定义出局部波峰波谷的起点/终点并进行删除。

3)将预处理后的夜间静息态数据取均值得到日均心率,得到一天一个点的日均心率数据:

将睡眠数据三等分,记为左、中、右三部分。

利用左段数据求进入睡眠状态时的斜率值。取长度i nterva l(3)=50的时间区间,定义统计量“下降得分”,用以判断此时所选的时间区间的质量(即用该区间求斜率的效果)。定义:对区间数据做一阶差分,计算下降数(差分数据中小于零的个数),下降量(差分数据中小于零的值求和然后取绝对值),再以0.3,0.7为权重将两者求和,称为区间的下降得分。遍历左段,寻找得分最高的区间段,寻找此区间左半段的最大值max_i nfo及其所在位置max_p l ace,寻找右半段的最小值mi n_i nfo及其所在位置。进入睡眠状态的斜率为该时间段内每分钟心率下降的数量(取负)。下降结束时间为入睡时间段最后一个时刻对应的时间,下降结束心率为下降结束时间对应的心率。

利用右段数据求醒来阶段的斜率值。取长度i nterva l(3)=50的时间区间,定义“上升得分”,用以判断此时所选的时间区间的质量(即用该区间求斜率的效果)。定义:对区间数据做一阶差分,计算上升数(差分数据中大于零的个数),上升量(差分数据中大于零的值求和),再将两者以0.3,0.7为权重求和,称为区间的上升得分。遍历右段,寻找得分最高的区间段。寻找此区间左半段的最小值mi n_i nfo及其所在位置mi n_p l ace,寻找右半段的最大值max_i nfo及其所在位置max_p l ace。醒来阶段的斜率值为该时间段内每分钟心率上升的数量。上升开始时间为醒来时间段第一个时刻对应的时间,上升开始心率为上升开始时间对应的心率。

日均心率为入睡时间段最后一个时刻到醒来时间段第一个时刻之间的夜间静息心率的均值,见图4,日均心率见图2c。

实施例2生物标志物分析结果确定

为证明夜间静息心率导数的峰点相位可以作为排卵的生物标志物,夜间静息心率导数的谷点相位可以作为月经的生物标志物,发明人使用从志愿者处收集的排卵记录和与排卵记录同时段的心率数据处理得到的生物标记物进行了比对,分析步骤和结果如下:

1)数据获取:

生物标志物提取基于夜间静息态心率,1天1个数据点的时间序列,如实施例1,夜间静息心率是指从分钟级心率数据中取夜间睡眠部分,将夜间睡眠部分的分钟级数据取均值生成的日均心率。

2)数据预处理:

2-1)由于未及时上传、志愿者未连续佩戴手环等多种原因,心率数据存在一些缺失值,对残缺数据进行筛选。

2-2)对连续缺失小于五天的缺失值进行线性插值补充,缺失值补充方式不限于线性插值方法,若所使用滤波器支持含缺失值数据可不补充缺失值。

3)数据滤波:

将经过预处理的心率数据画成曲线,该曲线包含宏观的生物钟和许多上下抖动的高频噪声,即分别由低频成分与高频成分组成。其中低频成分对应的曲线变化缓慢,高频成分对应的曲线变化剧烈。为了研究月节律,需要过滤掉高频噪声,故使用低频滤波器过滤或者大幅度衰减曲线的高频成分,让低频成分通过。此处使用Butterworth低通滤波器,得到滤波后的数据,见图6,滤波后的数据呈现出明显的月节律。

4)求导:

对滤波后的心率进行求导,见图7。

5)标记月经和排卵:

将志愿者记录的月经和排卵按照对应日期标记在心率滤波数据和导数数据上,其中月经在心率曲线上的标记是指月经第一天。

6)排卵日与排卵的生物标志物对比:

6-1)数据切分

首先将心率的导数标准化为-1到1之间,将标准化后的心率的导数曲线从谷点处切分,使每两个谷点之间成一段,代表一个生理周期,切分流程图见图5;

6-2)统一周期长度

由于不同志愿者的月经周期长度不一样,同一个志愿者的不同时间段的月经周期长度也不完全一样,为了更好地比较不同志愿者的所有月经周期,需将所有切分好的周期统一到28天。如果周期长度为L,就将周期中每两点间的距离乘28/L,周期长度即变成28天。每个周期中标记的排卵在周期中的相对位置不变,即,若排卵在一个切分好的月经周期中处于中心位置,在拉伸后的28天周期中也处于中心位置。

6-3)周期平均

将所有切分且统一长度的周期在0到28之间使用同一数列为时间进行插值,使所有周期长度为28天且在相同的时间点上均有数值,共n个周期,第i个周期记为ai。

经如上处理之后,将所有周期进行平均

7)月经首日与月经的生物标志物对比:

7-1)数据切分

首先将心率的导数标准化为-1到1之间,将标准化后的心率的导数曲线从峰点处切分,使每两个峰点之间成一段,代表一个生理周期,共切分为m个周期,切分流程图见图5;

7-2)统一周期长度

由于不同志愿者的月经周期长度不一样,同一个志愿者的不同时间段的月经周期长度也不完全一样,为了更好地比较不同志愿者的所有月经周期,需将所有切分好的周期统一到28天。如果周期长度为L,就将周期中每两点间的距离乘28/L,周期长度即变成28天。每个周期中标记的排卵在周期中的相对位置不变,即,若月经首日在一个切分好的月经周期中处于中心位置,在拉伸后的28天周期中也处于中心位置。

7-3)周期平均

将所有切分且统一长度的周期在0到28之间使用同一数列为时间进行插值,使所有周期长度为28天且在相同的时间点上均有数值,共m个周期,第i个周期记为bi。

经如上处理之后,将所有周期进行平均

实施例3使用排卵的标志物预测排卵

预测流程图见图10。在排卵预测中使用27名参与排卵监测的志愿者数据,利用黄体生成素排卵试纸在月经周期第8天开始检测直至获得阳性结果,共计监测86个周期,获得78个阳性排卵结果,为了确保预测的准确性,后续的数据处理中,要求参与预测或者训练的心率数据前面必须有大于一个月的数据以便于数据预处理,所以部分志愿者的第一个阳性检测结果未包含在训练数据集或者预测数据集中,最终参与训练和预测的排卵周期一共60个。其中一名受试者在不同时段使用了两种可穿戴设备,所以数据共分28组,编号1-28号。

根据日均心率曲线导数的峰点相位作为重要特征,训练受试者前n天的心率数据,实现对第n+1天是否排卵进行预测:步骤和结果如下:

1)数据获取:

生物标志物提取基于夜间静息态心率,1天1个数据点的时间序列,如实施例1,夜间静息心率是指从分钟级心率数据中取夜间睡眠部分,将夜间睡眠部分的分钟级数据取均值生成的日均心率。

2)数据预处理:

2-1)由于未及时上传、志愿者未连续佩戴手环等多种原因,心率数据存在一些缺失值,对残缺数据进行筛选。

2-2)对连续缺失小于五天的缺失值进行线性插值补充,缺失值补充方式不限于线性插值方法,若所使用滤波器支持含缺失值数据可不补充缺失值。

2-3)对以上数据直接滤波再取当前日的数值,会出现数据波动严重的问题,因此在滤波之前,数据先进行初步光滑处理:即用当前日往前五天加上当前日一共六天的心率平均值替代当前日的心率。

3)数据滤波:

使用低频滤波器过滤或者大幅度衰减曲线的高频成分,让低频成分通过。此处使用Butterworth低通滤波器,得到滤波后的数据。

4)求导

对滤波后的心率进行求导。排卵日处于导数的峰上的概率较大,由于我们的目标是预测下一天的状态,已知的是当前天及以前的数据,下一天的数据未知,所以我们使用向前求导公式如下:

其中f(x2)表示当前天的滤波心率,f(x

5)最小二乘拟合

在数据进行求导之后,取包括当前天在内的前面30天做最小二乘拟合,函数形式为b0+b1·cos(2π·b2·x+b3),初始值b0取这30天的心率数据的平均值,b1=1,b2=1/30,b3=0,如果当前日前面有大于45天的数据,则用前面45天的数据来拟合。由于前面做了初步光滑的处理,用多天平均的结果代替当前日数据,使得排卵不在导数曲线的峰上,而是向左偏移,这样预测出来的结果也会偏离真实排卵的范围。因此,我们进一步对这种偏离进行了弥补。用当前天往前30天拟合出的周期曲线取值的时候向右多取7天的值,再将这条曲线与导数曲线的最后一天对齐。拟合曲线r的峰处正好是排卵区域,因此,将r曲线的最后一个点组成的曲线(逐天拟合曲线)作为当前目的一个特征(称为特征f1),代替心率的导数,r曲线的导数的最后一个点组成的曲线(逐天拟合导数曲线)是当前日的第二个特征(称为特征f2),代替心率的二阶导数。在函数拟合过程中,通过设定罚函数实现对函数的待定参数进行限制的目的,从而使得每次拟合的函数不会发生非常剧烈的抖动,以达到比逐天导数更加光滑的效果。

6)模型训练与预测:

在日均心率导数曲线上,用当前日到前一个谷点的距离d作为当前日在周期上的相位,若当前日为峰点,则当前日到前一个谷点的距离表示日均心率曲线导数上的峰点相位。

从连续两个周期以上的1~12号志愿者和只有一个排卵周期的13~28号志愿者中,分别取最后4名志愿者为测试集(9、10、11、12、25、26、27、28),所有数据一共有60个周期,测试集占22个周期,其他20名志愿者的38个周期数据作为训练集。经过上述一系列数据预处理之后,时间每推进一天,便将此过程重新进行一遍,并将计算的d、f1、f2作为当前日的特征,将所有数据逐天处理之后得到n×3的矩阵,表示一共n天的特征。将如上所示的f1、f2、d在所有真实标记排卵日的前后五天的值作为特征,采用KDE方法得到d、f1、f2三个特征的概率密度模型model_kde,这是一个通用于不同志愿者的公共模型。

7)评估模块:

若输出的可能性指标为probability1=model_kde1(x),x∈R

实施例4使用月经的标志物预测月经期

在月经预测中同样采用上述1-28号受试者的数据,预测流程图见图10。

根据日均心率曲线导数的谷点相位作为重要特征,训练受试者前n天的心率数据,实现对第n+1天是否为月经首日进行预测:步骤和结果如下:

1)数据获取:

生物标志物提取基于夜间静息态心率,1天1个数据点的时间序列,如实施例1,夜间静息心率是指从分钟级心率数据中取夜间睡眠部分,将夜间睡眠部分的分钟级数据取均值生成的日均心率。

2)数据预处理:

2-1)由于未及时上传、志愿者未连续佩戴手环等多种原因,心率数据存在一些缺失值,对残缺数据进行筛选。

2-2)对连续缺失小于五天的缺失值进行线性插值补充,缺失值补充方式不限于线性插值方法,若所使用滤波器支持含缺失值数据可不补充缺失值。

2-3)对以上数据直接滤波再取当前日的数值,会出现数据波动严重的问题,因此在滤波之前,数据先进行初步光滑处理:即用当前日往前五天加上当前日一共六天的心率平均值替代当前日的心率。

3)数据滤波:

使用低频滤波器过滤或者大幅度衰减曲线的高频成分,让低频成分通过。此处使用Butterworth低通滤波器,得到滤波后的数据。

4)求导:

对滤波后的心率进行求导。排卵日处于导数的峰上的概率较大,由于我们的目标是预测下一天的状态,已知的是当前天及以前的数据,下一天的数据未知,所以我们使用向前求导公式如下:

其中f(x2)表示当前天的滤波心率,f(x0)和f(x1)代表当前天前面两天的心率。要判断导数曲线的峰或谷,即首先要寻找二阶导数为零的范围,所以二阶导数也是一个非常重要的特征。

5)最小二乘拟合:

在数据进行求导之后,取包括当前天在内的前面30天做最小二乘拟合,函数形式为b0+b1·cos(2π·b2·x+b3),初始值b0取这30天的心率数据的平均值,b1=1,b2=1/30,b3=0,如果当前日前面有大于45天的数据,则用前面45天的数据来拟合。由于前面做了初步光滑的处理,用多天平均的结果代替当前日数据,使得排卵不在导数曲线的峰上,而是向左偏移,这样预测出来的结果也会偏离真实月经的范围。因此,我们进一步对这种偏离进行了弥补。用当前天往前30天拟合出的周期曲线取值的时候向右多取7天的值,再将这条曲线与导数曲线的最后一天对齐,拟合r曲线。拟合曲线r的谷处正好是月经区域,因此,将r曲线的最后一个点组成的曲线(逐天拟合曲线)作为当前日的一个特征(称为特征f1),代替心率的导数,r曲线的导数的最后一个点组成的曲线(逐天拟合导数曲线)是当前日的第二个特征(称为特征f2),代替心率的二阶导数。在函数拟合过程中,通过设定罚函数实现对函数的待定参数进行限制的目的,从而使得每次拟合的函数不会发生非常剧烈的抖动,以达到比逐天导数更加光滑的效果。

6)模型训练与预测

在日均心率导数曲线上,用当前日到前一个峰点的距离d作为当前日在周期上的相位,若当前日为谷点,则当前日到前一个峰点的距离表示日均心率曲线导数上的谷点相位。

从连续两个周期以上的1~12号志愿者和只有一个排卵周期的13~28号志愿者中,分别取最后4名志愿者为测试集(9、10、11、12、25、26、27、28)。经过上述一系列数据预处理之后,时间每推进一天,便将此过程重新进行一遍,并将计算的d、f1、f2作为当前日的特征,将所有数据逐天处理之后得到n×3的矩阵,表示一共n天的特征。将如上所示的f1、f2、d在所有真实月经首日的前后五天的值作为特征,采用KDE方法得到d、f1、f2三个特征的概率密度模型model_kde_m,这是一个通用于不同志愿者的公共模型。

7)评估模块

若输出的可能性指标为probability2=model_kde1(x),x∈R

显然,上述实施例仅仅是为清楚地说明所作的举例,并非对实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式变化或变动。这里无需也无法对所有的实施方式予以穷举。而由此所引申出的显而易见的变化或变动仍处于本发明创造的保护范围之中。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号