首页> 中国专利> 流行病预测方法、计算机装置及计算机可读存储介质

流行病预测方法、计算机装置及计算机可读存储介质

摘要

一种流行病预测方法,所述方法获取流行病监测的时间序列数据;计算所述时间序列数据中每个流行病监测数据对应时间点属于流行季/非流行季转折点的概率,得到一组概率序列;确定所述概率序列中的概率峰值,得到概率峰值序列;对所述概率峰值序列中的概率峰值进行筛选,根据筛选后的概率峰值得到所述时间序列数据的流行季/非流行季转折点;确定每个流行季/非流行季转折点的类型,所述类型包括上升转折点和下降转折点,所述上升转折点为流行病流行季的起始点,所述下降转折点为流行病流行季的终止点。本发明还提供一种计算机装置及可读存储介质。本发明可以实现高效快速的流行病预测。

著录项

  • 公开/公告号CN108630321A

    专利类型发明专利

  • 公开/公告日2018-10-09

    原文格式PDF

  • 申请/专利权人 平安科技(深圳)有限公司;

    申请/专利号CN201810322421.4

  • 发明设计人 阮晓雯;徐亮;肖京;

    申请日2018-04-11

  • 分类号

  • 代理机构深圳市赛恩倍吉知识产权代理有限公司;

  • 代理人杨毅玲

  • 地址 518000 广东省深圳市福田区八卦岭工业区平安大厦六楼

  • 入库时间 2023-06-19 06:44:48

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-02-21

    授权

    授权

  • 2018-11-02

    实质审查的生效 IPC(主分类):G16H50/80 申请日:20180411

    实质审查的生效

  • 2018-10-09

    公开

    公开

说明书

技术领域

本发明涉及疾病预测技术领域,具体涉及一种流行病预测方法、计算机装置和计算机可读存储介质。

背景技术

随着社会和自然环境的变化,流行病的病原体、传播途径、发病特点以及影响因素也发生很大变化,如何能早期识别到流行病突发公共卫生事件,及时发出预警,尽早采取相应的控制措施,将突发公共卫生事件造成的损失降到最低,是公共卫生领域长期以来关注的焦点,也是卫生应急工作的重要内容。突发公共卫生事件预警,是通过对有关数据的收集,整理、分析和整合,运用计算机、网络、通讯等现代先进的技术,对事件的征兆进行监测、识别、诊断与评价,及时报警,告知有关部门和公众做好相关的应对和准备工作,及时采取有效的防控措施,尽可能阻止或减缓突发事件的发生或减少事件的危害。

流行病预警中的一个重要环节是流行病预测。现有的流行病预测大多是根据预测模型计算流行病阈值,将流行病监测数据与流行病阈值进行比较来划分流形季与流行病非流行季,不同算法的预测效果受其参数影响较大,需要对参数进行调整,以获得较佳的预测效果。然而,参数调整所需要的时间较长。

发明内容

鉴于以上内容,有必要提出一种流行病预测方法及装置、计算机装置和计算机可读存储介质,其可以实现高效快速的流行病预测。

本申请的第一方面提供一种流行病预测方法,所述方法包括:

获取流行病监测的时间序列数据;

计算所述时间序列数据中每个流行病监测数据对应时间点属于流行季/ 非流行季转折点的概率,得到一组概率序列;

确定所述概率序列中的概率峰值,得到概率峰值序列;

对所述概率峰值序列中的概率峰值进行筛选,根据筛选后的概率峰值得到所述时间序列数据的流行季/非流行季转折点;

确定每个流行季/非流行季转折点的类型,所述类型包括上升转折点和下降转折点,所述上升转折点为流行病流行季的起始点,所述下降转折点为流行病流行季的终止点。

另一种可能的实现方式中,所述时间序列数据为X=[x0,x1,x2,…,xt],时间点0为已知的上一个流行季/非流行季转折点,时间点t为给定时间点,以>t表示时间点t到上一个流行季/非流行季转折点的间距,所述计算所述时间序列数据中每个流行病监测数据对应时间点属于流行季/非流行季转折点的概率包括:

步骤a:计算时间点t下rt取值的概率:

(1)计算时间点t的真实值xt基于[x0>t-1]序列分布的概率P(xt|x1:t-1),

其中μ1:t-1表示[x0,…,xt-1]的均值,σ1:t-1表示[x0,…,xt-1]的标准差;

(2)计算上一时间点rt-1的概率P(rt-1),

rt都是由上一时间点rt-1变化而来,rt=rt-1+1或rt=0;

(3)计算rt-1转变成rt的概率P(rt|rt-1),

P(rt|rt-1)为可调的参数值,当P(rt|rt-1)越大,则表明下一时间点t是流行季/非流行季转折点的概率越大;

步骤b:计算时间点t属于流行季/非流行季转折点概率Pt

Pt(rt)=Pt-1(rt-1)*Pt(rt|rt-1)*P(xt|x1:t-1)。

另一种可能的实现方式中,所述对所述概率峰值序列中的概率峰值进行筛选,根据筛选后的概率峰值得到所述时间序列数据的流行季/非流行季转折点包括:

计算所述概率峰值序列的预设百分位数,以所述预设百分位数作为筛选的阈值,若所述所述概率峰值序列中的概率峰值大于所述预设百分位数,则所述概率峰值为流行季/非流行季转折点;或者

计算所述概率峰值序列的平均数,以所述平均数作为筛选的阈值,若所述所述概率峰值序列中的概率峰值大于所述平均数,则所述概率峰值为流行季/非流行季转折点;或者

计算所述概率峰值序列的中位数,以所述中位数作为筛选的阈值,若所述所述概率峰值序列中的概率峰值大于所述中位数,则所述概率峰值为流行季/非流行季转折点。

另一种可能的实现方式中,所述流行病监测数据包括流行病的就诊数、就诊率、发病数或发病率。

另一种可能的实现方式中,所述确定每个流行季/非流行季转折点的类型包括:

计算所述时间序列数据中,所述流行季/非流行季转折点到前一个流行季 /非流行季转折点的均值,根据所述流行季/非流行季转折点到前一个流行季/ 非流行季转折点的均值确定所述流行季/非流行季转折点的类型;或者

计算所述时间序列数据中,所述流行季/非流行季转折点到前一个流行季 /非流行季转折点的均值以及所述流行季/非流行季转折点到后一个流行季/非流行季转折点的均值,根据所述流行季/非流行季转折点到前一个流行季/非流行季转折点的均值以及所述流行季/非流行季转折点到后一个流行季/非流行季转折点的均值确定所述流行季/非流行季转折点的类型。

另一种可能的实现方式中,所述获取流行病监测的时间序列数据包括:在预设区域建立由多个监测点组成的流行病监测网络,从所述监测点获取流行病监测数据,由所述流行病监测数据构成所述时间序列数据。

另一种可能的实现方式中,所述监测点包括满足预设人数或规模的医疗机构、学校和幼托机构、药店。

另一种可能的实现方式中,所述确定所述概率序列中的概率峰值包括:

依次比较概率序列中每个概率与其前后相邻概率的大小,若该概率大于其前后相邻概率,则该概率为所述概率序列中的概率峰值。

本申请的第二方面提供一种计算机装置,所述计算机装置包括处理器,所述处理器用于执行存储器中存储的计算机程序以实现所述流行病预测方法。

本申请的第三方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述流行病预测方法。

本发明获取流行病监测的时间序列数据;计算所述时间序列数据中每个流行病监测数据对应时间点属于流行季/非流行季转折点的概率,得到一组概率序列;确定所述概率序列中的概率峰值,得到概率峰值序列;对所述概率峰值序列中的概率峰值进行筛选,根据筛选后的概率峰值得到所述时间序列数据的流行季/非流行季转折点;确定每个流行季/非流行季转折点的类型,所述类型包括上升转折点和下降转折点,所述上升转折点为流行病流行季的起始点,所述下降转折点为流行病流行季的终止点。由于概率计算不受预测模型参数的影响,因此,本发明避免了调整参数要花费大量时间,实现了高效快速的流行病预测。

附图说明

图1是本发明实施例一提供的流行病预测方法的流程图。

图2是本发明实施例二提供的流行病预测装置的结构图。

图3是本发明实施例三提供的计算机装置的示意图。

具体实施方式

为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。

在下面的描述中阐述了很多具体细节以便于充分理解本发明,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。

优选地,本发明的流行病预测方法应用在一个或者多个计算机装置中。所述计算机装置是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路 (Application Specific IntegratedCircuit,ASIC)、可编程门阵列(Field- Programmable Gate Array,FPGA)、数字处理器(Digital Signal Processor,DSP)、嵌入式设备等。

所述计算机装置可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述计算机装置可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。

实施例一

图1是本发明实施例一提供的流行病预测方法的流程图。所述流行病预测方法应用于计算机装置。所述流行病预测方法可以计算流行病监测的时间序列数据中每个流行病监测数据对应时间点属于流行季/非流行季转折点的概率,根据该概率确定流行季/非流行季转折点,并确定每个流行季/非流行季转折点的类型,从而划分出流行病流行季与流行病非流行季。

如图1所示,所述流行病预测方法具体包括以下步骤:

步骤101,获取流行病监测的时间序列数据。

可以在预设区域(例如省、市、地区)建立由多个监测点组成的流行病监测网络,从所述监测点获取流行病监测数据,由所述流行病监测数据构成流行病监测的时间序列数据。可以选择医疗机构、学校和幼托机构、药店等作为监测点,分别对相应的目标人群进行流行病监测及数据采集。可以选择满足预设条件的场所作为监测点。所述预设条件可以包括人数、规模等。例如,选择学生人数达到预设数量的学校和幼托机构作为监控点。又如,选择规模(例如以日营业额统计)达到预设规模的药店作为监控点。再如,选择规模(例如以日就医人数统计)达到预设规模的医院作为监控点。

不同时间的流行病监测数据构成流行病监测的时间序列数据。例如,可以将以日为单位采集到的流行病监测数据构成流行病监测的时间序列数据。或者,可以将以周为单位采集到的流行病监测数据构成流行病监测的时间序列数据。

医疗机构(主要包括医院)是最能捕捉流行病早期暴发预兆的场所,是开展流行病监测的首选。可以根据病人就诊情况,获取流行病监测数据。

一部分流行病人会自行去药店购药来缓解早期症状,因此,可以根据药店的药品销售情况,获取流行病监测数据。

儿童和青少年是流行病的高危人群以及流行病传播过程中的重要环节,也应该加强对该人群的监测。学校和幼托机构是监测儿童和青少年流行病发病情况的较佳场所。可以根据学校和幼托机构的儿童和青少年的请假情况,获得流行病监测数据。

因此,本发明中主要选择医疗机构、学校和幼托机构、药店这三类场所进行流行病监测数据的采集。当然,上述对数据源的选择,并不能限制在另外的实施方案中增加或替换其他重点关注人群或场所作为监测的数据源。例如,可以将宾馆纳入流行病监测范围,获取宾馆入住人员的流行病监测数据。

根据需要,可以取任意一类监控点(例如医疗机构)采集的流行病监测数据构成流行病监测的时间序列数据。例如,可以取医院采集的流行病监测数据构成流行病监测的时间序列数据。或者,可以结合多类监控点采集的流行病监测数据构成流行病监测的时间序列数据。例如,可以以医院采集的流行病监测数据为主,以药店参加的流行病监测数据作为补充,构成流行病监测的时间序列数据。

流行病监测数据可以包括流行病的就诊数、就诊率、发病数或发病率等。例如,可以从医疗机构(例如医院)获取流行病(例如流感)的每日就诊数,将流行病(例如流感)的每日就诊数作为流行病监测数据。又如,可以从学校获取学生的流行病(例如流感)的每日发病数,将流行病(例如流感)的每日发病数作为流行病监测数据。

步骤102,计算所述时间序列数据中每个流行病监测数据对应时间点属于流行季/非流行季转折点的概率,得到一组概率序列。

可以按照时间顺序依次计算所述时间序列数据中每个流行病监测数据对应时间点属于流行季/非流行季转折点的概率。

可以按照以下方法计算所述时间序列数据中每个流行病监测数据对应时间点属于流行季/非流行季转折点的概率:

流行病监测的时间序列数据为X=[x0,x1,x2,…,xt],时间点0为已知的上一个流行季/非流行季转折点,时间点t为给定时间点。

以rt表示时间点t到上一个流行季/非流行季转折点的间距。若时间点t>t=0。例如,时间点t=3是流行季/非流行季转折点,则rt=3=0,且rt=5=2,表示时间点t=5和上一个流行季/非流行季转折点t=3的间距为2。

因此,对于时间点t来说,若其下一时间点rt+1不是流行季/非流行季转折点,则rt+1=rt+1;若其下一时间点rt+1是流行季/非流行季转折点,则>t+1=0。

初始化时将时间序列数据中第一个时间点属于流行季/非流行季转折点的概率设置为1,即

Pt(rt=0)=1。

对于时间点t下rt取值的概率含有3个要素:

(1)时间点t的真实值xt基于[x0>t-1]序列分布的概率P(xt|x1:t-1),

其中μ1:t-1表示[x0,…,xt-1]的均值,σ1:t-1表示[x0,…,xt-1]的标准差。

(2)上一时间点rt-1的概率P(rt-1)。

rt都是由上一时间点rt-1变化而来,rt=rt-1+1或rt=0。

(3)rt-1转变成rt的概率P(rt|rt-1)。

P(rt|rt-1)概率是一个人为可调的参数值。当P(rt|rt-1)越大,则表明下一时间点t是流行季/非流行季转折点的概率越大。

则时间点t属于流行季/非流行季转折点概率Pt为:

Pt(rt)=Pt-1(rt-1)*Pt(rt|rt-1)*P(xt|x1:t-1)。

按照上述方法计算出时间点0到时间点t属于流行季/非流行季转折点的概率,得到概率序列:

P=[P0,P1,P2,…,Pt]。

步骤103,确定所述概率序列中的概率峰值,得到概率峰值序列。

可以依次比较概率序列中每个概率与其前后相邻概率的大小,若概率序列中的一个概率同时大于其前后相邻概率,则该概率为所述概率序列中的概率峰值。例如,P1、P2、P3相邻,P1<P2且P3<P2,则P2就是概率序列中的概率峰值。

所述概率序列中的所有概率峰值构成所述概率峰值序列。

步骤104,对所述概率峰值序列中的概率峰值进行筛选,根据筛选后的概率峰值得到所述时间序列数据的流行季/非流行季转折点。

可以计算所述概率峰值序列的预设百分位数(或分位数),以所述预设百分位数(或分位数)作为筛选的阈值,若所述概率峰值序列中的概率峰值大于所述预设百分位数(或分位数),则所述概率峰值为流行季/非流行季转折点。例如,可以计算所述概率峰值序列的第70百分位数(或0.7分位数),若所述概率峰值序列中的概率峰值大于所述概率峰值序列的第70百分位数 (或0.7分位数),则所述概率峰值为流行季/非流行季转折点。

或者,可以计算所述概率峰值序列的平均数,以所述平均数作为筛选的阈值,若所述概率峰值序列中的概率峰值大于所述平均数,则所述概率峰值为流行季/非流行季转折点。

或者,可以计算所述概率峰值序列的中位数,以所述中位数作为筛选的阈值,若所述概率峰值序列中的概率峰值大于所述中位数,则所述概率峰值为流行季/非流行季转折点。

步骤105,确定每个流行季/非流行季转折点的类型,所述类型包括上升转折点和下降转折点。

所述上升转折点为流行病流行季的起始点(即流行病非流行季的结束点),所述下降转折点为流行病流行季的终止点(即流行病非流行季的起始点),从上升转折点至相邻下降转折点为流行病流行季,从下降折点至相邻上升转折点为流行病非流行季。

对于每个流行季/非流行季转折点,可以计算所述时间序列数据中,所述流行季/非流行季转折点到前一个流行季/非流行季转折点(不包括所述流行季/非流行季转折点,包括前一个流行季/非流行季转折点)的均值,若所述流行季/非流行季转折点对应的流行病监测数据大于所述均值,则所述流行季/ 非流行季转折点为上升转折点。否则,若所述流行季/非流行季转折点对应的流行病监测数据小所述均值,则所述流行季/非流行季转折点为下降转折点。

或者,对于每个流行季/非流行季转折点,可以计算所述时间序列数据中,所述流行季/非流行季转折点到前一个流行季/非流行季转折点(不包括所述流行季/非流行季转折点,包括前一个流行季/非流行季转折点)的均值以及所述流行季/非流行季转折点到后一个流行季/非流行季转折点(不包括所述流行季/非流行季转折点,包括后一个流行季/非流行季转折点)的均值。若所述流行季/非流行季转折点到前一个流行季/非流行季转折点的均值小于所述流行季/非流行季转折点到后一个流行季/非流行季转折点的均值,则所述流行季/非流行季转折点为上升转折点。否则,若所述流行季/非流行季转折点到前一个流行季/非流行季转折点的均值大于所述流行季/非流行季转折点到后一个流行季/非流行季转折点的均值,则所述流行季/非流行季转折点为下降转折点。

或者,对于每个流行季/非流行季转折点,可以计算所述时间序列数据中,所述流行季/非流行季转折点到前一个流行季/非流行季转折点(不包括所述流行季/非流行季转折点,包括前一个流行季/非流行季转折点)的中位值以及所述流行季/非流行季转折点到后一个流行季/非流行季转折点(不包括所述流行季/非流行季转折点,包括后一个流行季/非流行季转折点)的中位值。若所述流行季/非流行季转折点到前一个流行季/非流行季转折点的中位值小于所述流行季/非流行季转折点到后一个流行季/非流行季转折点的中位值,则所述流行季/非流行季转折点为上升转折点。否则,若所述流行季/非流行季转折点到前一个流行季/非流行季转折点的中位值大于所述流行季/非流行季转折点到后一个流行季/非流行季转折点的中位值,则所述流行季/非流行季转折点为下降转折点。

下面对所述流行病预测方法进行举例说明:

步骤101,获取流行病监测的时间序列数据[2,2.5,2,3,2,4,3,6,7,6,5],其中 2,2.5,2,3,2,4,3,6,7,6,5分别对应时间点0,1,2,3,4,5,6,7,8,9,10。

步骤102,计算所述时间序列数据[2,2.5,2,3,2,4,3,6,7,6,5]中每个流行病监测数据对应时间点属于流行季/非流行季转折点的概率,得到一组概率序列 [0.01,0.02,0.01,0.03,0.03,0.06,0.04,0.4,0.02,0.04,0.05]。

步骤103,确定概率序列 [0.01,0.02,0.01,0.03,0.03,0.06,0.04,0.4,0.02,0.04,0.05]中的概率峰值为时间点 t=1的0.02、时间点t=5的0.06,和时间点t=7的0.4,得到概率峰值序列[0.02,0.06,0.4]。

步骤104,对所述概率峰值序列[0.02,0.06,0.4]中的概率峰值进行筛选,根据筛选后的概率峰值得到所述时间序列数据的流行季/非流行季转折点。例如,取第0.2分位数0.026作为阈值,删除所有小于0.026的概率峰值,即将时间点t=1的0.02删除,剩下时间点t=5的0.06和时间点t=7的0.4,则时间点t=5和t=7为流行季/非流行季转折点。

步骤105,确定时间点t=5和t=7为流行季/非流行季转折点的类型。时间点t=5前的流行病监测数据为[2,2.5,2,3,2],均值为2.3,由于时间点t=5为 4大于2.3,所以时间点t=5为上升转折点。时间点t=7到时间点t=5之间的流行病监测数据为[4,3],均值为3.5,时间点t=7为6大于3.5,所以时间点 t=7为上升转折点。

需要说明的是,上述举例出现了两个连续的上升转折点,第一个上升转折点表示流行病流行季的起始,第二个上升转折点表示从较低风险等级流行季进入较高风险等级流行季。

实施例一的流行病预测方法获取流行病监测的时间序列数据;计算所述时间序列数据中每个流行病监测数据对应时间点属于流行季/非流行季转折点的概率,得到一组概率序列;确定所述概率序列中的概率峰值,得到概率峰值序列;对所述概率峰值序列中的概率峰值进行筛选,根据筛选后的概率峰值得到所述时间序列数据的流行季/非流行季转折点;确定每个流行季/非流行季转折点的类型,所述类型包括上升转折点和下降转折点,所述上升转折点为流行病流行季的起始点,所述下降转折点为流行病流行季的终止点。由于概率计算不受预测模型参数的影响,因此,实施例一避免了调整参数要花费大量时间,实现了高效快速的流行病预测。

实施例二

图2为本发明实施例二提供的流行病预测装置的结构图。

如图2所示,所述流行病预测装置10可以包括:获取单元201、计算单元202、第一确定单元203、筛选单元204、第二确定单元205。

获取单元201,用于获取流行病监测的时间序列数据。

可以在预设区域(例如省、市、地区)建立由多个监测点组成的流行病监测网络,从所述监测点获取流行病监测数据,由所述流行病监测数据构成构成流行病监测的时间序列数据。可以选择医疗机构、学校和幼托机构、药店等作为监测点,分别对相应的目标人群进行流行病监测及数据采集。可以选择满足预设条件的场所作为监测点。所述预设条件可以包括人数、规模等。例如,选择学生人数达到预设数量的学校和幼托机构作为监控点。又如,选择规模(例如以日营业额统计)达到预设规模的药店作为监控点。再如,选择规模(例如以日就医人数统计)达到预设规模的医院作为监控点。

不同时间的流行病监测数据构成流行病监测的时间序列数据。例如,可以将以日为单位采集到的流行病监测数据构成流行病监测的时间序列数据。或者,可以将以周为单位采集到的流行病监测数据构成流行病监测的时间序列数据。

医疗机构(主要包括医院)是最能捕捉流行病早期暴发预兆的场所,是开展流行病监测的首选。可以根据病人就诊情况,获取流行病监测数据。

一部分流行病人会自行去药店购药来缓解早期症状,因此,可以根据药店的药品销售情况,获取流行病监测数据。

儿童和青少年是流行病的高危人群以及流行病传播过程中的重要环节,也应该加强对该人群的监测。学校和幼托机构是监测儿童和青少年流行病发病情况的较佳场所。可以根据学校和幼托机构的儿童和青少年的请假情况,获得流行病监测数据。

因此,本发明中主要选择医疗机构、学校和幼托机构、药店这三类场所进行流行病监测数据的采集。当然,上述对数据源的选择,并不能限制在另外的实施方案中增加或替换其他重点关注人群或场所作为监测的数据源。例如,可以将宾馆纳入流行病监测范围,获取宾馆入住人员的流行病监测数据。

根据需要,可以取任意一类监控点(例如医疗机构)采集的流行病监测数据构成流行病监测的时间序列数据。例如,可以取医院采集的流行病监测数据构成流行病监测的时间序列数据。或者,可以结合多类监控点采集的流行病监测数据构成流行病监测的时间序列数据。例如,可以以医院采集的流行病监测数据为主,以药店参加的流行病监测数据作为补充,构成流行病监测的时间序列数据。

流行病监测数据可以包括流行病的就诊数、就诊率、发病数或发病率等。例如,可以从医疗机构(例如医院)获取流行病(例如流感)的每日就诊数,将流行病(例如流感)的每日就诊数作为流行病监测数据。又如,可以从学校获取学生的流行病(例如流感)的每日发病数,将流行病(例如流感)的每日发病数作为流行病监测数据。

计算单元202,用于计算所述时间序列数据中每个流行病监测数据对应时间点属于流行季/非流行季转折点的概率,得到一组概率序列。

可以按照时间顺序依次计算所述时间序列数据中每个流行病监测数据对应时间点属于流行季/非流行季转折点的概率。

可以按照以下方法计算所述时间序列数据中每个流行病监测数据对应时间点属于流行季/非流行季转折点的概率:

流行病监测的时间序列数据为X=[x0,x1,x2,…,xt],时间点0为已知的上一个流行季/非流行季转折点,时间点t为给定时间点。

以rt表示时间点t到上一个流行季/非流行季转折点的间距。若时间点t>t=0。例如,时间点t=3是流行季/非流行季转折点,则rt=3=0,且rt=5=2,表示时间点t=5和上一个流行季/非流行季转折点t=3的间距为2。

因此,对于时间点t来说,若其下一时间点rt+1不是流行季/非流行季转折点,则rt+1=rt+1;若其下一时间点rt+1是流行季/非流行季转折点,则>t+1=0。

初始化时将时间序列数据中第一个时间点属于流行季/非流行季转折点的概率设置为1,即

Pt(rt=0)=1。

对于时间点t下rt取值的概率含有3个要素:

(1)时间点t的真实值xt基于[x0>t-1]序列分布的概率P(xt|x1:t-1),

其中μ1:t-1表示[x0,…,xt-1]的均值,σ1:t-1表示[x0,…,xt-1]的标准差。

(2)上一时间点rt-1的概率P(rt-1)。

rt都是由上一时间点rt-1变化而来,rt=rt-1+1或rt=0。

(3)rt-1转变成rt的概率P(rt|rt-1)。

P(rt|rt-1)概率是一个人为可调的参数值。当P(rt|rt-1)越大,则表明下一时间点t是流行季/非流行季转折点的概率越大。

则时间点t属于流行季/非流行季转折点概率Pt为:

Pt(rt)=Pt-1(rt-1)*Pt(rt|rt-1)*P(xt|x1:t-1)。

按照上述方法计算出时间点0到时间点t属于流行季/非流行季转折点的概率,得到概率序列:

P=[P0,P1,P2,…,Pt]。

第一确定单元203,用于确定所述概率序列中的概率峰值,得到概率峰值序列。

可以依次比较概率序列中每个概率与其前后相邻概率的大小,若概率序列中的一个概率同时大于其前后相邻概率,则该概率为所述概率序列中的概率峰值。例如,P1、P2、P3相邻,P1<P2且P3<P2,则P2就是概率序列中的概率峰值。

所述概率序列中的所有概率峰值构成所述概率峰值序列。

筛选单元204,用于对所述概率峰值序列中的概率峰值进行筛选,根据筛选后的概率峰值得到所述时间序列数据的流行季/非流行季转折点。

可以计算所述概率峰值序列的预设百分位数(或分位数),以所述预设百分位数(或分位数)作为筛选的阈值,若所述概率峰值序列中的概率峰值大于所述预设百分位数(或分位数),则所述概率峰值为流行季/非流行季转折点。例如,可以计算所述概率峰值序列的第70百分位数(或0.7分位数),若所述所述概率峰值序列中的概率峰值大于所述概率峰值序列的第70百分位数(或0.7分位数),则所述概率峰值为流行季/非流行季转折点。

或者,可以计算所述概率峰值序列的平均数,以所述平均数作为筛选的阈值,若所述概率峰值序列中的概率峰值大于所述平均数,则所述概率峰值为流行季/非流行季转折点。

或者,可以计算所述概率峰值序列的中位数,以所述中位数作为筛选的阈值,若所述概率峰值序列中的概率峰值大于所述中位数,则所述概率峰值为流行季/非流行季转折点。

第二确定单元205,用于确定每个流行季/非流行季转折点的类型,所述类型包括上升转折点和下降转折点。

所述上升转折点为流行病流行季的起始点(即流行病非流行季的结束点),所述下降转折点为流行病流行季的终止点(即流行病非流行季的起始点),从上升转折点至相邻下降转折点为流行病流行季,从下降折点至相邻上升转折点为流行病非流行季。

对于每个流行季/非流行季转折点,可以计算所述时间序列数据中,所述流行季/非流行季转折点到前一个流行季/非流行季转折点(不包括所述流行季/非流行季转折点,包括前一个流行季/非流行季转折点)的均值,若所述流行季/非流行季转折点对应的流行病监测数据大于所述均值,则所述流行季/ 非流行季转折点为上升转折点。否则,若所述流行季/非流行季转折点对应的流行病监测数据小所述均值,则所述流行季/非流行季转折点为下降转折点。

或者,对于每个流行季/非流行季转折点,可以计算所述时间序列数据中,所述流行季/非流行季转折点到前一个流行季/非流行季转折点(不包括所述流行季/非流行季转折点,包括前一个流行季/非流行季转折点)的均值以及所述流行季/非流行季转折点到后一个流行季/非流行季转折点(不包括所述流行季/非流行季转折点,包括后一个流行季/非流行季转折点)的均值。若所述流行季/非流行季转折点到前一个流行季/非流行季转折点的均值小于所述流行季/非流行季转折点到后一个流行季/非流行季转折点的均值,则所述流行季/非流行季转折点为上升转折点。否则,若所述流行季/非流行季转折点到前一个流行季/非流行季转折点的均值大于所述流行季/非流行季转折点到后一个流行季/非流行季转折点的均值,则所述流行季/非流行季转折点为下降转折点。

或者,对于每个流行季/非流行季转折点,可以计算所述时间序列数据中,所述流行季/非流行季转折点到前一个流行季/非流行季转折点(不包括所述流行季/非流行季转折点,包括前一个流行季/非流行季转折点)的中位值以及所述流行季/非流行季转折点到后一个流行季/非流行季转折点(不包括所述流行季/非流行季转折点,包括后一个流行季/非流行季转折点)的中位值。若所述流行季/非流行季转折点到前一个流行季/非流行季转折点的中位值小于所述流行季/非流行季转折点到后一个流行季/非流行季转折点的中位值,则所述流行季/非流行季转折点为上升转折点。否则,若所述流行季/非流行季转折点到前一个流行季/非流行季转折点的中位值大于所述流行季/非流行季转折点到后一个流行季/非流行季转折点的中位值,则所述流行季/非流行季转折点为下降转折点。

下面对所述流行病预测装置10进行举例说明:

获取单元201获取流行病监测的时间序列数据[2,2.5,2,3,2,4,3,6,7,6,5],其中2,2.5,2,3,2,4,3,6,7,6,5分别对应时间点0,1,2,3,4,5,6,7,8,9,10。

计算单元202计算所述时间序列数据[2,2.5,2,3,2,4,3,6,7,6,5]中每个流行病监测数据对应时间点属于流行季/非流行季转折点的概率,得到一组概率序列[0.01,0.02,0.01,0.03,0.03,0.06,0.04,0.4,0.02,0.04,0.05]。

第一确定单元203确定概率序列 [0.01,0.02,0.01,0.03,0.03,0.06,0.04,0.4,0.02,0.04,0.05]中的概率峰值为时间点 t=1的0.02、时间点t=5的0.06,和时间点t=7的0.4,得到概率峰值序列 [0.02,0.06,0.4]。

筛选单元204对所述概率峰值序列[0.02,0.06,0.4]中的概率峰值进行筛选,根据筛选后的概率峰值得到所述时间序列数据的流行季/非流行季转折点。例如,取第0.2分位数0.026作为阈值,删除所有小于0.026的概率峰值,即将时间点t=1的0.02删除,剩下时间点t=5的0.06和时间点t=7的0.4,则时间点t=5和t=7为流行季/非流行季转折点。

第二确定单元205确定时间点t=5和t=7为流行季/非流行季转折点的类型。时间点t=5前的流行病监测数据为[2,2.5,2,3,2],均值为2.3,由于时间点 t=5为4大于2.3,所以时间点t=5为上升转折点。时间点t=7到时间点t=5 之间的流行病监测数据为[4,3],均值为3.5,时间点t=7为6大于3.5,所以时间点t=7为上升转折点。

需要说明的是,上述举例出现了两个连续的上升转折点,第一个上升转折点表示流行病流行季的起始,第二个上升转折点表示从较低风险等级流行季进入较高风险等级流行季。

实施例二的流行病预测装置10获取流行病监测的时间序列数据;计算所述时间序列数据中每个流行病监测数据对应时间点属于流行季/非流行季转折点的概率,得到一组概率序列;确定所述概率序列中的概率峰值,得到概率峰值序列;对所述概率峰值序列中的概率峰值进行筛选,根据筛选后的概率峰值得到所述时间序列数据的流行季/非流行季转折点;确定每个流行季/非流行季转折点的类型,所述类型包括上升转折点和下降转折点,所述上升转折点为流行病流行季的起始点,所述下降转折点为流行病流行季的终止点。由于概率计算不受预测模型参数的影响,因此,实施例二实现了高效快速的流行病预测。

实施例三

图3为本发明实施例三提供的计算机装置的示意图。所述计算机装置1 包括存储器20、处理器30以及存储在所述存储器20中并可在所述处理器30 上运行的计算机程序40,例如流行病预测程序。所述处理器30执行所述计算机程序40时实现上述流行病预测方法实施例中的步骤,例如图1所示的步骤101~105:

步骤101,获取流行病监测的时间序列数据;

步骤102,计算所述时间序列数据中每个流行病监测数据对应时间点属于流行季/非流行季转折点的概率,得到一组概率序列;

步骤103,确定所述概率序列中的概率峰值,得到概率峰值序列;

步骤104,对所述概率峰值序列中的概率峰值进行筛选,根据筛选后的概率峰值得到所述时间序列数据的流行季/非流行季转折点;

步骤105,确定每个流行季/非流行季转折点的类型,所述类型包括上升转折点和下降转折点。

或者,所述处理器30执行所述计算机程序40时实现上述流行病预测实施例中各模块/单元的功能,例如图2中的单元201~205。

获取单元201,用于获取流行病监测的时间序列数据;

计算单元202,用于计算所述时间序列数据中每个流行病监测数据对应时间点属于流行季/非流行季转折点的概率,得到一组概率序列;

第一确定单元203,用于确定所述概率序列中的概率峰值,得到概率峰值序列;

筛选单元204,用于对所述概率峰值序列中的概率峰值进行筛选,根据筛选后的概率峰值得到所述时间序列数据的流行季/非流行季转折点;

第二确定单元205,用于确定每个流行季/非流行季转折点的类型,所述类型包括上升转折点和下降转折点。

示例性的,所述计算机程序40可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器20中,并由所述处理器30执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序40在所述计算机装置1中的执行过程。例如,所述计算机程序40可以被分割成图2中的获取单元201、计算单元202、第一确定单元203、筛选单元204、第二确定单元205,各单元具体功能参见实施例二。

所述计算机装置1可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。本领域技术人员可以理解,所述示意图3仅仅是计算机装置 1的示例,并不构成对计算机装置1的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述计算机装置1还可以包括输入输出设备、网络接入设备、总线等。

所称处理器30可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器30也可以是任何常规的处理器等,所述处理器30是所述计算机装置1的控制中心,利用各种接口和线路连接整个计算机装置1的各个部分。

所述存储器20可用于存储所述计算机程序40和/或模块/单元,所述处理器30通过运行或执行存储在所述存储器20内的计算机程序40和/或模块/ 单元,以及调用存储在存储器20内的数据,实现所述计算机装置1的各种功能。所述存储器20可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据计算机装置1的使用所创建的数据 (比如音频数据、电话本等)等。此外,存储器20可以包括高速随机存取存储器,还可以包括非易失性存储器,例如硬盘、内存、插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)、至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。

所述计算机装置1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,所述计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。

实施例四

本实施例提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述疾病异常数据检测方法实施例中的步骤,例如图1所示的步骤101~105:

步骤101,获取流行病监测的时间序列数据;

步骤102,计算所述时间序列数据中每个流行病监测数据对应时间点属于流行季/非流行季转折点的概率,得到一组概率序列;

步骤103,确定所述概率序列中的概率峰值,得到概率峰值序列;

步骤104,对所述概率峰值序列中的概率峰值进行筛选,根据筛选后的概率峰值得到所述时间序列数据的流行季/非流行季转折点;

步骤105,确定每个流行季/非流行季转折点的类型,所述类型包括上升转折点和下降转折点。

或者,该计算机程序被处理器执行时实现上述装置实施例中各模块/单元的功能,例如图2中的单元201~205:

获取单元201,用于获取流行病监测的时间序列数据;

计算单元202,用于计算所述时间序列数据中每个流行病监测数据对应时间点属于流行季/非流行季转折点的概率,得到一组概率序列;

第一确定单元203,用于确定所述概率序列中的概率峰值,得到概率峰值序列;

筛选单元204,用于对所述概率峰值序列中的概率峰值进行筛选,根据筛选后的概率峰值得到所述时间序列数据的流行季/非流行季转折点;

第二确定单元205,用于确定每个流行季/非流行季转折点的类型,所述类型包括上升转折点和下降转折点。

在本发明所提供的几个实施例中,应该理解到,所揭露的计算机装置和方法,可以通过其它的方式实现。例如,以上所描述的计算机装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。

另外,在本发明各个实施例中的各功能单元可以集成在相同处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在相同单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。

对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。计算机装置权利要求中陈述的多个单元或计算机装置也可以由同一个单元或计算机装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。

最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号