首页> 中国专利> 人流扩散风险的预测方法、装置、电子设备及存储介质

人流扩散风险的预测方法、装置、电子设备及存储介质

摘要

本申请提供了一种人流扩散风险的预测方法、装置、电子设备及存储介质,该方法包括:根据地理数据和原始用户数据,生成每个目标区域内包括用户是否为输入性病例和用户对应的感染日期的移动用户数据;根据移动用户数据和SEIR模型,确定第一目标日期及之后SEIR模型对应的第一目标参数,以及第二目标日期下各个目标区域中的SEIR模型对应的第二目标参数;根据第一目标参数,生成SEIR模型的目标参数随时间的变化曲线;在图形用户界面上显示变化曲线以及第二目标日期下各个目标区域中SEIR模型对应的第二目标参数。这样,能够基于真实的移动用户数据,进行时间和空间两个维度下人流扩散风险的预测,提高了预测结果的真实性和准确性。

著录项

说明书

技术领域

本申请涉及风险预测技术领域,具体而言,涉及一种人流扩散风险的预测方法、装置、电子设备及存储介质。

背景技术

在突发公共卫生事件发展期间,流行病会随着人流的移动发生扩散,民众对扩散可能带来的风险具有很强的探知需求,该需求包括人流扩散风险时间发展态势需求和人流扩散风险空间发展态势需求。

目前,相关部门都是通过在每天的特定时间(比如每天20.00),统计每个城市内各区域的感染人数,并根据不同的感染人数确定该城市下各区域的风险等级,之后,将各城市各区域的风险等级在地图上通过不同的警示颜色进行显示。但是,该种方式,只能定期统计已有感染人数,无法对人流扩散风险进行预测,因此,无法满足民众的需求。

另外,还有一种方式能够模拟人流移动导致的流行病扩散现象,但是,该种模拟方式,模拟数据采用的数据集不是来自真实世界的数据集,因此,无法准确的反映人流移动导致流行病扩散的风险在真实世界中的时空发展态势。

发明内容

有鉴于此,本申请的目的在于提供一种人流扩散风险的预测方法、人流扩散风险的预测方法及装置,能够基于真实的移动用户数据,进行时间和空间两个维度下的人流扩散风险预测,真实的反映了人流移动导致的流行病的扩散风险,提高了预测结果的真实性和准确性。

第一方面,本申请实施例提供了一种人流扩散风险的预测方法,所述预测方法包括:

根据地理数据和原始用户数据,生成每个目标区域内的移动用户数据;其中,所述原始用户数据至少包括移动定位数据和病例数据;所述移动用户数据至少包括:用户的停留区域、用户在所述停留区域的停留时间、用户是否为输入性病例的病例状态和输入性病例对应的感染日期;

根据所述移动用户数据和预先训练好的SEIR模型,确定第一目标日期及之后所述SEIR模型对应的第一目标参数,以及第二目标日期下各个目标区域中的所述SEIR模型对应的第二目标参数;其中,所述SEIR模型的目标参数至少包括四种人群类型分别对应的数量;所述四种人群类型包括:易感者、潜伏者、感染者和康复者;

在图形用户界面上显示所述第一目标日期及之后所述SEIR模型对应的第一目标参数的变化曲线,以及第二目标日期下各个目标区域中的所述SEIR模型对应的第二目标参数。

在一种可能的实施方式中,所述地理数据包括区域边界数据,每一个所述区域边界数据对应一目标区域;所述原始用户数据还包括人口普查数据;所述根据地理数据和原始用户数据,生成每个目标区域内的移动用户数据,包括:

根据所述移动定位数据和所述区域边界数据,确定所述移动定位数据中的每个用户在每个所述目标区域内的停留时间;

根据所述移动定位数据和所述人口普查数据,为所述移动定位数据中的每个用户分配用户属性;其中,所述用户属性包括以下至少之一:年龄、性别;

根据所述病例数据和每个用户对应的用户属性,确定所述移动定位数据中每个用户是否为输入性病例的病例状态和输入性病例对应的感染日期,得到每个目标区域内的移动用户数据。

在一种可能的实施方式中,所述移动定位数据包括:用户标识、定位日期、定位时间和定位位置;所述根据所述移动定位数据和所述区域边界数据,确定所述移动定位数据中的每个用户在每个所述目标区域内的停留时间,包括:

根据所述移动定位数据包括的定位日期,对所述移动定位数据进行排序,得到排序后的第一移动定位数据;

根据所述用户标识,从所述第一移动定位数据中获取每个用户在每个定位日期下的第二移动定位数据,并基于所述第二移动定位数据包括的定位时间,对所述第二移动定位数据进行排序,得到每个用户在每个定位日期下的第三移动定位数据;

针对每个用户在每个定位日期下的每一个第三移动定位数据,根据该第三移动定位数据中的定位位置,确定该定位位置对应的目标区域;

针对每个定位日期下的每个用户,若存在同一目标区域内的连续多条第三移动定位数据,则根据所述多条第三移动定位数据中的第一条第三移动定位数据和最后一条第三移动定位数据,确定该定位日期下该用户在该目标区域的停留时间。

在一种可能的实施方式中,所述人口普查数据包括:多个预设年龄阶段下不同性别的人口数量;所述根据所述移动定位数据和所述人口普查数据,为所述移动定位数据中的每个用户分配用户属性,包括:

根据所述人口普查数据中每个年龄阶段的第一人口数量以及人口总数量,确定每个年龄阶段对应的第一比例;

根据所述移动定位数据对应的第一用户数量以及每个年龄阶段对应的第一比例,确定每个年龄阶段下的第二用户数量,并基于所述每个年龄阶段下的第二用户数量,为所述移动定位数据中的用户分配匹配年龄阶段的年龄属性;

根据所述人口普查数据中每个年龄阶段的第一人口数量以及该年龄阶段各个性别下的第二人口数量,确定该年龄阶段下各个性别对应的第二比例;

根据每个年龄阶段下各个性别对应的第二比例,为所述移动定位数据中该年龄阶段下的用户分配性别属性。

在一种可能的实施方式中,所述病例数据至少包括:病例用户属性、病例家庭住址、病例状态和感染日期;所述根据所述病例数据和每个用户对应的用户属性,确定所述移动定位数据中每个用户是否为输入性病例的病例状态和输入性病例对应的感染日期,得到每个目标区域内的移动用户数据,包括:

针对每一条病例数据,根据该条病例数据中的病例家庭住址,确定该条病例数据对应的第一目标区域;

获取所述第一目标区域对应的第一用户标识;

根据所述病例数据中的病例用户属性以及每个第一用户标识在所述第一目标区域的停留时间,从所述第一用户标识中选取第二用户标识;

根据所述病例数据中的病例状态和感染日期,确定所述第二用户标识为输入性病例以及所述输入性病例对应的感染日期。

在一种可能的实施方式中,所述病例数据还包括近期旅居史;其中,判断每个病例数据是否为输入性病例的方法,包括:

针对每一个病例数据,判断该病例数据中的近期旅居史是否与第二目标区域相一致;

若否,则确定该病例数据为输入性病例;若是,确定该病例数据为本地感染病例。

在一种可能的实施方式中,通过如下方法训练所述SEIR模型,包括:

根据所述病例数据,统计历史时间段内每一个历史日期下的第一感染人数;

根据所述移动用户数据和每一个历史日期下的第一感染人数,确定每一个历史日期下对应于所述SEIR模型的第三目标参数;

将每一个历史日期下的第三目标参数输入到预设的SEIR模型中,得到所述SEIR模型输出的每一个历史日期后一天的第四目标参数;计算所述第四目标参数中的第二感染人数与所述每一个历史日期后一天的实际感染人数的损失函数,当所述损失函数满足预设条件,得到训练好的包括最优训练参数的SEIR模型;其中,所述训练参数包括:潜伏者转化成感染者的概率、感染者转化成康复者的概率、感染者转化成康复者的概率;所述SEIR模型的初始值中,潜伏者的数量和康复者的数量等于0。

在一种可能的实施方式中,所述根据所述移动用户数据和预先训练好的SEIR模型,确定第一目标日期及之后所述SEIR模型对应的第一目标参数,包括:

根据所述移动用户数据,确定初始历史日期下的第五目标参数;其中,所述初始历史日期下,潜伏者的数量和康复者的数量等于0;

在将所述第五目标参数输入到预先训练好的SEIR模型后,根据所述SEIR模型输出的初始历史日期后一天的第一目标参数,确定初始历史日期后一天对应的第六目标参数,将所述初始历史日期后一天作为新的初始历史日期,将所述第六目标参数作为新的第五目标参数,返回在将所述第五目标参数输入到预先训练好的SEIR模型后,根据所述SEIR模型输出的初始历史日期后一天的第一目标参数,确定初始历史日期后一天对应的第六目标参数的步骤,直至达到第一截止条件,得到第一目标日期及之后所述SEIR模型对应的第一目标参数。

在一种可能的实施方式中,所述根据所述SEIR模型输出的初始历史日期后一天的第一目标参数,确定初始历史日期后一天对应的第六目标参数,包括:

根据所述SEIR模型输出的初始历史日期后一天的第一目标参数以及所述移动用户数据,确定所述初始历史日期后一天对应的第六目标参数。

在一种可能的实施方式中,根据所述移动用户数据和预先训练好的SEIR模型,确定第二目标日期下各个目标区域中的所述SEIR模型对应的第二目标参数,还包括:

针对每个目标区域,统计第二目标日期前一天在该目标区域停留过的第一移动用户数据,并根据所述第一移动用户数据对应的第一人群类型,确定第二目标日期前一天所述SEIR模型对应的第七目标参数;

将所述第七目标参数输入到预先训练好的SEIR模型中,得到所述SEIR模型输出的第二目标日期下该目标区域的第二目标参数。

在一种可能的实施方式中,确定第二目标日期前一天在该目标区域停留过的第一移动用户数据对应的第一人群类型,包括:

针对每个目标区域,统计初始历史日期下在该目标区域停留过的第二移动用户数据,并根据所述第二移动用户数据对应的第二人群类型,确定初始历史日期下的第八目标参数;其中,所述初始历史日期下,潜伏者的数量和康复者的数量等于0;

在将所述第八目标参数输入到预先训练好的SEIR模型后,得到所述SEIR模型输出的初始历史日期后一天的第九目标参数;

根据所述第九目标参数、所述第八目标参数和所述第二移动用户数据对应的第二人群类型,确定初始历史日期后一天所述第二移动用户数据对应的第三人群类型;

根据所述第二移动用户数据对应的第三人群类型,统计初始历史日期后一天在该目标区域停留过的第三移动用户数据,将所述第三移动用户数据作为新的第二移动用户数据,返回根据所述第二移动用户数据对应的第二人群类型,确定初始历史日期下的第八目标参数的过程,直至达到第二截止条件,确定第二目标日期前一天在该目标区域停留过的第一移动用户数据对应的第一人群类型。

在一种可能的实施方式中,所述根据所述第九目标参数、所述第八目标参数和所述第二移动用户数据对应的第二人群类型,确定初始历史日期后一天所述第二移动用户数据对应的第三人群类型,包括:

若所述第九目标参数中的第一感染者数量大于所述第八目标参数中的第二感染者数量,则根据所述第一感染者数量、所述第二感染者数量和所述第八目标参数中的第一潜伏者数量,确定初始历史日期后一天所述第二移动用户数据对应的第三人群类型;

若所述第九目标参数中的第一康复者数量大于所述第八目标参数中的第二康复者数量,则根据所述第一康复者数量、所述第二康复者数量和所述第八目标参数中的第一感染者数量,更新所述初始历史日期后一天所述第二移动用户数据对应的第三人群类型;

若所述第九目标参数中的第二潜伏者数量大于所述第八目标参数中的第一潜伏者数量,则根据所述第八目标参数中的第一易感者数量以及所述第二移动用户数据中各个易感者对应的感染权重值,更新所述初始历史日期后一天所述第二移动用户数据对应的第三人群类型。

在一种可能的实施方式中,确定所述第二移动用户数据中各个易感者对应的感染权重值,包括:

根据所述第二移动用户数据中每个易感者的在该目标区域的停留时间以及每个易感者的用户属性,确定每个易感者对应的感染权重值。

在一种可能的实施方式中,所述预测方法还包括:

响应针对图形用户界面上触发标识的第一控制操作,控制所述触发标识在图形用户界面上移动;

当检测到所述触发标识悬浮在所述变化曲线上时,确定所述触发标识映射在所述变化曲线上的定位点,并确定所述定位点对应的目标数据;

在所述图形用户界面上显示所述目标数据。

在一种可能的实施方式中,在图形用户界面上显示第二目标日期下各个目标区域中的所述SEIR模型对应的第二目标参数,包括:

按照目标展示维度,在所述图形用户界面上显示第二目标日期下各个目标区域中的所述SEIR模型对应的第二目标参数;其中,所述目标展示维度包括:区域维度和行政维度。

在一种可能的实施方式中,所述预测方法还包括:

响应针对图形用户界面的第二控制操作,确定当前的第一展示维度和待切换的第二展示维度,并将当前的第一展示维度切换为待切换的第二展示维度。

第二方面,本申请实施例还提供了一种人流扩散风险的预测装置,所述预测装置包括:

生成模块,用于根据地理数据和原始用户数据,生成每个目标区域内的移动用户数据;其中,所述原始用户数据至少包括移动定位数据和病例数据;所述移动用户数据至少包括:用户的停留区域、用户在所述停留区域的停留时间、用户是否为输入性病例的病例状态和输入性病例对应的感染日期;

第一确定模块,用于根据所述移动用户数据和预先训练好的SEIR模型,确定第一目标日期及之后所述SEIR模型对应的第一目标参数,以及第二目标日期下各个目标区域中的所述SEIR模型对应的第二目标参数;其中,所述SEIR模型的目标参数至少包括四种人群类型分别对应的数量;所述四种人群类型包括:易感者、潜伏者、感染者和康复者;

第一显示模块,用于在图形用户界面上显示所述第一目标日期及之后所述SEIR模型对应的第一目标参数的变化曲线,以及第二目标日期下各个目标区域中的所述SEIR模型对应的第二目标参数。

第三方面,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行如第一方面任一项所述的人流扩散风险的预测方法的步骤。

第四方面,本申请实施例还提供了一种电子设备,包括:处理器、存储介质和总线,所述存储介质存储有所述处理器可执行的机器可读指令,当电子设备运行时,所述处理器与所述存储介质之间通过总线通信,所述处理器执行所述机器可读指令,以执行如第一方面任一项所述的人流扩散风险的预测方法的步骤。

本申请实施例提供了一种人流扩散风险的预测方法、装置、电子设备及存储介质,该方法包括:根据地理数据和原始用户数据,生成每个目标区域内包括用户是否为输入性病例和输入性病例对应的感染日期的移动用户数据;根据移动用户数据和预先训练好的SEIR模型,确定第一目标日期及之后SEIR模型对应的第一目标参数,以及第二目标日期下各个目标区域中的SEIR模型对应的第二目标参数;其中,SEIR模型的目标参数至少包括四种人群类型分别对应的数量;四种人群类型包括:易感者、潜伏者、感染者和康复者;根据第一目标日期及之后SEIR模型对应的第一目标参数,生成SEIR模型的目标参数随时间的变化曲线;在图形用户界面上显示SEIR模型的目标参数随时间的变化曲线,以及第二目标日期下各个目标区域中的SEIR模型对应的第二目标参数。这样,能够基于真实的移动用户数据,进行时间和空间两个维度下的人流扩散风险预测,真实的反映了人流移动导致的流行病的扩散风险,提高了预测结果的真实性和准确性。

附图说明

为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1a示出了本申请实施例提供的一种人流扩散风险的预测方法的流程图;

图1b北京市门头沟区的geojson格式的行政区边界数据;

图1c北京市门头沟区的geojson格式的行政区边界数据;

图1d示出了以六边形网格划分北京市得到的示意图;

图1e示出了移动定位数据包括的字段和相应字段下的数据的示意图;

图1f示出了各地区预设的各年龄阶段、各性别的人口数量;

图1g示出了四种人群(即易感者、潜伏者、感染者和康复者)之间的转化方式;

图1h示出了易感者、潜伏者、感染者、康复者的人数随时间变化曲线示意图;

图1i示出了北京市各行政区感染者分布图;

图1j示出了北京市各细粒度的目标区域中的图感染者分布图;

图2示出了本申请实施例提供的另一种人流扩散风险的预测方法的流程图;

图3示出了本申请实施例提供的另一种人流扩散风险的预测方法的流程图;

图4示出了本申请实施例提供的另一种人流扩散风险的预测方法的流程图;

图5示出了本申请实施例提供的另一种人流扩散风险的预测方法的流程图;

图6示出了本申请实施例提供的另一种人流扩散风险的预测方法的流程图;

图7示出了本申请实施例提供的一种人流扩散风险的预测装置的结构示意图;

图8示出了一种电子设备的结构示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,应当理解,本申请中附图仅起到说明和描述的目的,并不用于限定本申请的保护范围。另外,应当理解,示意性的附图并未按实物比例绘制。本申请中使用的流程图示出了根据本申请的一些实施例实现的操作。应该理解,流程图的操作可以不按顺序实现,没有逻辑的上下文关系的步骤可以反转顺序或者同时实施。此外,本领域技术人员在本申请内容的指引下,可以向流程图添加一个或多个其他操作,也可以从流程图中移除一个或多个操作。

另外,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。

为了使得本领域技术人员能够使用本申请内容,结合特定应用场景“网约车领域”,给出以下实施方式。对于本领域技术人员来说,在不脱离本申请的精神和范围的情况下,可以将这里定义的一般原理应用于其他实施例和应用场景。虽然本申请主要围绕人流扩散风险的预测进行描述,但是应该理解,这仅是一个示例性实施例。

需要说明的是,本申请实施例中将会用到术语“包括”,用于指出其后所声明的特征的存在,但并不排除增加其它的特征。

本申请中的术语“乘客”、“请求方”、“服务请求方”和“客户”可互换使用,以指代可以请求或订购服务的个人、实体或工具。本申请中的术语“司机”、“驾驶员”、“提供方”、“服务提供方”和“供应商”可互换使用,以指代可以提供服务的个人、实体或工具。

考虑到针对突发公共卫生事件,现有技术的一种方式只能定期统计已有感染人数,无法对人流扩散风险进行预测,因此,无法满足民众的需求。另外,现有技术的另一种方式能够模拟人流移动导致的流行病扩散现象,但是,该种模拟方式,模拟数据采用的数据集不是来自真实世界的数据集,因此,无法准确的反映人流移动导致流行病扩散的风险在真实世界中的时空发展态势。基于此,本申请的目的在于提供一种人流扩散风险的预测方法、人流扩散风险的预测方法及装置,能够基于真实的移动用户数据,进行时间和空间两个维度下的人流扩散风险预测,真实的反映了人流移动导致的流行病的扩散风险,提高了预测结果的真实性和准确性。

本申请实施例提供了一种人流扩散风险的预测方法,可以应用于服务器,也可以应用于终端设备,下面以上述预测方法应用于服务器为例进行说明。

参照图1a所示,为本申请实施例提供的一种人流扩散风险的预测方法的流程示意图,该方法可以由服务器执行,所述预测方法具体包括:

S101、根据地理数据和原始用户数据,生成每个目标区域内的移动用户数据;其中,所述原始用户数据至少包括移动定位数据和病例数据;所述移动用户数据至少包括:用户的停留区域、用户在所述停留区域的停留时间、用户是否为输入性病例的病例状态和输入性病例对应的感染日期。

S102、根据所述移动用户数据和预先训练好的SEIR模型,确定第一目标日期及之后所述SEIR模型对应的第一目标参数,以及第二目标日期下各个目标区域中的所述SEIR模型对应的第二目标参数;其中,所述SEIR模型的目标参数至少包括四种人群类型分别对应的数量;所述四种人群类型包括:易感者、潜伏者、感染者和康复者。

S103、在图形用户界面上显示所述第一目标日期及之后所述SEIR模型对应的第一目标参数的变化曲线,以及第二目标日期下各个目标区域中的所述SEIR模型对应的第二目标参数。

本申请实施例提供了上述人流扩散风险的预测方法,能够生成真实的移动用户数据,并基于真实的移动用户数据,进行时间和空间两个维度下人流扩散风险的预测,真实的反映了人流移动导致的流行病的扩散风险,提高了预测结果的真实性和准确性。

下面分别对本申请实施例的上述示例性的各步骤分别进行说明:

S101、根据地理数据和原始用户数据,生成每个目标区域内的移动用户数据;其中,所述原始用户数据至少包括移动定位数据和病例数据;所述移动用户数据至少包括:用户的停留区域、用户在所述停留区域的停留时间、用户是否为输入性病例的病例状态和输入性病例对应的感染日期。

本申请实施例中,首先进行数据获取;其中,服务器(也即系统)需要从数据库中获取两类数据:地理数据和用户数据(即原始用户数据)。

这里,上述地理数据主要包括:行政边界数据和区域边界数据。第一,行政边界数据包括行政区、行政街道等边界数据。其中,行政边界数据包括一系列有序的经纬度坐标。以行政区为例,城市管辖的各个行政区边界可由一系列有序的经纬度坐标组成,这些坐标构成城市行政区边界数据。以北京市为例,北京市门头沟区geojson格式的边界数据如图1b所示。第二,针对区域边界数据,区域是按照规则划分城市得到的一个个多边形网格(如正方形、六边形网格),相应的,区域边界数据实际上指的是规则多边形顶点的经纬度坐标。以六边形网格为例,图1c显示了ID为OL13F1i4938j2570的六边形网格需要存储的边界数据。在图1c中,Longitude表示经度,latitude表示纬度。其中,图1d示出了以六边形网格划分北京市得到的示意图。

这里,上述原始用户数据主要包括:移动定位数据、第六次人口普查数据和官方病例数据。第一,上述移动定位数据由通信运营商提供,如图1e所示,移动定位数据具体包含如下字段信息:用户匿名ID、时间戳、经度和纬度。上述时间戳为Unix时间戳,记录了从1970年1月1日开始所经过的秒数。第二,上述第六次人口普查数据统计了各地区预设的各年龄阶段、各性别的人口数量,如图1f所示。其中,预设的年龄阶段包括22个,分别为0岁、1-4岁、5-9岁、10-14岁、15-19岁等。第三,上述官方病例数据是指由地方卫生部门提供的一定时间段内每日疫情感染病例数据,官方病例数据的字段信息包括:病例匿名ID、年龄、性别、家庭住址、感染日期和近期旅居史。其中,由每个感染者的近期旅居史能够判断该感染者是否属于输入性病例:如果该感染者近期离开过研究城市,则认为该感染者是研究城市的输入性病例;反之,则认为该感染者是本地感染病例。经过判别后将是否为输入性病例作为字段补充到上述官方病例数据中。

本申请实施例中,基于上述地理数据、第六次人口普查数据和官方病例数据,确定每一个移动定位数据(具体为每一个用户匿名ID)对应的停留区域、在停留区域的停留时间、是否为输入性病例的病例状态和输入性病例时对应的感染日期。

S102、根据所述移动用户数据和预先训练好的SEIR模型,确定第一目标日期及之后所述SEIR模型对应的第一目标参数,以及第二目标日期下各个目标区域中的所述SEIR模型对应的第二目标参数;其中,所述SEIR模型的目标参数至少包括四种人群类型分别对应的数量;所述四种人群类型包括:易感者、潜伏者、感染者和康复者。

本申请实施例中,在对地理数据和原始用户数据进行数据预处理,得到移动用户数据后,基于预先训练好的传染病模型(Susceptible、Exposed、Infectious、Recovered,SEIR)模型和上述真实的移动用户数据,分别从时间和空间两个维度预测人流扩散风险。其中,SEIR模型也即传播动力学模型,在该SEIR模型中,一共有四种人群类型(也即四类人群),分别为:易感者、潜伏者、感染者和康复者,上述四类人群对应人数分别用S、E、I、R表示;其中,地区总人数用N表示,相应的,N=S+E+I+R。本申请实施例中,上述SEIR模型的目标参数至少包括上述四种人群类型分别对应的数量,具体为:易感者的数量、潜伏者的数量、感染者的数量和康复者的数量。

其中,上述4种人群之间的转化方式如图1g所示。图1g中,β表示易感者转化为潜伏者的概率,σ表示潜伏者转化成感染者的概率、γ表示感染者转化成康复者的概率。此外,σ、γ还具有其他物理含义,σ数值的倒数表示代表潜伏期的时长,γ数值的倒数表示康复期的时长。其中,SEIR模型的训练参数包括上述β、σ和γ。相应的,预先训练好的SEIR模型包括最优的上述训练参数。其中,使用数学表达式可以将该模型写成如下常微分方程组:

在本步骤中,一方面根据移动用户数据和预先训练好的SEIR模型,确定时间维度下,第一目标日期及之后的SEIR模型对应的第一目标参数;另一方面,根据移动用户数据和预先训练好的SEIR模型,确定空间维度下,第二目标日期下各个目标区域中的SEIR模型对应的第二目标参数。

其中,上述第一目标日期和第二目标日期可以相同,也可以不同;上述第一目标日期可以是未来的任一日期。比如,当前为2020年1月31日,官方病例数据为2020年1月1日到2020年1月31日的数据,上述第一目标日期可以是2020年2月1日;上述第二目标日期可以是2020年2月1日及该日期之后的任一日期。

S103、在图形用户界面上显示所述第一目标日期及之后所述SEIR模型对应的第一目标参数的变化曲线,以及第二目标日期下各个目标区域中的所述SEIR模型对应的第二目标参数。

本申请实施例中,在时间和空间两个维度下进行人流扩散风险的可视化。

第一、在时间维度下,在确定第一目标日期及之后所述SEIR模型对应的第一目标参数,根据第一目标日期及之后所述SEIR模型对应的第一目标参数,生成所述SEIR模型的目标参数随时间的变化曲线,并在图形用户界面上显示该变化曲线。

比如,根据2020年2月1号及2020年2月1号之后四种人群的数量(即易感者的数量、潜伏者的数量、感染者的数量和康复者的数量),生成2020年2月1号以后上述四种人群的数量的变化曲线,并在图形用户界面上显示上述变化曲线。其中,图形用户界面中,横轴中的横坐标表示时间,纵轴中的纵坐标表示人数。如图1h所示,图1h示出了易感者、潜伏者、感染者、康复者的人数随时间变化曲线示意图。

第二、在空间维度下,在图形用户界面中显示第二目标日期下各个目标区域中的所述SEIR模型对应的第二目标参数。

本申请实施例中,按照目标展示维度,在图形用户界面上显示第二目标日期下各个目标区域中的SEIR模型对应的第二目标参数;这里,目标展示维度包括:区域维度和行政维度。

其中,通过模拟人流每日在区域间移动可以统计每日结束时城市内各区域感染者的数量,并借助热力图完成该数据的可视化,示意图如图1i和图1j所示。在视觉显示方面,各区域的感染者数量使用不同的高度显示,将感染者数量划分为若干等级使用不同的颜色显示。交互方面的设计主要包括多层递进式图层设计和时间轴动画设计。多层递进式图层设计指的是随着地图的放缩显示不同粒度的空间划分,区域为最细粒度的空间划分,对于其余空间划分,计算其覆盖区域感染者总和以及平均值,分别用于高度和颜色显示:以图1i和图1j为例,其显示了两层递进式图层设计,图1i即第一层利用行政区边界数据显示行政区级别的空间划分,图1j即第二层利用区域边界数据显示区域级别的空间划分。时间轴动画设计指的是为用户提供播放按钮以自动播放感染者在数量和分布上的动态变化,同时也允许用户选定特定日期手动观察不同日期下感染者的数量及分布。

进一步的,如图2所示,本申请实施例提供的人流扩散风险的预测方法,所述地理数据包括区域边界数据,每一个所述区域边界数据对应一目标区域;所述原始用户数据还包括人口普查数据;所述根据地理数据和原始用户数据,生成每个目标区域内的移动用户数据,包括:

S201、根据所述移动定位数据和所述区域边界数据,确定所述移动定位数据中的每个用户在每个所述目标区域内的停留时间。

本申请实施例中,地理数据还包括行政边界数据,每一个行政边界数据对应一行政区;其中,根据所述行政边界数据和所述区域边界数据,确定每个所述目标区域所属的至少一个层级的行政区;其中,不同层级的行政区之间具有从属关系。比如,北京市包括海淀区,海淀区中包括目标区域1~10。

其中,移动定位数据包括:用户标识、定位日期、定位时间和定位位置;上述具体确定方式包括如下步骤:

1、根据所述移动定位数据包括的定位日期,对所述移动定位数据进行排序,得到排序后的第一移动定位数据。

这里,对于输入的移动定位数据和区域边界数据,首先将Unix时间戳转化为对应的日期时间,并将日期、时间作为新字段存入移动定位数据表;第二步按照日期从早到晚排列数据。

2、根据所述用户标识,从所述第一移动定位数据中获取每个用户在每个定位日期下的第二移动定位数据,并基于所述第二移动定位数据包括的定位时间,对所述第二移动定位数据进行排序,得到每个用户在每个定位日期下的第三移动定位数据。

这里,第三步,每日数据内部按照用户匿名ID进行排序;第四步按照时间顺序从早到晚排列每个用户的每日数据。

3、针对每个用户在每个定位日期下的每一个第三移动定位数据,根据该第三移动定位数据中的定位位置,确定该定位位置对应的目标区域。

这里,最后遍历每个用户的每日数据,通过遍历所有区域边界数据利用点在凸包内外快速判别算法确定每条数据中的经纬度对应的区域ID。

4、针对每个定位日期下的每个用户,若存在同一目标区域内的连续多条第三移动定位数据,则根据所述多条第三移动定位数据中的第一条第三移动定位数据和最后一条第三移动定位数据,确定该定位日期下该用户在该目标区域的停留时间。

这里,如果出现连续两条或更多条定位数据中的经纬度位于同个区域,则把这些数据中最后一条和第一条的时间戳相减,即可得到此日期该用户在这个区域停留的时间,将日期、用户匿名ID、区域ID、停留时间存入新数据表称为停留数据表。

S202、根据所述移动定位数据和所述人口普查数据,为所述移动定位数据中的每个用户分配用户属性;其中,所述用户属性包括以下至少之一:年龄、性别。

本申请实施例中,移动定位数据包括:用户匿名ID、时间戳、经度、纬度、日期和时间;人口普查数据(可以为第六次人口普查数据)统计了各地区预设的各年龄阶段、各性别的人口数量。其中,在输入人口普查数据中找到研究城市的各年龄、性别的人口数量数据,然后对移动定位数据中涉及的所有匿名用户的年龄、性别两个属性进行初始化,具体方法包括:

1、根据所述人口普查数据中每个年龄阶段的第一人口数量以及人口总数量,确定每个年龄阶段对应的第一比例;根据所述移动定位数据对应的第一用户数量以及每个年龄阶段对应的第一比例,确定每个年龄阶段下的第二用户数量,并基于所述每个年龄阶段下的第二用户数量,为所述移动定位数据中的用户分配匹配年龄阶段的年龄属性。

这里,首先构建移动用户数据表,遍历移动定位数据表取出每个用户的匿名ID,第一步初始化年龄属性:针对每一个年龄阶段,计算该年龄阶段的第一人口数量与人口总数量的比值,将该比值确定为该年龄阶段对应的第一比例,得到各个年龄阶段对应的人口数量比例;针对每一个年龄阶段,计算该移动定位数据对应的第一用户数量与该年龄阶段对应的第一比例的乘积,得到该年龄阶段下的第二用户数量,并为第二用户数量的用户(也即用户匿名ID)分配匹配该年龄阶段的年龄属性。

具体在为每一个用户(也即用户匿名ID)分配匹配年龄阶段的年龄属性时,从该用户匿名ID被分配的年龄阶段中随机选取一个数值作为该用户匿名ID对应的年龄属性。

2、根据所述人口普查数据中每个年龄阶段的第一人口数量以及该年龄阶段各个性别下的第二人口数量,确定该年龄阶段下各个性别对应的第二比例;根据每个年龄阶段下各个性别对应的第二比例,为所述移动定位数据中该年龄阶段下的用户分配性别属性。

本申请实施例中,在为用户分配了年龄属性后,第二步初始化用户的性别属性:针对每个年龄阶段,该年龄阶段每个性别下的第二人口数量与该年龄阶段的第一人口数量的第二比例;计算该比例与该年龄阶段下的第二用户数量的比值,得到该年龄阶段下的第三用户数量,为该年龄阶段下第三用户数量的用户的分配该性别。

S203、根据所述病例数据和每个用户对应的用户属性,确定所述移动定位数据中每个用户是否为输入性病例的病例状态和输入性病例对应的感染日期,得到每个目标区域内的移动用户数据。

本申请实施例中,病例数据至少包括:病例匿名ID、病例用户属性、病例家庭住址、病例状态、感染日期;其中,上述病例状态包括是输入性病例、本地感染病例和未感染;具体,根据上述病例数据和每个用户对应的用户属性,确定每个目标区域内的移动用户数据的方法包括:

1、针对每一条病例数据,根据该条病例数据中的病例家庭住址,确定该条病例数据对应的第一目标区域。

2、获取所述第一目标区域对应的第一用户标识。

其中,根据每一个病例匿名ID对应的第一目标区域查找停留数据表,确定该第一目标区域停留过的所有用户的用户匿名ID。

3、根据所述病例数据中的病例用户属性以及每个第一用户标识在所述第一目标区域的停留时间,从所述第一用户标识中选取第二用户标识。

本步骤中,针对每一个官方病例数据中的输入性病例,根据该输入性病例的性别和所属年龄阶段作为筛选条件对确定的上述用户匿名ID(即第一用户标识)进行过滤,并从过滤出的匹配性别和年龄阶段的用户匿名ID中,选择停留时间最长的用户匿名ID(即第二用户标识)作为输入性病例。

这里,若第二用户标识为多个,则从多个第二用户标识中随机选取一个目标第二用户标识。

4、根据所述病例数据中的病例状态和感染日期,确定所述第二用户标识为输入性病例以及所述输入性病例对应的感染日期。

本申请实施例中,将该条输入性病例的病例状态以及对应的感染日期匹配给第二用户标识,并存入到移动用户数据表中。

实际中,官方提供的病例数据中包括近期旅居史,但不包括输入性病例的病例状态;因此,本申请实施例中,判断官方提供的每个病例数据是否为输入性病例的方法包括:

针对每一个病例数据,判断该病例数据中的近期旅居史是否与第二目标区域相一致;若否,则确定该病例数据为输入性病例;若是,确定该病例数据为本地感染病例。

这里,第二目标区域可以为研究城市;比如,对于每个病例数据,若该病例匿名ID的近期旅居史为近期离开过研究城市,则认为该病例匿名ID是研究城市的输入性病例,否则,该病例匿名ID是研究城市的本地感染病例。

进一步的,如图3所示,本申请实施例提供的人流扩散风险的预测方法中,通过如下方法训练所述SEIR模型,包括:

S301、根据所述病例数据,统计历史时间段内每一个历史日期下的第一感染人数。

S302、根据所述移动用户数据和每一个历史日期下的第一感染人数,确定每一个历史日期下对应于所述SEIR模型的第三目标参数。

S303、将每一个历史日期下的第三目标参数输入到预设的SEIR模型中,得到所述SEIR模型输出的每一个历史日期后一天的第四目标参数;计算所述第四目标参数中的第二感染人数与所述每一个历史日期后一天的实际感染人数的损失函数,当所述损失函数满足预设条件,得到训练好的包括最优训练参数的SEIR模型;其中,所述训练参数包括:潜伏者转化成感染者的概率、感染者转化成康复者的概率、感染者转化成康复者的概率;所述SEIR模型的初始值中,潜伏者的数量和康复者的数量等于0。

本申请实施例中,首先定义损失函数,模型拟合的数据来自官方公布的病例数据。将该数据按照日期从早到晚进行排序,统计每日感染人口总数,用I

Loss(β,σ,γ)=∑

其中,I(y)表示模型输出的第t天的感染病例数。上述损失函数可用数值方法求得参数最优值β

下面分别说明确定时间维度下,确定第一目标日期及之后所述SEIR模型对应的第一目标参数的方法,以及空间维度下,第二目标日期下各个目标区域中的所述SEIR模型对应的第二目标参数。

第一、如图4所示,本申请实施例提供的人流扩散风险的预测方法,所述根据所述移动用户数据和预先训练好的SEIR模型,确定第一目标日期及之后所述SEIR模型对应的第一目标参数,包括:

S401、根据所述移动用户数据,确定初始历史日期下的第五目标参数;其中,所述初始历史日期下,潜伏者的数量和康复者的数量等于0。

S402、在将所述第五目标参数输入到预先训练好的SEIR模型后,根据所述SEIR模型输出的初始历史日期后一天的第一目标参数,确定初始历史日期后一天对应的第六目标参数,将所述初始历史日期后一天作为新的初始历史日期,将所述第六目标参数作为新的第五目标参数,返回在将所述第五目标参数输入到预先训练好的SEIR模型后,根据所述SEIR模型输出的初始历史日期后一天的第一目标参数,确定初始历史日期后一天对应的第六目标参数的步骤,直至达到第一截止条件,得到第一目标日期及之后所述SEIR模型对应的第一目标参数。

其中,在确定SEIR模型输出的初始历史日期后一天的第一目标参数后,根据SEIR模型输出的初始历史日期后一天的第一目标参数以及所述移动用户数据,确定所述初始历史日期后一天对应的第六目标参数。

第二、如图5所示,本申请实施例提供的人流扩散风险的预测方法,根据所述移动用户数据和预先训练好的SEIR模型,确定第二目标日期下各个目标区域中的所述SEIR模型对应的第二目标参数,还包括:

S501、针对每个目标区域,统计第二目标日期前一天在该目标区域停留过的第一移动用户数据,并根据所述第一移动用户数据对应的第一人群类型,确定第二目标日期前一天所述SEIR模型对应的第七目标参数。

本申请实施例中,第一移动用户数据对应的第一人群类型包括:每一个第一移动用户数据对应的用户匿名是属于易感者、潜伏者、感染者、康复者,基于此,确定第七目标参数,第七目标参数包括:第二目标日期前一天在该目标区域停留过的易感者的数量、潜伏者的数量、感染者的数量、康复者的数量。

其中,确定第二目标日期前一天在该目标区域停留过的第一移动用户数据对应的第一人群类型,包括:

1、针对每个目标区域,统计初始历史日期下在该目标区域停留过的第二移动用户数据,并根据所述第二移动用户数据对应的第二人群类型,确定初始历史日期下的第八目标参数;其中,所述初始历史日期下,潜伏者的数量和康复者的数量等于0;

2、在将所述第八目标参数输入到预先训练好的SEIR模型后,得到所述SEIR模型输出的初始历史日期后一天的第九目标参数;

3、根据所述第九目标参数、所述第八目标参数和所述第二移动用户数据对应的第二人群类型,确定初始历史日期后一天所述第二移动用户数据对应的第三人群类型;

4、根据所述第二移动用户数据对应的第三人群类型,统计初始历史日期后一天在该目标区域停留过的第三移动用户数据,将所述第三移动用户数据作为新的第二移动用户数据,返回根据所述第二移动用户数据对应的第二人群类型,确定初始历史日期下的第八目标参数的过程,直至达到第二截止条件,确定第二目标日期前一天在该目标区域停留过的第一移动用户数据对应的第一人群类型。

本申请实施例中,在SEIR模型输出的初始历史日期后一天的第九目标参数后,需要将真实的每条第二移动用户数据和第九目标参数匹配上,也即,确定初始历史日期后一天每一条第二移动用户数据的第三人群类型,即该第二移动用户数据是属于易感者、潜伏者、感染者、康复者,这样,可以通过更新的初始历史日期后一天每一条第二移动用户数据的第三人群类型继续下一天的目标参数的预测,直至确定第二目标日期前一天在该目标区域停留过的第一移动用户数据对应的第一人群类型。

S502、将所述第七目标参数输入到预先训练好的SEIR模型中,得到所述SEIR模型输出的第二目标日期下该目标区域的第二目标参数。

进一步的,本申请实施例提供的人流扩散风险的预测方法,所述根据所述第九目标参数、所述第八目标参数和所述第二移动用户数据对应的第二人群类型,确定初始历史日期后一天所述第二移动用户数据对应的第三人群类型,包括:

1、若所述第九目标参数中的第一感染者数量大于所述第八目标参数中的第二感染者数量,则根据所述第一感染者数量、所述第二感染者数量和所述第八目标参数中的第一潜伏者数量,确定初始历史日期后一天所述第二移动用户数据对应的第三人群类型。

如果感染者出现新增,则从原潜伏者中随机选取相应数量的个体并设置其在当天结束时的状态为感染者。

2、若所述第九目标参数中的第一康复者数量大于所述第八目标参数中的第二康复者数量,则根据所述第一康复者数量、所述第二康复者数量和所述第八目标参数中的第一感染者数量,更新所述初始历史日期后一天所述第二移动用户数据对应的第三人群类型。

如果康复者出现新增,则从原感染者中随机选取相应数量的个体并设置其在当天结束时的状态为康复者。

3、若所述第九目标参数中的第二潜伏者数量大于所述第八目标参数中的第一潜伏者数量,则根据所述第八目标参数中的第一易感者数量以及所述第二移动用户数据中各个易感者对应的感染权重值,更新所述初始历史日期后一天所述第二移动用户数据对应的第三人群类型。

如果潜伏者出现新增,则根据易感者个体被感染的权重大小

另外,本申请实施例提供的人流扩散风险的预测方法中,确定所述第二移动用户数据中各个易感者对应的感染权重值,包括:

根据所述第二移动用户数据中每个易感者的在该目标区域的停留时间以及每个易感者的用户属性,确定每个易感者对应的感染权重值。

本申请实施例中,易感者个体被感染的权重大小

进一步的,如图6所示,本申请实施例提供的人流扩散风险的预测方法中,所述预测方法还包括:

S601、响应针对图形用户界面上触发标识的第一控制操作,控制所述触发标识在图形用户界面上移动。

S602、当检测到所述触发标识悬浮在所述变化曲线上时,确定所述触发标识映射在所述变化曲线上的定位点,并确定所述定位点对应的目标数据。

S603、在所述图形用户界面上显示所述目标数据。

结合步骤601~步骤603,利用SEIR模型的马尔科夫链形式和参数最优值通过曲线图显示人流扩散风险时间发展态势,即易感者、潜伏者、感染者、康复者的人数随时间的变化,示意图如图1h所示。在交互设计方面,当用户将鼠标悬浮在曲线上的某一点时,会显示该点对应的横纵坐标值(即目标数据),比如,该目标数据为某一天对应的感染者的数量。

进一步的,本申请实施例提供的人流扩散风险的预测方法中,所述预测方法还包括:

响应针对图形用户界面的第二控制操作,确定当前的第一展示维度和待切换的第二展示维度,并将当前的第一展示维度切换为待切换的第二展示维度。

本申请实施例中,可以从粗粒度(即行政区的维度,比如,每个城市或者每个城市下的行政区)展示每天的第二目标参数(即易感者的数量、潜伏者的数量、感染者的数量、康复者的数量),也可以从细粒度(每个目标区域)展示每天的第二目标参数(即易感者的数量、潜伏者的数量、感染者的数量、康复者的数量),且用户可以通过第二控制操作,切换上述展示维度。可选的,第二控制操作可以为针对控件的选择操作,也可以是缩放滑动操作。

本申请实施例提供了上述人流扩散风险的预测方法,能够生成真实的移动用户数据,并基于真实的移动用户数据,进行时间和空间两个维度下人流扩散风险的预测,真实的反映了人流移动导致的流行病的扩散风险,提高了预测结果的真实性和准确性。

基于同一发明构思,本申请实施例中还提供了与人流扩散风险的预测方法对应的人流扩散风险的预测装置,由于本申请实施例中的装置解决问题的原理与本申请实施例上述人流扩散风险的预测方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。

参照图7所示,为本申请实施例提供的一种人流扩散风险的预测装置,所述预测装置包括:

生成模块701,用于根据地理数据和原始用户数据,生成每个目标区域内的移动用户数据;其中,所述原始用户数据至少包括移动定位数据和病例数据;所述移动用户数据至少包括:用户的停留区域、用户在所述停留区域的停留时间、用户是否为输入性病例的病例状态和输入性病例对应的感染日期;

第一确定模块702,用于根据所述移动用户数据和预先训练好的SEIR模型,确定第一目标日期及之后所述SEIR模型对应的第一目标参数,以及第二目标日期下各个目标区域中的所述SEIR模型对应的第二目标参数;其中,所述SEIR模型的目标参数至少包括四种人群类型分别对应的数量;所述四种人群类型包括:易感者、潜伏者、感染者和康复者;

第一显示模块703,用于在图形用户界面上显示所述第一目标日期及之后所述SEIR模型对应的第一目标参数的变化曲线,以及第二目标日期下各个目标区域中的所述SEIR模型对应的第二目标参数。

在一种可能的实施方式中,所述地理数据包括区域边界数据,每一个所述区域边界数据对应一目标区域;所述原始用户数据还包括人口普查数据;所述生成模块701根据地理数据和原始用户数据,生成每个目标区域内的移动用户数据,包括:

根据所述移动定位数据和所述区域边界数据,确定所述移动定位数据中的每个用户在每个所述目标区域内的停留时间;

根据所述移动定位数据和所述人口普查数据,为所述移动定位数据中的每个用户分配用户属性;其中,所述用户属性包括以下至少之一:年龄、性别;

根据所述病例数据和每个用户对应的用户属性,确定所述移动定位数据中每个用户是否为输入性病例的病例状态和输入性病例对应的感染日期,得到每个目标区域内的移动用户数据。

在一种可能的实施方式中,所述地理数据还包括行政边界数据,每一个所述行政边界数据对应一行政区;所述预测装置还包括:

第二确定模块,用于根据所述行政边界数据和所述区域边界数据,确定每个所述目标区域所属的至少一个层级的行政区;其中,不同层级的行政区之间具有从属关系。

在一种可能的实施方式中,所述移动定位数据包括:用户标识、定位日期、定位时间和定位位置;所述生成模块701根据所述移动定位数据和所述区域边界数据,确定所述移动定位数据中的每个用户在每个所述目标区域内的停留时间,包括:

根据所述移动定位数据包括的定位日期,对所述移动定位数据进行排序,得到排序后的第一移动定位数据;

根据所述用户标识,从所述第一移动定位数据中获取每个用户在每个定位日期下的第二移动定位数据,并基于所述第二移动定位数据包括的定位时间,对所述第二移动定位数据进行排序,得到每个用户在每个定位日期下的第三移动定位数据;

针对每个用户在每个定位日期下的每一个第三移动定位数据,根据该第三移动定位数据中的定位位置,确定该定位位置对应的目标区域;

针对每个定位日期下的每个用户,若存在同一目标区域内的连续多条第三移动定位数据,则根据所述多条第三移动定位数据中的第一条第三移动定位数据和最后一条第三移动定位数据,确定该定位日期下该用户在该目标区域的停留时间。

在一种可能的实施方式中,所述人口普查数据包括:多个预设年龄阶段下不同性别的人口数量;所述生成模块701根据所述移动定位数据和所述人口普查数据,为所述移动定位数据中的每个用户分配用户属性,包括:

根据所述人口普查数据中每个年龄阶段的第一人口数量以及人口总数量,确定每个年龄阶段对应的第一比例;

根据所述移动定位数据对应的第一用户数量以及每个年龄阶段对应的第一比例,确定每个年龄阶段下的第二用户数量,并基于所述每个年龄阶段下的第二用户数量,为所述移动定位数据中的用户分配匹配年龄阶段的年龄属性;

根据所述人口普查数据中每个年龄阶段的第一人口数量以及该年龄阶段各个性别下的第二人口数量,确定该年龄阶段下各个性别对应的第二比例;

根据每个年龄阶段下各个性别对应的第二比例,为所述移动定位数据中该年龄阶段下的用户分配性别属性。

在一种可能的实施方式中,所述病例数据至少包括:病例用户属性、病例家庭住址、病例状态和感染日期;所述生成模块701根据所述病例数据和每个用户对应的用户属性,确定所述移动定位数据中每个用户是否为输入性病例的病例状态和输入性病例对应的感染日期,得到每个目标区域内的移动用户数据,包括:

针对每一条病例数据,根据该条病例数据中的病例家庭住址,确定该条病例数据对应的第一目标区域;

获取所述第一目标区域对应的第一用户标识;

根据所述病例数据中的病例用户属性以及每个第一用户标识在所述第一目标区域的停留时间,从所述第一用户标识中选取第二用户标识;

根据所述病例数据中的病例状态和感染日期,确定所述第二用户标识为输入性病例以及所述输入性病例对应的感染日期。

在一种可能的实施方式中,所述病例数据还包括近期旅居史;其中,所述预测装置还包括:

判断模块,用于针对每一个病例数据,判断该病例数据中的近期旅居史是否与第二目标区域相一致;

第三确定模块,用于若该病例数据中的近期旅居史与第二目标区域不一致,则确定该病例数据为输入性病例;若该病例数据中的近期旅居史与第二目标区域相一致,确定该病例数据为本地感染病例。

在一种可能的实施方式中,所述预测装置还包括:

统计模块,用于根据所述病例数据,统计历史时间段内每一个历史日期下的第一感染人数;

第四确定模块,用于根据所述移动用户数据和每一个历史日期下的第一感染人数,确定每一个历史日期下对应于所述SEIR模型的第三目标参数;

训练模块,用于将每一个历史日期下的第三目标参数输入到预设的SEIR模型中,得到所述SEIR模型输出的每一个历史日期后一天的第四目标参数;计算所述第四目标参数中的第二感染人数与所述每一个历史日期后一天的实际感染人数的损失函数,当所述损失函数满足预设条件,得到训练好的包括最优训练参数的SEIR模型;其中,所述训练参数包括:潜伏者转化成感染者的概率、感染者转化成康复者的概率、感染者转化成康复者的概率;所述SEIR模型的初始值中,潜伏者的数量和康复者的数量等于0。

在一种可能的实施方式中,所述第一确定模块702根据所述移动用户数据和预先训练好的SEIR模型,确定第一目标日期及之后所述SEIR模型对应的第一目标参数,包括:

根据所述移动用户数据,确定初始历史日期下的第五目标参数;其中,所述初始历史日期下,潜伏者的数量和康复者的数量等于0;

在将所述第五目标参数输入到预先训练好的SEIR模型后,根据所述SEIR模型输出的初始历史日期后一天的第一目标参数,确定初始历史日期后一天对应的第六目标参数,将所述初始历史日期后一天作为新的初始历史日期,将所述第六目标参数作为新的第五目标参数,返回在将所述第五目标参数输入到预先训练好的SEIR模型后,根据所述SEIR模型输出的初始历史日期后一天的第一目标参数,确定初始历史日期后一天对应的第六目标参数的步骤,直至达到第一截止条件,得到第一目标日期及之后所述SEIR模型对应的第一目标参数。

在一种可能的实施方式中,所述第一确定模块702根据所述SEIR模型输出的初始历史日期后一天的第一目标参数,确定初始历史日期后一天对应的第六目标参数,包括:

根据所述SEIR模型输出的初始历史日期后一天的第一目标参数以及所述移动用户数据,确定所述初始历史日期后一天对应的第六目标参数。

在一种可能的实施方式中,第一确定模块702根据所述移动用户数据和预先训练好的SEIR模型,确定第二目标日期下各个目标区域中的所述SEIR模型对应的第二目标参数,还包括:

针对每个目标区域,统计第二目标日期前一天在该目标区域停留过的第一移动用户数据,并根据所述第一移动用户数据对应的第一人群类型,确定第二目标日期前一天所述SEIR模型对应的第七目标参数;

将所述第七目标参数输入到预先训练好的SEIR模型中,得到所述SEIR模型输出的第二目标日期下该目标区域的第二目标参数。

在一种可能的实施方式中,第一确定模块702确定第二目标日期前一天在该目标区域停留过的第一移动用户数据对应的第一人群类型,包括:

针对每个目标区域,统计初始历史日期下在该目标区域停留过的第二移动用户数据,并根据所述第二移动用户数据对应的第二人群类型,确定初始历史日期下的第八目标参数;其中,所述初始历史日期下,潜伏者的数量和康复者的数量等于0;

在将所述第八目标参数输入到预先训练好的SEIR模型后,得到所述SEIR模型输出的初始历史日期后一天的第九目标参数;

根据所述第九目标参数、所述第八目标参数和所述第二移动用户数据对应的第二人群类型,确定初始历史日期后一天所述第二移动用户数据对应的第三人群类型;

根据所述第二移动用户数据对应的第三人群类型,统计初始历史日期后一天在该目标区域停留过的第三移动用户数据,将所述第三移动用户数据作为新的第二移动用户数据,返回根据所述第二移动用户数据对应的第二人群类型,确定初始历史日期下的第八目标参数的过程,直至达到第二截止条件,确定第二目标日期前一天在该目标区域停留过的第一移动用户数据对应的第一人群类型。

在一种可能的实施方式中,所述第一确定模块702根据所述第九目标参数、所述第八目标参数和所述第二移动用户数据对应的第二人群类型,确定初始历史日期后一天所述第二移动用户数据对应的第三人群类型,包括:

若所述第九目标参数中的第一感染者数量大于所述第八目标参数中的第二感染者数量,则根据所述第一感染者数量、所述第二感染者数量和所述第八目标参数中的第一潜伏者数量,确定初始历史日期后一天所述第二移动用户数据对应的第三人群类型;

若所述第九目标参数中的第一康复者数量大于所述第八目标参数中的第二康复者数量,则根据所述第一康复者数量、所述第二康复者数量和所述第八目标参数中的第一感染者数量,更新所述初始历史日期后一天所述第二移动用户数据对应的第三人群类型;

若所述第九目标参数中的第二潜伏者数量大于所述第八目标参数中的第一潜伏者数量,则根据所述第八目标参数中的第一易感者数量以及所述第二移动用户数据中各个易感者对应的感染权重值,更新所述初始历史日期后一天所述第二移动用户数据对应的第三人群类型。

在一种可能的实施方式中,第一确定模块702确定所述第二移动用户数据中各个易感者对应的感染权重值,包括:

根据所述第二移动用户数据中每个易感者的在该目标区域的停留时间以及每个易感者的用户属性,确定每个易感者对应的感染权重值。

在一种可能的实施方式中,所述预测装置还包括:

控制模块,用于响应针对图形用户界面上触发标识的第一控制操作,控制所述触发标识在图形用户界面上移动;

第五确定模块,用于当检测到所述触发标识悬浮在所述变化曲线上时,确定所述触发标识映射在所述变化曲线上的定位点,并确定所述定位点对应的目标数据;

第二显示模块,用于在所述图形用户界面上显示所述目标数据。

在一种可能的实施方式中,第一显示模块703在图形用户界面上显示第二目标日期下各个目标区域中的所述SEIR模型对应的第二目标参数,包括:

按照目标展示维度,在所述图形用户界面上显示第二目标日期下各个目标区域中的所述SEIR模型对应的第二目标参数;其中,所述目标展示维度包括:区域维度和行政维度。

在一种可能的实施方式中,所述预测装置还包括:

第六确定模块,用于响应针对图形用户界面的第二控制操作,确定当前的第一展示维度和待切换的第二展示维度;

切换模块,用于将当前的第一展示维度切换为待切换的第二展示维度。

本申请实施例提供了一种人流扩散风险的预测装置,能够生成真实的移动用户数据,并基于真实的移动用户数据,进行时间和空间两个维度下人流扩散风险的预测,真实的反映了人流移动导致的流行病的扩散风险,提高了预测结果的真实性和准确性。

如图8所示,本申请实施例提供的一种电子设备800,包括:处理器801、存储器802和总线,所述存储器802存储有所述处理器801可执行的机器可读指令,当电子设备运行时,所述处理器801与所述存储器802之间通过总线通信,所述处理器801执行所述机器可读指令,以执行如上述人流扩散风险的预测方法的步骤。

具体地,上述存储器802和处理器801能够为通用的存储器和处理器,这里不做具体限定,当处理器801运行存储器802存储的计算机程序时,能够执行上述人流扩散风险的预测方法。

对应于上述人流扩散风险的预测方法,本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述人流扩散风险的预测方法的步骤。

所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考方法实施例中的对应过程,本申请中不再赘述。在本申请所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或模块的间接耦合或通信连接,可以是电性,机械或其它的形式。

所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。

所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、ROM、RAM、磁碟或者光盘等各种可以存储程序代码的介质。

以上仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以权利要求的保护范围为准。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号