法律状态公告日
法律状态信息
法律状态
2022-07-05
授权
发明专利权授予
技术领域
本发明涉及交通大数据挖掘与交通应急管理领域,尤其是涉及一种基于公共交通知识图谱的传染病接触目标追踪方法。
背景技术
公共交通工具和车站由于其相对封闭的空间和高客运量,成为病毒传播的关键模式。许多国家对公共交通实施各种控制措施,包括定期消毒、强制戴口罩、降低社交距离能力、改变运营时间表,甚至完全暂停服务。然而,相较于总体管控策略,及时发现和隔离感染个体的目标针对策略更加有效。而目前,如何从大规模非结构化出行数据中高效挖掘准确知识以缓解疾病方面仍然存在挑战。
在传染病学领域,通常采用人工接触者追踪,但对于大规模调查的应用手动跟踪效率低下,而具有固定路线和运行时间表的智能卡数据被认为有助于在公共交通系统中捕获接触者和追踪感染。以往研究通常使用关系数据库,但考虑到关系型数据库的数据结构,联系人存储在乘客对之间,因此不适用于直接表示实际的网络结构,并且可能导致在执行用于联系追踪的多个递归连接和查询时性能不佳。
知识图谱是近年来被广泛应用的技术,对高效构建高分辨率联系网络具有重要意义。知识图谱不同于传统的关系数据库,采用节点和边的形式存储数据,通常支持数百亿个节点和边的网络规模,能够直观地表示现实世界中的任何事物,并从理论上构建一个语义丰富的网络。
发明内容
本发明的目的就是为了克服上述现有技术存在的关系数据库在执行用于联系追踪的多个递归连接和查询时性能不佳的缺陷而提供一种基于公共交通知识图谱的传染病接触目标追踪方法。
本发明的目的可以通过以下技术方案来实现:
一种基于公共交通知识图谱的传染病接触目标追踪方法,具体包括以下步骤:
S1、采用自上而下与自下而上结合的构建方式,基于出行链模型构建公交知识图谱;
S2、获取多个乘客的出行数据,根据公交知识图谱确定乘客的出行顺序,并确定乘客之间的传染病接触类型;
S3、提取多个乘客的出行数据中感染者的出行数据,并进行标记,选取预设比例的感染者进行追踪,根据乘客之间的传染病接触类型,定位交通系统中的二次感染个体。
所述公交知识图谱中将本体作为模式层,对应的数据映射为实体和关系。
进一步地,所述公交知识图谱从乘客的出行数据中提取实体和关系,并作为数据层导入图形数据库。
所述步骤S1中构建公交知识图谱的过程还包括整合从智能卡、自动车辆定位(AVL)设备、班次记录以及公共汽车、快速公交(BRT)和地铁系统的路线单中收集的多源数据。
所述步骤S2中公交知识图谱简化为边图G=(V,E),对应的节点V
节点V
其中,E
进一步地,所述乘客的出行顺序中若出行三次,对应的表示关系如下所示:
其中,T
进一步地,所述乘客的出行顺序中第一次旅行
其中,
对于连续出行链(即连续乘车)两端的行程,综合关系由上下文表示,具体如下所示:
其中,transfer=1表示乘客在行程中换乘一次。
所述乘客之间的传染病接触类型包括直接接触和间接接触,具体关系如下所示:
其中,V
进一步地,所述直接接触包括共同乘车和共同候车,表示关系如下:
其中,E
进一步地,两名乘客乘坐同一辆公共交通工具定义为共同乘车,判定公式如下所示:
其中,,j,k∈{1,2},j≠k,E
两名乘客在预设的候车时间间隔阈值内在同一车站上车,则定义为共同候车,判定公式如下所示:
其中,E
出行顺序中存在直接接触和间接接触的出行联系如下所示:
其中,E
所述步骤S3中将公交知识图谱中所有感染者所在的节点标记为“感染”,选择预设比例的感染者的节点作为索引病例,标记为“索引”,根据乘客之间的传染病接触类型进行追踪,若有其他乘客所在的节点被搜索到,则被标记为“选中”,同时也被标记为“发现”,其他节点被标记为“未选中”。
与现有技术相比,本发明具有以下有益效果:
本发明通过利用出行链模型,整合基于智能卡和公共交通系统的多源数据,基于公共交通图谱重建一个语义丰富的公共交通系统的接触网络,从构建的知识图中提取有针对性的简化联系网络,减少数据冗余,并有利于数据扩展,基于个体接触特征的感染风险预测模型来模拟接触网络中的疫情传播,基于已经检测到的病例有效定位交通系统中的二次感染个体,支持有效的疫情传播建模和有效的数字接触追踪,有效提高了存在多个场景转换和递归查询时判断传染病接触目标的准确性,在大规模联系网络中实现有效且快速的追踪。
附图说明
图1为本发明的流程示意图;
图2为本发明实施例中数字接触追踪的示意图,其中图2(a)~图2(e)为从索引节点追踪感染者以及确定密切接触者的示意图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
实施例
如图1所示,一种基于公共交通知识图谱的传染病接触目标追踪方法,具体包括以下步骤:
S1、采用自上而下与自下而上结合的构建方式,基于出行链模型构建公交知识图谱;
S2、获取多个乘客的出行数据,根据公交知识图谱确定乘客的出行顺序,并确定乘客之间的传染病接触类型;
S3、提取多个乘客的出行数据中感染者的出行数据,并进行标记,选取预设比例的感染者进行追踪,根据乘客之间的传染病接触类型,定位交通系统中的二次感染个体。
公交知识图谱中将本体作为模式层,对应的数据映射为实体和关系。
公交知识图谱从乘客的出行数据中提取实体和关系,并作为数据层导入图形数据库。
步骤S1中构建公交知识图谱的过程还包括整合从智能卡、自动车辆定位(AVL)设备、班次记录以及公共汽车、快速公交(BRT)和地铁系统的路线单中收集的多源数据。
步骤S2中公交知识图谱简化为边图G=(V,E),对应的节点V
节点V
其中,E
乘客的出行顺序中若出行三次,对应的表示关系如下所示:
其中,T
乘客的出行顺序中第一次旅行
其中,
对于连续出行链(即连续乘车)两端的行程,综合关系由上下文表示,具体如下所示:
其中,transfer=1表示乘客在行程中换乘一次。
乘客之间的传染病接触类型包括直接接触和间接接触,具体关系如下所示:
其中,V
直接接触包括共同乘车和共同候车,表示关系如下:
其中,E
两名乘客乘坐同一辆公共交通工具定义为共同乘车,判定公式如下所示:
其中,,j,k∈{1,2},j≠k,E
两名乘客在预设的候车时间间隔阈值内在同一车站上车,则定义为共同候车,判定公式如下所示:
其中,E
出行顺序中存在直接接触和间接接触的出行联系如下所示:
其中,E
步骤S3中将公交知识图谱中所有感染者所在的节点标记为“感染”,选择预设比例的感染者的节点作为索引病例,标记为“索引”,根据乘客之间的传染病接触类型进行追踪,若有其他乘客所在的节点被搜索到,则被标记为“选中”,同时也被标记为“发现”,其他节点被标记为“未选中”。
基于知识图谱的数字接触追踪算法:
此外,需要说明的是,本说明书中所描述的具体实施例,所取名称可以不同,本说明书中所描述的以上内容仅仅是对本发明结构所做的举例说明。凡依据本发明构思的构造、特征及原理所做的等效变化或者简单变化,均包括于本发明的保护范围内。本发明所属技术领域的技术人员可以对所描述的具体实例做各种各样的修改或补充或采用类似的方法,只要不偏离本发明的结构或者超越本权利要求书所定义的范围,均应属于本发明的保护范围。