首页> 中国专利> 一种基于图计算的人员关系构建和分析方法

一种基于图计算的人员关系构建和分析方法

摘要

本发明公开了一种基于图计算的人员关系构建,第一步是关系数据的提取,通过整合内外数据,提炼出关系信息的最细粒度数据,存储到图数据库中;第二步是关系模型的构建,通过梳理关系类型,遍历图数据库中存储的顶点与边实现关系重组,形成关系模型。如前文背景技术提到的方式一,在关系模型中会转变为“该目标手机乘车前后N天(默认时间)的联系手机,该手机户主的身份证也有订该次车”。关系分析的灵活度的提高,由于引入了关系模型的概念,关系分析过程中可以灵活的调用一个或多个关系模型,通过传入不同的参数得到不同的关系分析结果。

著录项

  • 公开/公告号CN112749237A

    专利类型发明专利

  • 公开/公告日2021-05-04

    原文格式PDF

  • 申请/专利权人 广州金越软件技术有限公司;

    申请/专利号CN202011618324.3

  • 发明设计人 张天际;李继征;林嘉俊;

    申请日2020-12-30

  • 分类号G06F16/28(20190101);G06F16/901(20190101);

  • 代理机构

  • 代理人

  • 地址 510000 广东省广州市天河区高唐路235号7栋403单元

  • 入库时间 2023-06-19 10:51:07

说明书

技术领域

本发明涉及一种人员关系图谱构建和分析方法,具体是一种基于图计算的人员关系构建和分析方法。

背景技术

目前关系图谱构建和分析的方法,一般基于固定数据模型提取,以下对人员同车关系在基于固定数据模型的提取方式说明:

方式一:该目标手机乘车前后3天(默认时间)的联系手机,该手机户主的身份证也有订该次车;

方式二:该车次上与目标起始地相同的人员,其与目标同入住相同旅业;

方式三:除本次外,在3个月内(默认时间)与目标坐过同一趟车(同一航班)的人;

方式四:模糊查询方式,该车次上与目标起始地相同的人员,其身份证号码前六位与目标相同;

方式五:模糊查询方式,目标临近座位,起始地相同,且购票时间相近(如10分钟内)。

目前基于固定数据模型提取关系数据的方法,是通过将关系数据持久化,再对外提供查询服务的方法,很难支撑复杂多变的关系分析场景。比如方式一中,当需要把“乘车前后3天”换成“乘车前后5天”时,就需要对关系数据进行重新提取,造成大量的关系运算和存储开销;又比如方式三中,“在3个月内”换成“在1个月内”,同样存在关系数据需要重新生成的问题。

因此,本发明提供了一种基于图计算的人员关系构建和分析方法,以解决上述背景技术中提出的问题。

发明内容

针对目前方法的不足,本发明运用了图数据库在图运算的先天优势,将关系分析转换成图计算,基于深度优先遍历算法和广度优先遍历算法,将关系分析实时化,使得最终需要呈现的关系数据是通过图计算得到了,解决了关系数据持久化带来的分析受限问题。

为实现上述目的,本发明提供如下技术方案:

本方案采用百度开源的HugeGraph作为图数据库,HugeGraph是一款易用、高效、通用的开源图数据库系统(Graph Database,GitHub项目地址),实现了Apache TinkerPop3框架及完全兼容Gremlin查询语言,具备完善的工具链组件,助力用户轻松构建基于图数据库之上的应用和产品。

HugeGraph支持百亿以上的顶点和边快速导入,并提供毫秒级的关联关系查询能力 (OLTP),并可与Hadoop、Spark等大数据平台集成以进行离线分析(OLAP)。

一种基于图计算的人员关系构建,包括如下步骤:

一、关系数据的提取;

a)通过SparkSql从内外部系统数据库中,提取人员基本信息、轨迹信息、话单信息等,将人员、列车、酒店、手机号码等实体作为顶点,将事件或从属关系作为边,将关系型数据库转换为图数据文件,写入到分布式存储系统HDFS中;

b)借助HugeGraph提供的HugeGraph-Loader工具,将图数据文件导入到图数据库中。

二、关系模型的构建;通过SpringBoot+Vue+ElementsUi的前后端分离框架,前端通过Vue+ElementUI配置关系模型,后端通过SpringBoot开发的持久化接口实现关系模型的持久化。

对一种基于图计算的人员关系构建的模型的分析方法:

a)使用GoJS构建关系图谱的展现效果;

b)可以输入一个或多个人员的身份信息,根据输入条件自动选择深度遍历优先或广度遍历优先查询或分析人与人之间的关系;

c)支持关系的扩展,通过步骤(二)中构建的关系模型进行关系扩展,可以选取多个不同的关系模型形成一种组合分析条件,在分析过程中可以输入不同的参数得到不同的分析结果。

与现有技术相比,本发明的有益效果是:

1、存储开销和数据利用率的提高,关系数据是在图计算后实时产生的,所以不需要再次占用更多的存储空间;图数据库中存储的是最细粒度的基础信息和轨迹信息,不同的关系模型可以使用同一份图数据,数据的重复利用率很高。

2、关系分析的灵活度的提高,由于引入了关系模型的概念,关系分析过程中可以灵活的调用一个或多个关系模型,通过传入不同的参数得到不同的关系分析结果。

3、关系分析的时效性得到满足,关系分析过程是实时的图计算过程,分析结果可以即刻呈现,时效性高。

附图说明

图1为一种基于图计算的人员关系构建和分析方法。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示,一种基于图计算的人员关系构建,包括如下步骤:

一、关系数据的提取;

a)通过SparkSql从内外部系统数据库中,提取人员基本信息、轨迹信息、话单信息等,将人员、列车、酒店、手机号码等实体作为顶点,将事件或从属关系作为边,将关系型数据库转换为图数据文件,写入到分布式存储系统HDFS中;

b)借助HugeGraph提供的HugeGraph-Loader工具,将图数据文件导入到图数据库中。

二、关系模型的构建;通过SpringBoot+Vue+ElementsUi的前后端分离框架,前端通过Vue+ElementUI配置关系模型,后端通过SpringBoot开发的持久化接口实现关系模型的持久化。

对一种基于图计算的人员关系构建的模型的分析方法:

a)使用GoJS构建关系图谱的展现效果;

b)可以输入一个或多个人员的身份信息,根据输入条件自动选择深度遍历优先或广度遍历优先查询或分析人与人之间的关系;

c)支持关系的扩展,通过步骤(二)中构建的关系模型进行关系扩展,可以选取多个不同的关系模型形成一种组合分析条件,在分析过程中可以输入不同的参数得到不同的分析结果。

以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号