首页> 中国专利> 一种企业基因测序系统及方法

一种企业基因测序系统及方法

摘要

本发明属于企业基因测序技术领域,提供了一种企业基因测序系统及方法,其中,方法包括:S101:采集企业相关数据;S102:建立企业基因图谱;S103:对已形成的知识图谱进行标准化处理;S104:数据映射;系统包括:数据采集模块、数据存储模块、数据修改模块、数据计算模块和数据输出模块。本发明的一种企业基因测序系统及方法,通过抽取企业相关数据中的实体、属性和值三元组,形成知识图谱,在多个知识图谱之间建立连接关系,从而得到企业的股权结构,为查找线索和破解经济犯罪提供便利。

著录项

  • 公开/公告号CN112633889A

    专利类型发明专利

  • 公开/公告日2021-04-09

    原文格式PDF

  • 申请/专利权人 中科金审(北京)科技有限公司;

    申请/专利号CN202011258558.1

  • 发明设计人 邓昌智;孙桂川;

    申请日2020-11-12

  • 分类号G06Q20/40(20120101);G06F16/36(20190101);G16B30/00(20190101);

  • 代理机构50219 重庆百润洪知识产权代理有限公司;

  • 代理人陈万江

  • 地址 100081 北京市海淀区学院南路62号中关村资本大厦3层301

  • 入库时间 2023-06-19 10:32:14

说明书

技术领域

本发明涉及企业基因测序技术领域,具体涉及一种企业基因测序系统及方法及系统。

背景技术

公司股权结构是开展公司控制关系调査的“DNA”。特别是,如何准确发现公司隐性股权结构这一“隐性基因”,有效穿透人为设置的层层嵌套,精准测序股权控制网络结构,是至关重要的问题。

发明内容

针对现有技术中的缺陷,本发明提供的一种企业基因测序系统及方法,有效获取企业的股权结构,为查找线索和破解经济犯罪提供便利。

为了解决上述技术问题,本发明提供以下技术方案:

一种企业基因测序方法,包括以下步骤:

S101:采集企业相关数据;

S102:建立企业基因图谱:将企业相关数据经过数据清洗后分别抽取数据中的实体、属性和值三元组,形成知识图谱;

S103:对已形成的知识图谱进行标准化处理:剪掉知识图谱中的冗余数据和噪声数据,对实体进行补全和对齐,形成知识图谱的标准形式;

S104:数据映射:将存在关联关系的实体之间建立连接关系,形成扩展知识图谱。

进一步地,所述步骤S102中将实体、属性和值三元组形成知识图谱的过程包括以下步骤:

S10201:定义实体:首先,添加点的类型信息和属性信息,然后,对属性信息进行编辑,配置属性的英文名称、中文名称、数据类型、数值以及主键设置;

S10202:定义链接:添加链接的中文名称、英文名称、源节点、目标节点以及链接的类型信息。

进一步地,所述步骤S104中数据映射的过程包括以下步骤:

S10401:对比两个知识图谱中点的信息进行对比,如果点的主键对比一致,进行步骤S10402;如果点的信息对比不一致,说明两个知识图谱之间不存在关联关系;

S10402:删除一个知识图谱中的点,保留该知识谱图中与点相关联的链接,并将该知识谱图中与点相关联的链接与另一个知识图谱中的点关联;

S10403:将新增的链接类型信息添加到点的属性信息中,形成扩展知识图谱;

S10404:根据筛选条件对扩展知识图谱进行筛选,得到目标知识图谱。

进一步地,所述点的类型信息包括人、公司、邮箱、手机、银行卡、火车、航班、城市。地址、酒店和银行,链接的类型信息包括法人、股东、任职、报税人、财务负责人、实控人、关系、乘坐飞机、乘坐汽车、入住、现住址、户籍地、籍贯、持有手机号、登记邮箱、持有卡、登记手机号、注册所在地、登记邮箱号、卡户账号、分支机构、股东、隶属、交易、位于1、位于2和开户行。

本发明还提供一种企业基因测序方法,包括数据采集模块、数据存储模块、数据修改模块、数据计算模块和数据输出模块,

所述数据采集模块用于采集企业相关数据;

所述数据存储模块用于将采集的企业相关数据进行数据清洗,抽取实体、属性和值三元组形成知识图谱,然后,剪掉知识图谱中的冗余数据和噪声数据,对实体进行补全和对齐,形成知识图谱的标准形式;

所述数据计算模块用于将存在关联关系的实体之间建立连接关系,形成知识图谱;

所述数据修改模块用于对点和链接进行新增、修改或删除,并编辑点的类型信息、属性信息以及链接的类型信息;

所述输出模块用于以拓扑图的形式展示知识图谱之间的连接关系。

由上述技术方案可知,本发明的有益效果:通过抽取企业相关数据中的实体、属性和值三元组,形成知识图谱,在多个知识图谱之间建立连接关系,从而得到企业的股权结构,为查找线索和破解经济犯罪提供便利。

附图说明

为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。

图1为本发明的流程图;

图2为本发明步骤S102中将实体、属性和值三元组形成知识图谱的流程图;

图3为本发明步骤S104中数据映射的流程图;

图4为本发明的股权结构图谱;

图5为本发明的人员关系图谱;

图6为本发明的人企穿透图谱;

图7为本发明的资金关系图谱;

图8为本发明的实际控制人图谱;

图9本发明的系统模块图。

具体实施方式

下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只作为示例,而不能以此来限制本发明的保护范围。

参阅图1所示,本实施例提供的一种企业基因测序方法,包括以下步骤:

S101:采集企业相关数据,企业的相关数据包括公司成立时间地点、主营业务、股权结构;公司重组事项、并购事项、业务转型事项;总资产、净利润、负债情况等财务指标;有无重大诉讼、仲裁、行政刑事案件、担保、关联交易等资产质量指标;银行资金信息:人员基本信息、账户基本信息、公司银行交易明细信息、贷款信息;警务信息:全国银行核查、民航订票、民航离岗、出入境记录、全国铁路售票、旅馆住宿、出入境证件、全国驾驶人证件、全国机动车违章信息、人员关系、轨迹信息;媒体热点信息:失信被执行信息、公告信息、资产重组信息、重大合同信息、股东转移信息;

S102:建立企业基因图谱:将企业相关数据经过数据清洗后分别抽取数据中的实体、属性和值三元组,形成知识图谱;

S103:对已形成的知识图谱进行标准化处理:剪掉知识图谱中的冗余数据和噪声数据,避免冗余数据和噪声数据对实体关联的影响,对实体进行补全和对齐,形成知识图谱的标准形式,避免多个知识图谱之间的实体信息和属性信息的表达不一致,导致不能成功匹配,影响企业股权结构的正确剖析;

S104:数据映射:将存在关联关系的实体之间建立连接关系,形成扩展知识图谱。

在实际使用中,通过抽取企业相关数据中的实体、属性和值三元组,形成知识图谱,在多个知识图谱之间建立连接关系,从而得到企业的股权结构,为查找线索和破解经济犯罪提供便利。

参与图2所示,所述步骤S102中将实体、属性和值三元组形成知识图谱的过程包括以下步骤:

S10201:定义实体:首先,添加点的类型信息和属性信息,然后,对属性信息进行编辑,配置属性的英文名称、中文名称、数据类型、数值以及主键设置;

S10202:定义链接:添加链接的中文名称、英文名称、源节点、目标节点以及链接的类型信息。

在实际使用中,通过在链接上设置和修改源节点和目标节点信息,将原本独立的多个实体关联起来,能够清晰显示实体之间的关联关系,例如,实体之间的控股信息、交易金额、出现在同一地点的次数等。

参阅图3所示,所述步骤S104中数据映射的过程包括以下步骤:

S10401:对比两个知识图谱中点的信息进行对比,如果点的主键对比一致,进行步骤S10402;如果点的信息对比不一致,说明两个知识图谱之间不存在关联关系;

S10402:删除一个知识图谱中的点,保留该知识谱图中与点相关联的链接,并将该知识谱图中与点相关联的链接与另一个知识图谱中的点关联;

S10403:将新增的链接类型信息添加到点的属性信息中,形成扩展知识图谱;

S10404:根据筛选条件对扩展知识图谱进行筛选,得到目标知识图谱。

在实际使用中,点的主键是唯一标识实体的编号,通过将点的主键之间对比,保证了实体之间对比的准确性,然后,删除多余实体同时保留实体相关联的链接,增加了实体的属性信息,扩大了知识图谱的范围,使知识图谱包含多维信息数据,并简明地体现出实体间的关系要素。

根据企业基本信息和股东的基本信息构建知识图谱的过程:首先,增加公司节点和股东人员节点,然后,判断股东人员与公司之间是否存在控股关系,如果存在控股关系,在股东人员和公司之间添加链接,同时,根据股东人员与公司人员之间的控股股份确定固定的控股类型,最后,得到如图4所示的股权结构图谱,其中,占100%股权的为“全资控股型“、占50%以上的为“绝对控股型”、占10%-50%的为“相对控股型”、占10%以下的为“股权高度分散型”;

根据股东人员信息和行为轨迹信息构建知识图谱的过程:首先,增加股东人员节点,然后,判断股东之间是否有同航班、同火车或同酒店信息,如果有,在两个股东之间添加链接,最后,统计同航班、同火车或同酒店的次数,得到如图5所示的人员关系图谱;

根据公司法人信息和成员信息构建知识图谱的过程:首先,增加公司节点和成员节点,如果成员与企业之间存在职务关系,在企业节点和成员节点之间添加链接,最后形成如图6所示的人气穿透图谱;

根据公司及人员的资金交易构建知识图谱的过程:首先,增加公司节点和成员节点,如果公司与人员之间存在交易信息,在公司与人员之间添加链接,并根据交易的出入账户确定链接的源节点和目标节点,最后形成如图7所示的资金关系图谱;

基于股权结构图谱、人员关系图谱、人企穿透图谱和资金关系图谱,根据公司与公司、人员与公司、人员与人员之间存在相同的实体以及实体间的关联关系构建扩展知识图谱,根据筛选条件包括公司与公司之间的关系,例如投资关系、资金关系、同注册地址、同注册电话和同法人,公司与人员之间的关系,例如,资金关系、法人、股东和董监高,人员与人员之间关系,例如,资金关系、同公司、同住、同行和同户籍对扩展知识图谱进行筛选,最终获取的公司的实际控制人,如图8所示。

如表1所示,所述点的类型信息包括人、公司、邮箱、手机、银行卡、火车、航班、城市。地址、酒店和银行,链接的类型信息包括法人、股东、任职、报税人、财务负责人、实控人、关系、乘坐飞机、乘坐汽车、入住、现住址、户籍地、籍贯、持有手机号、登记邮箱、持有卡、登记手机号、注册所在地、登记邮箱号、卡户账号、分支机构、股东、隶属、交易、位于1、位于2和开户行,在备注列对链接的源节点和目标节点进行指示和定义。

参阅图9所示,一种企业基因测序方法,包括数据采集模块、数据存储模块、数据修改模块、数据计算模块和数据输出模块,

所述数据采集模块用于采集企业相关数据;

所述数据存储模块用于将采集的企业相关数据进行数据清洗,抽取实体、属性和值三元组形成知识图谱,然后,剪掉知识图谱中的冗余数据和噪声数据,对实体进行补全和对齐,形成知识图谱的标准形式;

所述数据计算模块用于将存在关联关系的实体之间建立连接关系,形成知识图谱;

所述数据修改模块用于对点和链接进行新增、修改或删除,并编辑点的类型信息、属性信息以及链接的类型信息;

所述输出模块用于以拓扑图的形式展示知识图谱之间的连接关系。

在实际使用中,通过将采集的企业数据进行数据清洗,提高数据的有效性和完整性,抽取实体、属性和值三元组形成知识图谱,然后,去掉冗余数据和噪声数据,避免大量的冗余数据增加数据存储模块的处理负荷,降低数据存储模块的处理速度,同时补全实体信息,使实体信息的含义具有一致性,便于后期进行多个知识图谱之间的关联,提高关联的准确性,有利于快速形成企业的股权结构,为查找线索和破解经济犯罪提供便利。

最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围,其均应涵盖在本发明的权利要求和说明书的范围当中。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号