首页> 中国专利> 自然资源知识图谱构建方法、装置、服务器及可读存储器

自然资源知识图谱构建方法、装置、服务器及可读存储器

摘要

本发明公开了自然资源知识图谱构建方法、装置、服务器及可读存储器,构建方法包括:针对自然资源领域构建数据模型,所述数据模型包括实体、属性、实体属性值、实体之间的时间关系、空间关系及业务关系;根据数据模型采集自然资源领域的资源数据形成三元组数据;根据三元组数据及预设的时空关联分析算法、业务关联分析算法构建自然资源知识图谱,解决了目前自然资源模型中各实体节点之间关联关系单一,在国土空间治理中无法实现对自然资源要素从多个维度进行全周期管理的技术问题。

著录项

  • 公开/公告号CN112612908A

    专利类型发明专利

  • 公开/公告日2021-04-06

    原文格式PDF

  • 申请/专利权人 上海云扣科技发展有限公司;

    申请/专利号CN202110006052.X

  • 发明设计人 程洋;张赛男;

    申请日2021-01-05

  • 分类号G06F16/36(20190101);G06F16/29(20190101);G06F16/28(20190101);

  • 代理机构32200 南京经纬专利商标代理有限公司;

  • 代理人朱小兵

  • 地址 200083 上海市虹口区广纪路173号1001-1007室161K

  • 入库时间 2023-06-19 10:29:05

说明书

技术领域

本发明涉及大数据技术领域,具体而言,涉及自然资源知识图谱构建方法、装置、服务器及可读存储器。

背景技术

传统的自然资源数据模型,主要是基于GIS的建模理论,将数据按照不同类型分层存储在数据库中,并在应用系统中采用图层叠加的方式进行表达,这种数据建模方法很好地实现了不同时间切片的现实世界的计算机数字化,但忽略了数据中自然资源要素不同时期和业务阶段的关联关系,为了弥补这种缺陷,现阶段自然资源领域主要是在业务事项办理过程中通过编码的串联来实现相关要素之间的关联,但这种关联属于典型的树状关联,忽略了自然资源要素对应的空间边界范围会在自然资源管理的各项业务过程中持续发生拆分合并等变化,且随着时间的推移,自然资源要素的边界、权属、状态也会发生变化,单纯的编码串联的形式难以满足国土空间治理中对自然资源要素基于时间变化和空间变化的全周期管理要求。

发明内容

为了解决目前自然资源模型中各数据之间关联关系单一,在国土空间治理中无法实现对自然资源要素从多个维度进行全周期管理的技术问题,本发明采用包含实体、属性、实体属性值、实体之间的时间关系、空间关系及业务关系的数据模型来限定自然资源领域的资源数据形成三元组数据的数据结构,结合预设的时空关联分析算法、业务关联分析算法进一步优化数据模型中的三元组数据,从而形成了自然资源知识图谱,本发明能很好弥补纯业务编码树状结构的不足,能够全面从时间、空间及业务三个维度展示自然资源中各实体节点的关联关系,实现了国土空间治理中对自然资源要素基于时间、空间及业务三个维度进行全周期管理要求。

为了实现以上目的,本发明采取的一种技术方案是:

一种自然资源知识图谱构建方法,包括:

针对自然资源领域构建数据模型,所述数据模型包括实体、属性、实体属性值、实体之间的时间关系、空间关系及业务关系;

根据数据模型采集自然资源领域的资源数据形成三元组数据;

根据三元组数据及预设的时空关联分析算法、业务关联分析算法构建自然资源知识图谱。

进一步地,针对自然资源领域构建数据模型,所述数据模型包括实体、属性、实体属性值、实体之间的时间关系、空间关系及业务关系,包括:

定义自然资源领域实体集合、实体属性集合、实体之间的关系集合,从而形成包括实体、属性、实体属性值、实体之间的时间关系、空间关系及业务关系的数据模型。

进一步地,根据数据模型采集自然资源领域的资源数据形成三元组数据,包括:

根据数据模型采集时间数据、空间资源数据及业务资源数据,所述时间资源数据、空间资源数据及业务资源数据经过预处理后形成实体-属性-实体属性值、实体-时间关系-实体、实体-空间关系-实体及实体-业务关系-实体三元组数据。

进一步地,所述时间资源数据、空间资源数据及业务资源数据经过预处理后形成实体-属性-实体属性值、实体-时间关系-实体、实体-空间关系-实及实体-业务关系-实体三元组数据,包括:

对时间资源数据、空间资源数据及业务资源数据进行数据统一化预处理后形成实体-属性-实体属性值、实体-时间关系-实体、实体-空间关系-实体及实体-业务关系-实体三元组数据。

进一步地,根据三元组数据及预设的时空关联分析算法、业务关联分析算法构建自然资源知识图谱,包括:

从三元组数据中抽取实体、属性、实体属性值作为自然资源知识图谱的实体节点、属性及实体节点属性值;

通过预设的时空关联分析算法确定实体节点之间的时间及空间关系:实体节点之间小于时间预设阈值的时间关系作为实体节点的时间关系、大于空间预设阈值的空间关系作为实体节点的空间关系,对于大于或者等于时间预设阈值的时间关系及小于或者等于空间预设阈值的空间关系采用数据向量化处理并预测时间及空间关系,并将预测时间及空间关系作为实体节点的时间及空间关系;

通过预设的业务关联分析算法确定实体节点之间的业务关系:实体节点之间满足采用最短路径的业务关系作为实体节点之间的业务关系;

根据所述实体节点、属性、实体节点属性值、实体节点的空间、时间及业务关系构建自然资源知识图谱。

进一步地,根据三元组数据及预设的时空关联分析算法、业务关联分析算法构建自然资源知识图谱后还包括进一步修正补偿所述自然资源知识图谱,所述进一步修正补偿操作包括:

对游离在自然资源知识图谱外的实体节点进行业务关系补偿,通过逐步增加预设的业务关联分析算法中的跳跃步长并结合最短路径将游离在自然资源知识图谱外的实体节点进行关联,所述跳跃步长依据自然资源的全业务周期中各业务阶段之间间隔映射;

对完成业务关系补偿后的自然资源知识图谱中的实体节点进行修正,采用实体节点属性值中的时间和空间数据联合判断已关联的实体节点之间的时间和空间关系的正确性来进行修正。

进一步地,所述自然资源知识图谱用于终端应用,所述实体节点、属性、实体节点属性值、实体节点之间的空间、时间及业务关系和地理信息等数据相结合以便进行时空动态展示;

所述终端还用于自然资源知识图谱中的实体节点、属性、实体节点属性值、实体节点之间的空间、时间及业务关系进行管理。

进一步地,通过预设的图谱规则比对算法,将一系列问题识别的方法转译为计算机能识别的规则,从而基于图谱进行空间和属性比对,实现自然资源数据问题的自动识别;

通过预设的图谱叠加分析算法,筛选出异常的实体节点,实现自然资源要素配置。

本发明还提供一种自然资源知识图谱构建装置,包括:

自然资源领域模型构建模块,用于对自然资源数据建模得到数据模型,所述数据模型包括实体、属性、实体属性值、实体之间的时间关系、空间关系及业务关系;

三元组数据构建模块,用于依据数据模型采集自然资源领域的资源数据形成三元组数据;

知识图谱构建模块,用于根据三元组数据及预设的时空关联分析算法、业务关联分析算法构建自然资源知识图谱。

本发明还提供一种服务器,包括存储器及处理器,所述存储器中储存有计算机程序,所述计算机程序被所述处理器执行时,使得所述处理器执行如上方法的步骤。

本发明还提供一种可读存储器,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上方法的步骤。

本发明的有益效果在于:本发明很好弥补纯业务编码树状结构的不足,不仅能对一个实体或概念的属性进行刻画,还能够基于时间、空间、业务等维度与其他实体或概念进行关联,最终形成一个巨大的网状来关联所有自然资源实体或概念的前世今生,解决了目前自然资源模型中各数据之间关联关系单一,在国土空间治理中无法实现对自然资源要素从多个维度进行全周期管理的技术问题。

附图说明

图1为一个实施例中的应用环境示意图;

图2为一个实施例中自然资源知识图谱构建的方法的流程图;

图3为图2中对自然资源领域构建数据模型的流程图;

图4为图2中根据三元组数据及预设的时空关联分析算法、业务关联分析算法构建自然资源知识图谱的流程图;

图5为一个实施例中进一步修正补偿建自然资源知识图谱的流程图;

图6为一个实施例中自然资源知识图谱构建装置的结构框图;

图7为图6中自然资源领域数据模型构建模块的结构框图;

图8为一个实施例中服务器的内部结构示意图;

图9为一个具体实施例中自然知识图谱的实例一;

图10为一个具体实施例中自然知识图谱的实例二。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明提供的自然资源知识图谱构建方法,可以应用于如图1所示的应用环境图中。该应用环境包括终端120及服务器140,终端120与服务器140之间通过网络进行连接,这里对终端120及服务器140的数量不做限制,网络包含但不限于:广域网、城域网或局域网。服务器140可以针对自然资源领域构建数据模型,所述数据模型包括实体、属性、实体属性值、实体之间的时间关系、空间关系及业务关系;根据数据模型采集自然资源领域的资源数据形成三元组数据;根据三元组数据及预设的时空关联分析算法、业务关联分析算法构建自然资源知识图谱。终端120可以获取用户输入的检索词条,将检索词条发送至服务器140,由服务器140根据检索词条从所构建的知识图谱中查找到相关的知识数据,并返回至终端120,终端120再将检索结果展示给用户。

图2为一个实施例中自然资源知识图谱构建方法的流程图,提供一种自然资源知识图谱构建方法,应用于服务器,包括步骤201至步骤203。

步骤201,针对自然资源领域构建数据模型,所述数据模型包括实体、属性、实体属性值、实体之间的时间关系、空间关系及业务关系;

其中,数据模型用于描述由一套对象类型(概念或者类)、属性及关系类型构成的自然世界,本发明定义了可以用于构成自然资源图谱的要素集合及数据结构,这些要素包含了实体、属性、实体属性值、实体之间的时间关系、空间关系及业务关系,事先定义要素集合可以有效去除噪声数据及保证要素的全面性,自然资源领域中的资源数据依据此数据模型中的要素集合及数据结构可以形成三元组数据,通过该数据模型中提供的引擎能够快速抽取出三元组数据构建自然资源知识图谱。

步骤202,根据数据模型采集自然资源领域的资源数据形成三元组数据;

其中,由于自然资源数据存在于不同的数据库或者纸质文件中,例如实体的时空数据一般存在于GIS地图软件中、实体的业务数据一般存在于业务支撑数据,例如:自然资源供应合同等,资源数据非常复杂庞大,因此依据步骤201中的数据模型进行有效筛选及存储,可以高效地形成三元组的结构数据,便于后期形成自然资源知识图谱。

步骤203,根据三元组数据及预设的时空关联分析算法、业务关联分析算法构建自然资源知识图谱。

其中,通过数据模型中提供的引擎能够快速抽取三元组数据,一般是通过将三元组中的实体、属性、实体属性值作为自然资源知识图谱的实体节点、属性及实体节点属性值,由于两个实体之间会存在多种业务关联因此不会将三元组中实体对应的业务关系直接作为实体节点之间的业务关系,需要将三元组数据结合业务关联分析算法来实现更加精确的业务关系关联;同样的,如果实体节点之间的时间跨度非常大,比如一块地的现状用地1980年是农用地,2011年是城镇建设用地——它们的时间关系超过了30年,直接关联着2个实体对业务的实际帮助不大,而通过“农转用”“土地供应”等业务关联更有实际价值;或者实体节点之间的空间距离非常大,这部分数据对自然资源的全周期管理意义不大,因此不会将三元组中实体对应的时间及空间关系直接作为实体节点之间的业务关系,需要将三元组数据结合时空关联分析算法来实现更合理的时间、空间关系及业务关系关联。

本实施例中,提供了一种自然资源知识图谱构建方法,通过针对自然资源领域构建数据模型,所述数据模型包括实体、属性、实体属性值、实体之间的时间关系、空间关系及业务关系;根据数据模型采集自然资源领域的资源数据形成三元组数据;根据三元组数据及预设的时空关联分析算法、业务关联分析算法构建自然资源知识图谱。相比较于传统的知识图谱仅包括实体节点、实体节点之间的单一关系、实体节点的属性值,本发明采用包含实体、属性、实体属性值、实体之间的时间关系、空间关系及业务关系的数据模型来限定自然资源领域的资源数据形成三元组数据的数据结构,结合预设的时空关联分析算法、业务关联分析算法进一步优化数据模型中的三元组数据,从而形成了自然资源知识图谱,因此能够全面从时间、空间及业务三个维度展示自然资源中各实体节点的关联关系,解决了目前自然资源模型中各数据之间关联关系单一的问题,实现了国土空间治理中对自然资源要素基于时间、空间及业务三个维度进行全周期管理要求。

在其中一个实施例中,如图3所示,步骤201,针对自然资源领域构建数据模型,所述数据模型包括实体、属性、实体属性值、实体之间的时间关系、空间关系及业务关系,包括:

步骤2011,定义自然资源领域实体集合;

具体地,自然资源领域实体对象是指自然资源业务领域内具有一定含义的内容,比如地块、项目、承建单位,或者法律法规涉及到的专有词汇等。实体对象的识别需要依托大量专业的自然资源业务领域知识,通常需要先由行业业务专家梳理一定数量的实体对象,再借助分词技术,过滤掉不可能为自然资源实体的部分,配合人工词性标注进行半监督实体识别,逐步训练实体识别模型,通过不断对行业数据和资料的分析、识别,扩充实体集合;

步骤2012,定义自然资源领域实体属性集合;

具体地,自然资源领域实体属性的定义是为每个实体构造属性值列表,具体的属性有多种分类,例如时间属性(属性值:项目审批日期)、地点属性(属性值:项目地址)、数量属性(属性值:建筑面积)、状态属性(属性值:项目开、竣工阶段)等,属性具有必选或可选、单值或多值、组合或派生等多种特性。属性依附于实体对象,因此一般先定义实体再定义属性及实体属性值,所述属性及实体属性值为实体在多维度的表达提供了更丰富的支持;

步骤2013,定义自然资源领域实体之间的关系集合;

具体地,实体之间的关系有多种分类,根据已经定义完成的实体集合及实体属性集合定义出实体之间的关系集合,例如业务关系(土地供应、土地审批)、时间关系(之后、之前)、空间关系(压盖、相邻、相同)。

步骤2014,形成包括实体、属性、实体属性值、实体之间的时间关系、空间关系及业务关系的数据模型。

其中,实体、属性、实体属性值、实体之间的时间关系、空间关系及业务关系在数据模型中数据结构一般为实体-属性-实体属性值、实体-时间关系-实体、实体-空间关系-实体及实体-业务关系-实体的三元组数据结构,从而形成完整的数据模型。

本实施例中,提供了一种针对自然资源领域构建数据模型的步骤,通过按照定义实体集合、实体属性集合、实体之间的关系集合的步骤来建立数据模型,数据结构一般为实体-属性-实体属性值、实体-时间关系-实体、实体-空间关系-实体及实体-业务关系-实体的三元组数据结构,因此按照该数据模型来采集自然资源数据时可形成了多维度的三元组数据,保证实现知识图谱的多维度展示。

在其中一个实施例中,根据数据模型采集自然资源领域的资源数据形成三元组数据,包括:

根据数据模型采集时间数据、空间资源数据及业务资源数据,所述时间资源数据、空间资源数据及业务资源数据经过预处理后形成实体-属性-实体属性值、实体-时间关系-实体、实体-空间关系-实体及实体-业务关系-实体三元组数据;所述时间资源数据、空间资源数据及业务资源数据经过预处理后形成实体-属性-实体属性值、实体-时间关系-实体、实体-空间关系-实体及实体-业务关系-实体三元组数据,包括:对时间资源数据、空间资源数据及业务资源数据进行数据统一化后形成实体-属性-实体属性值、实体-时间关系-实体、实体-空间关系-实体及实体-业务关系-实体三元组数据。

其中,空间数据本质上是一个多数据类型结构的结构体,它包含实体、属性及实体属性值、时间关系及空间关系,它由多种原子类型的属性组合而成,不同软件采集或处理的空间数据,会以不同的数据格式通过数据库或者文件方式进行存储,采集空间数据只需要通过对应软件提供的SDK或基于SQL的空间数据查询、分析库函数等,对这个结构体进行拆箱,便可从中提取出需要实体、属性及实体属性值、时间关系及空间关系,例如空间关系(实体1、空间位置关系、实体2),从而达到读取不同格式空间数据的目的。

自然资源管理业务范围包括自然资源的调查、规划、供应、登记、评价的全生命周期,每个阶段都有着相应的业务支撑数据(例如:自然资源供应合同),构成了庞大的自然资源业务数据体系。数据分为结构化数据和非结构化数据存储。针对不同的数据类型,编写不同的数据接口,并配合采取不同的数据抽取、加载、转换手段,保证有序采集需要的业务资源数据(如实体1、实体的审批业务关系、实体2)。

采集的时间数据、空间资源数据及业务资源数据有不同的数据包格式(如SHP、MDB、GDB等),数据的属性也存在定义不统一的情况(例如,同样表达名称的属性可能是“项目名称”,或“立项名称”等),所以采集的数据无法直接使用,而需要对其进行标准化处理之后才能进入后续的图谱构建流程,上述过程可称为预处理过程,此步骤针对不同来源的数据,通过定义统一的数据结构(例如:地理坐标系统、空间位置信息、业务名称等),依据数据转换映射处理得到具有统一结构的数,进一步通过动态计算引擎,从具有统一结构的数据中提取出需要的各类数据,并对数据进行名称、类型、格式上的对齐转换,从而得到完整、规范的数据。转换器提供多种表达式引擎用于动态执行表达式,如基于JS的Nashorn引擎,基于脚本的Groovy引擎,基于Spring的SPEL引擎,基于规则的Drools引擎等。

因此所述时间资源数据、空间资源数据及业务资源数据经过预处理后形成实体-属性-实体属性值、实体-时间关系-实体、实体-空间关系-实体及实体-业务关系-实体三元组数据,上述三元组数据可以用于构造自然资源知识图谱。

在其中一个实施例中,如图4所示,步骤203,根据三元组数据及预设的时空关联分析算法、业务关联分析算法构建自然资源知识图谱,包括:

步骤2031,从三元组数据中抽取实体、属性、实体属性值作为自然资源知识图谱的实体节点、属性及实体节点属性值;

其中,以某一地块作为实体对象为例,抽取三元组数据中与该地块存在时间、空间及业务关系的所有实体节点、属性以及实体节点属性值;

步骤2032,通过预设的时空关联分析算法确定实体节点之间的时间及空间关系:实体节点之间小于时间预设阈值的时间关系作为实体节点的时间关系、大于空间预设阈值的空间关系作为实体节点的空间关系,对于大于或者等于时间预设阈值的时间关系及小于或者等于空间预设阈值的空间关系采用数据向量化处理并预测时间及空间关系,并将预测时间及空间关系作为实体节点的时间及空间关系;

其中,为了准确观测某个自然资源的前世今生,以某一地块为例,在空间关系上一般采用相同位置、相邻或者压盖较多的情况进行关联即空间距离较短、时间上选择合理的全业务周期即时间周期较短,即采用时差作为时间预设阈值,空间压盖占比作为空间预设阈值,因此实体节点之间小于时间预设阈值的时间关系作为实体节点的时间关系、大于空间预设阈值的空间关系作为实体节点的空间关系,考虑到一些特殊情况的地块,对于大于或者等于时间预设阈值的时间关系及小于或者等于空间预设阈值的空间关系采用数据向量化处理并预测时间及空间关系,并将预测时间及空间关系作为实体节点的时间及空间关系;

步骤2033,通过预设的业务关联分析算法确定实体节点之间的业务关系:实体节点之间满足采用最短路径的业务关系作为实体节点之间的业务关系;

其中,由于两个实体节点之间会存在多种业务关联,因此不会将基于数据模型形成的三元组数据中实体对应的业务关系直接作为实体节点之间的业务关系,需要将三元组数据结合业务关联分析算法来实现更加精确的业务关系关联。

步骤2034,根据所述实体节点、属性、实体节点属性值、实体节点的空间、时间及业务关系构建自然资源知识图谱。

本实施例中给出了根据三元组数据及预设的时空关联分析算法、业务关联分析算法构建自然资源知识图谱的具体构造过程,大大提高了知识图谱构造的准确性,即提升了自然资源基于时间、空间及业务三个维度进行全周期管理的准确性。

在其中一个实施例中,如图5所示,根据三元组数据及预设的时空关联分析算法、业务关联分析算法构建自然资源知识图谱后还包括进一步修正补偿所述自然资源知识图谱,所述进一步修正补偿操作包括:

对游离在自然资源知识图谱外的实体节点进行业务关系补偿,通过逐步增加预设的业务关联分析算法中的跳跃步长并结合最短路径将游离在自然资源知识图谱外的实体节点进行关联,所述跳跃步长依据业务关系中全业务周期中各业务阶段之间的间隔映射,例如全业务周期一般包括批、供、用、补、查等业务阶段,其中批-供之间的间隔为1,批-用之间的间隔为2;

其中,在步骤2033中,实体节点之间的业务关系严格依据自然资源的全业务管理周期中的批、供、用、补、查步骤进行关联,此时跳跃步长为1,即存在批供、供用等业务关系的实体节点直接关联,但是不排除有一些特殊情况造成实体节点直接的跳跃步长超过1,造成了部分实体节点游离在自然资源知识图谱外,因此采用逐步增加预设的业务关联分析算法中的跳跃步长将实体节点之间进行关联,因则将跳跃步长设为2,例如存在批供关系的实体节点之间进行关联,重复上述步骤,直到全周期的业务链全部查找完毕,保证了自然资源知识图谱的整体完整性。

对完成业务关系补偿后的自然资源知识图谱中的实体节点进行修正,采用实体节点属性值中的时间和空间数据联合判断已关联的实体节点之间的时间和空间关系的正确性来进行修正;

其中,利用实体节点的时间及空间即属性值联合判定实体节点之间连接的准确性,因此保证了自然资源知识图谱的正确性。

所述自然资源知识图谱用于终端应用,所述实体节点、属性、实体节点属性值、实体节点之间的空间、时间及业务关系和地理信息等数据相结合以便进行时空动态展示;

其中,利用终端设备进行展示自然资源知识图谱,本发明中不对终端设备类型进行限制,再利用实体节点的地理信息等数据结合GIS软件动态展示实体节点例如地块之间的时空关系及业务关系,有助于人们可以把图谱中的实体节点和实际世界中的物进行联系,非常直观便于理解;

所述终端还用于自然资源知识图谱中的实体节点、属性、实体节点属性值、实体节点之间的空间、时间及业务关系进行管理。所述自然资源知识图谱模型提供可视化的构建管理接口,所述构建管理接口包含实体管理接口、实体属性管理接口及实体关系管理接口,所终端利用所述构建管理接口对实体节点、属性、实体节点属性值、实体节点之间的空间、时间及业务关系进行管理,所述管理一般包括定义及修改;

自然资源要素存在创建、拆分、合并、消亡等状态,对应到知识图谱中,即要求知识图谱实体节点也需要能够增加或删除。实体管理接口除了提供实体节点增加、删除、修改、查询等基础功能外,还提供了自动调整连接关系的功能,用于调整因自然资源要素拆分或合并涉及到空间位置变化而产生的空间连接关系改变。

自然资源要素会随着业务调整而发生属性信息的变更,如变更用地性质等。实体属性管理接口除了针对实体节点属性值进行增加、删除、修改、查询外,还提供了数据提取、类型转换、值转换的接口。

知识图谱中的连接关系均是自动计算或通过机器学习等手段计算得到,不可避免的会存在误差、少关联或多关联。知识图谱提供实体节点关系新增和删除管理接口,用于修正这些误差。此外,还提供预览接口,用于检查并核实修正后的成果。

所述终端设备可以调用实体管理接口、实体属性管理接口及实体关系管理接口实现对自然资源知识图谱中的实体节点、属性、实体节点属性值、实体节点之间的空间、时间及业务关系进行管理。

进一步地,通过预设的图谱规则比对算法,将一系列问题识别的方法转译为计算机能识别的规则,从而基于图谱进行空间和属性比对,实现自然资源数据问题的自动识别;

通过预设的图谱叠加分析算法,筛选出异常的实体节点,例如对实时用地、储备用地、新增建设用地、新增耕地、批而未供、供而未用、闲置低效、违法用地等自然资源要素的实现全方位的监测管理,实现自然资源要素配置。

在一个具体的实施例中,如图9所示,为某现状地块在全业务周期经历的各种变化的自然资源知识图谱模型,整个知识图谱由实体节点、属性、实体节点属性值、空间关系、时间关系、业务关系及属性关系要素组成,实体节点按照业务阶段可以分为现状地块、总规地块、控规地块、农转用地块、土地征收地块、土地储备红线、土地供应红线、低效用地再开发地块、建新地块、拆旧地块、规划用地红线、工程红线等;属性包括用地报批项目信息、农转用项目信息、低效用地项目信息、征地项目信息、建设项目信息、农整项目信息、工程项目信息、工程地块信息等;空间关系是按照空间位置判断将相关的实体节点进行关联;时间关系是通过将相同业务阶段的多个实体节点按照时间顺序进行关联;业务关系是通过业务阶段将业务上有关系的实体节点进行关联;属性关系是实体跟属性之间的关联。

在另一个实例中,如图10所示,为一个地块从2016年到2020年的知识图谱,该地块从时间及空间上来看,是由2016年的两块地(1块水浇地和1块水田)到2017年合并成一块农用地,水浇地和水田在空间上是相邻关系,2018年以后开始做了建设,所以此后都变成了城镇用地;从业务上看,2016年的水浇地和2016的水田和规划建设用地2016之间的业务关系为现状-规划的业务关系,即通过2016的规划把这个地块做建设用;规划建设用地2016和三个小地块(NZY2016-006112 2016、NZY2016-006165 2016、NZY2017-02735 2017)存在规划-报批的业务关系,即完成了该地块分了3个小地块的“农转用”报批手续;小地块(NZY2016-006112 2016)通过审批后变成了XL05-01-a地块,小地块(NZY2016-0061122016)和地块XL05-01-a之间的业务关系是批-供的关系,同样的两个小地块(NZY2016-006165 2016及NZY2017-02735 2017)合并进行审批通过后变成了XL05-01-b地块,小地块NZY2016-0061652016和XL05-01-b地块、小地块NZY2017-02735 2017和和XL05-01-b地块之间的业务关系均为批-供的关系,即完成了该地块的“土地供应”手续,但是该手续分了2步完成;小地块XL05-01-b及XL05-01-b与德信房产·辰欣之间的业务关系是供-用的业务关系,即完成了该地块的“用地许可”;德信房产·辰欣和德信房产·辰欣一期、德信房产·辰欣和德信房产·辰欣二期之间的业务关系是用地-工程,即完成了“工程许可”;就像前面说的,这个小区分开2期建房子;2020年,德信房产·辰欣二期和1#~4#之间的业务关系是工程-核实,即二期做了工程竣工核实,在图10中,一方面从时间空间的角度对地块进行展示,拆合、用地属性展示出地块的今生前世、从业务的维度展示了地块从农用地变成城镇用地的业务演变过程及现状,满足了国土空间治理中对自然资源要素基于时间、空间及业务三个维度进行全周期管理要求。

在其中一个实施例中,提供了一种自然资源知识图谱构建装置600,如图6所示,包括:

自然资源领域模型构建模块601,用于对自然资源数据建模得到数据模型,所述数据模型包括实体、属性、实体属性值、实体之间的时间关系、空间关系及业务关系;

三元组数据构建模块602,用于依据数据模型采集自然资源领域的资源数据形成三元组数据;

知识图谱构建模块603,用于根据三元组数据及预设的时空关联分析算法、业务关联分析算法构建自然资源知识图谱。

在其中一个实施例中,如图7所示,自然资源领域模型构建模块601,包括:

自然资源领域实体定义模块6011,用于定义自然资源领域实体集合;

自然资源领域实体属性模块6012,用于定义自然资源领域实体属性集合;

自然资源领域实体之间的关系定义模块6013,用于定义自然资源领域实体之间的关系集合;

数据模型生成模块6014,用于根据自然资源领域实体集合、数据模型生成模块6014,用于根据自然资源领域实体集合、实体属性集合、实体之间的关系集合生成数据模型,数据模型中包含了实体-属性-实体属性值、实体-时间关系-实体、实体-空间关系-实体及实体-业务关系-实体的三元组数据结构。

上述知识图谱构建装置中各个模块的划分仅用于举例说明,在其他实施例中,可将知识图谱构建装置按照需要划分为不同的模块,以完成上述知识图谱构建装置的全部或部分功能。

图8为一个实施例中服务器的内部结构示意图。如图8所示,该服务器包括通过系统总线连接的处理器和存储器。其中,该处理器用于提供计算和控制能力,支撑整个服务器的运行。存储器可包括非易失性存储介质及内存储器。非易失性存储介质存储有操作系统和计算机程序。该计算机程序可被处理器所执行,以用于实现以下各个实施例所提供的一种自然资源知识图谱构建方法。内存储器为非易失性存储介质中的操作系统计算机程序提供高速缓存的运行环境。该服务器可以是手机、平板电脑或者个人数字助理或穿戴式设备等。

本发明实施例中提供的知识图谱构建装置中的各个模块的实现可为计算机程序的形式。该计算机程序可在终端或服务器上运行。该计算机程序构成的程序模块可存储在终端或服务器的存储器上。该计算机程序被处理器执行时,实现本发明实施例中所描述方法的步骤。

本发明实施例还提供了一种计算机可读存储介质。一个或多个包含计算机可执行指令的非易失性计算机可读存储介质,当计算机可执行指令被一个或多个处理器执行时,使得处理器执行自然资源知识图谱构建方法的步骤。

一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行自然资源知识图谱构建方法。

本发明实施例所使用的对存储器、存储、数据库或其它介质的任何引用可包括非易失性和/或易失性存储器。合适的非易失性存储器可包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM),它用作外部高速缓冲存储器。作为说明而非局限,RAM以多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDR SDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)。

以上实施例仅表达了本发明的几种实施方式,其描述较为具体和详细但并不能因此而理解为对本申请专利范围的限制。对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号