首页> 中国专利> 基于知识图谱的数据保存方法及知识图谱的构建方法

基于知识图谱的数据保存方法及知识图谱的构建方法

摘要

本发明涉及一种基于知识图谱的数据保存方法及知识图谱的构建方法,所述数据保存方法包括以下步骤:从图库中获取当前画布中已加载的节点和边数据,并备份,得到当前画布中展示的知识图谱的备份数据;根据用户对当前画布中展示的知识图谱的操作,更新所述备份数据;获取当前画布中展示的知识图谱中各个节点的位置信息,并保存。基于本发明的数据保存方法,可以实现局部知识图谱的保存,使得用户在构建新的知识图谱时,可以直接调用已经保存的局部知识图谱,极大地提高了知识图谱的构建效率。

著录项

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2020-08-14

    专利权质押合同登记的生效 IPC(主分类):G06F16/36 登记号:Y2020980004255 登记生效日:20200722 出质人:成都数联铭品科技有限公司 质权人:中国农业银行股份有限公司成都蜀都支行 发明名称:基于知识图谱的数据保存方法及知识图谱的构建方法 授权公告日:20200410 申请日:20200107

    专利权质押合同登记的生效、变更及注销

  • 2020-07-24

    专利权质押合同登记的注销 IPC(主分类):G06F16/36 授权公告日:20200410 登记号:Y2020980002850 出质人:成都数联铭品科技有限公司 质权人:中国农业银行股份有限公司成都蜀都支行 解除日:20200701 申请日:20200107

    专利权质押合同登记的生效、变更及注销

  • 2020-06-30

    专利权质押合同登记的生效 IPC(主分类):G06F16/36 登记号:Y2020980002850 登记生效日:20200608 出质人:成都数联铭品科技有限公司 质权人:中国农业银行股份有限公司成都蜀都支行 发明名称:基于知识图谱的数据保存方法及知识图谱的构建方法 授权公告日:20200410 申请日:20200107

    专利权质押合同登记的生效、变更及注销

  • 2020-04-10

    授权

    授权

  • 2020-03-13

    实质审查的生效 IPC(主分类):G06F16/36 申请日:20200107

    实质审查的生效

  • 2020-02-18

    公开

    公开

查看全部

说明书

技术领域

本发明涉及知识图谱技术领域,特别涉及一种基于知识图谱的数据保存方法。

背景技术

大数据是指海量的、高增长率和多样化的信息资产。如今,大数据的应用越来越多,电子商务、O2O、物流配送等,通过大数据分析,对于消费者行为的判断、产品销售量的预测、精确的营销范围以及存货的补给,都已经得到全面的改善与优化。随着大数据技术的发展,人们对于数据的要求不再局限于海量的传统数据,数据工作者及科学家开始着眼于探求数据更深层次的价值,知识图谱应运而生。

知识图谱(Knowledge Graph),在图书情报界称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,用可视化技术描述知识资源及其载体,挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。目前知识图谱的研发重心集中在如何更加做好数据可视化和如何实现更强大的图计算方法,为此,出现了很多具有标准定义的可视化图谱布局,比如层级布局、重力学布局、网格布局等,Pagerank、LPA等等经典图计算的支持使得图谱平台拥有了思考与计算的能力。这固然是知识图谱领域很重要的两方面技术,但是,知识的目的在于传播、复制、共享、协作,目前的知识图谱都是不同的应用者基于自己的应用独立构建,缺乏知识图谱的传播及共享性,继而导致知识图谱构建的效率低下。

发明内容

本发明的目的在于提供一种基于知识图谱的数据保存方法,以增强知识图谱的传播性及共享性,继而提高知识图谱的构建效率。

为了实现上述发明目的,本发明实施例提供了以下技术方案:

一种基于知识图谱的数据保存方法,包括以下步骤:

从图库中获取当前画布中已加载的节点和边数据,并备份,得到当前画布中展示的知识图谱的备份数据;

根据用户对当前画布中展示的知识图谱的操作,更新所述备份数据;

获取当前画布中展示的知识图谱中各个节点的位置信息,并保存。

上述方法中,通过对当前画布中展示的知识图谱的节点和边数据进行备份,并且同时记录用户的每一个操作,每一次更新后的备份数据即为用户每一次操作后得到的新的知识图谱所对应的数据,也就是说实现了将每一次操作后得到的新的知识图谱进行保存,使得以后可以直接调用存储的知识图谱,避免了再次重新构建,继而可以提高知识图谱的构建效率。

上述方法中,在更新所述备份数据之后,还包括:将当前画布中展示的知识图谱以图片格式进行保存。在另一方案中,还包括步骤:将当前画布中展示的知识图谱以缩略图的形式保存,并展示在显示设备的当前显示界面的展示栏中。

通过将每得到的一个新的知识图谱以图片格式进行存储,保存了知识图谱的外观,便于用户在调取时查看。

上述方法中,还包括步骤:当更新后的备份数据被调取时,从图库中获取对应的数据,并将所述更新后的备份数据与从图库中调取的数据进行校验,若不一致,则更新所述更新后的备份数据,使其与从图库中调取的数据保持一致。通过校验,使得图谱快照在保留用户操作的基础上与图库数据保持一致,避免前端出现异常节点或边而造成的报错。

上述方法中,还包括步骤:在校验结束之后还包括步骤:在当前画布中展示所述被调取的更新后的备份数据所对应的知识图谱,并根据用户对当前画布中展示的知识图谱的操作,更新所述被调取的更新后的备份数据。

另一方面,本发明实施例还提供了另一种实施方式的基于知识图谱的数据保存方法,包括以下步骤:

确定用户从当前画布所展示的知识图谱中所选择的部分节点和边;

从图库中获取用户所选择的部分节点和边对应的节点和边数据,并备份,得到备份数据;

根据用户对其所选择的部分节点和边的操作,更新所述备份数据;

获取用户所选择的所述部分节点的位置信息,并保存。

在上述方法中,是对用户选择的部分节点和边的数据进行保存,相当于对一个完整的知识图谱进行更小单元的划分,对每一个更小单元进行保存,使得其他用户在使用起来时更灵活,无需对一个更大单元(例如前述方法所保存的知识图谱)的知识图谱进行删除操作之后才能得到所想要的更小单元,进一步加快知识图谱的构建效率。

另一方面,本发明实施例提供了一种知识图谱的构建方法,包括以下步骤:

调取用户选择的知识图谱,并在当前画布中展示所述用户选择的知识图谱;所述用户选择的知识图谱由上述任一方法所保存得到;

接收用户对当前画布中展示的知识图谱的操作指令并执行,得到新的知识图谱。

再一方面,本发明实施例同时提供了一种包括计算机可读指令的计算机可读存储介质,所述计算机可读指令在被执行时使处理器执行本发明实施例中所述方法中的操作。

再一方面,本发明实施例同时提供了一种电子设备,包括:存储器,存储程序指令;处理器,与所述存储器相连接,执行存储器中的程序指令,实现本发明实施例中所述方法中的步骤。

与现有技术相比,本发明所提供数据保存方法,任何操作知识图谱的用户都可以方便的复用前人所操作过的图谱,无损的保留一切操作过程及计算过程,并可在此基础上继续进行进一步的操作与挖掘,极大地提高了知识图谱构建的效率,方便了用户操作。

附图说明

为了更清楚地说明本发明实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍, 应当理解,以下附图仅示出了本发明的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。

图1为实施例1中提供的基于知识图谱的数据保存方法的流程图。

图2为实施例1中提保存的知识图谱的缩略图展示在显示界面的示意图。

图3为实施例2中提供的基于知识图谱的数据保存方法的流程图。

图4a、图4b分别为实施例2中提及的知识图谱展示在显示界面的示意图。

图5为实施例中所述的电子设备的组成框图。

具体实施方式

下面将结合本发明实施例中附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本发明的实施例的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施例。基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

在阐述本发明方法之前,先对涉及的几个名词定义进行说明。

画布:展示图谱的视图区域。

边:是指两个点之间的那条连线,一条连线代表一种关系,如图4a中所示。

边数据:关系的属性值,例如起始节点,终止终止节点。

实施例1

图1为实施例中提供的基于知识图谱的数据保存方法的流程图,除了有明确的逻辑关系以外,各个步骤之间没有执行顺序的先后之分。

具体地,请参阅图1,本实施例中提供的基于知识图谱的数据保存方法,包括以下步骤:

S10,从图库中获取当前画布中已加载的节点和边数据,并备份,得到当前画布中展示的知识图谱的备份数据(json数据)。此处的备份数据单独存储,即不存储于图库中。

S20,根据用户对当前画布中展示的知识图谱的操作,更新所述备份数据。

此处所述的操作包括删除或添加节点,当删除或添加节点时,相应的节点和边数据就会发生改变,此时备份数据则相应改变,使得用户操作后所得到的新的知识图谱所对应的数据都能得到保存。此处的操作是指用户所做的每一个操作,例如删除一个节点,又例如再删除一个节点,用户的每一次操作过程都会被记录,对应的数据变化相应更新。

当用户删除或添加节点后,图库中的节点和边数据也会相应更新。本步骤中,通过对步骤S10中得到的备份数据进行更新,可以使得备份数据与图库中的数据保持一致,避免当调取保存的知识图谱时在前端出现异常节点或边而造成的报错。

图库保存的是知识图谱的全量数据,即整个知识图谱系统的所有节点和边数据,而上述方法中存储的备份数据为用户每一次操作后当前画布上所展示的知识图谱所对应的节点和边数据,相比于图库中的数据,可以理解为备份数据仅为局部知识图谱数据。通过保存用户每一次操作得到的知识图谱对应的节点和边数据,可以方便新用户在构建知识图谱时直接快速高效地调取该数据。

在更优化的方案中,上述方法还包括步骤S30:获取当前画布中展示的知识图谱中各个节点的位置信息,并保存。容易理解的,此处的位置信息是基于当前画布而言的,也就是基于预建的坐标系,记录并保存每个节点的位置坐标,以便于得到该知识图谱的结构。

在保存当前画布中(用户操作后得到的)知识图谱的节点和边数据时,同时保存该知识图谱中各个节点的位置信息,通过位置信息以及节点和边数据,就可以完整无损地在画布中展示出所保存的知识图谱,新用户在构建新的知识图谱时,可以直接调取出之前用户保存的图谱,进一步提高了新主视图谱的构建效率,方便了用户操作。

请继续参阅图1,在进一步完善的方案中,上述方法还包括步骤S40:将当前画布中展示的知识图谱以图片格式进行保存。或者,将当前画布中展示的知识图谱以缩略图的形式保存,并展示在显示设备的当前显示界面的展示栏中,例如图2所示。图2中,显示界面中下方所示图谱即为已经保存的知识图谱,上方所示知识图谱为当前画布中所展示的知识图谱。

对于新产生的知识图谱,不仅保存其节点和边数据,保存其各个节点的位置信息,还以图片形式保存其外形结构,方便于用户直观查看,使得用户可以更加快速地找出自己所需的现有知识图谱,继而更进一步地加快了新知识图谱的构建效率,也更加方便了用户操作。

当用户对当前画布中进行操作后,虽然备份数据和图库中的数据会同步更新,但是为了进一步保障两者数据的一致性,避免各种原因导致的数据不同步,在更优化的方案中,当已存储的知识图谱所对应的节点和边数据被调取时,同时从图库中获取对应(即同一知识图谱结构)的数据,并将两份数据进行校验,判断是否一致,若不一致,则更新所述已存储的知识图谱所对应的节点和边数据,使其与从图库中调取的数据保持一致。若一致,则不做处理。

若用户是基于图库中的数据构建知识图谱,则在步骤S10中是从图库中获取节点和边数据;若用户是在已经存储的知识图谱的基础上进一步操作,则用户选择所需的已存储的知识图谱后,调取出该知识图谱对应的节点和边数据,在当前画布中展示该知识图谱,并根据用户对当前画布中展示的知识图谱的操作,更新该知识图谱对应的节点和边数据。也就是说,记录用户每一次操作后所产生的知识图谱及其对应的节点和边数据,实现对画布中展示的知识图谱的保持。

通过上述数据保存方法,用户均可在前人已保存的知识图谱(可称为图谱快照)中进行任何操纵,操作过程均会被系统记录,并在下次使用之前进行图数据的校验。这个动态循环的过程,使得图谱快照成为一个可多人协同操作的工作流程,非常具有可传播,可复用,可协同的特点。

实施例2

本实施例中提供了另一种实施方式的数据保存方法。具体地,请参阅图3,本实施例中提供的基于知识图谱的数据保存方法包括以下步骤:

S100,确定用户从当前画布所展示的知识图谱中所选择的部分节点和边。如图4a所示,当用户需要对知识图谱中的部分节点和边进行保存时,通过勾选或圈选的方式选择需要保存的部分节点和边,如图4a圈中所示部分。

S200,从图库中获取用户所选择的部分节点和边对应的节点和边数据,并备份,得到备份数据。也就是实现对用户所选择的部分节点和边的数据进行保存,以便于在其他用户或者该用户下次使用时可以直接调取出该数据。

S300,获取用户所选择的所述部分节点的位置信息,并保存。也就是对用户选择的节点的位置信息进行存储,使得用户在使用时不仅可以调取相应的节点和边数据,还可以调取出位置信息,以便于在画布上直接再现所保存的局部知识图谱,即实现局部知识图谱的结构保存。

S400,将用户所选择的所述部分节点和边以缩略图或原图的形式保存。也就是将所选择的部分节点和边组成的结构外形进行保存,以便于用户在调用时可以直观查看。

上述方法实施了对用户所选择的部分节点和边的数据、结构和外形进行保存,当用户在其所选择的部分节点和边的基础上进行了进一步操作,例如删除其中某一个节点(如图4a和图4b所示),则此时也可以对操作后的部分节点和边进行的数据进行保存。即是说,上述方法还包括步骤:根据用户对其所选择的部分节点和边的操作,更新步骤S200所得到的备份数据。

同样地,为了保障备份数据与图库数据的一致性,当备份数据(也就是被保存的局部知识图谱)被调用时,也需要对该调取的数据进行校验。因此,上述方法还可以包括步骤:当步骤S200中所述备份数据或更新后的备份数据被调取时,从图库中获取对应的数据,并将所述备份数据或更新后的备份数据与从图库中调取的数据进行校验,若不一致,则更新所述备份数据或更新后的备份数据,使其与从图库中调取的数据保持一致。

同样的,当用户对调取的知识图谱进行操作时,也可以对用户操作后的知识图谱进行保存,因此,上述方法中,还可以包括步骤:在校验结束之后,在当前画布中展示被调取或调取后又更新(当调取的数据与图库数据不一致的情况)的数据所对应的知识图谱,并根据用户对当前画布中展示的知识图谱的操作,更新所述被调取或调取后又更新的数据。

实施例1中所述方法是对当前画布中所展示的知识图谱的全部节点和边数据、结构和外形进行保存,本实施例中所述方法是对画布中所展示的知识图谱的部分节点和边数据、结构和外形进行保存,基于相同的发明构思而实现,本实施例中未涉及之处还请参见实施例1中的相应描述。

实施例3

基于上述实施例1或实施例2所述的数据保存方法,可以实现一种新的知识图谱的构建方式,即:

调取用户选择的知识图谱,并在当前画布中展示所述用户选择的知识图谱;

接收用户对当前画布中展示的知识图谱的操作指令并执行,得到新的知识图谱。

用户在构建知识图谱时,在整个构建过程的任意环节都可以调用已存储的知识图谱,例如构建图谱的中间环节。此处仍然可以借助于图4a对新的图谱构建方法进行说明。

显示页面的下方显示有已存储的知识图谱,当用户已构建了部分知识图谱(如图4a所示画布中圈以外的图片结构)后需要调取已存储的知识图谱时,点击所需调取的知识图谱(例如图4a中所示显示页面下方的知识图谱,该知识图谱包含4个节点和3条边)后,即可从备份数据库中调取该知识图谱的节点、边数据和各个节点的位置信息,然后在当前画布中展示出由调取出的节点、边数据和位置信息组成的空间结构,如图4a中圈中所示结构。用户是要将调取的知识图谱与已构建的知识图谱进行组合,于是接收用户的拼接指令,将调取的知识图谱的相应节点与已构建的知识图谱的相应节点进行拼接,得到一个新的知识图谱,如图4a画布中所展示的结构。

如图5所示,本实施例同时提供了一种电子设备,该电子设备可以包括处理器51和存储器52,其中存储器52耦合至处理器51。值得注意的是,该图是示例性的,还可以使用其他类型的结构来补充或替代该结构,实现数据提取、报告生成、通信或其他功能。

如图5所示,该电子设备还可以包括:输入单元53、显示单元54和电源55。值得注意的是,该电子设备也并不是必须要包括图5中显示的所有部件。此外,电子设备还可以包括图5中没有示出的部件,可以参考现有技术。

处理器51有时也称控制器或操作控件,可以包括微处理器或其他处理器装置和/或逻辑装置,该处理器51接收输入并控制电子设备的各个部件的操作。

其中,存储器52例如可以是缓存器、闪存、硬驱、可移动介质、易失性存储器、非易失性存储器或其他合适装置中的一种或多种,可存储上述处理器51的配置信息、处理器51执行的指令、记录的表格数据等信息。处理器51可以执行存储器52存储的程序,以实现信息存储或处理等。在一个实施例中,存储器52中还包括缓冲存储器,即缓冲器,以存储中间信息。

本发明实施例还提供一种计算机可读指令,其中当在电子设备中执行所述指令时,所述程序使得电子设备执行本发明方法所包含的操作步骤。

本发明实施例还提供一种存储有计算机可读指令的存储介质,其中所述计算机可读指令使得电子设备执行本发明方法所包含的操作步骤。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的模块,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成模块及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

在本申请所提供的几个实施例中,应该理解到,所揭露的系统,可以通过其它的方式实现。例如,以上所描述的系统实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个模块或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。

以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号