首页> 中国专利> 知识卡片的构建方法及装置

知识卡片的构建方法及装置

摘要

本发明提供了知识卡片的构建方法及装置,该方法包括:从原始数据库中获取至少一条原始数据;针对至少一条原始数据中的每一条原始数据,确定当前原始数据的至少一个第一三元组信息,其中,每一个第一三元组信息中包含两个实体、两个实体之间的关系或者实体属性信息;根据第一三元组信息,生成待构建知识图谱的本体库;根据待构建知识图谱的本体库,生成待构建知识图谱;根据待构建知识图谱,生成待构建知识卡片;当监测到原始数据库中存在一条新增原始数据时,确定新增原始数据的至少一个新增第一三元组信息,更新本体库;根据更新后的本体库,更新待构建知识卡片。本方案能够提高知识卡片构建的智能化程度。

著录项

  • 公开/公告号CN112905612A

    专利类型发明专利

  • 公开/公告日2021-06-04

    原文格式PDF

  • 申请/专利权人 北京机电工程研究所;

    申请/专利号CN202110167514.6

  • 申请日2021-02-07

  • 分类号G06F16/23(20190101);G06F16/28(20190101);

  • 代理机构37100 济南信达专利事务所有限公司;

  • 代理人李世喆

  • 地址 100074 北京市丰台区云岗北里40号院

  • 入库时间 2023-06-19 11:16:08

说明书

技术领域

本发明涉及计算机技术领域,特别涉及知识卡片的构建方法及装置。

背景技术

随着移动互联网的不断发展,移动学习成为当下学习者广泛选择的学习方式。面对碎片化学习中存在的问题,学习者亟需对知识进行管理,因此,知识卡片应运而生。

现有技术一般依据不同数据展示效果的建议,结合可视化图表的具体形式,生成可视化的知识卡片。然而,现有技术的知识卡片构建的智能化程度较低。

发明内容

本发明实施例提供了知识卡片的构建方法及装置,可以提高知识卡片构建的智能化程度。

第一方面,本发明实施例提供了知识卡片的构建方法,该方法包括:

从原始数据库中获取至少一条原始数据;

针对所述至少一条原始数据中的每一条原始数据,确定所述当前原始数据的至少一个第一三元组信息,其中,每一个所述第一三元组信息中包含两个实体、所述两个实体之间的关系或者实体属性信息;

根据所述第一三元组信息,生成待构建知识图谱的本体库;

根据所述待构建知识图谱的本体库,生成所述待构建知识图谱;

根据所述待构建知识图谱,生成所述待构建知识卡片;

当监测到所述原始数据库中存在一条所述新增原始数据时,确定所述新增原始数据的至少一个新增第一三元组信息;

根据所述至少一个新增第一三元组信息,更新所述本体库;

根据更新后的所述本体库,更新所述待构建知识图谱;

根据更新后的所述待构建知识图谱,更新所述待构建知识卡片。

优选地,

所述至少一条原始数据包括:结构化原始数据、半结构化原始数据和非结构化原始数据;

所述针对所述至少一条原始数据中的每一条原始数据,确定所述当前原始数据中的至少一个第一三元组信息包括:

D1:确定所述当前原始数据是否为所述结构化原始数据,若是,执行步骤D2,否则,执行步骤D3;

D2:将所述结构化原始数据确定为一个所述第一三元组信息;

D3:确定所述当前原始数据是否为所述半结构化原始数据,若是,执行步骤D4,否则,执行步骤D6;

D4:解析所述当前原始数据;

D5:将所述解析后的当前原始数据作为一个所述第一三元组信息;

D6:确定所述当前原始数据是否为非结构化原始数据;

D7:在确定出所述当前原始数据为所述非结构化原始数据时,抽取所述当前原始数据中的一个所述第一三元组信息。

优选地,

所述根据所述待构建知识图谱的本体库,生成待构建知识图谱,包括:

将每一个所述第一三元组中所包含的两个实体分别作为所述待构建知识图谱的两个节点,其中,所述两个实体与所述待构建知识图谱中的实体定义相同;

将每一个所述第一三元组中所包含的所述两个实体之间的关系或者实体属性信息作为所述待构建知识图谱的边,其中,所述两个实体之间的关系或者实体属性定义与所述待构建知识图谱中的所述两个实体之间的关系定义或者实体属性定义相同;

根据每一个所述第一三元组所构建的所述两个节点和所述边,生成待构建知识图谱。

优选地,

所述待构建知识卡片包括:至少一个卡片要素;

每一个所述卡片要素的展示方式,包括折线图、饼状图、气泡图、雷达图和关系图。

所述根据所述待构建知识图谱,生成所述待构建知识卡片,包括:

从预先设置的模型库中确定所述待构建知识卡片的目标模板,其中,所述模型库是所述待构建知识卡片的整体界面展示效果的基本模板库;

确定所述待构建卡片中的目标卡片要素,其中,所述目标卡片要素用于表征需要关联所述待构建知识图谱的卡片要素;

在所述目标卡片要素上添加目标超级链接,其中,所述目标超级链接将所述目标卡片要素所包含的第一目标实体与所述待构建知识图谱中对应的第二目标实体相关联,在所述目标卡片要素被触发时,所述待构建知识卡片会跳转至与相关联的待构建知识图谱;

根据所述目标超级链接和所述目标模板,生成所述待构建卡片。

优选地,

所述根据所述第一三元组信息,生成待构建知识图谱的本体库,包括:

根据每一条所述原始数据中的至少一个第一三元组信息,构建知识图谱的模式层和知识图谱的数据层,其中,所述知识图谱的模式层包括至少一个第二三元组信息,每一个所述第二三元组信息中包含两个本体、所述两个本体之间的关系或者本体属性信息,所述两个实体为所述两个本体对应的实例,所述知识图谱的数据层包含所述至少一个第一三元组信息;

根据所述知识图谱的模式层和所述知识图谱的数据层,生成所述待构建知识图谱的本体库。

第二方面,本发明实施例提供了知识卡片的构建装置,包括:

获取模块,用于从原始数据库中获取至少一条原始数据;

确定模块,用于针对所述获取模块获取的所述至少一条原始数据中的每一条原始数据,确定所述当前原始数据的至少一个第一三元组信息,其中,每一个所述第一三元组信息中包含两个实体、所述两个实体之间的关系或者实体属性信息;

构建模块:根据所述确定模块确定的所述第一三元组信息,生成待构建知识图谱的本体库;根据所述待构建知识图谱的本体库,生成所述待构建知识图谱;根据所述待构建知识图谱,生成所述待构建知识卡片;

更新模块:用于当监测到所述原始数据库中存在一条所述新增原始数据时,确定所述新增原始数据的至少一个新增第一三元组信息;根据所述至少一个新增第一三元组信息,更新所述本体库;根据更新后的所述本体库,更新所述待构建知识图谱;根据更新后的所述待构建知识图谱,更新所述待构建知识卡片。

优选地,

所述至少一条原始数据包括:结构化原始数据、半结构化原始数据和非结构化原始数据;

所述确定模块,用于执行:

D1:确定所述当前原始数据是否为所述结构化原始数据,若是,执行步骤D2,否则,执行步骤D3;

D2:将所述结构化原始数据确定为一个所述第一三元组信息;

D3:确定所述当前原始数据是否为所述半结构化原始数据,若是,执行步骤D4,否则,执行步骤D6;

D4:解析所述当前原始数据;

D5:将所述解析后的当前原始数据作为一个所述第一三元组信息;

D6:确定所述当前原始数据是否为非结构化原始数据;

D7:在确定出所述当前原始数据为所述非结构化原始数据时,抽取所述当前原始数据中的一个所述第一三元组信息。

优选地,

所述构建模块,用于将每一个所述第一三元组中所包含的两个实体分别作为所述待构建知识图谱的两个节点,其中,所述两个实体与所述待构建知识图谱中的实体定义相同;将每一个所述第一三元组中所包含的所述两个实体之间的关系或者实体属性信息作为所述待构建知识图谱的边,其中,所述两个实体之间的关系或者实体属性定义与所述待构建知识图谱中的所述两个实体之间的关系定义或者实体属性定义相同;根据每一个所述第一三元组所构建的所述两个节点和所述边,生成待构建知识图谱。

优选地,

所述待构建知识卡片包括:至少一个卡片要素;

每一个所述卡片要素的展示方式,包括折线图、饼状图、气泡图、雷达图和关系图。

所述构建模块,还用于执行:

从预先设置的模型库中确定所述待构建知识卡片的目标模板,其中,所述模型库是所述待构建知识卡片的整体界面展示效果的基本模板库;

确定所述待构建卡片中的目标卡片要素,其中,所述目标卡片要素用于表征需要关联所述待构建知识图谱的卡片要素;

在所述目标卡片要素上添加目标超级链接,其中,所述目标超级链接将所述目标卡片要素所包含的第一目标实体与所述待构建知识图谱中对应的第二目标实体相关联,在所述目标卡片要素被触发时,所述待构建知识卡片会跳转至与相关联的待构建知识图谱;

根据所述目标超级链接和所述目标模板,生成所述待构建卡片。

优选地,

所述构建模块,还用于根据每一条所述原始数据中的至少一个第一三元组信息,构建知识图谱的模式层和知识图谱的数据层,其中,所述知识图谱的模式层包括至少一个第二三元组信息,每一个所述第二三元组信息中包含两个本体、所述两个本体之间的关系或者本体属性信息,所述两个实体为所述两个本体对应的实例,所述知识图谱的数据层包含所述至少一个第一三元组信息;根据所述知识图谱的模式层和所述知识图谱的数据层,生成所述待构建知识图谱的本体库。

本发明实施例提供了知识卡片的构建方法及装置,知识图谱是用于描述知识发展进程及显示知识结构关系的一种图形,可以基于知识图谱技术对碎片化知识进行管理,通过构建知识之间的关联,将碎片化知识形成为学习者的知识体系。因此,待构建知识图谱是待构建知识卡片形成的关键。针对知识图谱的构建,可以通过确定原始数据库中每一条原始数据的第一三元组信息,基于每一个第一三元组信息中所包含两个实体、两个实体之间的关系或者实体属性信息生成待构建知识图谱的本体库并进一步生成待构建知识图谱,同时可以基于待构建知识图谱形成待构建知识卡片。待构建知识图谱的自动更新可以实现待构建知识卡片自动更新。通过上述方式,基于待构建知识图谱生成待构建知识卡片,同时不断完善和更新,可以提高待构建知识卡片构建的智能化程度。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1是本发明一实施例提供的一种知识卡片的构建方法的流程图;

图2是本发明一实施例提供的另一种知识卡片的构建方法的流程图;

图3是本发明一实施例提供的一种知识卡片的构建装置的示意图。

具体实施方式

为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例,基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本发明保护的范围。

如图1所示,本发明实施例提供了知识卡片的构建方法,该方法可以包括以下步骤:

步骤101:从原始数据库中获取至少一条原始数据;

步骤102:针对至少一条原始数据中的每一条原始数据,确定当前原始数据的至少一个第一三元组信息,其中,每一个第一三元组信息中包含两个实体、两个实体之间的关系或者实体属性信息;

步骤103:根据第一三元组信息,生成待构建知识图谱的本体库;

步骤104:根据待构建知识图谱的本体库,生成待构建知识图谱;

步骤105:根据待构建知识图谱,生成待构建知识卡片;

步骤106:当监测到原始数据库中存在一条新增原始数据时,确定新增原始数据的至少一个新增第一三元组信息;

步骤107:根据至少一个新增第一三元组信息,更新本体库;

步骤108:根据更新后的本体库,更新待构建知识图谱;

步骤109:根据更新后的待构建知识图谱,更新待构建知识卡片。

在本发明实施例中,知识图谱是用于描述知识发展进程及显示知识结构关系的一种图形,可以基于知识图谱技术对碎片化知识进行管理,通过构建知识之间的关联,将碎片化知识形成为学习者的知识体系。因此,待构建知识图谱是待构建知识卡片形成的关键。针对知识图谱的构建,可以通过确定原始数据库中每一条原始数据的第一三元组信息,基于每一个第一三元组信息中所包含两个实体、两个实体之间的关系或者实体属性信息生成待构建知识图谱的本体库并进一步生成待构建知识图谱,同时可以基于待构建知识图谱形成待构建知识卡片。待构建知识图谱的自动更新可以实现待构建知识卡片自动更新。通过上述方式,基于待构建知识图谱生成待构建知识卡片,同时不断完善和更新,可以提高待构建知识卡片构建的智能化程度。

为了进行数据处理,在本发明一实施例中,上述实施例中的至少一条原始数据包括:结构化原始数据、半结构化原始数据和非结构化原始数据;

上述实施例中的步骤102,具体可以如下方式实现:

D1:确定当前原始数据是否为结构化原始数据,若是,执行步骤D2,否则,执行步骤D3;

D2:将结构化原始数据确定为一个第一三元组信息;

D3:确定当前原始数据是否为半结构化原始数据,若是,执行步骤D4,否则,执行步骤D6;

D4:解析当前原始数据;

D5:将解析后的当前原始数据作为一个第一三元组信息;

D6:确定当前原始数据是否为非结构化原始数据;

D7:在确定出当前原始数据为非结构化原始数据时,抽取当前原始数据中的一个第一三元组信息。

在本发明实施例中,原始数据按照数据的结构化程度可以划分为:结构化原始数据、半结构化原始数据和非结构化原始数据。根据原始数据的不同的结构化形式,可以采用不同的方法,将原始数据转换为第一三元组的形式。比如,针对结构化原始数据,通常是关系型数据库的数据,数据结构清晰,把关系型数据库中的原始数据可以转换为RDF数据,一般采用的是D2R技术,D2R主要包括D2R Server,D2RQ Engine和D2RRQ Mapping语言;半结构化原始数据,主要是指那些具有一定的数据结构,但需要进一步提取整理的数据。比如百科的数据,网页中的数据等。对于这类数据,主要采用包装器的方式进行处理;对于非结构化原始数据,需要进行包括实体、实体关系和特定实体属性的知识抽取。

为了生成待构建知识图谱,在本发明一实施例中,上述实施例中的步骤104,具体可以通过如下方式实现:

将每一个第一三元组中所包含的两个实体分别作为待构建知识图谱的两个节点,其中,两个实体与待构建知识图谱中的实体定义相同;

将每一个第一三元组中所包含的两个实体之间的关系或者实体属性信息作为待构建知识图谱的边,其中,两个实体之间的关系或者实体属性定义与待构建知识图谱中的两个实体之间的关系定义或者实体属性定义相同;

根据每一个第一三元组所构建的两个节点和边,生成待构建知识图谱。

在本发明实施例中,知识图谱是由节点和边形成的反映知识结构的图形,在知识图谱中,节点表示实体,边表示实体间的关系,而第一三元组信息中包含两个实体、两个实体之间的关系和特定实体的属性,故可以将第一三元组信息中的两个实体、两个实体之间的关系和特定实体的属性映射到知识图谱的每一个节点和边中,在此过程中,在第一三元组信息和知识图谱中的实体定义、属性定义和关系定义必须保持一致,以能够为将第一三元组信息中所包含的两个实体、两个实体之间的关系和特定实体的属性映射到知识图谱中的对应的节点和边提供基础,从而生成待构建知识图谱。

为了生成待构建知识卡片,在本发明一实施例中,上述实施例中的待构建知识卡片包括:至少一个卡片要素;

每一个卡片要素的展示方式,包括折线图、饼状图、气泡图、雷达图和关系图。

上述实施例中的步骤105根据待构建知识图谱,生成待构建知识卡片,具体可以通过如下方式实现:

从预先设置的模型库中确定待构建知识卡片的目标模板,其中,模型库是待构建知识卡片的整体界面展示效果的基本模板库;

确定待构建卡片中的目标卡片要素,其中,目标卡片要素用于表征需要关联待构建知识图谱的卡片要素;

在目标卡片要素上添加目标超级链接,其中,目标超级链接将目标卡片要素所包含的第一目标实体与待构建知识图谱中对应的第二目标实体相关联,在目标卡片要素被触发时,待构建知识卡片会跳转至与相关联的待构建知识图谱;

根据目标超级链接和目标模板,生成待构建卡片。

在本发明实施例中,知识卡片中包含至少一个卡片元素,需要基于至少一个卡片元素的搭建以及整个知识卡片整体展示的模型搭建生成最终展示的待构建卡片,而针对每一个卡片元素,可以设置一个包含折线图、饼状图、气泡图、雷达图和关系图的图表库,以便可以通过图表的方式直观地进行展示,同时可以从预先设置的模型库中确定待构建知识卡片的目标模板,在需要关联待构建知识图谱的目标卡片要素上可以添加目标超级链接,以使得在目标卡片要素被触发时,待构建知识卡片会跳转至与相关联的待构建知识图谱,实现待构建知识图谱和待构建知识卡片之间的关联关系,同时可以基于待构建知识卡片的动态更新实现待构建知识卡片的动态更新。

为了生成待构建知识图谱的本体库,在本发明一实施例中,上述实施例中的步骤103中根据第一三元组信息,生成待构建知识图谱的本体库,具体可以通过如下方式实现:

根据每一条原始数据中的至少一个第一三元组信息,构建知识图谱的模式层和知识图谱的数据层,其中,知识图谱的模式层包括至少一个第二三元组信息,每一个第二三元组信息中包含两个本体、两个本体之间的关系或者本体属性信息,两个实体为两个本体对应的实例,知识图谱的数据层包含至少一个第一三元组信息;

根据知识图谱的模式层和知识图谱的数据层,生成待构建知识图谱的本体库。

在本发明实施例中,由于每一个三元组信息中均包含两个实体、两个实体之间的关系和特定实体的属性,因此,可以基于每一个第一三元组信息生成待构建知识图谱。在待构建知识图谱的搭建过程中,可以基于每一条原始数据中的至少一个第一三元组信息,先构建知识图谱的模式层和知识图谱的数据层,以使得可以根据知识图谱的模式层和知识图谱的数据层搭建待构建知识图谱的本体库,从而可以比较方便地生成待构建知识图谱。

在本发明一实施例中,本发明通过领域知识图谱技术,基于互联网数据、基础知识库数据,构建自动学习的领域知识图谱,通过结合可视化展示技术,形成领域知识卡片,为用户提供快速学习、掌握知识的技术手段。主要是促进知识图谱技术在面对不同的领域学习者对知识掌握的诉求时,发挥管理信息、关联知识、形成体系的能力,形成一套自动化构建方法和设备,满足不同场景下知识卡片构建的需求,同时利用可视化展示设备,提供给学习者直观、便捷的浏览方式。

在本发明一实施例中,本申请可以应用于热点事件的知识构建和知识卡片构建,通过采集实时事件数据,进行分析和挖掘,通过自然语言处理和机器学习技术,生成知识库和知识图谱,通过自动分析和管理,自动创建知识卡片,并进行推送,让热点事件的实际行政管理人员掌握一手情况,快速关联,了解态势,辅助决策。构建热点事件知识图谱,可以从事件的各个属性进行描述,建立不同事件之间的关联关系,然后通过知识卡片构建功能建设应用实例,为用户提供知识服务。不同的热点事件可以创建不同的卡片来分专题展示。

如图2所示,为了更加详细地阐述本发明的技术方案,本发明实施例提供了知识卡片的构建方法,该方法包括:

步骤201:从原始数据库中获取至少一条原始数据,其中,至少一条原始数据包括:结构化原始数据、半结构化原始数据和非结构化原始数据。

具体地,该原始数据可以从互联网、基础知识库、专业数据库获取公共安全领域的多源数据,可以应用于面向公共安全领域的知识学习、挖掘类的业务,包括舆情监测、热点跟踪、涉事人情感倾向分析等等,通过网络爬虫自动获取最新的网络信息数据,运用知识图谱自动构建技术,动态更新和扩充现有知识库,为公共安全领域行为分析提供知识支撑。

举例来说,原始数据假设为1992年的张三在长城大厦偷窃一辆奥迪车。

步骤202:确定当前原始数据是否为结构化原始数据,若是,执行步骤203,否则,执行步骤204。

步骤203:将结构化原始数据确定为一个第一三元组信息,其中,每一个第一三元组信息中包含两个实体、两个实体之间的关系或者实体属性信息,执行步骤208。

步骤204:确定当前原始数据是否为半结构化原始数据,若是,执行步骤205,否则,执行步骤206。

步骤205:解析当前原始数据,将解析后的当前原始数据作为一个第一三元组信息,执行步骤208。

步骤206:确定当前原始数据是否为非结构化原始数据。

步骤207:在确定出当前原始数据为非结构化原始数据时,抽取当前原始数据中的一个第一三元组信息,执行步骤208。

具体地,对公共安全领域多源数据进行实体识别,命名实体识别是自然语言处理的基础且重要的处理环节。命名实体识别直接决定了后续数据的准确率。对实体识别后的公共安全领域多源数据进行关系抽取,关系抽取作为知识图谱构建的重要环节,直接决定了知识图谱构建的数据质量。关系抽取可以采用的模型为:BERT+双向GRU+Attention+FC,其中BERT用来提取文本的特征,Attention为注意力机制层,FC为全连接层知识概览是类百科的一种知识描述,可以查询各个实体的数据指标以及通过推荐算法实现的智能匹配推荐等。

举例来说,基于上述分析可知原始数据为非结构化的原始数据,需要抽取至少一个三元组,假设为张三—偷窃—长城大厦;张三—年龄—1992。

步骤208:根据每一条原始数据中的至少一个第一三元组信息,构建知识图谱的模式层和知识图谱的数据层,其中,知识图谱的模式层包括至少一个第二三元组信息,每一个第二三元组信息中包含两个本体、两个本体之间的关系或者本体属性信息,两个实体为两个本体对应的实例,知识图谱的数据层包含至少一个第一三元组信息。

举例来说,模式层为:人名—事件—地点;人名—年龄—时间;

数据层为:张三—偷窃—长城大厦;张三—年龄—1992。

步骤209:根据知识图谱的模式层和知识图谱的数据层,生成待构建知识图谱的本体库。

具体地,本体库包括用于描述领域知识的数据集合。具体包括概念、关系、函数、公理和实例五个基本组成元素。构建本体主要分几个部分,一是确定本体所覆盖的专业领域、范围和应用目标;二是列举该领域中所有概念以及对概念的详细解释;三是建立分类概念以及分类概念的层次结构;四是定义概念之间的关系。

步骤210:将每一个第一三元组中所包含的两个实体分别作为待构建知识图谱的两个节点,其中,两个实体与待构建知识图谱中的实体定义相同;

步骤211:将每一个第一三元组中所包含的两个实体之间的关系或者实体属性信息作为待构建知识图谱的边,其中,两个实体之间的关系或者实体属性定义与待构建知识图谱中的两个实体之间的关系定义或者实体属性定义相同。

步骤212:根据每一个第一三元组所构建的两个节点和边,生成待构建知识图谱。

具体地,通过本体知识的构建,形成知识库,将知识库以图数据库的形式进行存储。

举例来说,以第二三元组人名—事件—地点为例,则节点为人名和地点,边为事件,即以张三和长城大厦为节点、偷窃为边可以生成最基础的知识图谱,反映张三和长城大厦之间的关系。

步骤213:从预先设置的模型库中确定待构建知识卡片的目标模板,其中,模型库是待构建知识卡片的整体界面展示效果的基本模板库,其中,待构建知识卡片包括:至少一个卡片要素,每一个卡片要素的展示方式,包括折线图、饼状图、气泡图、雷达图和关系图。

步骤214:确定待构建卡片中的目标卡片要素,其中,目标卡片要素用于表征需要关联待构建知识图谱的卡片要素;

步骤215:在目标卡片要素上添加目标超级链接,其中,目标超级链接将目标卡片要素所包含的第一目标实体与待构建知识图谱中对应的第二目标实体相关联,在目标卡片要素被触发时,待构建知识卡片会跳转至与相关联的待构建知识图谱。

步骤216:根据目标超级链接和目标模板,生成待构建卡片。

具体地,可以利用知识图谱数据,依据不同数据展示效果的建议,结合可视化图表具体形式,自动生成可视化的待构建知识卡片。在构建待构建知识卡片时,可以将数据与前台的展示页面进行了数据绑定,在展示页面会根据知识点与其他知识点的关系,添加目标超级链接,用户能够通过不断点选,浏览各类知识。同时可以通过可视化展示设备,为用户展示待构建知识卡片,通过APP、网页等方式展示待构建知识卡片,自动关联待构建知识图谱,展示知识点之间的关系,以图谱的形式呈现。

举例来说,可以采用B/S架构,Web页面方式呈现,构建过程可以自动化,也可以人工干预,交互设计。

步骤217:当监测到原始数据库中存在一条新增原始数据时,确定新增原始数据的至少一个新增第一三元组信息。

步骤218:根据至少一个新增第一三元组信息,更新本体库;根据更新后的本体库,更新待构建知识图谱;根据更新后的待构建知识图谱,更新待构建知识卡片。

如图3所示,本发明实施例提供了知识卡片的构建装置,包括:

获取模块301,用于从原始数据库中获取至少一条原始数据;

确定模块302,用于针对获取模块301获取的至少一条原始数据中的每一条原始数据,确定当前原始数据的至少一个第一三元组信息,其中,每一个第一三元组信息中包含两个实体、两个实体之间的关系或者实体属性信息;

构建模块303:根据确定模块确定302的第一三元组信息,生成待构建知识图谱的本体库;根据待构建知识图谱的本体库,生成待构建知识图谱;根据待构建知识图谱,生成待构建知识卡片;

更新模块304:用于当监测到原始数据库中存在一条新增原始数据时,确定新增原始数据的至少一个新增第一三元组信息;根据至少一个新增第一三元组信息,更新本体库;根据更新后的本体库,更新构建模块303处理得到的待构建知识图谱;根据更新后的待构建知识图谱,更新待构建知识卡片。

在本发明实施例中,知识图谱是用于描述知识发展进程及显示知识结构关系的一种图形,可以基于知识图谱技术对碎片化知识进行管理,通过构建知识之间的关联,将碎片化知识形成为学习者的知识体系。因此,待构建知识图谱是待构建知识卡片形成的关键。针对知识图谱的构建,可以通过确定模块确定获取模块获取到的原始数据库中每一条原始数据的第一三元组信息,基于每一个第一三元组信息中所包含两个实体、两个实体之间的关系或者实体属性信息通过构建模块生成待构建知识图谱的本体库并进一步生成待构建知识图谱,同时可以基于待构建知识图谱形成待构建知识卡片。待构建知识图谱的自动更新可以通过更新模块实现待构建知识卡片自动更新。通过上述方式,基于待构建知识图谱生成待构建知识卡片,同时不断完善和更新,可以提高待构建知识卡片构建的智能化程度。

在本发明一实施例中,至少一条原始数据包括:结构化原始数据、半结构化原始数据和非结构化原始数据;

确定模块302,用于执行:

D1:确定当前原始数据是否为结构化原始数据,若是,执行步骤D2,否则,执行步骤D3;

D2:将结构化原始数据确定为一个第一三元组信息;

D3:确定当前原始数据是否为半结构化原始数据,若是,执行步骤D4,否则,执行步骤D6;

D4:解析当前原始数据;

D5:将解析后的当前原始数据作为一个第一三元组信息;

D6:确定当前原始数据是否为非结构化原始数据;

D7:在确定出当前原始数据为非结构化原始数据时,抽取当前原始数据中的一个第一三元组信息。

在本发明一实施例中,构建模块,用于将每一个第一三元组中所包含的两个实体分别作为待构建知识图谱的两个节点,其中,两个实体与待构建知识图谱中的实体定义相同;将每一个第一三元组中所包含的两个实体之间的关系或者实体属性信息作为待构建知识图谱的边,其中,两个实体之间的关系或者实体属性定义与待构建知识图谱中的两个实体之间的关系定义或者实体属性定义相同;根据每一个第一三元组所构建的两个节点和边,生成待构建知识图谱。

在本发明一实施例中,待构建知识卡片包括:至少一个卡片要素;

每一个卡片要素的展示方式,包括折线图、饼状图、气泡图、雷达图和关系图。

构建模块303,还用于执行:

从预先设置的模型库中确定待构建知识卡片的目标模板,其中,模型库是待构建知识卡片的整体界面展示效果的基本模板库;

确定待构建卡片中的目标卡片要素,其中,目标卡片要素用于表征需要关联待构建知识图谱的卡片要素;

在目标卡片要素上添加目标超级链接,其中,目标超级链接将目标卡片要素所包含的第一目标实体与待构建知识图谱中对应的第二目标实体相关联,在目标卡片要素被触发时,待构建知识卡片会跳转至与相关联的待构建知识图谱;

根据目标超级链接和目标模板,生成待构建卡片。

在本发明一实施例中,构建模块303,还用于根据每一条原始数据中的至少一个第一三元组信息,构建知识图谱的模式层和知识图谱的数据层,其中,知识图谱的模式层包括至少一个第二三元组信息,每一个第二三元组信息中包含两个本体、两个本体之间的关系或者本体属性信息,两个实体为两个本体对应的实例,知识图谱的数据层包含至少一个第一三元组信息;根据知识图谱的模式层和知识图谱的数据层,生成待构建知识图谱的本体库。

可以理解的是,本发明实施例示意的结构并不构成对知识图谱的构建装置的具体限定。在本发明的另一些实施例中,知识图谱的构建装置可以包括比图示更多或者更少的部件,或者组合某些部件,或者拆分某些部件,或者不同的部件布置。图示的部件可以以硬件、软件或者软件和硬件的组合来实现。

上述装置内的各单元之间的信息交互、执行过程等内容,由于与本发明方法实施例基于同一构思,具体内容可参见本发明方法实施例中的叙述,此处不再赘述。

本发明实施例还提供了知识图谱的构建装置,包括:至少一个存储器和至少一个处理器;

至少一个存储器,用于存储机器可读程序;

至少一个处理器,用于调用机器可读程序,执行本发明任一实施例中的知识图谱的构建方法。

本发明实施例还提供了一种计算机可读介质,计算机可读介质上存储有计算机指令,计算机指令在被处理器执行时,使处理器执行本发明任一实施例中的知识图谱的构建方法。

具体地,可以提供配有存储介质的系统或者装置,在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机(或CPU或MPU)读出并执行存储在存储介质中的程序代码。

在这种情况下,从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此程序代码和存储程序代码的存储介质构成了本发明的一部分。

用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD+RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上下载程序代码。

此外,应该清楚的是,不仅可以通过执行计算机所读出的程序代码,而且可以通过基于程序代码的指令使计算机上操作的操作系统等来完成部分或者全部的实际操作,从而实现上述实施例中任意一项实施例的功能。

此外,可以理解的是,将由存储介质读出的程序代码写到插入计算机内的扩展板中所设置的存储器中或者写到与计算机相连接的扩展单元中设置的存储器中,随后基于程序代码的指令使安装在扩展板或者扩展单元上的CPU等来执行部分和全部实际操作,从而实现上述实施例中任一实施例的功能。

本发明各个实施例至少具有如下有益效果:

1、在本发明实施例中,知识图谱是用于描述知识发展进程及显示知识结构关系的一种图形,可以基于知识图谱技术对碎片化知识进行管理,通过构建知识之间的关联,将碎片化知识形成为学习者的知识体系。因此,待构建知识图谱是待构建知识卡片形成的关键。针对知识图谱的构建,可以通过确定原始数据库中每一条原始数据的第一三元组信息,基于每一个第一三元组信息中所包含两个实体、两个实体之间的关系或者实体属性信息生成待构建知识图谱的本体库并进一步生成待构建知识图谱,同时可以基于待构建知识图谱形成待构建知识卡片。待构建知识图谱的自动更新可以实现待构建知识卡片自动更新。通过上述方式,基于待构建知识图谱生成待构建知识卡片,同时不断完善和更新,可以提高待构建知识卡片构建的智能化程度;

2、在本发明一实施例中,原始数据按照数据的结构化程度可以划分为:结构化原始数据、半结构化原始数据和非结构化原始数据。根据原始数据的不同的结构化形式,可以采用不同的方法,将原始数据转换为第一三元组的形式。比如,针对结构化原始数据,通常是关系型数据库的数据,数据结构清晰,把关系型数据库中的原始数据可以转换为RDF数据,一般采用的是D2R技术,D2R主要包括D2R Server,D2RQ Engine和D2RRQ Mapping语言;半结构化原始数据,主要是指那些具有一定的数据结构,但需要进一步提取整理的数据。比如百科的数据,网页中的数据等。对于这类数据,主要采用包装器的方式进行处理;对于非结构化原始数据,需要进行包括实体、实体关系和特定实体属性的知识抽取;

3、在本发明一实施例中,知识图谱是由节点和边形成的反映知识结构的图形,在知识图谱中,节点表示实体,边表示实体间的关系,而第一三元组信息中包含两个实体、两个实体之间的关系和特定实体的属性,故可以将第一三元组信息中的两个实体、两个实体之间的关系和特定实体的属性映射到知识图谱的每一个节点和边中,在此过程中,在第一三元组信息和知识图谱中的实体定义、属性定义和关系定义必须保持一致,以能够为将第一三元组信息中所包含的两个实体、两个实体之间的关系和特定实体的属性映射到知识图谱中的对应的节点和边提供基础,从而从而生成待构建知识图谱。

需要说明的是,上述各流程和各系统结构图中不是所有的步骤和模块都是必须的,可以根据实际的需要忽略某些步骤或模块。各步骤的执行顺序不是固定的,可以根据需要进行调整。上述各实施例中描述的系统结构可以是物理结构,也可以是逻辑结构,即,有些模块可能由同一物理实体实现,或者,有些模块可能分由多个物理实体实现,或者,可以由多个独立设备中的某些部件共同实现。

以上各实施例中,硬件单元可以通过机械方式或电气方式实现。例如,一个硬件单元可以包括永久性专用的电路或逻辑(如专门的处理器,FPGA或ASIC)来完成相应操作。硬件单元还可以包括可编程逻辑或电路(如通用处理器或其它可编程处理器),可以由软件进行临时的设置以完成相应操作。具体的实现方式(机械方式、或专用的永久性电路、或者临时设置的电路)可以基于成本和时间上的考虑来确定。

上文通过附图和优选实施例对本发明进行了详细展示和说明,然而本发明不限于这些已揭示的实施例,基与上述多个实施例本领域技术人员可以知晓,可以组合上述不同实施例中的代码审核手段得到本发明更多的实施例,这些实施例也在本发明的保护范围之内。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号