首页> 中国专利> 用于为RDF数据库查询生成RDF数据库的方法和设备以及用于RDF数据库查询的检索方法和检索设备

用于为RDF数据库查询生成RDF数据库的方法和设备以及用于RDF数据库查询的检索方法和检索设备

摘要

本发明涉及用于生成数据库的方法和设备。在此借助节点和描述两个节点或者信息值之间的从属关系的定向边构造用于数据库查询的定向图形式的信息值。通过使用描述在选择的节点和目标三元组之间的定向边的数目的路径距离,能够减少数据库查询时的复杂性,从而加速数据库查询,所述目标三元组由两个用一条定向边连接的节点和属于这两个节点的定向边组成。此外本发明包括用于查询上述数据库的检索方法和检索设备。本发明例如可用于监视装置或者医学数据库。此外本发明可用于例如通过监视装置中的新的事件动态扩展的数据库。

著录项

  • 公开/公告号CN102395968A

    专利类型发明专利

  • 公开/公告日2012-03-28

    原文格式PDF

  • 申请/专利权人 西门子公司;

    申请/专利号CN201080016904.3

  • 发明设计人 M·德勒;G·贝泽;F·M·施特格迈尔;

    申请日2010-03-23

  • 分类号G06F17/30;

  • 代理机构中国专利代理(香港)有限公司;

  • 代理人张涛

  • 地址 德国慕尼黑

  • 入库时间 2023-12-18 04:42:57

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-03-12

    未缴年费专利权终止 IPC(主分类):G06F17/30 授权公告日:20151007 终止日期:20180323 申请日:20100323

    专利权的终止

  • 2015-10-07

    授权

    授权

  • 2012-05-09

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20100323

    实质审查的生效

  • 2012-03-28

    公开

    公开

说明书

技术领域

本发明涉及用于为数据库查询生成数据库的方法和设备。此外本发明涉及 用于查询数据库的检索方法和检索设备。

背景技术

诸如飞行数据或者交易所行情的信息值当今借助数据库向用户提供使用。 为此存在许多数据库语言,用这些语言能够结构化地描述和查询相应的数据库。 用语义关系描述数据库的代表例如是RDF/OWL(RDF-Resource Description  Framework,资源描述框架,OWL-Web Ontology Language,Web本体语言) [1,2]。这里信息值以节点形式被描述,其中每两个节点和在该两个节点之间的 定向边称为RDF三元组(Tripel)。这里该两个节点代表一个主体和一个客体, 而定向边代表谓语。在此该谓语一般定义该主体和该客体之间的语义关系。以 图1的例子详细说明这点。这里节点B代表主体“人”,节点A代表客体“Mario”, 定向边代表谓语“有名字”。因此该RDF三元组“BaA”读作“人有名字Mario”。这 样的RDF三元组的链接导致一种图形结构,该图形结构描述一个定向图,例如 参见图1。三元组在图1中加以宽边。

为查询按照RDF/OWL的数据库的信息值,可以使用查询语言SPARQL (SPARQL-SPARQL Protocol and RDF Query Language,SPARQL协议和RDF 查询语言)[3]。为此从可预先给定的节点亦即确定的信息值出发,检索数据库 的一个或者多个RDF三元组,例如参见图1中加宽边的RDF三元组(BAA, HjJ,IkK)。为查询该RDF三元组,亦即为了进行语义查询,通过说明所有涉 及到的RDF三元组而实现所检索的子图。因此为了说明上述三个RDF三元组, 必须详细说明包括在图2中加宽边的RDF三元组的RDF三元组链。这种处理 方式决定了这种语义的数据库查询是复杂的并且是花费时间的,因为需要在提 出数据库查询时就已经充分了解数据库的结构。

发明内容

因此本发明的任务是说明一种用于为数据库查询生成数据库的方法和设 备,以及用于查询数据库的检索方法和检索设备,它们能够在数据库查询时减 少复杂性。

该任务通过独立权利要求解决。本发明的扩展从从属权利要求得知。

本发明涉及用于为数据库查询生成数据库的方法,所述数据库用于借助节 点提供信息值和借助定向边提供该信息值的从属关系,其中通过节点和通过定 向边构造定向图形式的数据库,在该方法中执行下述步骤:

a)读入描述准则,其说明每两个信息值以及属于这两个信息值的从属关系 的分配;

b)为相应的信息值建立相应的节点和为相应的从属关系建立相应的定向 边;

c)从节点的一个可预先给定的节点出发根据描述准则产生定向图,其中把 每两个节点和连接这些节点的定向边作为三元组表征;

d)确定从该可预先给定的节点到一个要在数据库查询中确定的三元组的 至少一条路径;

e)生成相应路径的相应的路径距离,其中相应的路径距离说明从所述可预 先给定的节点到要确定的三元组的定向边的数目,其中在数据库查询时可以从 可预先给定的节点出发来分析相应的路径距离。

通过本方法能够减少检索确定的三元组时的计算功率,因为通过说明路径 距离能够减少要查找的节点。

此外一种用于为数据库查询生成数据库的设备是本发明的一部分,所述数 据库用于借助节点提供信息值和借助定向边提供该信息值的从属关系,其中通 过节点和通过定向边构建定向图形式的数据库,该设备包括下述部件:

a)第一部件,用于读入描述准则,其说明每两个信息值以及属于这两个信 息值的从属关系的分配;

b)第二部件,用于为相应的信息值建立相应的节点和为相应的从属关系建 立相应的定向边;

c)第三部件,用于从节点的一个可预先给定的节点出发根据描述准则产生 定向图,其中把每两个节点和连接这些节点的定向边作为三元组表征;

d)第四部件,用于确定从该可预先给定的节点到一个要在数据库查询中确 定的三元组的至少一条路径;

e)第五部件,用于生成相应路径的相应的路径距离,其中相应的路径距离 说明从可该预先给定的节点到要确定的三元组的定向边的数目,其中在数据库 查询时可以从该可预先给定的节点出发分析相应的路径距离。

借助该设备能够实现用于生成数据库的方法。

此外本发明的一部分是用于在数据库中确定信息值的检索方法,其中该数 据库可以按照用于生成数据库的方法生成,在该方法中执行下述步骤:

借助检索模式产生数据库查询,该检索模式包括对可预先给定的节点、路 径距离和要确定的三元组的说明;

遍查数据库以确定该数据库查询,其中在遍查时考虑在检索模式中说明的 路径距离;

提供满足检索模式的规定的至少一个三元组的至少一个信息值。

通过该检索方法,能够减少在数据库中检索确定的三元组时的计算功率, 因为通过说明路径距离能够减少要查找的节点。

在该检索方法的一种扩展中,在遍查数据库以确定数据库查询时考虑这样 的三元组,其到检索模式中预先给定的节点的路径距离最大为在检索模式中说 明的路径距离。由此能够进一步减少用于执行数据库查询的计算功率,因为进 一步减少了为检索要考虑的三元组的数目。

此外如果在遍查数据库以确定数据库查询时考虑这样的三元组,其到检索 模式中预先给定的节点的路径距离正好等于在检索模式中说明的路径距离,则 能够再进一步减少用于执行数据库查询的计算功率。

在该检索方法的一种有利的扩展中,处理检索模式中用于路径距离的值零, 使得把该路径距离设置为数据库中存在的至少一个最大路径距离。这使得能够 独立于存在的最大路径距离而全部检索数据库的所有节点和三元组。

最后,本发明的一部分是用于在数据库中确定信息值的检索设备,其中数 据库按照用于生成数据库的设备生成,该设备包括下述单元:

第一单元,用于借助检索模式产生数据库查询,该检索模式包括对可预先 给定的节点、路径距离和要确定的三元组的说明;

第二单元,用于遍查数据库以确定该数据库查询,其中在遍查时考虑在检 索模式中说明的路径距离;

第三单元,用于提供满足检索模式的规定的至少一个三元组的至少一个信 息值。

借助该检索设备可以实现检索方法。对于该检索设备的其它优点,以及对 于该搜索设备的扩展的其它优点可以从检索方法的分别对应的特征中得知。

此外在检索设备的一种扩展中,第二单元构建为,在遍查数据库以确定数 据库查询时考虑这样的三元组,其到检索模式中预先给定的节点的路径距离最 大为在检索模式中说明的路径距离。

此外对此附加或者替代的是,第二单元可以构建为,在遍查数据库以确定 数据库查询时考虑这样的三元组,其到检索模式中预先给定的节点的路径距离 正好等于在检索模式中说明的路径距离。

此外在检索设备的一种有利的扩展中,第二单元构建为,处理检索模式中 用于路径距离的值零,使得可以把该路径距离至少设置为在数据库中存在的最 大路径距离。

附图说明

根据附图详细说明本发明及其扩展。附图中:

图1示出按照标准RDF/OWL的具有边和节点的数据库的结构(现有技 术);

图2示出数据库的RDF三元组的数目,这些RDF三元组在查询三个RDF 三元组时必须考虑(现有技术);

图3示出根据本发明的一个实施例的数据库的结构;

图4示出用于建立按照图3的数据库的流程图;

图5示出查询数据库的流程图。

在附图中给具有相同功能和作用的元件提供相同的附图标记。

具体实施方式

图3和4示出本发明的实施例。其中要在一座建筑物内的监视应用的范围 内建立数据库用于以语义方式标注人对于一个或者多个房间的时间的和空间的 分配。这里图3示出节点和定向边,它们分别可以采取确定的信息值和从属关 系。这里图3中使用下面的附图标记:

A:用于信息值IA=名字的节点

B:用于信息值IB=人的节点

C:用于信息值IC=位置的节点

D:用于信息值ID=时间的节点

E:用于信息值IE=空间的节点

F:用于信息值IF=地方的节点

G:用于信息值IG=名字的节点

a:用于从属关系aa=“有名字”的定向边

b:用于从属关系bb=“有位置”的定向边

c:用于从属关系cc=“有时间位置”的定向边

d:用于从属关系dd=“有空间位置”的定向边

e:用于从属关系ee=“位于”的定向边

f:用于从属关系ff=“有空间区域”的定向边

g:用于从属关系gg=“有名字”的定向边

在步骤STA起动具有步骤S1到S5的方法,以便建立数据库DB。

在步骤S1读入描述准则DEF,其规定每两个信息值IA、IB以及属于它们 的从属关系aa的分配。描述准则DEF可以以纸张形式或者作为电子文件建立, 并且例如借助描述语言XML(XML-eXtensible Markup Language,可扩展标记 语言)表示相应的分配。在该例子中描述准则描述这种分配,如在图3中以图 形表示的那样。

在步骤S2,为相应的信息值IA、...、IG构造相应的节点A、...、G以及 为从属关系aa、...、gg构造相应的定向边a、...、g。边是定向的,因为定向边 所起源的节点例如相应于主体,在其处定向边结束的节点相应于客体,其中定 向边代表两个边的语义关系。用定向边连接的两个节点以及属于它们的定向边 称为三元组TA、TF。

然后在下一步骤S3,从一个可预先给定的节点AA=B出发根据描述准则构 造由节点和定向边组成的定向图TR。可预先给定的节点AA源于节点集合,并 且是数据库查询的出发点。

这里该实施例在一次具体的实现亦即一个实例中如下所述:

-人=第一人“有名字”名字=Werner

-人=第一人“有位置”位置=15

-位置=15“有时间位置”时间=12:05

-位置=15“有空间位置”空间=48°8’NB,11°34’

-空间=48°8’NB,“有空间区域”地方=第一房间段

-时间=12:05“位于”地方=第一房间段

-地方=第一房间段“有名字”名字=进入区域

其涉及在多个要监视的地方即区域中监视大的房间。每次当一个人进入一 个区域时就可以在数据库中存储一个实例。一般在数据库DB中存在至少一次 具体的实现。

在下一步骤S4,构造从可预先给定的节点AA到要在数据库查询中确定的 三元组TF的路径PF1。在本实施例中,从该可预先给定的节点AA到三元组 TF的节点F有下面的路径PF1、PF2:

PF1=AA-b-C-c-D-e-F

PF2=AA-b-C-d-E-f-F

路径的长度即路径距离通过在相应路径中的定向边的数目确定。在本例子 中路径PF1的路径距离DIS是DIS1=3,路径PF2的路径距离DIS是DIS2=3。

在一种可选的扩展中可以在步骤S4在存在多条路径的情况下确定要在下 面使用的最短的路径。然而在本例子中两条路径等长。

在下一步骤S5,给三元组TF添加路径距离DIS。按照图4的流程图在步 骤END结束。

本发明还涉及用于在数据库DB中确定信息值的检索方法。按照图5该查 询在状态STA时起动。

在步骤S6借助检索模式产生数据库查询。这里在该数据库查询时作为检索 模式QY,代替如在现有技术中在查询语言SPARQL中的情况的可预先给定的 路径而使用可预先给定的节点,亦即属于它的信息值,这些信息值描述在检索 中要考虑的距离和要确定的三元组,例如

QY=“(人)[3](地方“有名字”名字)”

这意味着,如在步骤S7所示,从信息值(人)出发以路径距离3来检索三 元组(地方“有名字”名字)。因此在该检索中仅仍考虑具有路径距离为3的三元 组。一般在数据库中检索时考虑路径距离。此外该检索方法可以确定对于检索 最不复杂的路径。

作为该检索的结果在步骤S8输出通过该检索确定的三元组的至少一个信 息值。此外也能够表示所确定的三元组的其它信息值和/或表示从属关系。

此外可以在检索模式中查询用于该三元组的至少一个元素的具体的值实 现。于是检索模式QY例如为:

QY=“(人)[3](地方“有名字”名字=“进入区域”)”

在此在数据库中检索作为名字的具体的值实现而具有“进入区域”的地方。

此外在遍查数据库时可以考虑离检索模式中说明的可预先给定的节点AA 的距离正好等于或者最大为在检索模式中说明的路径距离DIST的三元组。此外 可以借助在检索模式中说明的路径距离DIST=0中的值零通知检索方法要遍查 数据库中的所有节点。

按照图5的流程图在步骤END结束。

在现有技术中可以借助表来存储各个类型的三元组。在分析检索模式亦即 可预先给定的路径时必须将所涉及的表彼此关联。该检索的效率主要依赖于表 的大小和相应的选择性。

与此相反,在实施本发明时,可以把检索限制到需要很少计算步骤的那些 路径。由此这些可以是最短的、亦即具有最小路径距离的路径。在这种情况下, 为了从可预先给定的节点到达要确定的三元组TF只需处理更少的三元组。此外 通过在处理三元组时借助表来选择具有尽可能小的表的那些路径,能够产生优 点。在按照图3的本例子中,例如为节点D建立一张表,为节点E建立另一张 表。节点D的表包含较大数目的条目,而节点E的表仅包括对此较小数目的条 目。因此在使用表来实现数据库时适当地选择路径PF2,该路径通过节点E延 伸,而不包括节点D。由此减小计算复杂性。

在按照现有技术借助SPARQL查询时,必须完整说明检索模式即可预先给 定的路径。在这种情况下,不能选择从该可预先给定的节点通到要确定的三元 组TF的路径。由此通过本发明能够做到,检索模式仅具有对检索来说重要的元 素,并且检索方法能够根据该检索模式确定用于分析该检索的最优的路径。

本发明的另一个优点在于,通过在检索模式中说明距离能够在数据库查询 时设置详细程度。离可预先给定的节点的距离越大,信息程度越详细。因此借 助本发明也能够在数据库查询时说明要确定的三元组TF的质量。

在一种扩展中,可以说明路径距离的值为零,使得不限制距离地执行检索。 这是有利的,因为由此提供一种可能性,即不依赖于数据库的巨大,亦即不需 要了解数据库中存在的最大的路径距离而在数据库查询时考虑所有三元组。

用于生成数据库的方法可以借助五个部件M1、M2、M3、M4、M5使用 设备VOR执行。此外用于确定数据库中的信息值的检索方法可以借助单元E1、 E2和E4使用检索设备SVOR实现。这些部件和/或单元可以以硬件、软件或者 硬件和软件的组合实现。此外这些部件和/或单元可以借助计算机单元实施。

参考文献

[1]“Resource Description Framework”,

http://en.wikipedia.org/wiki/Resource Description Framework,Stand 15.04.2009

[2]“Web ontology Language”,

http://en.wikipedia.org/wiki/Web ontology Language,Stand 15.04.2009

[3]“SPARQL Protocol and RDF Query Language”,

http://en.wikipedia.org/wiki/SPARQL,Stand 15.04.2009

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号