首页> 中国专利> 生成关系数据转换为RDF格式数据的映射规则的方法和装置

生成关系数据转换为RDF格式数据的映射规则的方法和装置

摘要

本发明涉及数据库,其提供了一种生成关系型数据转换为RDF格式数据的映射规则的方法和装置,该方法包括:获取第一关系型数据库中的关系数据转换为RDF格式数据的第一映射规则,其中所述第一映射规则的URI模式表达了第一关系型数据库中的关系数据的特征;解析所述第一映射规则的URI模式的生成规则;确定所述第二关系型数据库的第二关系模型与所述第一关系型数据库的第一关系模型符合模式匹配;根据所述生成规则和所述第一关系模型和第二关系模型的模式匹配的映射关系生成第二关系型数据库的所述关系数据转换为RDF格式数据的第二映射规则。按照该方法的映射规则生成的URI能够表达RDF格式数据的特征,更符合用户期望的效果。

著录项

  • 公开/公告号CN105446966A

    专利类型发明专利

  • 公开/公告日2016-03-30

    原文格式PDF

  • 申请/专利权人 国际商业机器公司;

    申请/专利号CN201410241150.1

  • 发明设计人 蔡鹏;曹锋;倪渊;祝慧佳;

    申请日2014-05-30

  • 分类号G06F17/30(20060101);

  • 代理机构11256 北京市金杜律师事务所;

  • 代理人酆迅;陈姗姗

  • 地址 美国纽约阿芒克

  • 入库时间 2023-12-18 15:07:46

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2019-01-18

    授权

    授权

  • 2016-04-27

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20140530

    实质审查的生效

  • 2016-03-30

    公开

    公开

说明书

技术领域

本发明涉及数据库,更具体地,涉及生成关系数据转换为RDF格式 数据的映射规则的方法和装置。

背景技术

语义网是由万维网之父TimBerners-Lee在1998年提出的一个概念。 语义网的核心是让计算机能力理解文档中的数据和数据之间的关联关系, 从而使得计算机可以自动的处理语义网上的信息。语义网的愿景是将全球 的数据发布并关联起来。语义网采用RDF(resourcedescriptionframework, 资源描述框架)来描述数据。RDF的基本思想是:(1)将一切可以在Web上 标识的事物(具体的或抽象的,存在的或不存的)统称为“资源”;(2)用 URI(UniversalResourceIdentifier,通用资源标识)来标识资源;(3)用 属性(property)和属性值来描述资源。在RDF中任何表达式的基本结构是 一个三元组的集合,每个三元组由主语,谓语和宾语构成。主语对应于资 源,是可拥有URI的任何事物,比如http://dbpedia.org/resource/China;谓 语对应于属性,是拥有名称的资源,比如author,firstname;宾语对应于属 性值,可以是字符串或者另外一个资源,比如david或者 http://dbpeida.org/resource/United_States。

随着语义网的快速发展,越来越多的数据提供者和Web应用开发者 将数据发布成RDF的形式,并且与其他数据源关联起来,形成巨大的关联 数据网络(Linkeddata)。比如Wikipedia被发布成DBpedia,IMDB数据集, GeoSpacial数据集都被发布成RDF。迄今为止,linkeddata上共有61billions 的三元组。

不仅仅是PublicWeb,随着企业2.0的到来,企业内部也迫切需要 越来越多的数据与Web上的数据关联,从而构建更好的应用与服务。而 现有的数据,尤其是企业内部的数据,大多数存在于关系型数据库中,因 此,我们需要一个工具将关系型数据发布成RDF数据。目前已经存在将 关系数据发布成RDF数据的工具,例如D2R是使用最广泛的工具,它包 括D2R服务器,D2RQ引擎和D2RQ映射语言,D2RQ映射语言的主要 功能是定义将关系型数据转换成RDF格式的映射规则。然而,根据映射 规则自动生成的URI没有任何含义,不能表达关系型数据的特征,需要人 工手动修改映射规则,按照修改后的映射规则能够表达关系型数据的特 征,然而对于复杂的关系型数据库,通常包含上千个映射规则,修改映射 规则通常需要大量繁琐的人工劳动。

因此需要一种自动生成将关系数据转换成RDF格式数据的映射规 则的方法。

发明内容

根据本发明的一个方面,提供了生成关系数据转换为RDF格式数据 的映射规则的方法,包括:获取第一关系型数据库中的关系数据转换为 RDF格式数据的第一映射规则,其中所述第一映射规则的URI模式表达了 第一关系型数据库中的关系数据的特征;解析所述第一映射规则的URI模 式的生成规则;确定所述第二关系型数据库的第二关系模型与所述第一关 系型数据库的第一关系模型符合模式匹配;根据所述生成规则和所述第一 关系模型和第二关系模型的模式匹配的映射关系生成第二关系型数据库 的所述关系数据转换为RDF格式数据的第二映射规则。

根据本发明的另一个方面,提供了生成关系数据转换为RDF格式数 据的映射规则的装置,包括:获取模块,被配置为获取第一关系型数据库 中的关系数据转换为RDF格式数据的第一映射规则,其中所述第一映射规 则的URI模式表达了第一关系型数据库中的关系数据的特征;解析模块, 被配置为解析所述第一映射规则的URI模式的生成规则;第一确定模块, 被配置为确定所述第二关系型数据库的第二关系模型与所述第一关系型 数据库的第一关系模型符合模式匹配;生成模块,被配置为根据所述生成 规则和所述第一关系模型和第二关系模型的模式匹配的映射关系生成第 二关系型数据库的所述关系数据转换为RDF格式数据的第二映射规则。

根据本发明实施例的生成关系数据转换为RDF格式数据的映射规 则的方法和装置,自动生成的映射规则能够表达由关系数据库中的关系数 据转化的RDF格式数据的特征,按照该映射规则生成的URI,用户可以 很容易的知道所对应的RDF数据的关键特征和信息。该映射规则更符合 用户期望的效果,减轻了用户对自动生成的映射规则修改的工作。

附图说明

通过结合附图对本公开示例性实施方式进行更详细的描述,本公开的 上述以及其它目的、特征和优势将变得更加明显,其中,在本公开示例性 实施方式中,相同的参考标号通常代表相同部件。

图1示出了适于用来实现本发明实施方式的示例性计算机系统/服务 器12的框图。

图2示出根据本发明实施例的生成关系型数据转换为RDF格式数据 的映射规则的方法。

图3示出根据本发明实施例的解析所述第一映射规则的URI模式的生 成规则的方法。

图4示出根据本发明实施例的生成第二关系型数据库的所述关系数据 转换为RDF格式数据的第二映射规则的方法。

图5示出根据本发明实施例的生成关系型数据转换为RDF格式数据 的映射规则的装置500。

具体实施方式

下面将参照附图更详细地描述本公开的优选实施方式。虽然附图中显 示了本公开的优选实施方式,然而应该理解,可以以各种形式实现本公开 而不应被这里阐述的实施方式所限制。相反,提供这些实施方式是为了使 本公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的 技术人员。

图1示出了适于用来实现本发明实施方式的示例性计算机系统/服务 器12的框图。图1显示的计算机系统/服务器12仅仅是一个示例,不应对 本发明实施例的功能和使用范围带来任何限制。

如图1所示,计算机系统/服务器12以通用计算设备的形式表现。计 算机系统/服务器12的组件可以包括但不限于:一个或者多个处理器或者 处理单元16,系统存储器28,连接不同系统组件(包括系统存储器28和 处理单元16)的总线18。

总线18表示几类总线结构中的一种或多种,包括存储器总线或者存 储器控制器,外围总线,图形加速端口,处理器或者使用多种总线结构中 的任意总线结构的局域总线。举例来说,这些体系结构包括但不限于工业 标准体系结构(ISA)总线,微通道体系结构(MAC)总线,增强型ISA 总线、视频电子标准协会(VESA)局域总线以及外围组件互连(PCI)总 线。

计算机系统/服务器12典型地包括多种计算机系统可读介质。这些介 质可以是任何能够被计算机系统/服务器12访问的可用介质,包括易失性 和非易失性介质,可移动的和不可移动的介质。

系统存储器28可以包括易失性存储器形式的计算机系统可读介质, 例如随机存取存储器(RAM)30和/或高速缓存存储器32。计算机系统/ 服务器12可以进一步包括其它可移动/不可移动的、易失性/非易失性计算 机系统存储介质。仅作为举例,存储系统34可以用于读写不可移动的、 非易失性磁介质(图1未显示,通常称为“硬盘驱动器”)。尽管图1中未 示出,可以提供用于对可移动非易失性磁盘(例如“软盘”)读写的磁盘驱 动器,以及对可移动非易失性光盘(例如CD-ROM,DVD-ROM或者其它 光介质)读写的光盘驱动器。在这些情况下,每个驱动器可以通过一个或 者多个数据介质接口与总线18相连。存储器28可以包括至少一个程序产 品,该程序产品具有一组(例如至少一个)程序模块,这些程序模块被配 置以执行本发明各实施例的功能。

具有一组(至少一个)程序模块42的程序/实用工具40,可以存储在 例如存储器28中,这样的程序模块42包括——但不限于——操作系统、 一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一 个或某种组合中可能包括网络环境的实现。程序模块42通常执行本发明 所描述的实施例中的功能和/或方法。

计算机系统/服务器12也可以与一个或多个外部设备14(例如键盘、 指向设备、显示器24等)通信,还可与一个或者多个使得用户能与该计 算机系统/服务器12交互的设备通信,和/或与使得该计算机系统/服务器 12能与一个或多个其它计算设备进行通信的任何设备(例如网卡,调制解 调器等等)通信。这种通信可以通过输入/输出(I/O)接口22进行。并且, 计算机系统/服务器12还可以通过网络适配器20与一个或者多个网络(例 如局域网(LAN),广域网(WAN)和/或公共网络,例如因特网)通信。 如图所示,网络适配器20通过总线18与计算机系统/服务器12的其它模 块通信。应当明白,尽管图中未示出,可以结合计算机系统/服务器12使 用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处 理单元、外部磁盘驱动阵列、RAID系统、磁带驱动器以及数据备份存储 系统等。

现在参看图2,图2示出根据本发明实施例的生成关系型数据转换为 RDF(资源描述框架)格式数据的映射规则的方法,包括:在步骤S201, 获取第一关系型数据库中的关系数据转换为RDF格式数据的第一映射规 则,其中所述第一映射规则的URI(通用资源标识)模式表达了第一关系 型数据库中的关系数据的特征;在步骤S202,解析所述第一映射规则的URI 模式的生成规则;在步骤S203,确定所述第二关系型数据库的第二关系模 型与所述第一关系型数据库的第一关系模型符合模式匹配;在步骤S204, 根据所述生成规则和所述第一关系模型和第二关系模型的模式匹配的映 射关系生成第二关系型数据库的所述关系数据转换为RDF格式数据的第 二映射规则。

在步骤S201,获取第一关系型数据库中的关系数据转换为RDF格式数 据的第一映射规则,其中所述第一映射规则的URI模式表达了第一关系型 数据库中的关系数据的特征。

按照工具自动生成的映射规则产生的URI模式包括唯一资源标识部 分,其中唯一资源标识部分是由关系型数据库的关系模型中的主键名生成 的,然而关系模型的主键名都是自增型数值,没有任何含义,因此为了表 达关系型数据的特征,从而使生成的URI能够体现RDF数据的特征,需 要修改自动产生的映射规则,根据本发明的实施例,修改后的映射规则对 应于第一映射规则,第一映射规则的URI模式包括唯一资源标识部分和特 征部分,其中所述特征部分包括第一关系型数据库的第一关系模型包含的 表名和至少一个列名,按照第一映射规则生成的URI能够表达RDF格式 数据的特征。

关系模型是关系型数据库的数据模型,在关系模型中,无论是实体还 是实体之间的关系均由单一的结构关系,即二维表来表示。每个二维表由 行和列组成。表的每一行为一条数据记录,表的每一列通过唯一的列名定 义,表中第I行,第J列的元素记录了第I条数据记录在第J列上的取值。关 系模型选取某个或多个能唯一标识一条数据记录的列为主键名。在实际应 用中,通常将每一个实体设计为一个表,例如:3个表分别存储期刊论文、 作者、标题三类不同的实体,每个表达列代表了这个实体的属性特征,例 如作者的属性特征包括姓名、年龄和职业等。

利用将关系数据发布成RDF数据的工具例如D2R生成映射规则,映 射规则即利用映射语言,以RDF格式描述映射关系,形成映射文件,该 文件的作用是在访问关系型数据时将RDF数据的查询语言SPARQL转换 为关系数据库的SQL数据查询式,并将SQL查询结果转换为RDF三元组。 以D2R的映射语言D2RQMapping为例,作为一种声明性语言,用于描 述关系型数据模式与RDFSVocabularies或者OWL的映射关系。该语言 的语义映射包括两部分:

(1)URI模式定义

在RDF格式数据中,任何一个资源都使用HTTPURI来标识,以通 过HTTP协议来访问,实现基于Web的访问与互联。D2RQ映射语言提供 了URI生成的描述模板机制,用来指导生成实例化资源的真实URI,具体 包括4种方式:绝对URI模式(URIPattern)、相对URI模式(RelativeURI Pattern)、URI列模式(URIcolumnsPattern)和空间点模式(BlankNodes Pattern)。以绝对URI模式为例,即,使用d2rq:uripattern属性对每个表 对象进行配置,形如http://namespace/personalinfo/personalinfo.id, namespace表示发布数据的域名空间,两个“/”之间的部分为表名,后面两 个“”之间的唯一资源标识部分为关系型数据库的关系模型的主键名, 用于唯一标识由关系数据库中的关系数据转化的RDF格式数据。

(2)类和属性的映射

类映射(d2rq:ClassMaps)中的ClassMap代表一个类或本体中相似 的一组类,它与关系型数据库中的一个表相映射。

属性映射(d2rq:PropertyBridge)代表类的属性,它与关系型数据库 中某个表的列相对应。

表1示出根据本发明实施例的关系型数据库DB1的个人信息表 personalinfo,如下示出按照工具自动产生的映射规则1,URI模式中的唯 一资源标识部分为位于两个“”之间的部分:Personalinfo.id,其中id为 表1的主键名,然而关系型数据库中的表的主键名都是自增型数值,没有 任何含义,因此为了表达关系型数据的特征,从而使生成的URI能够体现 RDF数据的特征,需要人工手动修改映射规则的类映射,增加URI模式 的特征部分。

表1示出关系型数据库DB1的个人信息表personalinfo

ID Firstname Lastname Sex 1 San Zhang M 2 Si Li M 3 Wu Wang F

由工具自动产生的映射规则1如下:

Map:Personad2rq:classMap

d2rq:dataStoragemapDB1

D2rq:classPerson

D2rq:uriPatternhttp://abc.cn/personalinfo/Personalinfo.id

Map:Sexad2rqPropertyBridge

d2rq:belongsToClassMapMapPerson

d2rq:Propertysex

d2rq:column“PersonalInfo.Sex”

d2rq:datatypeString

Map:Firstnamead2rqPropertyBridge

d2rq:belongsToClassMapMapPerson

d2rq:Propertyfirstname

d2rq:column“PersonalInfo.FirstName”

d2rq:datatypeString

Map:FamilyNamead2rqPropertyBridge

d2rq:belongsToClassMapMapPerson

d2rq:Propertylastname

d2rq:column“PersonalInfo.LastName”

d2rq:datatypeString

修改后的URI模式为:

http://abc.cn/personalInfo/PersonalInfo.Firstname_PersonalInfo.Lastname_PersonalInfo.id,在两个“”之间添加了个人信息 表personalinfo的列名Firstname和Lastname,使URI模式能够体现关系 型数据的特征,以下是修改后的映射规则2。

Map:Personad2rq:classMap

d2rq:dataStoragemapDB1

D2rq:classPerson

D2rq:uriPattern

http://abc.cn/personalInfo/PersonalInfo.Firstname_PersonalInfo.Lastname_PersonalInfo.id

Map:Sexad2rqPropertyBridge

........

Map:Firstnamead2rqPropertyBridge

........

Map:FamilyNamead2rqPropertyBridge

.......

在步骤S202,解析所述第一映射规则的URI模式的生成规则,其中 第一映射规则即经过修改的映射规则,根据映射规则的语法规范解析映射 规则,图3示出根据本发明实施例的解析所述第一映射规则的URI模式的 生成规则的方法,其中进一步包括:在步骤S301,识别出所述第一映射规 则中的类映射和对应于所述类映射的所有属性映射;在步骤S302,识别出 所述类映射的URI模式中的特征部分,具体地,提取出所述URI模式中 标识唯一资源标识部分和特征部分的所有字符串,根据所述第一关系模型 的主键名确定唯一资源标识部分,识别出所述所有字符串中唯一资源标识 部分之外的字符串为特征部分;在步骤S303,对于每个属性映射,识别出 与属性映射对应的所述第一关系模型的表名和列名;在步骤S304,确定 URI模式中的特征部分包含的所述第一关系模型的表名和列名。通常在映 射规则中会有多个类映射,对于每个类映射都重复执行步骤S301至S304。

以修改后的映射规则2为例,首先,根据Map:Personad2rq:classMap 识别出映射文件中定义的类映射person,以及根据Map:Sexad2rq PropertyBridge,d2rq:column“PersonalInfo.Sex”识别出对应于该类映射 person的属性映射Sex是从表名为PersonalInfo、列名为Sex的列中取值, 根据Map:firstnamead2rqPropertyBridge,d2rq:column “PersonalInfo.FirstName”识别出对应于该类映射person的属性映射 Firstname是从表名为PersonalInfo、列名为Firstname的列中取值,根据 Map:FamilyNamead2rqPropertyBridge,d2rq:column “PersonalInfo.Lastname”识别出对应于该类映射person的属性映射 FamilyName是从表名为PersonalInfo、列名为Lastname的列中取值;然后, 从类映射person的URI模式中提取出URI的唯一资源标识部分和特征部 分的全部字符串,即识别出两个之间的字符串 “PersonalInfo.Firstname”、“PersonalInfo.Lastname”、“PersonalInfo.id”, 根据表名和列名确定出URI模式中唯一资源标识部分的字符串的生成规 则是“表名PersonalInfo.列名Firstname”、“表名PersonalInfo.列名Lastname” 以及“表名PersonalInfo.主键名ID”构成的。

在步骤S203,确定所述第二关系型数据库的第二关系模型与所述第一 关系型数据库的第一关系模型符合模式匹配。模式匹配的目标就是寻找两 个或更多个模式元素之间的语义的对应关系。模式匹配技术分为单一的匹 配技术和结合的匹配技术,对于单一的模式匹配技术,通常考虑以下因素:

(1)基于模式的匹配:仅考虑模式信息,而不考虑实例数据。可获 得的模式信息包括模式元素的一些属性,例如,元素名、描述、元素实例 的数据类型、关系类型、约束和模式结构。

(2)基于实例的匹配:考虑的是实例级的数据,通过实例级的数据 可以认识到模式元素所表示的内容和意义。

(3)基于元素的匹配:对单个模式元素进行匹配,对以第一个输入 模式的每个元素,在第二个输入模式中确定匹配元素。

(4)基于结构的匹配:基于结构的匹配技术能够发掘在结构中共同 出现元素的匹配结合。

(5)基于语言学的匹配:应用名字和文本来挖掘语义上相似的模式 元素,主要技术有基于名字的匹配和描述匹配。

(6)基于约束的匹配:对于定义数据类型、数据值的取值范围、唯 一性、可选性、关系类型等通常都会有一下模式约束,如果两个输入模式 中都包含有这样的约束信息,就可以应用约束信息确定模式元素的相似 度。

(7)基于匹配基数的匹配:匹配基数是指实体集中的一个实体通过 一个联系集能够与另一个实体集相关联的实体数目。根据匹配基数可以将 模式匹配分为:1:1匹配、1:n匹配、n:1匹配和n:m匹配四种。

结合的匹配技术有两种方式:一种是混合的匹配器,另一种是合成的 匹配器。混合的匹配器基于多个标准和信息源,综合了多种匹配技术来确 定候选匹配。合成的匹配器是把多个单一匹配技术独立运行时产生的结果 进行合并,这些单独执行的模式匹配技术也可以包括混合匹配器。以上进 行模式匹配的技术细节属于现有技术的范畴,在此不一一赘述,在以上匹 配技术基础之上可以做出任何变形,只要可以实现本发明的目的,均在本 发明的保护范围内,本发明对此不做任何限制。

根据本发明的实施例,表2示出关系型数据库DB2的员工信息表 Employee,对表1和表2的关系数据进行模式匹配。

表2示出关系型数据库DB2的员工信息表Employee

EID Firstname Familyname Workyea

r 1 Hong Li 1 2 Li Li 3 3 Gang Wang 4

关系模型1

表名:PersonalInfo

列名:ID

Firstname

Lastname

Sex

关系模型2

表名:Employee

列名:EID

Firstname

Familyname

Workyear

根据本发明的实施例,关系模型1对应于表1的数据模式,关系模型 2对应于表2的数据模式,利用上述任何的模式匹配方法对关系模型1和 关系模型2进行模式匹配,得到关系模型1和关系模型2的模式匹配的映 射关系:

PersonalInfo.ID=Employee.EID(关系模型1中的第一列主键名ID对 应于关系模型2中的第一列主键名EID),

PersonalInfo.Firstname=Employee.Firstname(关系模型1中的第二列 对应模式2中的第二列),

PersonalInfo.Lastname=Employee.Familyname(关系模型1中的第三 列对应模式2中的第3列)。

本领域技术人员理解,步骤S203的执行顺序不是固定不变的,其独 立于之前的两个步骤,并不依赖前面两个步骤的执行,例如,步骤S203 可以在步骤S201和S202之前进行,也可以与步骤S201和S202同步进行, 还可以在步骤S201和S202之后执行。

在步骤S204,根据所述生成规则和所述第一关系模型和第二关系模型 的模式匹配的映射关系生成第二关系型数据库的所述关系数据转换为 RDF格式数据的第二映射规则。

具体地,图4示出根据本发明实施例的生成第二关系型数据库的所述 关系数据转换为RDF格式数据的第二映射规则的方法,该方法包括:在步 骤S401,确定所述第二关系模型中存在与URI模式的特征部分包含的所述 第一关系模型的表名模式匹配的表名;在步骤S402,确定所述第二关系模 型中存在与URI模式的特征部分包含的所述第一关系模型的列名模式匹配 的至少一个列名;在步骤S403,用第二关系模型中符合模式匹配的表名替 换URI模式的特征部分中包括的第一关系模型的表名;在步骤S404,用第 二关系模型中符合模式匹配的所述至少一个列名替换URI模式的特征部分 中与第二关系模型中的所述至少一个列名模式匹配的第一关系模型的至 少一个列名。

根据本发明的实施例,利用DB2的表2与DB1的表1模式匹配的映 射关系以及DB1的表1的映射规则2的生成规则生成DB2的表2员工信 息表Employee的关系数据转换为RDF格式数据的映射规则,即分别用 “Employee.EID”、“Employee.Firstname”和“Employee.Familyname” 替换表1的映射规则2中的URI模式中的URI的唯一资源标识部分的字 符串“PersonalInfo.id”、“PersonalInfo.Firstname”和“PersonalInfo.Lastname”, 生成DB2的表2的映射规则3:

Map:Personad2rq:classMap

d2rq:dataStoragemapDB2

D2rq:classPerson

D2rq:uriPattern

http://def.cn/employee/Employee.Familyname_Employee.Firstname_Employee.EID

Map:Workyearad2rqPropertyBridge

d2rq:belongsToClassMapMapPerson

d2rq:PropertyWorkyear

d2rq:column“Employee.Workyear”

d2rq:datatypeString

Map:Firstnamead2rqPropertyBridge

d2rq:belongsToClassMapMapPerson

d2rq:PropertyFirstname

d2rq:column“Employee.Firstname”

d2rq:datatypeString

Map:Familynamead2rqPropertyBridge

d2rq:belongsToClassMapMapPerson

d2rq:PropertyFamilyname

d2rq:column“Employee.Familyname”

d2rq:datatypeString

现有的方法,由独立的映射引擎为每个关系型数据库的关系数据生成 映射规则,各个映射引擎彼此独立,互不可见,根据本发明的实施例,第 一映射规则和第二映射规则均由统一的映射引擎进行管理,由映射引擎实 现对修改后的映射规则进行解析的步骤和根据解析结果为符合模式匹配 的其它关系型数据库的关系数据自动生成映射规则的步骤,从而在生成其 它映射规则时能够重用之前修改的映射规则,而不用人工修改每一个映射 规则。

按照本发明实施例自动生成映射规则生成的URI,由于其表达了关系 数据的特征,因此用户可以很容易知道所对应的RDF数据的关键特征, 该映射规则更符合用户期望的效果,减轻了用户对自动生成的映射规则进 行修改的繁重工作。

前面已经参考附图描述了实现本发明的方法的各个实施例。本领域技 术人员可以理解的是,上述方法可以以软件方式实现,也可以以硬件方式 实现,或者通过软件与硬件相结合的方式实现。并且,本领域技术人员可 以理解,通过以软件、硬件或者软硬件相结合的方式实现上述方法中的各 个步骤,可以提供一种生成关系型数据转换为RDF格式数据的映射规则 的装置。即使该装置在硬件结构上与通用处理设备相同,由于其中所包含 的软件的作用,使得该装置表现出区别于通用处理设备的特性,从而形成 本发明的各个实施例的装置。

基于同一发明构思,根据本发明的实施例还提出一种生成关系型数据 转换为RDF格式数据的映射规则的装置,图5示出根据本发明实施例的 生成关系型数据转换为RDF格式数据的映射规则的装置500,包括:获 取模块501,被配置为获取第一关系型数据库中的关系数据转换为RDF格 式数据的第一映射规则,其中所述第一映射规则的URI模式表达了第一关 系型数据库中的关系数据的特征;解析模块502,被配置为解析所述第一 映射规则的URI模式的生成规则;确定模块503,被配置为确定所述第二关 系型数据库的第二数据模式与所述第一关系型数据库的第一数据模式符 合模式匹配;生成模块504,被配置为根据所述生成规则和所述第一数据 模式和第二数据模式的映射关系生成第二关系型数据库的所述关系数据 转换为RDF格式数据的第二映射规则。

其中所述第一映射规则的URI模式包括唯一资源标识部分和特征部 分,其中所述特征部分包括所述第一数据模式的表名和至少一个列名。

根据本发明的实施例,其中解析模块502进一步配配置为:第一识别 模块,被配置为识别出所述第一映射规则中的类映射和对应于所述类映射 的所有属性映射;第二识别模块,被配置为识别出所述类映射的URI模式 中的特征部分;

第三识别模块,被配置为对于每个属性映射,识别出与属性映射对应的 所述第一数据模式的表名和列名;第二确定模块,被配置为确定URI模式 中的特征部分包含的所述第一数据模式的表名和列名。

根据本发明的实施例,其中第二识别模块进一步被配置为:提取出所 述URI模式中标识唯一资源标识部分和特征部分的所有字符串;根据所述 第一数据模式的主键名确定唯一资源标识部分;识别出所述所有字符串中 唯一资源标识部分之外的字符串为特征部分。

根据本发明的实施例,其中生成模块504进一步被配置为:确定所述 第二关系模型中存在与URI模式的特征部分包含的所述第一关系模型的表 名模式匹配的表名;确定所述第二数据模式中存在与URI模式的特征部分 包含的所述第一数据模式的列名模式匹配的至少一个列名;用第二关系模 型中符合模式匹配的表名替换URI模式的特征部分中包括的第一关系模型 的表名;用第二关系模型中符合模式匹配的所述至少一个列名替换URI模 式的特征部分中与第二关系模型中的所述至少一个列名模式匹配的第一 关系模型的至少一个列名。

根据本发明的实施例,其中所述解析模块和生成模块由统一的映射引 擎实现。

上述每个模块的具体实现方法参照根据本发明实施例的生成关系型 数据转换为RDF格式数据的映射规则的方法中的详细描述,在此不一一 赘述。

本发明可以是系统、方法和/或计算机程序产品。计算机程序产品可以 包括计算机可读存储介质,其上载有用于使处理器实现本发明的各个方面 的计算机可读程序指令。

计算机可读存储介质可以是可以保持和存储由指令执行设备使用的 指令的有形设备。计算机可读存储介质例如可以是――但不限于――电存 储设备、磁存储设备、光存储设备、电磁存储设备、半导体存储设备或者 上述的任意合适的组合。计算机可读存储介质的更具体的例子(非穷举的 列表)包括:便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存 储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、静态随机 存取存储器(SRAM)、便携式压缩盘只读存储器(CD-ROM)、数字多 功能盘(DVD)、记忆棒、软盘、机械编码设备、例如其上存储有指令的 打孔卡或凹槽内凸起结构、以及上述的任意合适的组合。这里所使用的计 算机可读存储介质不被解释为瞬时信号本身,诸如无线电波或者其他自由 传播的电磁波、通过波导或其他传输媒介传播的电磁波(例如,通过光纤 电缆的光脉冲)、或者通过电线传输的电信号。

这里所描述的计算机可读程序指令可以从计算机可读存储介质下载 到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/ 或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、 光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服 务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机 可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理 设备中的计算机可读存储介质中。

用于执行本发明操作的计算机程序指令可以是汇编指令、指令集架构 (ISA)指令、机器指令、机器相关指令、微代码、固件指令、状态设置 数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码, 所述编程语言包括面向对象的编程语言—诸如Smalltalk、C++等,以及常 规的过程式编程语言—诸如“C”语言或类似的编程语言。计算机可读程序 指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为 一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、 或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远 程计算机可以通过任意种类的网络—包括局域网(LAN)或广域网(WAN)— 连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务 提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序 指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编 程门阵列(FPGA)或可编程逻辑阵列(PLA),该电子电路可以执行计 算机可读程序指令,从而实现本发明的各个方面。

这里参照根据本发明实施例的方法、装置(系统)和计算机程序产品 的流程图和/或框图描述了本发明的各个方面。应当理解,流程图和/或框 图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读 程序指令实现。

这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它 可编程数据处理装置的处理器,从而生产出一种机器,使得这些指令在通 过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图 和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些 计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算 机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指 令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的 一个或多个方框中规定的功能/动作的各个方面的指令。

也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装 置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备 上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、 其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图 中的一个或多个方框中规定的功能/动作。

附图中的流程图和框图显示了根据本发明的多个实施例的系统、方法 和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程 图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述 模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的 可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不 同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并 行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。 也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中 的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来 实现,或者可以用专用硬件与计算机指令的组合来实现。

以上已经描述了本发明的各实施例,上述说明是示例性的,并非穷尽 性的,并且也不限于所披露的各实施例。在不偏离所说明的各实施例的范 围和精神的情况下,对于本技术领域的普通技术人员来说许多修改和变更 都是显而易见的。本文中所用术语的选择,旨在最好地解释各实施例的原 理、实际应用或对市场中的技术的技术改进,或者使本技术领域的其它普 通技术人员能理解本文披露的各实施例。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号