首页> 中国专利> 一种基于概念格的异构空间信息服务分类的语义匹配方法

一种基于概念格的异构空间信息服务分类的语义匹配方法

摘要

一种基于概念格的异构空间信息服务分类的语义匹配方法,首先利用概念格理论与分析方法,对多种异构的空间信息服务分类进行语义因子提取,然后从服务分类模型中获取的服务分类特征属性,并构建服务分类语义概念格,再基于概念格的空间信息服务分类相似度计算,最终实现异构空间信息服务分类的语义匹配。本发明针对跨不同注册中心的异构空间信息服务共享存在的问题,充分利用分类体系中语义关系进行服务遍历和选择,实现跨多个注册中心的空间信息服务分类语义匹配,有效提高服务检索效率,促进空间信息服务的发展。有效克服异构空间信息服务分类的语义匹配技术难点。

著录项

  • 公开/公告号CN104765763A

    专利类型发明专利

  • 公开/公告日2015-07-08

    原文格式PDF

  • 申请/专利权人 中国测绘科学研究院;

    申请/专利号CN201510050509.1

  • 发明设计人 罗安;刘纪平;张福浩;王勇;

    申请日2015-02-02

  • 分类号

  • 代理机构

  • 代理人

  • 地址 100830 北京市海淀区莲花池西路28号

  • 入库时间 2023-12-18 09:43:13

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2017-12-19

    授权

    授权

  • 2015-08-05

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20150202

    实质审查的生效

  • 2015-07-08

    公开

    公开

说明书

技术领域

本发明属于空间信息服务语义技术领域,特别的,涉及了一种新 型的异构空间信息服务分类的语义匹配方法。

背景技术

随着语义网技术的发展,大量空间信息资源和空间数据处理功 能都以服务的形式提供给用户。面对数量如此庞大的互联网信息资 源,用户如何快速发现自己所需要的空间信息服务,是空间信息服务 领域亟待解决的问题。空间信息服务分类的语义匹配则是解决这一问 题的首当其出、至关重要的一步。

围绕这一问题,国内学者开展了相关研究,并已经取得了一定 的进展。从服务的角度提出功能的分类,可以追溯到Tsou  Ming-Hslang提出的面向任务的分布式地理信息服务组件分类方式, 它将GIS任务分为六大类。为了将服务分类与用户需求的匹配联系 起来,张霞首次将用户分类和服务分类联系起来。詹勤通过分析遥感 信息服务的领域特征及其概念的时间名词特点,结合框架语义学理 论,提出了基于事件框架提取遥感信息服务概念的语义特征,并在此 基础上利用形式概念分析构建遥感信息服务分类本体。

目前空间信息服务分类匹配,大多数是要求请求服务具有统一 的规范服务分类语义描述,并且要求服务发布者和请求者在对服务分 类进行描述时都必须采用同一种空间信息服务分类体系,同时还要建 立在他们对服务的分类认识完全相同的条件下,这样描述的服务分类 才能进行有效的语义匹配。这些都是一种假设,这种假设在现实中是 无法满足的,其原因如下:其一,服务请求者并不一定都是行业用户, 随着空间信息服务的越来越普及,普通老百姓已经开始成为空间信息 服务的对象,而他们对空间信息服务的分类一无所知,就不可能在请 求服务时对服务的类型进行有效地描述;其二,空间信息服务的分类 体系多种多样,为了促进了空间信息服务进一步共享和互操作,各种 标准化组织,如国际标准化组织(ISO)、开放地理空间信息联盟(Open  Geospatial Consortium,OGC)和其他标准化组织,都针对空间信 息服务的应用和实现,提出了相关的空间信息服务分类规范。这些空 间信息服务分类体系各有优缺点,并且现阶段也还不存在一种被行业 人士完全认可并适合服务发现匹配和互操作的空间信息服务分类体 系。

因此,可以说现阶段空间信息服务分类的语义匹配,受到服务分 类所采用分类体系的限制,只能对采用相同分类体系的空间信息服务 进行语义匹配,无法实现不同分类体系的异构空间信息服务分类匹 配。从而使得各个组织或研究机构在利用互联网上的空间信息服务 时,不能直接利用互联网上已有的语义描述空间信息服务,需要使用 自己的服务分类标准/体系对服务信息重新进行语义描述,并将其注 册到自己构建的空间信息服务注册中心。

发明内容

针对上述问题,本发明将语义异构互操作中的概念格引入到空间 信息服务领域,提出了一种基于概念格的异构空间信息服务分类语义 融合与匹配方法,利用构造服务概念格的方式来计算服务之间的语义 相似度,有效解决采用不同分类体系描述的请求空间信息服务和广告 服务来之间的语义匹配,并通过注册中心目录服务的语义层次关系来 提高最优服务遍历和选择效率。

为达此目的,本发明采用以下技术方案:

一种基于概念格的异构空间信息服务分类的语义匹配方法,包括 如下步骤:

步骤一、从空间信息服务的描述原始信息中,提取空间信息服务 的分类相关信息;

步骤二、根据步骤一中提取的空间信息服务的分类信息,追踪到 其采用的服务分类体系,并从中提取与该服务相关的语义因子;

步骤三、根据提取的语义因子与空间信息服务的语义关联关系, 建立空间信息服务分类模型;

步骤四、从空间信息服务的描述信息和所对应分类体系的描述信 息中,提取与服务类型相关的特征属性,形成与服务类型相关的特征 属性集;

步骤五、将步骤三的空间信息服务分类模型与步骤四的服务类型 相关的特征属性集分别作为概念格的内涵和外延,构建空间信息服务 分类的概念格,形成相应的服务概念格S=(U,D),S表示服务概念 格,U表示服务的内涵,D则表示服务的外延;

步骤六、对概念格的内涵部分与指定分类体系中的各个类型概念 格的内涵部分进行融合匹配,根据从服务分类体系中获取的服务分类 模型的原子属性,构建服务语义因子的形式化背景矩阵,形成空间信 息服务语义信息的形式化知识表达;

步骤七、根据所述形式化概念背景矩阵,通过将有效的服务语义 因子进行重新排列和组合,并排除一些不可能作为服务模型的节点, 融合并生成新的服务语义模型;

步骤八、根据步骤七融合生成的服务语义模型之间的语义因子关 系,构建服务模型的语义距离树;

步骤九.分别计算语义距离树相似度及特征属性集的集合相似 度,通过统一的服务概念格计算方法,计算得到服务概念格之间的相 似度,最终实现异构空间信息服务分类的语义匹配。

优选地,在步骤一中,所述分类相关信息为服务分类类别、分类 体系的名称和分类体系URL地址。

优选地,在步骤二中,提取语义因子的方法为:

若两个原子服务概念之间是无交集关系,则二者同时成为服务概 念语义因子;

若两个原子服务概念之间是包含关系,则子概念直接成为服务概 念语义因子,同时创建一个新的服务概念语义因子,其范围为子概念 相对于父概念的补集;

若两个原子服务概念之间是等价关系,则将二者融合为一个服务 概念语义因子;

若两个原子服务概念之间是交叉关系,则可以分为三个服务概念 语义因子,一个为两个服务概念之间的交集,另外两个为两个原子服 务概念的相互补集。

优选地,在步骤三中,所述服务分类模型能够以树状的形状表型 出来,其根节点的类别是一个涵盖待分类的所有服务的总分类类型, 叶子节点则是分类体系中不可再分的原子分类,其它节点是根据某种 分类标准对根节点细分类型。

优选地,在步骤四中,所述与服务类型相关的特征属性包括:

功能分类信息相关的服务概念属性:指的是能够代表服务功能特 征的属性信息;

依赖于IO参数类型的属性,指的是以空间数据为核心来定义描 述服务模型所需要的IO相关属性,包括数据、空间、时间、几何、 属性、单位和数据质量;

与IO参数类型相关的属性,指的是描述空间数据的辅助性概念, 包括角度、文本、单位和查询方式。

优选地,在步骤八中,建立语义距离树的方法为:首先将语义因 子独立出来,然后根据每个空间信息服务包含语义因子的情况进行逐 聚类,如果两个服务的语义因子具有共同的部分,则将共同的部分作 为一个语义距离树的虚拟节点独立出来,使得两个服务的节点能够直 接建立在公共虚拟节点之上,如此循环,直到所有的节点之间没有相 同的语义因子,最终构建成空间信息服务的语义距离树。

优选地,所述语义距离树相似度计算为:通过语义距离树,来计 算服务模型之间的语义距离,然后通过语义距离与相似度之间的计算 公式(1),计算出空间信息服务概念格内涵之间的相似度,

Sim(U1,U2)=[1-1h(U)·|d1-d2|d1+d2]·1min(d1,d2)[1-max(d1,d2)-1h(U)]  公式(1)

其中,h(U)表示服务分类的语义距离树中层次的深度值,d1和d2是两个进行相似度计算的服务到它们最近公共祖先的语义距离;

特征属性集的集合相似度计算为:参见公式(2),通过将两个属 性集交集中属性的数量除以它们中最大一个集合的属性数量,实现空 间信息服务概念格外延之间的相似度计算;

Sim(D1,D2)=|D1D2|Max(|D1|,|D2|)  公式(2)

式中D1∩D2表示特征属性集合之间的交集,Max(|D1|,|D2|)表示最 大的一个集合中属性的数量;

服务概念格之间的相似度计算为:通过公式(3)计算得到

Sim(S1,S2)=α·Sim(U1,U2)+β·Sim(D1,D2)    公式(3)

其中,Sim(S1,S2)表示两个不同服务S1与S2的相似度,α、β作 为内涵与外延的权值,Sim(D1,D2)表示特征属性集合D1、D2之间的相似 度,也就是服务概念格外延D1、D2之间的相似度,Sim(U1,U2)则表示语 义距离树相似度,也就是服务概念格内涵U1与U2的语义相似度。

优选地,在异构空间信息服务分类的匹配结果后,结合服务注册 中心中目录服务的语义层次关系,能够有效提高最优服务遍历和选择 的效率,具体的服务遍历的方法为,根据匹配服务的分类信息,首先 通过与分类体系中的大类进行匹配;然后根据匹配成功与否,选择进 入该类别下的子类别进行匹配,或者直接略过该类别,进行下一个大 类匹配,并在与大类中的子类型匹配过程中,同样采用先与父节点匹 配的方法,根据匹配成果与否,选择是否进入子类节点的匹配,如此 循环,直到匹配成果,否则为匹配失败。

因此,本发明结合目前空间信息服务语义匹配与形式概念格的研 究现状,针对跨不同注册中心的异构空间信息服务语义匹配存在的问 题,首先利用概念格理论与分析方法,对多种异构的空间信息服务分 类进行语义因子提取,然后从服务分类模型中获取的服务分类特征属 性,并构建服务分类语义概念格,再基于概念格的空间信息服务分类 相似度计算,最终实现异构空间信息服务分类的语义匹配。本发明能 够充分利用分类体系中语义关系进行服务遍历和选择,实现跨多个注 册中心的空间信息服务分类语义匹配,有效提高服务检索效率。

附图说明

图1是根据本发明的基于概念格的异构空间信息服务分类的语 义匹配方法的流程图;

图2为空间信息服务分类信息示例图;

图3为空间信息服务语义距离树示例图;

图4为基于分类匹配的空间信息服务遍历与选择示例图。

具体实施方式

空间信息服务分类是空间信息服务功能信息的一种特殊的形式 化表达方式之一,它能够从服务所完成的整体功能上对服务进行描 述。通过分析空间信息服务的分类,人们能够大致了解这个服务主要 是用来做什么的和执行该服务能够达到何种效果等。因此,空间信息 服务分类匹配能够在空间信息服务查找、匹配和发现中起到一定的作 用。越来越多的国内外研究者也都开始意识到这一点,并有效利用空 间信息服务分类的特点,提高空间信息服务分类匹配的准确性和效 率。

现实生活中,空间信息服务的描述往往是采用不同的分类体系对 服务分类信息进行语义描述时,这时需要对请求服务的分类进行异构 的空间信息服务分类匹配。由于两者的分类采用了不同的分类体系, 而不同分类体系之间无法按照同构的服务分类匹配方法进行匹配,因 此,本发明需要先建立不同分类体系之间的映射关系,使得两种分类 体系之间能够完全映射,从而将这种异构的空间信息服务分类匹配转 换成同构的空间信息服务分类匹配。

为了有效解决上述问题,本发明提出一种基于概念格的异构空间 信息服务分类的语义匹配方法,首先通过基于形式化概念分析方法对 空间信息服务分类体系融合映射,即将不同分类体系进行融合,然后 根据融合后生成的新的服务分类体系能够更好地兼容融合前的各种 服务分类体系的特征,有效地建立异构服务分类体系之间的映射关 系,完成异构条件下的空间信息服务分类的语义匹配。

以下结合理论和实施例详细说明本发明技术方案:

1、理论基础

空间信息服务分类是空间信息服务共享和互操作的一种标准,同 信息分类一样,空间信息服务分类也是根据空间信息服务的特征及作 用来对服务进行分类的。同种类型的服务具有相同的特征,并且完成 的功能也相似。而不同类型的服务在服务特征和服务功能上都会有一 定的差别。

空间信息服务分类不仅能够表现服务的功能类别,还具有服务的 一些特性属性。为了对异构空间信息服务分类进行语义匹配,在一个 具体的实施例中,本发明通过扩展OWL-S本体中的服务分类 (Service Category)部分对空间信息服务分类进行语义描述(如图 2所示),扩展后的服务分类(Service Category)主要包括以下几个 部分:

服务实例(Service Instance):指向属于该服务类型的服务实 例,实现服务实例与服务类型之间的映射关系。Service Instance可 以指向多个服务实例,从而通过相同服务分类,将各个服务实例语义 关联起来。

服务分类体系(Service Taxonomy):标识某一特定的服务分 类体系,表示该服务分类从属于某一服务分类体系或采用某一特定的 服务分类标准进行的分类。

分类体系地址(Taxonomy Address):指向该服务分类所从属 或采用的分类标准/体系的地址。

服务类别(Service Classification):表示服务分类类型的参数, 通过引用某一服务分类体系中的特定服务类别。

当然,本发明也不局限于此,其它的一些语义分类体系也可以用 于对异构空间信息服务分类进行语义匹配。

从理论上可以发现:空间信息服务分类是空间信息服务功能信息 的一种特殊的形式化表达方式之一,它能够从服务所完成的整体功能 上对服务进行描述。随着语义技术的出现,在空间信息服务分类中加 入语义信息能够更好地帮助和辅助空间信息服务的匹配、发现、组合 与选择。这种使得空间服务信息分类中也带有语义信息,不仅能够从 语义的角度反应服务的功能,也能够使空间信息服务分类在服务匹配 发现中得到更加广泛的应用。

2、具体实施例

下面结合附图和实施例对本发明作进一步的详细说明。可以理解 的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明 的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本 发明相关的部分而非全部结构。

参见图1,示出了根据本发明的基于概念格的异构空间信息服务 分类的语义匹配方法的流程图,包括如下步骤:

步骤一、从空间信息服务的描述原始信息中,提取空间信息服务 的分类相关信息。

空间信息服务分类不仅能够表现服务的功能类别,还具有服务的 一些特性属性。一个完整的空间信息服务分类包括主要包括服务类 别、服务分类体系的版本信息、服务接口标准、服务分类的概要信息、 分类体系名称及分类体系URL地址等多部分内容。

优选地,本步骤提取与服务分类体系相关的服务分类类别、分类 体系的名称及分类体系URL地址三部分内容,为从服务分类体系中 提取语义因子奠定基础。

步骤二、根据步骤一中提取的空间信息服务的分类信息,追踪到 其采用的服务分类体系,并从中提取与该服务相关的语义因子。

在一个优选的实施例中,语义因子具体提取方法如下:

◆若两个原子服务概念之间是无交集关系,则二者同时成为服务 概念语义因子;

◆若两个原子服务概念之间是包含关系,则子概念直接成为服务 概念语义因子,同时创建一个新的服务概念语义因子,其范 围为子概念相对于父概念的补集;

◆若两个原子服务概念之间是等价关系,则将二者融合为一个服 务概念语义因子;

◆若两个原子服务概念之间是交叉关系,则可以分为三个服务概 念语义因子。一个为两个服务概念之间的交集,另外两个为 两个原子服务概念的相互补集。

步骤三、根据提取的语义因子与空间信息服务的语义关联关系, 建立空间信息服务分类模型。

服务分类模型是指服务分类体系中的各个分类节点的表达模型, 是一种描述各类型服务的元数据,可以通过has-input,has-output 等参数关联(如表1)来表达。在服务分类体系中,服务分类模型之 间则通过Is-apart-of,associated-with等各种语义关联关系(如表2) 进行连接,使得服务分类体系能够以树状的形状表型出来,其根节点 的类别是一个涵盖待分类的所有服务的总分类类型,叶子节点则是分 类体系中不可再分的原子分类,其它节点是根据某种分类标准对根节 点细分类型。参见图2,示例性的,本发明所采用的服务分类描述可 以采用图2中所示的扩展服务分类描述模型,利用服务参数进行关系 表达,并通过服务语义关系进行关联。这些原子分类类型是服务分类 体系中最基本的分类,其他的分类可以看作是原子分类的集合。

表1服务参数表达关系  表2服务语义关联关系

步骤四、从空间信息服务的描述信息和所对应分类体系的描述信 息中,提取与服务类型相关的特征属性,形成与服务类型相关的特征 属性集。

在服务分类模型包含了服务分类输入/输出参数的语义信息,但 是缺少服务的特征属性信息。服务分类的特征属性信息能够从属性层 面上表达服务的功能特征,对于服务分类的匹配具有重要的作用。

优选地,本发明根据服务分类匹配的要求,选取了以下三种服务 分类特征属性:

◆功能分类信息相关的服务概念属性:指能够代表服务功能特征 的属性信息,本发明提取的功能分类属性主要来自各分类体系中 较高层级的概念属性,确保彼此之间不会产生层级关系的冲突。

◆依赖于IO参数类型的属性:本发明以空间数据为核心来定义描 述服务模型所需要的IO相关属性,包括数据、空间、时间、几何、 属性、单位、数据质量等概念。

◆与IO参数类型相关的属性:主要指描述空间数据的辅助性概 念,如角度、文本、单位、查询方式概念。

步骤五、将步骤三的空间信息服务分类模型与步骤四的服务类型 相关的特征属性集分别作为概念格的内涵和外延,构建空间信息服务 分类的概念格。

本发明基于形式概念分析理论,服务分类模型和服务特征属性集 合分别作为概念格的内涵与外延,形成相应的服务概念格S=(U,D), S表示服务概念格,U表示服务的内涵,D则表示服务的外延。

步骤六、对概念格的内涵部分与指定分类体系中的各个类型概念 格的内涵部分进行融合匹配,根据从服务分类体系中获取的服务分类 模型的原子属性,构建服务语义因子的形式化背景矩阵,形成空间信 息服务语义信息的形式化知识表达。

由于组成每个服务概念格的内涵U是各种异构分类体系下的语 义因子,并不能够直接利用名称进行匹配,需要通过将异构的语义因 子进行融合映射,从而实现将其与指定分类体系中的各个类型概念格 的内涵部分进行融合匹配。

例如:本发明以空间信息服务领域的三本经典教程《Geographic  Information Systems and Science》、《Geographic Information  Systems:A Management Perspective》以及《Principles of  Geographical Information Systems for land Resources  Assessment》中三种空间信息服务分类体系为例,在下文中将这三 种分类体系依次简称为A、B、C三种分类体系。

以A、B、C三种分类体系中的Overylay、Buffer、Shortest等 服务为例,利用A、B、C分类体系中提取的语义因子(如表3所示), 构建服务语义因子的形式化背景矩阵,其结果如表4所示,实现了对 空间信息服务语义知识的形式化表达。

表3分类体系中局部分类模型

表4服务形式化概念背景矩阵

步骤七、根据所述形式化概念背景矩阵,通过将有效的服务语义 因子进行重新排列和组合,并排除一些不可能作为服务模型的节点, 融合并生成新的服务语义模型。

参见表5,示出了一个示例性的服务语义因子组合结果表。

表5服务语义因子组合结果表

步骤八、根据步骤七融合生成的服务模型之间的语义因子关系, 构建服务模型的语义距离树。

参见图3,示出了一种示例性的本发明的语义距离树的一种建立 方法。其主要过程包括首先将语义因子独立出来,然后根据每个空间 信息服务包含语义因子的情况进行逐聚类,如果两个服务的语义因子 具有共同的部分,则将共同的部分作为一个语义距离树的虚拟节点独 立出来,使得两个服务的节点能够直接建立在公共虚拟节点之上,如 此循环,直到所有的节点之间没有相同的语义因子,最终构建成空间 信息服务的语义距离树。

步骤九.分别计算语义距离树相似度及特征属性集的集合相似 度,通过统一的服务概念格计算方法,计算得到服务概念格之间的相 似度,最终实现异构空间信息服务分类的语义匹配。

优选地,所述语义距离树相似度计算为:通过语义距离树,来计 算服务模型之间的语义距离,然后通过语义距离与相似度之间的计算 公式(1),计算出空间信息服务概念格内涵之间的相似度

Sim(U1,U2)=[1-1h(U)·|d1-d2|d1+d2]·1min(d1,d2)[1-max(d1,d2)-1h(U)]  公式(1)

其中,h(U)表示服务分类的语义距离树中层次的深度值,d1和d2是两个进行相似度计算的服务到它们最近公共祖先的语义距离。

特征属性集的集合相似度计算:参见公式(2),通过将两个属性 集交集中属性的数量除以它们中最大一个集合的属性数量,实现空间 信息服务概念格外延之间的相似度计算。

Sim(D1,D2)=|D1D2|Max(|D1|,|D2|)   公式(2)

式中D1∩D2表示特征属性集合之间的交集,Max(|D1|,|D2|)表示最 大的一个集合中属性的数量。

服务概念格之间的相似度计算为:通过公式(3)计算得到

Sim(S1,S2)=α·Sim(U1,U2)+β·Sim(D1,D2)    公式(3)

其中,Sim(S1,S2)表示两个不同服务S1与S2的相似度,α、β作 为内涵与外延的权值,Sim(D1,D2)表示特征属性集合D1、D2之间的相似 度,也就是服务概念格外延D1、D2之间的相似度,Sim(U1,U2)则表示语 义距离树相似度,也就是服务概念格内涵U1与U2的语义相似度。

最后利用异构空间信息服务分类的匹配结果,结合服务注册中心 中目录服务的语义层次关系,能够有效提高最优服务遍历和选择的效 率,具体遍历方法如图4所示,根据匹配服务的分类信息,首先通过 与分类体系中的大类进行匹配;然后根据匹配成功与否,选择进入该 类别下的子类别进行匹配,或者直接略过该类别,进行下一个大类匹 配,并在与大类中的子类型匹配过程中,同样采用先与父节点匹配的 方法,根据匹配成果与否,选择是否进入子类节点的匹配,如此循环, 直到匹配成果,否则为匹配失败。从而实现了服务匹配的最优化,提 高服务分类的匹配速度。

本发明有效克服异构空间信息服务分类的语义匹配技术难点,利 用构造服务概念格的方式来计算服务之间的语义相似度,实现不同分 类体系描述的空间信息服务之间语义匹配,有效提高服务匹配、发现 与选取的效率。

以上内容是结合具体的优选实施方式对本发明所作的进一步详 细说明,不能认定本发明的具体实施方式仅限于此,对于本发明所属 技术领域的普通技术人员来说,在不脱离本发明构思的前提下,还可 以做出若干简单的推演或替换,都应当视为属于本发明由所提交的权 利要求书确定保护范围。

去获取专利,查看全文>

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号