首页> 中国专利> 一种语义Web服务组合结果的复合相似度度量方法

一种语义Web服务组合结果的复合相似度度量方法

页面导航

摘要
著录项
法律信息
说明书
相似文献

摘要

本发明提供一种语义Web服务组合结果的复合相似度度量方法，其包括：将语义Web服务组合方法得到的组合结果用有向层次图表示；根据所得的有向层次图，分析每个子服务的输入列表被满足的情况，判断子服务的可用性，从而得到子服务以及组合结果的可执行性；根据所得的有向层次图，分析每个子服务的每个输出的用途，通过人工智能方法分析得出不同用途的输出的重要性系数，从而计算每个子服务的权重；结合子服务权重以及IO关联关系的概念相似度，提出子服务的关联相似度计算方法；结合关联相似度计算方法，计算目标输出的关联相似度，结合组合结果中的子服务个数，联合计算得到组合结果与用户请求的匹配程度，便于用户对服务组合结果进行选择。

著录项

公开/公告号CN103336763A

专利类型发明专利
公开/公告日2013-10-02

原文格式PDF
申请/专利权人华南理工大学;
展开▼

申请/专利号CN201310222587.6
发明设计人刘发贵;林跃东;
展开▼

申请日2013-06-05
分类号G06F17/27(20060101);
代理机构44102 广州粤高专利商标代理有限公司;
代理人何淑珍
地址 510640 广东省广州市天河区五山路381号
入库时间 2024-02-19 20:16:50

法律信息

法律状态公告日

法律状态信息

法律状态
2017-01-04

专利权的转移 IPC(主分类):G06F17/27 登记生效日:20161214 变更前: 变更后: 申请日:20130605

专利申请权、专利权的转移
2016-05-04

授权

授权
2013-11-06

实质审查的生效 IPC(主分类):G06F17/27 申请日:20130605

实质审查的生效
2013-10-02

公开

公开

说明书

技术领域

本发明属于语义Web服务组合技术领域，具体涉及一种语义Web服务组合结果的符合相似度度量方法。

背景技术

语义Web服务组合方法分为：业务流程驱动的语义Web服务组合和即时任务求解的语义Web服务组合：(1)工作流程驱动的服务组合方法以工作流为基础模型，实现半自动的服务组合，受固定流程限制，无法满足动态流程的需求；(2)根据用户提出的服务请求，即时选取若干服务进行自动组合，主要有3大类：基于Petri网，基于AI理论和基于图搜索，但均无法处理子服务间的复杂关联关系。在组合算法的基础模型选择上，AI理论的组合方法依托形式化的表示与转化，如情景演化、定理证明等方法，主要的模型有Pi演算、 CCS等进程代数，虽具有动态演化特性，但复杂性高；而基于Petri网模型的组合方法既能够满足动态性需求，复杂性低于AI理论的方法，Petri网支持完全性、组合性与异步性等，图形化表示的直观性以及形式语义的表达能力。

语义Web服务组合方法根据服务请求，选取系列的子服务并组织其执行过程，形成服务组合结果，针对同一个服务请求，将存在1个或以上的组合结果能够满足该请求，那么如何分析其组合结果中子服务的可用性以及评估组合结果与用户请求间的匹配程度，从而实现自动化地对服务组合结果进行排序以便于用户进行选择，是组合方法中的关键问题。

当前的语义Web服务组合模型仅能够表示语义Web服务组合的结果而未能实现组合结果与用户请求匹配程度的计算，有的学者研究并提出了从QoS等非功能参数进行组合结果的分析与选择，但已有的这些方法均未能分析组合过程中的子服务对组合结果的影响以及组合结果与用户请求匹配程度的计算。

针对上述不足，本发明提出基于子服务权重与子服务关联相似度的度量方法，度量服务组合结果在结构与关联关系上与用户请求的匹配程度，便于对服务组合结果进行选择。

发明内容

本发明的目的在于解决目前的服务组合结果的度量方法无法处理子服务的可用性、无法评估组合结果在子服务关联及功能结构上与用户请求的匹配程度等问题，本发明针对服务组合结果中子服务的关联关系与功能结构进行分析，提出一种语义Web服务组合结果的复合相似度度量方法。

为了实现上述发明目的，采取的技术方案如下：

一种语义Web服务组合结果的复合相似度度量方法，其包括如下步骤：

1）将语义Web服务组合方法得到的组合结果用有向层次图表示；

2）根据步骤1）所得的有向层次图，分析每个子服务的输入列表被满足的情况，判断子服务的可用性，从而得到子服务以及组合结果的可执行性；

3）根据步骤1）所得的有向层次图，分析每个子服务的每个输出的用途，通过人工智能方法分析得出不同用途的输出的重要性系数，从而计算每个子服务的权重；

4）结合子服务权重以及IO关联关系的概念相似度，提出子服务的关联相似度计算方法；

5）结合步骤4）的关联相似度计算方法，计算目标输出的关联相似度，结合组合结果中的子服务个数，联合计算得到组合结果与用户请求的匹配程度。

上述的语义Web服务组合结果的复合相似度度量方法中，步骤1）所述有向层次图包括：

方框表示服务组合结果中的子服务；

圆圈表示子服务的输入、输出、前置条件以及后置条件信息，位于方框上方的圆圈是该子服务的输入列表；位于方框下半部分的圆圈表示该子服务的输出列表；位于方框左侧的圆圈代表该子服务的前置条件；位于方框右侧的圆圈代表该子服务的后置条件；

关联的有向边表示前一个子服务A的某个输出与后一个子服务B的某个输入相匹配，将子服务A产出的数据传递到子服务B。

上述的语义Web服务组合结果的复合相似度度量方法中，步骤2）具体包括：分析语义Web服务组合结果的有向层次图中每个子服务的输入列表，判断输入列表中是否存在输入，且该输入不存在任何的有向边与之关联，当存在这类输入时，该子服务所需的输入没有被完全满足，该子服务不具有可用性，则该组合结果不具有可执行性，相反，当子服务的输入列表中的所有输入均被满足时，该子服务具有可用性，而当组合结果的所有子服务均具有可用性时，该组合结果具有可执行性。

上述的语义Web服务组合结果的复合相似度度量方法中，步骤4）和步骤5）所述的关联相似度计算方法包括：

在组合结果的有向层次图中，子服务A通过输出i即OP_i与后续的B的输入j即IP_j关联，子服务B通过IP_j从子服务A的输出OP_i获取信息，则所获取的信息的相似度用m_ji表示：

其中，

函数计算IP_j与OP_i的语义的模糊相似度；

Si表示提供子服务A的关联相似度，是该子服务所包含的信息相似度的总量；

W_i表示子服务A的权重，由子服务权重计算公式获得；

子服务B的输入集IP关联其他子服务的输出，形成关联集合Δj，则子服务的关联相似度是所获取得到的信息m_ji之和，为：

当子服务是用户请求提供的输入时，不存在输入集IP，其输出集对应用户请求提供的输入信息，是服务组合方法中的第一个子服务；根据子服务权重的极值分析可知，子服务权重最大值为输出重要性系数中的最大值且小于1，假设该子服务的关联相似度S_init为1，权重W_init为0.1957。

与现有技术相比，本发明具有如下优点和技术效果：

本发明所提出的复合相似度度量方法具有以下优势：充分考虑组合结果中子服务的权重、相似度、输入输出的模糊概念相似度以及子服务数量等因素，度量组合结果与用户请求匹配程度，便于用户进行选择。

至此，本发明已提出了一种行之有效的语义Web服务组合结果的复合相似度度量方法。

附图说明

图1为服务组合结果的有向层次图表示。

图2a～图2c为服务组合结果的三种基本形式。

图3为子服务权重判定函数的分类器示意图。

具体实施方式

以上内容已经对本发明作出了充分的公开，以下再结合附图对本发明的实施作进一步说明，但本发明的实施和保护范围不限于此。

本实例将服务组合结果转换成为有向层次图，如附图1所示，其中，

方框表示服务组合结果中的子服务；

圆圈表示子服务的输入、输出、前置条件以及后置条件信息。位于方框上方的圆圈是该子服务的输入列表；位于方框下半部分的圆圈表示该子服务的输出列表；位于方框左侧的圆圈代表该子服务的前置条件；位于方框右侧的圆圈代表该子服务的后置条件。

关联的有向边表示前一个子服务A的某个输出与后一个子服务B的某个输入相匹配，将子服务A产出的数据传递到子服务B。

如附图1所示，服务组合结果的起始子服务是由用户请求中所提供的输入列表形成的；组合结果的结束子服务是由用户请求中的目标输出形成的；中间过程是由服务组合结果中所涉及的子服务组成。

本实例中语义Web服务组合结果的基本形式如附图2所示，其中仅涉及两个子服务的情况。

对于仅有2个子服务构成的服务组合结果的情况，服务组合结果的有向层次图包含以下三种形式：

(1)子服务间存在并行关系：每个子服务从用户请求获取输入信息，并产出满足目标输出的输出库所，如附图2a所示；

(2)子服务间存在前后关联的串连关系：子服务A的输入库所信息，完全来源于另外一个子服务B的输出库所，如附图2b所示；

(3)子服务间存在部分关联的关系：子服务A的输入信息，一部分来源于用户请求中提供的输入库所，一部分则来源于另外一个子服务B的输出库所,如附图2c；

对于n（n大于或等于3）个服务组合成的结果，通过将其分为n1和n2两个部分的服务组(n1+n2=n)，使得n1服务组形成的服务A和n2服务组形成的服务B，满足上述三种基本形式。

本实例分析语义Web服务组合结果的有向层次图中每个子服务的输入列表，判断输入列表中是否存在输入，该输入不存在任何的有向边与之关联。当存在这类输入时，该子服务所需的输入没有被完全满足，该子服务不具有可用性，则该组合结果不具有可执行性，相反，当子服务的输入列表中的所有输入均被满足时，该子服务具有可用性，而当组合结果的所有子服务均具有可用性时，该组合结果具有可执行性，可进行本实例中的复合相似度度量。

本实例分析语义Web服务组合结果的有向层次图中每个子服务的输出的不同作用，进而计算子服务的权重。对于不同作用的输出，在用户认知角度来看,其重要性是不同的：

(1)当子服务的输出满足用户请求的目标输出时，其重要性高于其他输出；

(2)当一个子服务A的输出，能够为其他子服务B提供输入，促使子服务B的输入被满足，则该输出的重要性略低于(1)中的输出；

(3)当子服务A的输出库所，能够为子服务B提供前置条件库所的信息，则这类输出的重要性位居第三或与(2)等同；

(4)当子服务A的输出不属于上述三种情况，而是作为一个目标输出之外的其他输出，为整个组合服务提供额外的丰富的输出，该输出的重要性最低。

子服务所产出的每类输出所占比例不同，对服务组合结果的贡献程度不同（用子服务权重表示）。

各类输出的重要性系数，用矩阵W^T=(w1,w2,w3,w4)表示，∑wi=1，i=1、2、3、4；

令X=(x1,x2,x3,x4)依次表示该子服务的上述四类输出所占比例，∑x_i=1

则该子服务的权重为

Weight=W^T X=w1*x1+w2*x2+w3*x3+w4*x4

上述公式称为子服务权重计算，权重的计算结果所属的区间范围。

首先，分析子服务权重计算所得的权重的最大值：

假设不同类型的库所重要性存在以下关系

w2、w3、w4≤w1，则w2=w1-Δw2,w3=w1-Δw3,w4=w1-Δw4,则权重计算公式可变形为:

Weight=w1*x1+w2*x2+w3*x3+w4*x4

=w1*x1+(w1-Δw2)*x2+(w1-Δw3)*x3+(w1-Δw4)*x4

=w1*(x1+x2+x3+x4)-Δw1*x2-Δw2*x3-Δw4*x4

=w1-(Δw2*x2+Δw3*x3+Δw4*x4)

∵0≤Δw2,Δw3,Δw4,xi≤1

∴(Δw2*x2+Δw3*x3+Δw4*x4)≥0

∴Weight=w1–(Δw2*x2+Δw3*x3+Δw4*x4)≤w1–0=w1

∴MAX_weight=w1

接着分析子服务权重的最小值：

在计算子服务权重的最小值时，不失一般性，可假设库所重要性系数存在如下不等式关系：

w4≤w3≤w2≤w1，则w1=w4+Δw1,w2=w4+Δw2,w3=w4+Δw3

由此，子服务权重计算公式可变形为

Weight=w1*x1+w2*x2+w3*x3+w4*x4

=(w4+Δw1)*x1+(w4+Δw2)*x2+(w4+Δw3)*x3+w4*x4

=w4*(x1+x2+x3+x4)+(Δw1*x1+Δw2*x2+Δw3*x3)

=w4+(Δw1*x1+Δw2*x2+Δw3*x3)

∵n≥1,0≤Δw1,Δw2,Δw3,xi≤1

∴(Δw1*x1+Δw2*x2+Δw3*x3)≥0

∴Weight=w4+(Δw1*x1+Δw2*x2+Δw3*x3)

≥w4+0=w4

∴Min_weight=w4

综上，子服务权重Weight∈[w4,w1]，可为各类库所重要性系数的选择提供依据。

本实例中的子服务权重计算公式满足线性判定函数定义，将子服务权重计算函数称为子服务权重判定函数，其判定分类器如附图3所示，对于同一子服务的两种不同分布所得的子服务权重具有可区分性，用权重区分度来表示样本中两种分布情况的区分程度，具体定义如下：

定义权重区分度Discrimination：对于子服务的两个输出分布X₁和X₂，在当前输出重要性系数矩阵W^T下权重的区分度D(X1,X2)为

D(X1,X2)=W^TX₁-W^TX₂

给定最小的权重区分度d的情况下，当样本中输出库所的两种分布X₁和X₂，则该样本被当前的权向量正确判定的条件为d≤D(X₁,X₂)。当该样本被当前的权向量A错分时， d>D(X₁,X₂)。

当出现样本被错分时，需要更新权向量W^T，具体更新操作如下所示：

W^T←W^T+ηD(X₁,X₂)

其中，η为学习率，0<η<1

借鉴模式分类中线性判定函数的权向量的固定增量的单样本感知器算法的思想，根据上述权重更新操作，选择单样本集进行训练，确定子服务的不同作用的输出的重要性系数 W^T=[0.5357,0.1957,0.1390,0.1296]。

本实例提出子服务关联相似度计算方法，度量组合结果中子服务间的关联关系，子服务之间通过输入输出IO进行关联并将信息传递给后续子服务，子服务关联相似度计算方法综合考虑子服务的关联关系、输入输出的概念相似度以及子服务权重。具体的关联相似度计算方法的技术方案如下：

在组合结果的有向层次图中，子服务A通过输出i(用OP_i表示)与后续的B的输入j(用 IP_j表示)关联，子服务B通过IP_j从子服务A的输出OP_i获取信息，则所获取的信息的相似度用m_ji表示：

其中

函数计算IP_j与OP_i的语义的模糊相似度；

Si表示提供子服务A的关联相似度，是该子服务所包含的信息相似度的总量；

W_i表示子服务A的权重，由子服务权重计算公式获得。

子服务B的输入集IP关联其他子服务的输出，形成关联集合Δj，则子服务的关联相似度是所获取得到的信息m_ji之和，为：

特殊的，当子服务是用户请求提供的输入时，不存在输入集IP，其输出集对应用户请求提供的输入信息，是服务组合算法中的第一个子服务。根据子服务权重的极值分析可知，子服务权重最大值为输出重要性系数中的最大值且小于1，从系统的角度来看，用户请求中都是最真实最重要的信息，故可假设该子服务的关联相似度S_init为1，权重W_init为0.1957。

本发明所提出的子服务关联相似度计算方法的特点在于：

(1)反映子服务的关联相似度对后续的子服务的影响：子服务关联相似度越大，为后续子服务提供的信息越可靠，相似度越大，反之亦然。

(2)反映子服务在组合过程中的重要程度对后续子服务的影响，子服务的权重越大，表示其为服务组合提供的信息越大，其包含的信息的相似度对后续子服务产生的影响越大，则其为后续子服务提供的信息越重要，相似度越高，反之亦然。

(3)反映子服务间的I/O模糊相似度的影响：子服务间通过I/O进行关联，并从前置子服务获取信息，则I/O的模糊相似度将影响子服务所获取到的信息的相似度，当I/O相似度越高，匹配程度越精确，获取到的关联相似度越高，反之亦然。

本发明提出服务组合结果的复合相似度度量方法，计算组合结果与用户请求的匹配程度的度量，综合考虑与服务请求的目标输出的子服务关联相似度S_end以及该组合结果中所包含的子服务的个数n，具体的计算方法如下：

Similarity=S_end/n

首先，在用户请求的目标输出形成的子服务WS_end的关联相似度S_end上，反映子服务的关联相似度对复合服务相似度的影响，通过子服务的关联，将子服务的相似度性传递下去，直到目标输出。

其次，在组合结果中所包含的子服务的个数，对服务组合结果的影响：一个子服务需要进行一次调用，这些服务的调用需要消耗网络资源等，因此，在没有其他QoS参数可以借鉴并进行度量的情况下，在相同的关联相似度的情况下，组合结果包含的子服务个数越少，该组合结果需要调用的子服务越少，消耗的网络资源等也越少，该结果越能被用户接受，即该结果与用户请求的匹配程度就越高。

本发明的服务组合结果的复合相似度度量方法具有如下特性：

(1)子服务关联相似度影响复合相似度，子服务关联相似度越小，复合相似度越小，反之也然。

(2)子服务个数影响复合相似度，子服务个数越多，调用时消耗的资源越多，导致复合相似度越低。

至此，本发明已提出了一种行之有效的语义Web服务组合结果的复合相似度度量方法，充分考虑IO关联的模糊概念相似度、子服务权重、子服务关联相似度、子服务数量等因素，从组合结果的功能结构上度量其与用户请求的匹配程度，便于用户进行组合结果的排序与选择。

去获取专利，查看全文>

相似文献

专利
中文文献
外文文献

1. 一种语义Web服务组合结果的复合相似度度量方法 [P] . 中国专利： CN103336763B . 2016.05.04
2. 一种短文本语义相似度度量方法、系统及装置 [P] . 中国专利： CN113761935A . 2021-12-07
3. METHOD FOR AUTOMATIC ITERATIVE CLUSTERISATION OF ELECTRONIC DOCUMENTS ACCORDING TO SEMANTIC SIMILARITY, METHOD FOR SEARCH IN PLURALITY OF DOCUMENTS CLUSTERED ACCORDING TO SEMANTIC SIMILARITY AND COMPUTER-READABLE MEDIA [P] . 俄罗斯专利： RU2556425C1 . 2015-07-10

机译：一种基于语义相似度的电子文档自动迭代聚类的方法，一种基于语义相似度的聚类文档的多种搜索方法及计算机可读介质
4. The method of text similarity measurement based on semantic analysis [P] . 英国专利： GB201818798D0 . 2019-01-02

机译：基于语义分析的文本相似度度量方法
5. A METHOD FOR GENERATING A SEMANTIC DESCRIPTION OF A COMPOSITE INTERACTION [P] . EP3712787B1 . 2021-12-29

机译：一种生成复合交互的语义描述的方法