【24h】

An Efficient Algorithm for Clustering XML Schemas

机译:一种用于聚类XML模式的有效算法

获取原文

摘要

Schema clustering is important as a prerequisite to the integration of XML schemas. This paper presents an efficient method for clustering XML schemas. The proposed method first computes similarities among schemas. The similarity is defined by the size of the common structure between two schemas under the assumption that the schemas with less cost to be integrated are more similar. Specifically, we extract one-to-one matchings between paths with the largest number of corresponding elements. Finally, a hierarchical clustering method is applied to the value of similarity. Experimental results with many XML schemas show that the method has performed better compared with previous works, resulting in a precision of 98% and a rate of clustering of 95% in average.
机译:架构群集是XML模式集成的先决条件很重要。 本文介绍了群集XML模式的有效方法。 所提出的方法首先计算模式之间的相似之处。 相似性由两个模式之间的公共结构的大小定义,假设具有较少成本的模式更加相似。 具体地,我们在具有最大数量的相应元素之间的路径之间提取一对一匹配。 最后,将分层聚类方法应用于相似性的值。 具有许多XML模式的实验结果表明,与以前的作品相比,该方法更好地表现出了98%的精度,平均为95%的聚类速率。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号