...
首页> 外文期刊>Knowledge and information systems >Using structural similarity for clustering XML documents
【24h】

Using structural similarity for clustering XML documents

机译:使用结构相似性对XML文档进行聚类

获取原文
获取原文并翻译 | 示例

摘要

In this paper, we describe a method for clustering XML documents. Its goal is to group documents sharing similar structures. Our approach is two-step. We first automatically extract the structure from each XML document to be classified. This extracted structure is then used as a representation model to classify the corresponding XML document. The idea behind the clustering is that if XML documents share similar structures, they are more likely to correspond to the structural part of the same query. Finally, for the experimentation purpose, we tested our algorithms on both real (ACM SIGMOD Record corpus) and synthetic data. The results clearly demonstrate the interest of our approach.
机译:在本文中,我们描述了一种用于群集XML文档的方法。其目标是将共享相似结构的文档分组。我们的方法分为两步。我们首先自动从每个要分类的XML文档中提取结构。然后,将提取的结构用作表示模型,以对相应的XML文档进行分类。集群背后的想法是,如果XML文档共享相似的结构,则它们更有可能对应于同一查询的结构部分。最后,出于实验目的,我们在真实数据(ACM SIGMOD记录语料库)和综合数据上测试了我们的算法。结果清楚地表明了我们方法的兴趣。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号