【24h】

Clustering XML Documents by Structure

机译:按结构对XML文档进行聚类

获取原文
获取原文并翻译 | 示例

摘要

This work explores the application of clustering methods for grouping structurally similar XML documents. Modeling the XML documents as rooted ordered labeled trees, we apply clustering algorithms using distances that estimate the similarity between those trees in terms of the hierarchical relationships of their nodes. We suggest the usage of tree structural summaries to improve the performance of the distance calculation and at the same time to maintain or even improve its quality. Experimental results are provided using a prototype testbed.
机译:这项工作探索了将聚类方法用于对结构相似的XML文档进行分组的方法。将XML文档建模为有根的有序标签树,我们使用距离算法应用聚类算法,这些距离根据它们的节点的层次关系来估计这些树之间的相似性。我们建议使用树形结构摘要来提高距离计算的性能,同时保持甚至提高其质量。使用原型测试台提供了实验结果。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号