【24h】

STRUCTURAL CLASSIFICATION OF XML DOCUMENTS USING MULTISETS

机译:使用多集的XML文档的结构分类

获取原文
获取原文并翻译 | 示例
           

摘要

In this paper, we investigate the problem of clustering XML documents based on their structure. We represent the paths in an XML document as a multiset and use the symmetric difference operation on multisets to define certain metrics. These metrics are then used to obtain a measure of similarity between any two documents in a collection. Our technique was successfully applied to real and synthesized XML documents yielding high-quality clusterings.
机译:在本文中,我们研究了基于XML文档结构的集群问题。我们将XML文档中的路径表示为多集,并对多集使用对称差异操作来定义某些指标。这些度量然后用于获得集合中任何两个文档之间的相似性度量。我们的技术已成功应用于产生高质量聚类的真实和合成XML文档。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号