【24h】

An Effective Data Processing Method for Fast Clustering

机译:一种有效的快速聚类数据处理方法

获取原文

摘要

Because of the extensive diffusion of Internet usage, heterogeneous computing platforms, and ubiquitous computing technologies, Web data that are usually written in XML format are explosively increased. With the growth of Web data and the importance of their clustering, we need similarity detection method because it is a fundamental technology for efficient document management. In this paper, we introduce a similarity detection method that can check both semantic similarity and structural similarity between XML DTDs. For semantic checking, we adopt ontology technology, and we apply longest common string and longest nesting common string methods for structural checking. Our similarity detection method uses multi-tag sequences instead of traversing XML schema trees, so that it gets fast and reasonable results.
机译:由于Internet使用,异构计算平台和无处不在的计算技术的广泛传播,通常以XML格式编写的Web数据正在爆炸性地增加。随着Web数据的增长及其聚集的重要性,我们需要相似性检测方法,因为它是有效文档管理的基本技术。在本文中,我们介绍了一种相似性检测方法,该方法可以同时检查XML DTD之间的语义相似性和结构相似性。对于语义检查,我们采用本体技术,并应用最长的公共字符串和最长的嵌套公共字符串方法进行结构检查。我们的相似性检测方法使用多标签序列而不是遍历XML模式树,从而获得快速而合理的结果。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号