【24h】

A Graph-based Clustering for Web Content Mining

机译:Web内容挖掘的基于图的聚类

获取原文
获取原文并翻译 | 示例

摘要

In this paper we will introduce a new method of clustering where the data to be clustered will be represented by graphs instead of vectors or other models. Specifically, we will extend the classical kmeans clustering algorithm to work with graphs that represent web documents. We modeled web documents Content as graphs because they can allow us to retain information which is often discarded in simpler models. The experiments comparing the performance of clustering when using the traditional vector representation and our novel graph-based representations showed improvements in clustering quality and executing time over vector-based model.
机译:在本文中,我们将介绍一种新的聚类方法,其中要聚类的数据将由图形而不是矢量或其他模型表示。具体来说,我们将扩展经典的kmeans聚类算法,以处理代表Web文档的图形。我们将Web文档的内容建模为图形,因为它们可以使我们保留通常在简单模型中丢弃的信息。使用传统矢量表示法和我们新颖的基于图的表示法比较聚类性能的实验表明,与基于矢量的模型相比,聚类质量和执行时间有所改善。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号