首页> 外文会议>Focused Access to XML Documents >Document Clustering Using Incremental and Pairwise Approaches
【24h】

Document Clustering Using Incremental and Pairwise Approaches

机译:使用增量和成对方法的文档聚类

获取原文
获取原文并翻译 | 示例

摘要

This paper presents the experiments and results of a clustering approach for clustering of the large Wikipedia dataset in the INEX 2007 Document Mining Challenge. The clustering approach employed makes use of an incremental clustering method and a pairwise clustering method. The approach enables us to perform the clustering task on a large dataset by first reducing the dimension of the dataset to an undefined number of clusters using the incremental method. The lower-dimension dataset is then clustered to a required number of clusters using the pairwise method. In this way, clustering of the large number of documents is performed successfully and the accuracy of the clustering solution is achieved.
机译:本文介绍了在INEX 2007 Document Mining Challenge中对大型Wikipedia数据集进行聚类的聚类方法的实验和结果。所采用的聚类方法利用了增量聚类方法和成对聚类方法。该方法使我们能够通过使用增量方法首先将数据集的维数减小到未定义数量的聚类来对大型数据集执行聚类任务。然后,使用成对方法将较低维度的数据集聚类为所需数量的聚类。这样,成功完成了大量文档的聚类,并达到了聚类解决方案的准确性。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号