首页> 外文会议>International Conference on Web Information Systems Engineering >The Heterogeneous Cluster Ensemble Method Using Hubness for Clustering Text Documents
【24h】

The Heterogeneous Cluster Ensemble Method Using Hubness for Clustering Text Documents

机译:使用集线器进行群集文本文档的异构群集合方法

获取原文
获取外文期刊封面目录资料

摘要

We propose a cluster ensemble method to map the corpus documents into the semantic space embedded in Wikipedia and group them using multiple types of feature space. A heterogeneous cluster ensemble is constructed with multiple types of relations i.e. document-term, document-concept and document-category. A final clustering solution is obtained by exploiting associations between document pairs and hubness of the documents. Empirical analysis with various real data sets reveals that the proposed method outperforms state-of-the-art text clustering approaches.
机译:我们提出了一种群集集群方法,将语料库文档映射到维基百科嵌入的语义空间,并使用多种类型的特征空间对它们进行分组。异构集群集合由多种类型的关系构建,I.文档术语,文档概念和文档类别。通过利用文档对和文档的套管之间的关联来获得最终聚类解决方案。具有各种真实数据集的实证分析表明,所提出的方法优于最先进的文本聚类方法。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号