首页> 外文OA文献 >Clustering documents using a Wikipedia-based concept representation
【2h】

Clustering documents using a Wikipedia-based concept representation

机译:使用基于Wikipedia的概念表示对文档进行聚类

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

This paper shows how Wikipedia and the semantic knowledge it contains can be exploited for document clustering. We first create a concept-based document representation by mapping the terms and phrases within documents to their corresponding articles (or concepts) in Wikipedia. We also developed a similarity measure that evaluates the semantic relatedness between concept sets for two documents. We test the concept-based representation and the similarity measure on two standard text document datasets. Empirical results show that although further optimizations could be performed, our approach already improves upon related techniques.
机译:本文说明了如何将Wikipedia及其包含的语义知识用于文档聚类。我们首先通过将文档中的术语和短语映射到Wikipedia中相应的文章(或概念)来创建基于概念的文档表示形式。我们还开发了一种相似性度量,用于评估两个文档的概念集之间的语义相关性。我们在两个标准文本文档数据集上测试了基于概念的表示形式和相似性度量。实验结果表明,尽管可以进行进一步的优化,但是我们的方法已经在相关技术上得到了改进。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号