【24h】

Ontology based text clustering using the dissimilarity measure

机译:使用差异度量的基于本体的文本聚类

获取原文

摘要

Performance of the text clustering can be improved by using ontologies. Before implementing the clustering process term mutual information matrix is calculated with the aid of the background knowledge build to textual data. Then the K-Modes algorithm is used to cluster the textual data with the dissimilarity measure. This result to obtain clusters with strong intra-similarities and efficiently cluster large textual data.
机译:文本聚类的性能可以通过使用本体来提高。在实施聚类过程之前,借助构建于文本数据的背景知识来计算相互信息矩阵。然后,使用K-Modes算法将文本数据与相异度度量进行聚类。该结果获得具有强内部相似度的聚类,并有效地聚类了大型文本数据。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号