【24h】

Research on Text Clustering Algorithms

机译:文本聚类算法研究

获取原文

摘要

Web documents are enormous. Text clustering is to place the documents with the most words in common into the same cluster. Thus the web search engine can structure the large result set for a certain quest. In this article, we study three kinds of clustering algorithms, prototype based, density based and hierarchical clustering algorithms. We compare two typical algorithms, K-medoids and DBSCAN. The results show that the K-medoids is sensitive to the initial center point and the DBSCAN has a better performance.
机译:Web文档是巨大的。文本群集是将文档放入同一群集中中的最多单词。因此,Web搜索引擎可以为某个任务构造大结果集。在本文中,我们研究了三种聚类算法,基于原型,密度基的和分层聚类算法。我们比较两个典型的算法,k-medoids和dbscan。结果表明,K-yemoids对初始中心点敏感,DBSCAN具有更好的性能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号