首页> 中文期刊>计算机应用 >基于R-Grams的文本聚类方法

基于R-Grams的文本聚类方法

     

摘要

针对传统文本聚类中存在着聚类准确率和召回率难以平衡等问题,提出了一种基于R-Grams文本相似度计算方法的文本聚类方法.该方法首先通过将待聚类文档降序排列,其次采用R-Grams文本相似度算法计算文本之间的相似度并根据相似度实现各聚类标志文档的确定并完成初始聚类,最后通过对初始聚类结果进行聚类合并完成最终聚类.实验结果表明:聚类结果可以通过聚类阈值灵活调整以适应不同的需求,最佳聚类阈值为15左右.随着聚类阈值的增大,各聚类准确率增大,召回率呈现先增后降的趋势.此外,该聚类方法避免了大量的分词、特征提取等繁琐处理,实现简单.

著录项

  • 来源
    《计算机应用》|2015年第11期|3130-3134|共5页
  • 作者

    王贤明; 谷琼; 胡智文;

  • 作者单位

    温州大学瓯江学院,浙江温州325035;

    温州信息化研究中心,浙江温州325035;

    湖北文理学院数学与计算机科学学院,湖北襄阳441053;

    西南大学逻辑与智能研究中心,重庆400715;

    浙江传媒学院新媒体学院,杭州310018;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 信息处理(信息加工);
  • 关键词

    文本; 聚类; 随机; R-Grams;

  • 入库时间 2022-08-18 04:49:46

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号