首页> 中文期刊> 《贵州科学 》 >基于关键句的K-means算法在热点发现领域的研究与应用

基于关键句的K-means算法在热点发现领域的研究与应用

             

摘要

由于“互联网+”提出的,网络信息呈现爆炸的趋势.面对海量数据如何准确找到热点事件成了网民关注的话题.文章从实际应用出发,首先对每一篇文本选取5句话作为该文本关键句,然后用TF-IDF计算特征词值,特征向量选择时不考虑单个字的权重,再用K-means算法进行聚类.以新浪新闻为例,将环境、住房和违法三类话题共322篇文本作为测试语料进行聚类,聚类准备率达到70%以上,说明选取关键句比将整个文本作为聚类对象的聚类效果好.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号