首页> 中文期刊>贵州师范大学学报(自然科学版) >基于TF-IDF的网页新闻分类的研究与应用

基于TF-IDF的网页新闻分类的研究与应用

     

摘要

文本分类作为处理和组织大量文本数据的关键技术,为用户准确、快速查找所需信息提供依据.通过TFIDF算法计算文本词汇的词频,并根据词频排序选择特征项,再用Simhash和余弦相似度算法计算文本之间的相似度,最后采用准确率和召回率为评价标准,根据评价结果分析两种算法的优劣.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号