首页> 中文期刊> 《计算机应用与软件》 >基于主题词分布的低价值新闻识别技术研究

基于主题词分布的低价值新闻识别技术研究

         

摘要

提出一种识别网络新闻中主要内容与标题不相符或相关性不大的低价值新闻的算法.该算法先从新闻标题中提取出最能反映新闻主题的两个主题词,再分析主题词在正文中的分布情况,并计算出相关概率,以相关概率来判断是否为低价值新闻.实验证明该算法的识别率可达到85.71%,高于基于主题句相似度计算方法的72%,且该算法不受新闻正文长度的影响,是一种实用有效的识别方法.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号