首页> 中文期刊>成都信息工程学院学报 >基于协同过滤和文本相似性的Web文本情感极性分类算法

基于协同过滤和文本相似性的Web文本情感极性分类算法

     

摘要

Web文本情感极性分类算法在网络舆情监控方面具有重要的研究价值.针对传统文本分类算法依赖于情感词典的弊端,以及不能很好的应用于不规则的Web文本分类的局限性,提出基于协同过滤和文本相似度的Web文本情感极性分类算法.先统计分析网络文本高频词汇覆盖情况,进而根据统计结果,基于协同过滤和余弦相似度计算提出一种新的Web文本情感极性分类算法,其利用余弦相似度方法计算出Web文本的相似性,判断文本的情感极性.对于无法直接判断情感极性的文本,该算法设计了协同过滤中的情感词评分以及Top-N情感词推荐机制,且通过对情感词的评分与推荐输出进行多次迭代相似度计算来判断未知Web文本情感极性.最后使用中文情感挖掘语料(ChnSentiCorp)进行实验.结果表明,算法具有较高的查全率和查准率,在不规则的Web文本下也表现出较好的分类效果,可较实用地解决Web文本情感极性分类问题并应用于网络舆情监控.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号