首页> 中文学位 >基于网格聚类的情感分析研究
【6h】

基于网格聚类的情感分析研究

代理获取

摘要

近年来,随着互联网电商平台的快速发展,网购逐渐取代了一部分人群的传统购物方式,成为当下主流的购物方式之一。与传统购物方式不同的是,网购消费者在购买商品之前能够在网上查看其他消费者对商品评价的好坏或褒贬。因此,商品的评论在一定程度上直接影响着消费者的购买决策。然而由于存在海量的商品评论信息,消费者无法通过单纯浏览这些信息而做到快速全面了解商品,因此,研究通过某些技术能够自动判别这些评论信息的褒贬情感倾向具有非常重要的现实意义。 情感分析又称意见挖掘,指对含有一定观点、喜好、情感等主观性文本进行分析与挖掘,从而获取有用的知识和信息。它能够对说话者的隐含态度、情绪信息、以及意见进行判断或者评估。传统基于语义词典和基于机器学习的中文情感分析方法需要借助大量繁琐的人工标注工作,领域适应性不强,并且其分析结果受人的主观因素影响较大,在一定程度上依赖人工建立的词典,词典的可扩展性不强。针对这些问题,论文主要研究以下内容并取得成果: (1)在知网情感词典基础上建立一个情感词语自动提取分类模型,实现情感词典的自动扩充。使用智能分词和词性标注方法,提取出知网情感词典以外可能含有一定情感倾向的形容词、状态词、语气词、形名词、叹词等五类词语。对提取出来的词语使用点互信息PMI算法、设置参数阈值等方法计算词语的情感倾向值,实现对这些词语的情感自动识别和分类,最终实现情感词典的自动扩充。 (2)研究评论语句的特征信息和特征表示,建立评论语句的特征向量模型,包括褒义词数、褒义极性强度、贬义词数、贬义极性强度、评论时间、评论地点和虚假度等,此外,还研究了评论语句的特征提取方法。 (3)在网格聚类理论基础上提出情感分类算法SCG,通过网格聚类方法建立分类模型。在网格聚类过程中引入动态衰减因子,周期性地移除稀疏网格,减少内存占用率和计算量。最终实验结果表明,相比Na?ve Bayes、SMO等机器学习分类算法,SCG算法具有更高的分类准确率。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号