首页> 中文学位 >面向用户评论的细粒度情感分析系统设计与实现
【6h】

面向用户评论的细粒度情感分析系统设计与实现

代理获取

目录

声明

第一章 绪论

1.2国内外研究现状及发展趋势

1.2.1情感词典与情感语料库

1.2.2文本主观性分类

1.2.4细粒度情感分析

1.4论文组织结构

1.5本章小结

第二章 相关理论和技术

2.1.2Robots.txt协议

2.1.3获取网页源代码

2.2.2传统的K-means算法

2.2.3改进的k-means算法

2.3基于聚类的垃圾评论检测方法

2.3.2评论数据的表示

2.3.3改进的基于聚类的垃圾评论检测方法

2.4细粒度特征提取

2.4.2条件随机场的参数化形式

2.4.4细粒度情感分析

2.5本章小结

第三章 细粒度情感分析系统需求分析

3.3系统的功能性需求分析

3.4系统的非功能性需求分析

3.5本章小结

第四章 细粒度情感分析系统设计

4.2系统详细设计

4.3系统功能模块设计

4.3.2数据采集模块

4.3.3基于聚类的数据处理模块

4.3.4基于RCF算法的情感分析模块

4.4数据库设计

4.4.2数据库表的设计

4.5本章小结

第五章 系统实现与展示

5.3系统的实现

5.3.1登录模块

5.3.2数据采集模块

5.3.3数据处理模块

5.3.4细粒度情感分析展示

5.3.5报告生成模块

5.4系统测试

5.5本章小结

第六章 总结与展望

6.2展望

参考文献

致谢

展开▼

摘要

随着互联网的快速发展,各种电子商务网站以及购物网站等也呈现了前所未有的增长速度,这就导致了大量网络评论短文本源源不断的产生。这些评论短文本中承载许多有用的用户评价信息,通过有效的分析这些评价短文本,不仅能够获得重要的信息,还能够促进电子商业的发展和繁荣。因此,当代网络舆情分析的关注点已经逐渐转移到了文本分析处理上。 针对这一背景,本文设计并实现了一个细粒度层次的情感分析系统,解决了人工处理网络评论文本费时费力,分析不全面,效率低下等问题。本文主要利用对本文系统采集到的数据进行处理分析得到的结果进行情感分析,最终以直观的界面化的形式展现在用户面前,为用户提供便利。下面是本文所用到的一些主要的技术以及方法: (1)提出了基于聚类的垃圾评论检测方法 本文首先对采集到的数据进行了预处理工作,将半结构化的网页转换成了结构化数据的形式,进而发现信息量过大将会对进行情感倾向性分析带来很大困扰。所以,考虑在进行情感分析之前进行信息的过滤,提出基于聚类垃圾评论过滤的方法。经过一系列的处理,将这些评论信息根据它们的相似性进行聚类,然后在此聚类的基础上进行处理。并且通过实验证明了,该方法具有高效性以及实用性。 (2)采用CRF算法迭代的抽取评价词,改进特征稀疏性问题 本文采用CRF算法,对情感对象、情感词及情感修饰词进行联合提取,将无监督抽取的结果作为CRF的输入,通过词性及位置等特征来迭代抽取文本中的特征词。由于评价对象大多是名词及其短语,所以为了提高挖掘的效率,本文在抽取评价词时只考虑了名词,将得到的候选评价词作为CRF的输入来提取评价词集合。因为在CRF模型中,所求得的是全局最优解,因此可以有效地避免由于上下文特征选择以及在最大熵模型中标签偏差的限制,改进特征稀疏性问题。 (3)本文设计并实现了细粒度情感分析系统 本文的系统通过采用网络爬虫、数据处理和细粒度情感分析等一系列的相关技术和方法,一步步实现了对网络中大量广泛存在的评价信息的采集和分析,并以可视化界面的形式直观的显示在了用户面前。使用者可以利用查询界面进行查询,来获取各自所需的相关信息。该系统能够快速、有效的收集网络中的相关信息,并对其进行整合处理、分析评价,最终以图形化的形式展现出来,具有实用性、可操作性、直观性等优点。 通过设计和实现本文系统,能够实现自动化的处理评论文本,并将情绪化分析结果展现在用户面前,方便用户获取信息。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号