首页> 中文学位 >基于句子结构的中文微博情绪分析系统
【6h】

基于句子结构的中文微博情绪分析系统

代理获取

摘要

随着互联网的高速发展以及移动终端的普及,社交网络对人们生活的影响日益增强。随着微博这种便捷并且具有极强即时性的社交网络渐渐进入网民的生活。越来越多的人会选择在微博上分享、获取信息,交流情感与观点。由于微博还具有极强的原创性以及其贴近大众的特点。通过对微博这种短文本进行情绪分析,可以实现舆情监控等许多功能。
  情绪分析的含义是在情感极性倾向分析的基础上进行更细粒度的情绪分类。本文所设计的系统主要将情绪分类为愤怒、厌恶、恐惧、高兴、喜好、悲伤和惊讶七种情绪分类。通过分析中文微博的自身特点,其与英文微博的区别以及与传统书面语的差异,设计了本系统。数据来源为新浪微博。通过调用新浪微博官方提供的API接口获取一定数量的微博,提取出其中的微博内容、地域来源、终端来源等基本信息。在将微博内容进行去冗余标点等预处理后,利用中科院提供的开源分词系统以及哈工大的句子结构划分系统得到分词结果以及句子结构划分结果。最后,利用句子结构以及微博的话题、情感词库以及否定和程度副词词库进行量化计算出微博中对于关键词的情感细粒度分类结果,进而通过对愤怒、厌恶、恐惧、高兴、喜好、悲伤和惊讶七种情绪的极性划分,得到微博的情感极性倾向分析结果存入MySQL数据库。
  利用jsp和tomcat,将MySQL数据库中的分析结果,以折线图、柱状图和饼状图的方式展现出来。并且用户可以根据地域来源、终端来源以及时间等基本信息分别查看关键词情感极性倾向。对于注册用户,可以在成功登陆后查看关键词的情绪分析结果。

著录项

  • 作者

    于泷;

  • 作者单位

    大连理工大学;

  • 授予单位 大连理工大学;
  • 学科 软件工程
  • 授予学位 硕士
  • 导师姓名 李凤歧;
  • 年度 2014
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP391.12;
  • 关键词

    中文微博; 句子结构; 情绪分析系统; 社交网络;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号