首页> 中文学位 >针对网络热点事件观点漂移检测技术的研究与实现
【6h】

针对网络热点事件观点漂移检测技术的研究与实现

代理获取

目录

声明

摘要

第1章 绪论

1.1 研究背景和意义

1.2 国内外研究现状

1.2.1 观点挖掘研究现状

1.2.2 网络舆情研究现状

1.3 问题提出

1.4 本文的主要工作

1.5 本文的组织结构

第2章 相关理论及技术

2.1 中文文本预处理

2.1.1 中文分词

2.1.2 去停用词

2.2 文本聚类

2.2.1 文本特征选取

2.2.2 文本表示

2.2.3 文本聚类

2.3 文本情感倾向性分析

2.3.1 海量数据的整体倾向性分析

2.3.2 篇章层次的情感倾向性分析

2.3.3 句子层次的情感倾向性分析

2.3.4 词汇与特征层次的情感倾向性

2.4 话题追踪与检测

2.4.1 话题检测

2.4.2 话题跟踪

2.5 本章小结

第3章 网络热点事件观点漂移检测框架及数据处理

3.1 网络热点事件观点漂移检测总体框架

3.2 网络热点事件评论数据的下载和处理

3.2.1 网络爬虫简介

3.2.2 AJAX技术简介

3.2.3 AJAX评论数据的下载和处理

3.2.4 网页评论数据的下载和处理

3.3 本章小结

第4章 网络热点事件的观点内容漂移

4.1 问题提出

4.2 观点内容漂移检测模型

4.3 任务分析

4.3.1 评论文本的建模

4.3.2 评论议题的提取

4.3.3 观点内容漂移的检测

4.4 本章小结

第5章 网络热点事件的观点情感倾向性漂移

5.1 问题提出

5.2 观点情感倾向性漂移检测模型

5.3 任务分析

5.3.1 时间区域的划分

5.3.2 评论数据集的情感倾向性分析

5.3.3 观点情感倾向性漂移的检测

5.4 本章小结

第6章 实验结果及分析

6.1 实验语料与实验环境

6.1.1 实验语料

6.1.2 实验环境

6.2 网络热点事件观点内容漂移的检测

6.2.1 评论数据集的隐含语义抽取

6.2.2 评论数据集的中心议题抽取

6.2.3 观点内容漂移的检测

6.2.4 观点内容漂移检测的实验结果分析

6.3 网络热点事件的观点情感倾向性漂移的检测

6.3.1 时间区域的划分

6.3.2 评论数据集的情感倾向性分析

6.3.3 观点情感倾向性漂移的检测

6.3.4 观点情感倾向性漂移检测的实验结果分析

6.4 本章小结

第7章 结论及未来工作

7.1 总结

7.2 进一步工作

参考文献

致谢

攻硕期间参加的项目及发表的文章

展开▼

摘要

随着互联网技术的发展,网络逐渐成为民众表达意见、观点和情感的场所。网络舆情正受到越来越多的重视,针对网络舆情信息的研究也越来越受到研究者的关注。在现阶段,网络舆情分析主要集中在(微)博客、评论等舆情信息的收集、分类、汇总等分析方面,而针对网络热点事件的相关舆论信息中,内容和观点变化分析的研究较少。基于此,本文针对网络热点事件相关评论等用户生成内容,研究观点内容漂移的检测和观点情感倾向性漂移的检测问题。
  在网络热点事件的观点内容漂移的检测方面,本文首先根据网络热点事件的特点,对每一天的评论应用LDA模型抽取出潜在语义,并对这些评论应用潜在语义进行建模和聚类。然后从得到的聚类中识别特定时间段的关键聚类并提取出关键聚类代表的中心议题的关键词集。最后针对观点内容漂移的检测,通过词语之间的语义相似性计算关键聚类之间的语义相似性,再比较相邻时间段中的关键聚类的语义相似性来检测观点内容是否发生了漂移。
  在网络热点事件的观点情感倾向性漂移的检测方面,本文首先根据网络热点事件的评论数据集的特点,将评论数据集进行时间区域的划分,得到一个评论子集的序列。然后以句子为情感倾向性分析的基本单元,首先计算一条评论中每个句子的情感倾向,再根据句子情感倾向的总和计算每条评论的情感倾向,之后根据评论子集中每条评论的情感倾向确定整个评论子集的情感倾向。最后根据不同时间区域的情感倾向性分布检测是否发生了观点情感倾向性漂移。
  实验表明,本文提出的方法能有效地对网络热点事件的相关评论进行观点内容漂移和观点情感倾向性漂移的检测,并且在这两个方面都取得了较好的效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号