首页> 中文学位 >互联网舆情指数挖掘方法研究
【6h】

互联网舆情指数挖掘方法研究

代理获取

目录

互联网舆情指数挖掘方法研究

THE RESEARCH ON MINING METHODS ABOUT THE AVERAGE OF NETWORK CONSENSUS

摘要

Abstract

第1章 绪论

1.1 课题背景

1.2 网络舆情和舆情指数

1.3 互联网舆情挖掘的研究现状

1.4 本文的研究内容及组织结构

第2章 舆情关键词挖掘技术

2.1 文本分类和聚类

2.2 舆情关键词挖掘方法概述

2.3 建立备选舆情关键词语料集

2.4 基于统计的中文高频词提取

2.5 网络舆情关键词的选取

2.6 网络舆情关键词的分类

2.7 本章小结

第3章 互联网舆情的突变分析和关联分析

3.1 舆情关键词的数据处理技术

3.2 互联网舆情突变分析的理论基础

3.3 互联网舆情关键词的突变分析

3.4 互联网舆情关键词的关联分析

3.5 小结

第4章 互联网舆情指数体系的建立

4.1 相关指数体系的参考

4.2 互联网舆情指数体系的建立

4.3 互联网舆情指数系统的原理性结构

4.4 本章小结

结论

参考文献

哈尔滨工业大学硕士学位论文原创性声明

哈尔滨工业大学硕士学位论文使用授权书

致谢

展开▼

摘要

互联网是人们获取信息和传递信息的主要载体,海量的各种类型的数据在网络上形成一个极其丰富的信息源。随着互联网的迅速发展,互联网舆情的研究面临着新的问题和挑战。互联网舆情体现了大多数网民对网络突发事件集中和真实的反映。因此利用互联网自身的信息触角,发现处于“未然态”的各种危机因素,建立起完善的网络舆情检测系统势在必行。
  网络舆情检测通常分为网络异常检测和常规趋势检测两方面。针对网络异常检测,本文采用数据流高频项检测技术,提出了全新的小波集摘要数据结构和改进的突变检测算法,并在此基础上进行了必要的关联分析;针对常规趋势检测,本文参考了相关领域现有的指数体系,提出了层级互联网舆情指数这一全新的概念。
  考虑到对中文单词进行聚类的复杂性,本文首先对所采集的关键词语料集进行了必要的分词,在此基础上,采用人工分类、类内高频词汇统计与聚类相结合的方法,从中统计出高频词汇,定义为舆情关键词。
  在此基础上,针对所选的舆情关键词进行频度曲线绘制,针对关键词频度曲线进行必要的突变分析和关联分析。针对关键词频度曲线的突变性突发,采用小波变换与滑动窗口技术相结合的方法,扩大了可分析数据的范围。在对传统的突发检测(Burst Detection)算法进行改进的基础之上,提出了改进的突变性突发检测算法,并对算法进行了必要的性能评价。同时,对所选择的舆情关键词做进一步的关联分析,为舆情指数体系的建立提供必要的支持。
  最后,参考现有的指数体系,通过与现有的社会稳定指数进行比较,给出层级互联网舆情指数的定义形式,并给出了互联网舆情指数系统的原理性结构。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号