首页> 中文学位 >基于微博的新兴热点事件检测研究
【6h】

基于微博的新兴热点事件检测研究

代理获取

目录

封面

中文摘要

英文摘要

目录

1 绪 论

1.1研究背景及意义

1.2国内外研究现状

1.3论文研究的主要内容

1.4论文的组织结构

1.5小结

2 相关技术和概念综述

2.1 微博简介及其特征

2.2 中文分词技术

2.3 文本相似性度量方法

2.4 微博事件检测技术

2.5 本章小结

3 微博新兴热点事件检测方法

3.1微博数据预处理

3.2 微博文本事件聚类

3.3 基于影响力的事件新兴热点评定

3.4 新兴热点事件摘要生成

3.5 本章小结

4 实验结果与分析

4.1 实验数据

4.2数据预处理

4.3新兴热点事件检测评估

4.4 本章小结

5 总结与展望

5.1 总结

5.2 展望

致谢

参考文献

附录 A 作者在攻读学位期间发表的论文目录

展开▼

摘要

随着社交网络的不断发展,用户迫切需要一种简便快捷的信息发布和获取方式,微博的出现也就成为了必然的趋势。微博的实时性和便捷性的特点使得其迅速发展,每天都会产生大量有实用价值的文本信息,其中就有对当前生活中热点事件的描述和评论。微博平台常常会将一些热门的话题或事件在首页上罗列出来,推荐给用户,但是这些话题往往只列出最近几天的少量事件,没有实时的给出每天更多的热点事件。这些事件往往不能满足用户对新兴事件的需求,用户如果要找到自己感兴趣的新兴事件,就必须自己寻找相关的微博帖子阅读,在这个信息爆炸的互联网时代,这必然带来很大的不便。
  当前从微博中准确高效地挖掘出正在发生的热点事件是近年来研究的热点。本文就微博中的新兴热点事件检测做了研究,微博中的新兴热点检测具有实用意义,某些新兴事件,如自然灾害、传染疾病和危害巨大的袭击等事件如果能在早期就检测出来可以有效的帮助政府或者个人及时预防和处理相关事件,从而尽量减少不必要的伤害和损失。
  论文综合考虑微博用户的粉丝数量和微博本身的转发、评论次数计算每条微博的影响力,从而提出一种基于影响力的微博新兴热点事件检测方法(Influence-BasedEmergingHotspotEventDetection,IEED)。该方法首先对微博数据进行预处理,得到特征向量;随后运用层次聚类将微博文本聚类为事件,得到候选事件集合,聚类过程中运用滑动窗口控制数据流入;最后运用微博影响力以及事件发布微博的数量计算事件的新兴热点评分,并提取出事件中的关键词构成事件摘要,将评分top-k的新兴热点事件推荐给用户。
  通过运用现实生活中的新浪微博数据作为实验数据集来测试论文提出的算法,实验结果表明,基于影响力的微博新兴热点事件检测方法(IEED)能在早期高效地检测出微博中的新兴热点事件,并准确给出事件摘要,具备一定的实际应用价值。

著录项

  • 作者

    朱荔;

  • 作者单位

    重庆大学;

  • 授予单位 重庆大学;
  • 学科 计算机系统结构
  • 授予学位 硕士
  • 导师姓名 李华;
  • 年度 2015
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP393.092;
  • 关键词

    社交网络; 微博; 新兴热点事件检测; 影响力;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号