首页> 中文学位 >微博关键用户和用户社区网络挖掘研究
【6h】

微博关键用户和用户社区网络挖掘研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章 绪 论

1.1 研究背景与意义

1.2 研究现状

1.3 本文的结构与内容

第2章 相关概念和技术

2.1 新浪微博简介

2.2 关键用户挖掘

2.3 社区网络挖掘

2.4 本章小结

第3章 微博用户数据的抽取和存储

3.1 用户数据抽取方式

3.2 数据解析和存储

3.3 本章小结

第4章 微博关键用户挖掘

4.1 微博关键用户的识别依据

4.2 微博用户影响力评价体系

4.3 微博关键用户识别模型构建

4.4 本章小结

第5章 微博用户社区网络挖掘

5.1 微博用户社区网络特征和相关计算

5.2挖掘结果的评价和挖掘流程

5.3 基于改进的相似度层次聚类社区网络挖掘

5.4 本章小结

第6章 总结和展望

6.1 论文总结

6.2 进一步展望

参考文献

攻读硕士学位期间发表的论文

致谢

展开▼

摘要

自从国内微博兴起以来,我国的互联网领域发展迅猛,特别是社会化媒体更是日新月异。微博已经成为工具应用到大众的日常生活、学习和工作中。微博平台产生的用户数据量巨大。庞大的信息在当今的信息高速公路(互联网)上迅速传播到每个角落,微博正在悄然改变着人们的信息获取方式,彻底改变了新闻的传播方式,同时也给更多的草根阶层融入社会并参与社会活动带来革命性的影响。  在国内,以新浪微博为代表的Web2.0时代迅速崛起,2014年8月15日,新浪对外公告显示,新浪微博拥有超1.56亿的活跃用户,他的用户注册量已经超过了6亿,并且每天有超过6140万活跃用户驻留在新浪微平台。根据微博平台规则,每一个微博用户都有一个关注列表,该列表为微博用户接受信息提供依据。研究人员称其为信息传递频道,微博用户之间通过关注与另一个微博用户形成联系,微博平台上所有用户之间的关联关系就构成了一个庞大的微博用户社区网络。  本文分析了微博用户个体以及微博用户群体的属性特征,利用微博开放平台API获取用户数据并导入MySQL数据库,在基本的用户社区网络挖掘算法基础上提出新的改进挖掘方法。这些研究将对微博舆情控制、网络安全、好友推荐、电子商务等具有实际意义。本文研究主要内容可以分为三个方面,如下:  一、本文分析了新浪微博开放平台使用特点。分别阐述微博开放平台API和网络爬虫两种常用的数据获取方式。分析给出两种数据获取手段的优劣。本文采用多用户频率控制的API调用获取新浪微博用户数据。对用户数据做了抽取、清洗等预处理工作,最后把清理后的用户数据存储到MySQL数据库中。  二、本文对微博平台上关键用户的识别进行设计。阐述了微博用户特征的属性的含义,并对这些属性归类成他人和个人两类影响因子。利用微博用户的敏感属性特征对关键用户进行识别发现。定义了微博关键用户识别的定量化计算公式,给出了微博关键用户识别的模型,并进行试验对比分析。  三、本文对微博平台上用户之间形成的虚拟社区网络进行挖掘。利用微博用户社区网络图概念,从挖掘算法、挖掘流程以及挖掘结果的评价三个方面阐述实现过程。提出了改进的用户相似度模型的层次聚类挖掘方法对微博用户社区进行聚类分析,实验结果表明社区挖掘效果有所提升。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号