首页> 中文学位 >基于数据挖掘的社交网络结构和用户影响力研究
【6h】

基于数据挖掘的社交网络结构和用户影响力研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1研究背景及意义

1.2国内外研究现状

1.3主要工作

1.4论文结构

第二章 社交网络与数据挖掘研究综述

2.1社交网络相关概念

2.2社交网络现状与分析

2.3数据挖掘简介

2.4 本章小结

第三章 数据采集及社交网络分析

3.1数据采集

3.2用户关注关系采集与解析

3.3社交网络结构研究

3.4社交网络用户行为分析

3.5 本章小结

第四章 社交网络用户影响力算法研究和实现

4.1 PageRank算法介绍

4.2 SNIRank算法提出

4.3 SNIRank算法实现

4.4 SNIRank算法性能分析

4.5 本章小结

第五章 基于时间因素的用户影响力算法改进

5.1 时间因素分析

5.2 基于时间因素的算法改进与实现

5.3 改进算法性能比较

5.4 本章小结

第六章 总结及展望

参考文献

致谢

展开▼

摘要

近年来,随着Web2.0技术的迅速发展,各类社交服务网站如雨后春笋般涌现出来,人们正在迅速进入在线社交的时代,对社交网络的研究也获得了广泛的关注。在线社交网络可以看成是传统社会关系在互联网上的一种映射和延伸。在线社交网络具有廉价、便捷、地域无关等特点,能够为用户带来了新的用户体验,因此成为了一种广泛使用的人际交互方式。
  与此同时,伴随着“大数据时代”的来临,数据挖掘已经越来越受到人们的青睐和关注。通过对社交网络的挖掘分析,可以发现各类社交网络的结构异同,优化网络结构,提高网络效率,改善用户体验。对用户行为的分析可以发现用户在网络中的地位,掌握用户的习惯,研究用户的兴趣传播,发掘最具影响力用户群,为企业实现精确的市场营销推广提供有力保证。
  首先,本文选取新浪微博为研究的真实数据来源,采用 API调用方式获取大量研究所需的用户信息,主要包括用户关注关系、注册时间、微博内容等。然后通过对数据的筛选和解析获取社交网络的平均度数、聚类系数等一系列基本信息,验证了社交网络的“小世界”特征。
  其次,针对新浪微博的用户影响力进行深入研究。具体而言,借鉴谷歌PageRank算法,在PageRank只考虑链接关系的基础上,结合用户参与在线社交的真实情况,将用户微博数、粉丝数等引入到影响力的迭代过程中实现非均匀的分配方式,提出了用于计算社交网络用户影响力排名的SNIRank(Social Network Influence Rank)算法,并将算法用于真实数据集,发现算法在用户覆盖人次等方面要显著优于PageRank算法。
  最后,考虑到社交网络不断变化,用户影响力也会随着时间的推移而改变,对上述算法进行改进,将用户活跃度引入算法之中,提出了基于时间的TSNIRank(Time-based Social Network Influence Rank)算法,结果表明改进算法能有效降低当前不活跃的老用户的排名,更加符合瞬息万变的社会网络特性以及商业推广的应用需求。

著录项

  • 作者

    卞京;

  • 作者单位

    南京邮电大学;

  • 授予单位 南京邮电大学;
  • 学科 电子与通信工程
  • 授予学位 硕士
  • 导师姓名 王玉峰;
  • 年度 2013
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP393.02;TP311.13;
  • 关键词

    社交网络; 数据挖掘; 用户影响力; 微博平台;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号