首页> 中文学位 >社交网络中基于关系强度的用户群体发现研究
【6h】

社交网络中基于关系强度的用户群体发现研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1 研究背景和意义

1.2 国内外研究现状

1.3 研究内容

1.4 论文框架

第二章 相关技术介绍

2.1 社交网络

2.2 用户关系强度

2.3 Hadoop分布式框架

2.4 基于LSH的图聚类算法

2.5 本章小结

第三章 基于主题文本的用户关系强度计算

3.1 用户间的同现向量

3.2 多样性指数

3.3 主题权重

3.4 用户关系强度计算模型

3.5 本章小节

第四章 基于关系强度的用户群体发现算法

4.1 算法概述

4.2 基于MapReduce的用户关系强度计算实现

4.3 基于MR-LSH的用户群体发现

4.4 本章小结

第五章 实验与结果分析

5.1 实验环境配置

5.2 实验数据

5.3 实验结果

5.4 本章小结

第六章 总结与展望

6.1 总结

6.2 展望

参考文献

攻读硕士学位期间的研究成果目录

致谢

展开▼

摘要

随着互联网的飞速发展,各式各样的社交网络不停地涌现出来。作为一种新颖便捷的交友模式,社交网络吸引了大量的用户。越来越多的用户通过社交网络收集的各类资源信息来发表看法、交友等,国外知名社交网站Facebook每月活跃人数已经达到11亿人,国内社交网络代表新浪微博的用户数已经突破五亿。面对日益增长的庞大数据,无论用户还是社交网络的服务商都迫切需要解决一个问题:即如何寻找出与自己兴趣爱好或者看法一致的人进行交流互动。用户群体发现研究正是基于此目的而产生的,其目标是通过对社交网络中的用户关系图进行挖掘,从中发现具有相似兴趣的用户群体,进而支持广告投放、市场营销、好友推荐等实际应用。
  传统的用户群体发现方法是基于社交网络中用户之间的原始关系图,将用户视为图中的顶点,用户间的关系作为图的边,通过对图进行聚类分析从而获得用户的群体聚簇。这些传统的方法未考虑到用户关系的稀疏性,以及用户关系在社交网络与现实网络中的差异。本文在发现用户群体的过程中,一方面既考虑了用户在各个主题上相似信息的总体分布,另一方面也考虑了主题热门程度的差异对用户关系的影响。结合以上两个方面,本文给出了用户关系强度的计算模型,通过该计算模型针对社交网络的特点扩充了用户关系,最后使用聚类分析实现用户的群体发现。本文的具体工作内容主要包括:
  1)首先介绍了相关技术,包括社交网络的相关理论基础、用户关系强度的计算方法,以及MapReduce编程模型与局部敏感哈希的基本思想。
  2)接着阐述了一种通过构建用户特征同现向量,计算用户关系强度的方法。该方法结合了多样性指数以及权重频率,从两个相互独立的角度,共同计算了用户间的关系强度。
  3)面对社交网络的数据量挑战,将上述的计算过程通过Map Reduce编程模型得以实现,并在关系强度的计算结果基础上,利用局部敏感哈希和MapReduce的特性实现了新的用户关系图上的用户群体发现。
  4)使用社交网站Last.fm所开放的端口获取的数据进行实验,并对模型的相关参数进行了估算。实验结果从性能分析和可靠性分析上,证明了用户关系强度计算及群体发现的可行性与实用性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号