首页> 中文学位 >基于多目标决策的微博用户影响力评价算法研究
【6h】

基于多目标决策的微博用户影响力评价算法研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

1绪论

1.1研究背景与意义

1.2国内外研究现状

1.3主要研究内容

1.4论文组织结构

2微博社会网络与多目标决策分析

2.1微博社会网络

2.2多目标决策

2.3本章小结

3基于多目标决策的用户影响力评价算法

3.1微博网络模型

3.2用户影响力评价指标

3.3用户影响力评价算法

3.4算法特点分析

3.5本章小结

4微博数据采集系统

4.1系统需求分析

4.2关键技术和解决方案

4.3系统总体架构设计

4.4主要功能模块设计

4.5系统实现与采集结果

4.6本章小结

5实验及结果分析

5.1实验环境及实验数据集合

5.2用户影响力评价指标的有效性验证

5.3与其他影响力评价算法对比

5.4实例研究

5.5本章小结

6总结与展望

6.1本文主要研究成果

6.2下一步研究工作展望

致谢

参考文献

展开▼

摘要

微博作为社交媒体的一种形式,具有信息传播快、来源广和多角度等特征,已经成为人们日常信息交流和分享的主要渠道,吸引了国内外学者的广泛关注。研究用户影响力对于微博的用户推荐、信息扩散、舆情监测和定向营销等具有重要的意义。
  首先,通过分析微博消息传播机制,构建了微博网络模型,并把微博网络细分为两个网络:用户关系网络和博文传播网络。然后,结合新浪微博的特征,为了有效地避免“僵尸粉”的影响,防止用户采用对博文的自我转发、自我评论等操作来恶意提升自己的影响力,从用户关系网络和博文传播网络两个角度,定义了四个评价用户影响力的指标:LeaderRank影响力、博文平均被转发数、博文平均被评论数和博文平均被赞数。在此基础上,为避免给不同指标确定合适的权重参数,引入了多目标决策中经典的Skyline计算方法,提出了WeiboLeaderRank影响力评价算法,并分析了该算法的特点。
  为了验证算法的有效性,使用网络爬虫技术,设计并实现了新浪微博数据采集系统,建立了包含125207个用户的微博研究数据集。由于微博服务器检测到异常的访问请求时,会采取重定向访问请求或禁止用户访问等措施,这会严重影响采集的速度。为解决这一问题,采用了多账号模拟登陆,一个账号开启一个线程,多线程同时采集的方法。线程使用匿名代理服务器请求数据,并动态改变请求HTTP头部信息,同时加入异常检测模块,及时发现异常情况并采取相应的操作,尽量模仿正常的用户访问行为,提高采集效率。
  最后在采集的数据集上进行实验,验证了四个影响力评价指标的有效性,并把WeiboLeaderRank算法和其他常用的用户影响力算法进行比较,结果表明WeiboLeaderRank算法评价效果更好,并且计算时间是随着数据量地增长而线性增加的,算法能适应超大规模的真实微博环境,同时具有较好的实时性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号