首页> 中文学位 >基于用户特征的信息传播方法研究
【6h】

基于用户特征的信息传播方法研究

代理获取

目录

声明

第1章 绪论

1.1 研究背景及意义

1.2 国内外研究现状及存在问题

1.3 论文的研究内容与组织结构

第2章 相关技术理论

2.1 微博介绍

2.2 微博数据获取与处理

2.3 文本相似性计算

2.4 PageRank算法

2.5 数据集与分类算法选取的关系

2.6 梯度下降算法

2.7本章小结

第3章 基于用户特征的转发预测方法

3.1面临的难点和方法总述

3.2 转发特征提取

3.3 用户兴趣的提取和用户权威性的衡量

3.4 好友的选取

3.5 非平衡数据集的处理与支持向量机的学习

3.6 方法描述

3.7 本章小结

第4章 实验结果及分析

4.1 实验环境与数据集的介绍

4.2实验方法的评估

4.3数据处理及实验设计

4.4实验结果及分析

4.5 本章小结

结论

参考文献

致谢

展开▼

摘要

随着互联飞速的发展,手持终端的普及以及社交平台的推广,信息的传播方式发生了本质的变化。微博作为一个开放的平台,用户之间的关注不需要认证,信息传播具有速度快、范围广的特点。如何有效的预测信息的传播成为亟待解决的难题。目前基于网络社交平台的信息传播模型的研究,主要集中在社交网络结构和信息内容对信息传播的影响这两方面。而针对个体特征和新用户对信息传播的影响研究不够深入。
  针对微博平台,微博的转发是信息传播的基础。本文重点研究用户对微博的转发会受到哪些个体特征的影响,如何通过这些特征有效的预测用户的转发行为,然后对于历史信息不足的用户,提出通过相邻好友预测微博转发行为的方案。首先本文将微博的转发行为看作是发送者、接收者、微博这三个实体间的相互作用。提取用户特征的时候先考虑每个实体的特征,然后考虑两两实体间关系的特征,本文共提取了11个特征。其中发送者权威特征是通过 PageRank算法衡量的,该特征反映了发送者在网络中的位置特征。对于兴趣相似特征,首先使用 LDA模型对用户的历史微博信息进行建模,得出用户微博的主题分布,然后使用改进后的KL算法度量两个用户兴趣的相似度。对提取后的特征进行归一化处理,使用 SVM算法进行微博转发的预测,同时本文还考虑了非平衡数据集对SVM算法的影响。使用基于SVM的过采样方法优化数据集,可以提高预测效果。同时本文还构建了好友选取模型,对于缺乏历史信息的用户,通过好友选取模型从相邻的好友中选择一位亲密好友作为参考好友,来预测微博的转发行为。该模型选择好友的原则是:对于相同的微博,转发行为越相似,则越有资格作为参考好友。
  本文提出的方法使用新浪微博的真实数据集进行验证,并和常用的逻辑回归算法和朴素贝叶斯算法进行了对比。实验结果显示本文提出的方法有效的提高了预测结果的准确性,并且对缺少历史信息的新用户,当其他算法都失效时,本文提出的算法依然有不错的效果。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号