首页> 中文学位 >基于多源信息的个性化微博用户推荐算法研究
【6h】

基于多源信息的个性化微博用户推荐算法研究

代理获取

目录

声明

第1章 绪论

1.1研究背景

1.2研究意义

1.3国内外研究现状

1.4本文的研究内容

1.5论文组织结构

1.6本章小结

第2章 微博用户推荐相关技术概述

2.1个性化推荐

2.2 Spark并行计算框架

2.3 本章小结

第3章 基于Canopy和粗糙集的CRS-KNN文本分类算法

3.1 引言

3.2 优化KNN算法的相关工作

3.3 CRS-KNN算法基础理论

3.4 数据的预处理

3.5 CRS-KNN算法

3.6 实验设计与分析

3.7 本章小结

第4章 基于多源信息相似度的微博用户推荐算法

4.1 引言

4.2 推荐算法相关研究

4.3 多源信息相似度

4.4 MISUR微博用户推荐算法

4.5 实验结果与分析

4.6 本章小结

第5章 总结与展望

5.1 总结

5.2 展望

参考文献

在读期间发表的学术论文及研究成果

致谢

展开▼

摘要

随着信息化产业、社交网络的不断发展,社交网络的用户越来越多,微博作为社交网络中的重要信息交互平台,具有共享性、时效性和交互性等特点,迅速受到大量用户的青睐。如何在微博的海量用户中快速、准确地找到用户感兴趣的用户信息,即实现用户推荐成为当前研究的一个热点问题。针对KNN算法的分类效率随着训练集规模和特征维数的增加而逐渐降低的问题,提出了优化的文本分类算法;针对传统的协同过滤推荐算法中存在的数据稀疏性和推荐准确率不高的问题,将上述提出的分类算法应用于用户推荐中,提出了基于多源信息相似度的微博用户推荐算法。
  本研究主要内容包括:⑴提出了基于Canopy和粗糙集的CRS-KNN文本分类算法。该算法首先将待处理的文本数据通过 Canopy进行聚类,然后对得到的每个类簇运用粗糙集理论进行上、下近似分割,对于分割得到的下近似区域无需再进行分类,而通过上、下近似做差所得的边界区域数据需要通过KNN算法确定其最终类别。该方法降低了KNN算法的数据计算规模,提高了分类效率,同时准确率、召回率和F1值都有一定的提高。⑵提出了基于多源信息相似度的微博用户推荐算法。该算法首先根据微博用户的标签信息,运用CRS-KNN算法对用户进行分类处理;其次,对得到的每个类中的用户分别计算其多源信息的相似度大小;再次,引入时间权重和丰富度权重计算多源信息的综合相似度,并根据其大小进行TOP-N用户推荐;最后,搭建了Spark并行计算框架,完成了算法有效性的验证,实验表明该方法不仅在用户推荐上具有良好的有效性,而且在准确率、召回率和效率等方面都有较大幅度地提升。

著录项

  • 作者

    姚彬修;

  • 作者单位

    曲阜师范大学;

  • 授予单位 曲阜师范大学;
  • 学科 计算机科学与技术
  • 授予学位 硕士
  • 导师姓名 倪建成;
  • 年度 2017
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.13;
  • 关键词

    信息检索; 数据挖掘; 程序语言; KNN算法;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号