首页> 中文学位 >大数据环境下基于协同过滤的推荐系统研究与实现
【6h】

大数据环境下基于协同过滤的推荐系统研究与实现

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第1章 绪论

1.1 课题背景

1.2 研究现状

1.3 本文主要研究内容与创新之处

1.4 本文结构

第2章 相关技术

2.1 引言

2.2 Hadoop技术

2.3 Hadoop相关项目

2.4 本章小结

第3章 协同过滤推荐系统综述

3.1 引言

3.2 协同过滤推荐流行算法

3.3 协同过滤推荐系统的评价标准

3.4 协同过滤系统当下面临的问题

3.5 本章小结

第4章 大数据环境下的社会化推荐方法

4.1 引言

4.2 大数据环境下的社会化推荐方法

4.3 LPTA基于Mapreduce模型的并行化实现

4.4 实验结果及分析

4.5 本章小结

第5章 大数据环境下基于概率矩阵分解的个性化推荐

5.1 引言

5.2 融入用户近邻信息的矩阵分解模型IPMF

5.3 并行化IPMF及其MapReduce和Spark实现

5.4 实验结果及分析

5.5 本章小结

第六章 基于Hadoop的推荐系统设计与实现

6.1 引言

6.2 系统需求分析

6.3 系统架构设计

6.4 系统执行流程

6.5 系统实现与展示

6.6 本章小结

第七章 总结与展望

7.1 总结

7.2 展望

参考文献

致谢

攻读学位期间参加的科研项目和成果

展开▼

摘要

推荐系统是一种能够主动挖掘用户兴趣偏好,为不同的用户制定个性化的推荐列表,提供个性化推荐服务的智能化系统。协同过滤算法是一种发展较早、应用广泛的个性化推荐算法,目前比较流行的包括社会化推荐算法与概率矩阵分解模型。前一种算法通过融入用户社会属性,提高用户偏好刻画的准确性,后一种算法通过机器学习的方法得到用户、项目的特征,具有较高的准确度。但是,如何拓展有限的社会关系和如何揭示用户之间相互作用对用户特征的影响都还有值得研究和改进的空间。另外,大数据时代的到来,海量数据的处理对推荐系统的计算与存储能力带来了严峻的挑战。由于传统的推荐系统通常运行在单服务器条件下,分析计算能力有限,已经不能满足有效处理爆发式增长数据的需求。针对上面的问题,本文提出了两种新的协同过滤算法,在 Hadoop平台实现并行化计算以提高计算效率与存储能力。另外,研究并实现了一个结合 Hadoop相关技术和本文所提推荐算法的具有处理海量数据能力的推荐系统。
  本研究主要内容包括:⑴大数据环境下的社会化推荐算法。该算法在协同过滤中引入社会信任关系,并且挖掘出更多的可信任关系。对于用户之间的信任关系,需要区分项目类别,在各类别下通过社区发现方法发现信任社区作为目标用户候选可信任用户集,以扩展目标用户可信任用户集。再根据候选可信任用户在项目类别下评价的专业性和该用户与目标用户评分的相似性,定义候选可信任用户的信任度。根据信任度得到目标用户可信任用户集,从而得到推荐结果。最终给出算法在Mapreduce编程模型下的并行化实现。⑵大数据环境下基于概率矩阵分解的个性化推荐。在该算法中把用户对项目偏好的相似度定义为两部分:用户对项目的评分相似度和用户对不同项目类别的关注度。根据相似度对用户进行聚类,并把用户近邻信息融入到概率矩阵分解模型以揭示用户互相影响关系。再根据聚类结果对用户、项目进行分组并组合,调整更新序列,分别在 Spark和MapReduce计算框架下实现并行计算。⑶在Hadoop平台,利用本文提出的推荐算法和Spark计算引擎实现了电影推荐系统。该系统具有较优的可扩展性,能够存储和计算海量的数据,能够达到较高的推荐精度,提供良好的用户体验。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号