大数据环境下基于协同过滤的推荐系统研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

推荐系统是一种能够主动挖掘用户兴趣偏好，为不同的用户制定个性化的推荐列表，提供个性化推荐服务的智能化系统。协同过滤算法是一种发展较早、应用广泛的个性化推荐算法，目前比较流行的包括社会化推荐算法与概率矩阵分解模型。前一种算法通过融入用户社会属性，提高用户偏好刻画的准确性，后一种算法通过机器学习的方法得到用户、项目的特征，具有较高的准确度。但是，如何拓展有限的社会关系和如何揭示用户之间相互作用对用户特征的影响都还有值得研究和改进的空间。另外，大数据时代的到来，海量数据的处理对推荐系统的计算与存储能力带来了严峻的挑战。由于传统的推荐系统通常运行在单服务器条件下，分析计算能力有限，已经不能满足有效处理爆发式增长数据的需求。针对上面的问题，本文提出了两种新的协同过滤算法，在 Hadoop平台实现并行化计算以提高计算效率与存储能力。另外，研究并实现了一个结合 Hadoop相关技术和本文所提推荐算法的具有处理海量数据能力的推荐系统。
　　本研究主要内容包括：⑴大数据环境下的社会化推荐算法。该算法在协同过滤中引入社会信任关系，并且挖掘出更多的可信任关系。对于用户之间的信任关系，需要区分项目类别，在各类别下通过社区发现方法发现信任社区作为目标用户候选可信任用户集，以扩展目标用户可信任用户集。再根据候选可信任用户在项目类别下评价的专业性和该用户与目标用户评分的相似性，定义候选可信任用户的信任度。根据信任度得到目标用户可信任用户集，从而得到推荐结果。最终给出算法在Mapreduce编程模型下的并行化实现。⑵大数据环境下基于概率矩阵分解的个性化推荐。在该算法中把用户对项目偏好的相似度定义为两部分：用户对项目的评分相似度和用户对不同项目类别的关注度。根据相似度对用户进行聚类，并把用户近邻信息融入到概率矩阵分解模型以揭示用户互相影响关系。再根据聚类结果对用户、项目进行分组并组合，调整更新序列，分别在 Spark和MapReduce计算框架下实现并行计算。⑶在Hadoop平台，利用本文提出的推荐算法和Spark计算引擎实现了电影推荐系统。该系统具有较优的可扩展性，能够存储和计算海量的数据，能够达到较高的推荐精度，提供良好的用户体验。

著录项

作者
沈杰;
展开▼
作者单位

浙江工业大学;

展开▼
授予单位浙江工业大学;
学科计算机技术
授予学位硕士
导师姓名田贤忠;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类程序语言、算法语言;
关键词
数据挖掘; 个性化推荐; 程序语言; 推荐算法;

相似文献

中文文献
外文文献
专利

1. 大数据环境下智能推荐系统中协同过滤算法研究 [J] . 李章威 ,陈丽 ,曹子谞 . 电脑编程技巧与维护 . 2016,第021期
2. 大数据环境下基于用户位置的个性化音乐推荐系统设计 [J] . 朱志慧 ,田婧 ,林捷 . 无线互联科技 . 2019,第002期
3. 大数据环境下基于用户画像的学术文献推荐系统研究 [J] . 刘相金 ,王梦菊 . 河南图书馆学刊 . 2019,第012期
4. 大数据环境下基于反馈的敏感数据识别方法研究与实现 [J] . 何欣 ,高运霞 . 电信工程技术与标准化 . 2020,第012期
5. 大数据环境下基于Hadoop框架的数据挖掘算法的研究与实现 [J] . 洪波 ,吕燕霞 ,黄磊 . 电子设计工程 . 2017,第007期
6. 大数据环境下基于人口统计学的改进聚类模型协同过滤算法 [C] . Wang Yuanyuan ,王嫒媛 ,Li Xiang . 2015全国高性能计算学术年会 . 2015
7. 大数据模拟环境下的分布式协同过滤推荐系统的研究 [A] . 谢瑶瑶 . 2014

大数据环境下基于协同过滤的推荐系统研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅