协同过滤中数据稀疏问题与推荐实时性的研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

数据爆炸的现今使得推荐系统技术变得越来越热门，越来越重要，几乎所有的电子商务网站以及部分门户网站，甚至是搜索引擎都有推荐系统相关技术的身影。总结其中的原因，一是在唾手可得的海量信息里，人们所期望获得的却是其中极小的一部分；二是人们期望获得的信息里有一些潜在的偏好，利用这些偏好可以做更多的事情。推荐系统的发展非常迅速，它分为协同过滤，基于知识的推荐，混合推荐等等，而各种类别的推荐算法下又有很多成熟的技术。协同过滤一直是这其中的研究最多的技术，同时也是在电子商务有着广泛应用的技术之一。典型的协同过滤，通过维护一个评分者—物品评分矩阵，计算相似度确定近邻来产生推荐。
　　不幸的是，这种算法的性能随着用户和商品的增加会产生很多问题：高维度，高稀疏度。此二者对于该技术在电子商务网站的应用产生巨大挑战。本文着眼于此，提出或改进了若干方法，以解决数据稀疏问题和推荐实时性。
　　对于数据稀疏问题，主要对外部信息做适当提取，计算其Jaccard相似度产生预测值，并将预测值有节制地填充至测试集，以此来提高传统推荐技术的准确性。具体的，评分外的信息，如：用户的年龄、职业，物品的类别等，通过Jaccard相似度做初步调整，再与经典协同过滤得到的最近邻相似性进行加权，通过多组具体的实验，确定了较为理想的权重系数。在这样权重下，我们得到的结果相对基准实验有了一些提高。
　　对于实时性的解决，我们引入聚类中的簇代表点技术(CURE，Clustering Using Representatives)，主要是将搜寻所有用户空间问题转变为搜索簇代表点的集合中的近邻问题，从而减少了近邻搜寻空间的规模，以提高实时性。解决这一问题的关键，亦或是本文的核心工作，在于簇代表点的计算上。通过对前人所提算法的研究，我们进行了适当的修改，通过平行实验对比，我们修改的算法得到的最终结果相对较好。

著录项

作者
徐键;
展开▼
作者单位

兰州大学;

展开▼
授予单位兰州大学;
学科软件工程
授予学位硕士
导师姓名张瑞生;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类算法理论;
关键词
推荐系统; 协同过滤; 数据稀疏; 权重系数;

相似文献

中文文献
外文文献
专利

1. 协同过滤推荐系统中数据稀疏问题的解决 [J] . 吴颜 ,沈洁 ,顾天竺 . 计算机应用研究 . 2007,第006期
2. 一种有效缓解数据稀疏问题的协同过滤推荐算法 [J] . 张清 ,于博 ,王辉 . 合肥工业大学学报（自然科学版） . 2019,第004期
3. 一种有效缓解数据稀疏问题的协同过滤推荐算法 [J] . 程芳 ,沈红岩 ,赵艳 . 现代情报 . 2016,第003期
4. 一种有效缓解协同过滤推荐评价数据稀疏问题的算法 [J] . 黄永锋 ,覃罗春 . 东华大学学报（自然科学版） . 2013,第001期
5. 基于数据稀疏性的协同过滤推荐算法改进研究 [J] . 岳希 ,唐聃 ,舒红平 . 四川大学学报（工程科学版） . 2020,第001期
6. 基于Hadoop的智能推荐系统中协同过滤算法的研究 [C] . Li Bingying ,李冰莹 ,Wang Xuejun . SCEG2015研讨会（2015年“计算机科学与技术及教育技术“学术研讨会） . 2015
7. 统计视角下面向数据稀疏问题的协同过滤推荐算法研究 [A] . 张娟娟 . 2016

协同过滤中数据稀疏问题与推荐实时性的研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅