统计视角下面向数据稀疏问题的协同过滤推荐算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着网络的普及以及电子商务的飞速发展，信息资源呈爆发式增长，用户在海量资源中快速而准确得找到自己喜欢的信息或商品变得越来越困难。为了解决这个问题，便产生了推荐系统。　　推荐算法一直是推荐系统的核心技术。目前，协同过滤推荐算法是众多推荐算法中应用最成功且最广泛的推荐技术。它主要根据用户留在网上的评分进行推荐。然而在实际应用中，由于用户数据和项目数据规模相当庞大，且用户对自己接触过的项目评分数量又非常有限，从而导致了严重的数据稀疏性问题，该问题是导致传统的协同过滤推荐算法推荐精度较差的主要原因之一。　　本文试图站在统计学的角度，针对数据稀疏性问题对协同过滤推荐算法进行研究。实现了基于描述性统计的简单推荐，并探究了将统计量填充、聚类分析、矩阵分解等方法应用到协同推荐算法中的效果。在详细分析了数据稀疏性问题的起因以及对协同推荐的影响途径基础上，本文提出了采用统计量填充的方法缓解数据稀疏性问题，进而用K-Means聚类方法对用户进行聚类，根据轮廓系数确定用户类别数，对每类用户的缺失评分使用同类别的评分统计量作为固定值进行填充。除了固定值填充缺失评分外，本文还采用奇异值分解(SVD)降维技术实现评分预测，利用预测评分对原始矩阵进行填充，形成新的用户—项目评分矩阵，再进行协同推荐。最后从推荐过程修正的角度出发，对传统的用户间相似度计算采用加权的方式进行改进，提出了基于用户偏好相似度与用户评分相似度进行加权计算用户间相似度的方法。采用MovieLens数据集对上述方法进行实验，通过平均绝对偏差(MAE)比较不同方法对推荐算法的改进效果，算法过程主要采用EXCEL，R语言辅助编程实现。实验证明，本文提出的方法均能在一定程度上缓解数据稀疏问题，从而提高推荐质量。统计量填充、聚类、相似度计算等都属于统计学中的基础方法，考虑将统计学方法应用于推荐领域，不应该只注重于繁杂的模型，将基础的统计方法加入到推荐算法的研究中来，也能够有效得解决推荐算法所面临的问题。在未来发展中，统计学方法将会应用于更多领域，获得更长足的发展。

著录项

作者
张娟娟;
展开▼
作者单位

重庆工商大学;

展开▼
授予单位重庆工商大学;
学科统计学
授予学位硕士
导师姓名李焕荣;
年度 2016
页码
总页数
原文格式 PDF
正文语种 chi
中图分类
关键词
统计学,协同过滤,推荐算法,数据稀疏性,电子商务;

相似文献

中文文献
外文文献
专利

1. 改进的面向数据稀疏的协同过滤推荐算法 [J] . 高倩 ,何聚厚 . 计算机技术与发展 . 2016,第003期
2. 一种有效缓解数据稀疏问题的协同过滤推荐算法 [J] . 张清 ,于博 ,王辉 . 合肥工业大学学报（自然科学版） . 2019,第004期
3. 一种有效缓解数据稀疏问题的协同过滤推荐算法 [J] . 程芳 ,沈红岩 ,赵艳 . 现代情报 . 2016,第003期
4. 一种有效缓解协同过滤推荐评价数据稀疏问题的算法 [J] . 黄永锋 ,覃罗春 . 东华大学学报（自然科学版） . 2013,第001期
5. 协同过滤推荐系统中数据稀疏问题的解决 [J] . 吴颜 ,沈洁 ,顾天竺 . 计算机应用研究 . 2007,第006期
6. 面向场景的协同过滤推荐算法 [C] . 张光卫 ,康建初 ,李鹤松 . 中国系统仿真学会2006年学术年会 . 2006
7. 面向数据稀疏优化的协同过滤推荐算法研究 [A] . 胡湘 . 2019

统计视角下面向数据稀疏问题的协同过滤推荐算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅