首页> 中文学位 >统计视角下面向数据稀疏问题的协同过滤推荐算法研究
【6h】

统计视角下面向数据稀疏问题的协同过滤推荐算法研究

代理获取

目录

声明

摘要

第1章 绪论

1.1 研究背景及意义

1.2 推荐系统的定义

1.3 国内外研究综述

1.4 论文研究内容、组织结构及创新之处

第2章 协同过滤推荐技术概述

2.1 基于内容的推荐技术

2.2 协同过滤推荐技术

第3章 数据稀疏性问题的起因及影响途径

3.1 数据稀疏性问题的起因

3.2 数据稀疏性问题对协同过滤推荐的影响途径

3.3 本文采用的解决方法

第4章 数据准备及基于描述性统计的简单推荐

4.1 数据集

4.2 协同过滤推荐算法的统计学评价标准—平均绝对偏差(MAE)

4.3 基于描述性统计的简单推荐

第5章 面向数据稀疏问题的协同过滤推荐算法改进

5.1 基于统计量填充的协同过滤推荐算法改进

5.2 K-Means聚类缓解数据稀疏性问题

5.3 奇异值分解(SVD)缓解数据稀疏性问题

5.4 基于用户加权相似度的协同过滤推荐算法改进

5.5 不同方法下的MAE对比

第6章 总结与展望

6.1 研究总结

6.2 展望

参考文献

附录

致谢

研究生期间科研情况

展开▼

摘要

随着网络的普及以及电子商务的飞速发展,信息资源呈爆发式增长,用户在海量资源中快速而准确得找到自己喜欢的信息或商品变得越来越困难。为了解决这个问题,便产生了推荐系统。  推荐算法一直是推荐系统的核心技术。目前,协同过滤推荐算法是众多推荐算法中应用最成功且最广泛的推荐技术。它主要根据用户留在网上的评分进行推荐。然而在实际应用中,由于用户数据和项目数据规模相当庞大,且用户对自己接触过的项目评分数量又非常有限,从而导致了严重的数据稀疏性问题,该问题是导致传统的协同过滤推荐算法推荐精度较差的主要原因之一。  本文试图站在统计学的角度,针对数据稀疏性问题对协同过滤推荐算法进行研究。实现了基于描述性统计的简单推荐,并探究了将统计量填充、聚类分析、矩阵分解等方法应用到协同推荐算法中的效果。在详细分析了数据稀疏性问题的起因以及对协同推荐的影响途径基础上,本文提出了采用统计量填充的方法缓解数据稀疏性问题,进而用K-Means聚类方法对用户进行聚类,根据轮廓系数确定用户类别数,对每类用户的缺失评分使用同类别的评分统计量作为固定值进行填充。除了固定值填充缺失评分外,本文还采用奇异值分解(SVD)降维技术实现评分预测,利用预测评分对原始矩阵进行填充,形成新的用户—项目评分矩阵,再进行协同推荐。最后从推荐过程修正的角度出发,对传统的用户间相似度计算采用加权的方式进行改进,提出了基于用户偏好相似度与用户评分相似度进行加权计算用户间相似度的方法。采用MovieLens数据集对上述方法进行实验,通过平均绝对偏差(MAE)比较不同方法对推荐算法的改进效果,算法过程主要采用EXCEL,R语言辅助编程实现。实验证明,本文提出的方法均能在一定程度上缓解数据稀疏问题,从而提高推荐质量。统计量填充、聚类、相似度计算等都属于统计学中的基础方法,考虑将统计学方法应用于推荐领域,不应该只注重于繁杂的模型,将基础的统计方法加入到推荐算法的研究中来,也能够有效得解决推荐算法所面临的问题。在未来发展中,统计学方法将会应用于更多领域,获得更长足的发展。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号