首页> 中文学位 >基于项目相似度改进的协同过滤TopN推荐算法研究
【6h】

基于项目相似度改进的协同过滤TopN推荐算法研究

代理获取

目录

声明

摘要

1 绪论

1.1 研究背景及意义

1.1.1 信息过载产生原因

1.1.2 信息过载传统解决方法

1.1.3 推荐系统

1.2 推荐系统的研究现状

1.3 本文的研究内容

1.4 本文的组织架构

2 研究理论基础

2.1 相关技术

2.1.1 信息检索

2.1.2 信息过滤

2.1.3 数据挖掘

2.2 推荐算法概述

2.2.1 基于内容的推荐算法

2.2.2 基于协同过滤的推荐算法

2.2.3 基于关联规则的推荐

2.2.4 基于聚类的推荐

2.2.5 基于知识的推荐

2.2.6 基于上下文感知的推荐

2.2.7 社交网络推荐

2.2.8 混合推荐算法

2.3 相关理论

2.3.1 长尾理论

2.3.2 马太效应

3 基于项目相似度改进的协同过滤TopN推荐算法

3.1 用户行为数据

3.1.1 用户行为数据简介

3.1.2 用户行为数据分类

3.1.3 数据集分类

3.2 基于项目的协同过滤算法主要步骤

3.2.1 建立用户一项目反馈信息矩阵R(m,n)

3.2.2 项目相似度计算

3.2.3 推荐列表生成

3.3 基于项目相似度改进的协同过滤TopN推荐算法

3.3.1 项目相似度计算公式改进

3.3.2 项目相似度的归一化

3.3.3 TopN推荐

4 实验设计与算法评测

4.1 推荐系统实验方法

4.1.1 离线实验

4.1.2 用户调查

4.1.3 在线实验

4.2 评测指标

4.2.1 用户满意度

4.2.2 准确度评价

4.2.3 覆盖率

4.2.4 新颖度

4.3 实验设计与结果分析

4.3.1 数据集选用

4.3.2 本文实验设计

4.3.3 实验结果与分析

5 总结与展望

5.1 总结

5.2 展望

参考文献

致谢

作者简介及读研期间主要科研成果

展开▼

摘要

随着互联网、物联网以及云计算等技术地快速发展,我们的生活也发生了翻天覆地的变化。我们在享受先进技术带来的便捷的同时,也承受着它们所带来的负面影响,信息过载就是其中之一。针对信息过载问题,早期主要有分类目录与搜索引擎两种解决方法,但均有其局限性,分类目录只能覆盖少数项目,相对于海量项目来说远远不够;搜索引擎则需要有明确需求,无法满足用户的个性化需求。为了更进一步解决信息过载这一难题,研究人员提出了推荐系统概念。
  推荐系统通过对用户历史行为地分析,发掘出用户潜藏的兴趣喜好,并且能够实现对用户的个性化推荐。推荐系统的核心部分就是推荐算法,现今在实际系统中运用最为广泛的算法就是协同过滤推荐算法。但是,随着推荐系统的进一步应用,传统的协同过滤推荐算法存在的诸如冷启动、数据稀疏性、推荐精度低、长尾项目发掘能力低等问题,使其不再满足实际应用需求。目前针对推荐系统的研究十分火热,不过相当多的研究工作主要将焦点放在如何提高推荐的准确度上,虽然取得了一定成果,但是无法兼顾推荐结果的新颖度,导致推荐新颖度仍处于比较低的水平。
  本文提出了基于项目相似度改进的协同过滤TopN推荐算法,该算法主要研究目的在于增强长尾项目发掘能力的同时,不降低推荐结果的精度。主要工作包括:
  1.分析用户活跃度对推荐结果的影响,引入用户活跃度概念,削弱活跃用户对推荐结果的影响,提高长尾项目的发掘能力,提高推荐结果的覆盖率。
  2.分析项目种类对推荐结果的影响,对相似度矩阵进行归一化处理,削弱同类项目只见相似度过高对推荐结果的影响,提高推荐结果的精度,增强推荐结果的可靠性。
  3.采用推荐领域经典的MovieLens数据集对改进算法进行分步仿真,验证改进算法每一步骤的有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号