首页> 中文学位 >大数据挖掘在图书阅读推荐中的应用研究
【6h】

大数据挖掘在图书阅读推荐中的应用研究

代理获取

目录

声明

1绪论

1.1研究背景

1.2国内外研究现状

1.2.1大数据发展现状分析

1.2.2推荐系统研究现状分析

1.3研究目的和意义

1.4论文主要工作

1.5论文组织结构

2相关技术和工具的介绍

2.1 Hadoop概述

2.1.1 MapReduce简介

2.1.2 HDFS简介

2.2 Mahout概述

3协同过滤算法的研究

3.1协同过滤算法简介

3.2基于用户的协同过滤算法

3.2.1算法原理

3.2.2算法过程

3.3基于物品的协同过滤算法

3.3.1算法原理

3.3.2算法过程

3.4基于用户和基于物品的协同过滤算法的比较

3.5基于用户和基于物品的协同过滤算法存在的问题

4基于协同过滤的推荐算法的实现

4.1环境搭建

4.1.1安装配置JDK

4.1.2安装配置Hadoop

4.1.3安装配置Mahout

4.2实验数据

4.3数据分析和生成读者评价

4.4算法实现

4.4.1基于用户的协同过滤算法的单机实现

4.4.2基于物品的协同过滤算法的单机实现

4.4.3基于物品的协同过滤算法的分布式实现

5结论

5.1文章总结

5.2研究的不足与展望

参考文献

致谢

展开▼

摘要

大数据时代的来临,给整个社会的各个领域都带来了巨大的冲击和挑战,大数据正在影响并改变着我们的生活。在这个信息过载、信息爆炸的时代背景下,如何快速地过滤掉冗余的信息和垃圾资源,准确地找到我们需要的信息资源变得比以前更加困难。所以个性化推荐应运而生,它是一个有效的便捷途径,我们可以从系统给我们推荐的信息中迅速找到自己需要的信息,省去了自己再去搜索的时间。同样的,个性化的图书推荐能够很好地帮助读者从图书馆海量的图书资源中过滤掉大量的自己不感兴趣的图书,快速引导读者准确的获取到自己所需要的高质量的图书资源,节省了读者找书的时间,同时也能提高图书馆藏书的利用率。 一般情况下,个性化推荐都由推荐系统产生。在推荐系统中,最关键的就是推荐算法,它决定了推荐效果的好坏。在众多的推荐算法中,应用最为广泛的就是协同过滤算法,它主要包括基于用户的协同过滤算法和基于物品的协同过滤算法。本文将尝试通过对图书借阅数据来挖掘读者评价,并利用协同过滤算法进行个性化图书阅读推荐来探讨将大数据挖掘技术应用到图书阅读推荐中的可行性,主要研究内容为: 1、学习和研究大数据的发展和应用的现状以及推荐系统的研究现状,学习了大数据挖掘的分布式框架Apache Hadoop和Apache Mahout。 2、深入学习和研究了两种协同过滤算法,详细分析了两种算法的原理和步骤,并对比分析了两种算法的优缺点和存在的问题。 3、利用某大学图书馆管理系统中导出的真实的借阅数据进行实验。利用了K-Means聚类算法,按照读者借阅时间长短进行聚类计算,作为读者对所借图书的评分。 4、结合Apache Mahout分别编程实现了两种协同过滤算法,并利用图书借阅数据进行实验,产生推荐结果,并在Hadoop平台上对基于物品的协同过滤推荐算法进行了分布式的实现。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号