首页> 中文学位 >大数据环境下基于用户行为的个性化推荐算法研究
【6h】

大数据环境下基于用户行为的个性化推荐算法研究

代理获取

目录

声明

摘要

1 绪论

1.1 选题背景和意义

1.1.1 背景

1.1.2 意义

1.2 国内外研究现状

1.2.1 国外研究现状

1.2.2 国内研究现状

1.2.3 目前研究现状述评

1.3 论文主要研究内容

1.4 论文研究方法和技术路线

1.4.1 研究方法

1.4.2 技术路线

2 相关理论

2.1 用户行为数据简介

2.2 基于用户行为数据的推荐算法简介

2.2.1 基于邻域的推荐算法

2.2.2 基于模型的推荐算法

2.2.3 基于图的推荐算法

2.3 推荐算法评价指标

2.3.1 预测准确度指标

2.3.2 多样性与新颖性指标

2.3.3 其他指标

2.4 推荐算法常用数据集

3 基于最近邻的改进受限玻尔兹曼机协同过滤推荐算法

3.1 基于RBM模型的协同过滤框架

3.2 基于最近邻的改进RBM及算法描述

3.2.1 改进方法

3.2.2 算法伪代码描述

3.3 实验分析

3.3.1 实验设置

3.3.2 实验结果及分析

4 基于项目标签改进的受限玻尔兹曼机协同过滤推荐算法

4.1 基于RBM模型的协同过滤算法问题分析

4.2 基于项目标签改进RBM模型的算法描述

4.2.1 改进具体过程

4.2.2 算法伪代码描述

4.3 实验分析

4.3.1 实验设置

4.3.2 实验结果及分析

5 基于加权网络结构的冷门资源推荐算法

5.1 基于网络结构的推荐算法分析

5.2 基于网络结构的推荐算法改进

5.2.1 算法的改进思路

5.2.2 算法具体实施步骤

5.3 实验分析

5.3.1 实验设置

5.3.2 实验结果分析

结论

致谢

参考文献

攻读学位期间的研究成果

展开▼

摘要

日新月异的信息技术遍及社会、经济、生活等领域的各个角落,各领域中相关活动的信息被记录成数据保存。科技的进步促进数据存储的成本大幅降低,海量的数据被存储在数据库或云端中,数据量正以前所未有的速度增长,并推动我们逐渐步入大数据时代。在大数据时代背景下,这些庞大的数据背后往往隐藏着惊人的价值。但是大数据环境下的数据呈现出规模性、多样性、实时性、低价值密度等特点,这极大的增加了对数据挖掘分析的难度,使数据的利用率远小于其增长率,造成信息过载问题越来越严重。
  目前,个性化推荐系统是解决信息过载问题的有效途径之一,因此推荐系统中的基础技术推荐算法也就成为当下热门研究方向之一。本文以大数据为背景环境,针对推荐算法中目前存在的关键问题做出改进,以期能提高推荐算法的预测准确性、改善推荐算法的多样性和新颖性。本文从以下几个角度开展理论研究和实践检验:
  (1)针对基于受限玻尔兹曼机(Restricted Boltzmann Machine,RBM)的协同过滤算法在预测阶段容易同化用户个性化需求影响推荐准确性的问题,提出了一种基于最近邻的受限玻尔兹曼机协同过滤推荐算法。近邻用户之间的兴趣会存在较高的相似性,相同兴趣的用户对同一个项目的评分也更接近。根据这一直观感受,计算项目(用户未评分而最近邻中有评分)的评分等级概率,将该概率融入RBM模型预测阶段强化预测结果中用户的个性化,提高算法预测的准确性。实验结果证明,加入最近邻的改进算法不仅使提高了算法的预测准确性,而且还增强了算法的抗过拟合能力。(2)针对基于受限玻尔兹曼机的协同过滤算法预测对“热门项目”有标新立异看法的用户的评分准确性差、预测“冷门项目”辨别力差的问题,提出一种基于项目标签的受限玻尔兹曼机的协同过滤算法。利用项目自身存在的客观标签(如电影的主题、商品的类别等)描述用户自身兴趣偏好,此过程只利用到用户自身已评分过的项目信息,强化了用户的个性化需求。且对“冷门项目”的预测依据更加客观真实、预测结果准确性也更高。最后实验结果证明,加入项目客观标签后算法的预测准确性提高达1.2%。(3)针对基于网络结构的推荐方法存在过度推荐“热门资源”,忽略推荐“冷门资源”的问题,本文提出一种基于加权网络结构的冷门资源推荐算法。本文通过改进其网络结构中的能量扩散方式,来提高推荐算法对“冷门资源”的推荐,进而改善推荐结果的多样性和新颖性。通过实验证明,该算法既兼顾了推荐的准确性,又有效的提高了对“冷门资源”的推荐。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号