首页> 中文学位 >增量协同过滤算法的并行化改进
【6h】

增量协同过滤算法的并行化改进

代理获取

目录

封面

中文摘要

英文摘要

目录

1 绪 论

1.1研究背景与意义

1.2研究现状

1.3论文研究内容

1.4论文组织结构

2 推荐系统及相关技术

2.1推荐算法概述

2.2推荐算法分类

2.3推荐算法的评测

2.4 本章小结

3 协同过滤推荐算法

3.1协同过滤推荐

3.2协同过滤分类介绍

3.3 协同过滤算法存在的问题

3.4 GDC相似度及其优化

3.5 K近邻优化

3.6本章小结

4 增量协同过滤及其并行化改进

4.1增量协同过滤概述

4.2增量协同过滤

4.3增量协同过滤并行化改进

4.4本章小结

5 实验设计与结果分析

5.1实验数据和环境

5.2实验设计

5.3实验结果与分析

5.4本章小结

6 总结与展望

6.1论文总结

6.2论文展望

致谢

参考文献

附录 A. 作者在攻读学位期间发表的论文目录:

展开▼

摘要

随着互联网的发展,信息过载的时代到来,能解决该问题的推荐系统得到了广泛的研究和应用。其中协同过滤推荐在电子商务领域的应用最为广泛,但是随着近几年参与网上购物的用户数的暴增,以及商品的多样化的发展,协同过滤推荐系统需要面对的数据量成线性增长,此时传统的协同过滤推荐算法面对如此大的数据量可扩展性和实时性的问题开始突显,算法运行时间变得过久,无法为快速响应用户的最新需求;或者算法无法运行如此大的数据量,因而无法推荐。此时增量的协同过滤算法得到研究,该算法仅使用增量数据和部分相关原数据来动态更新相应的算法因子,因而计算时间大大缩短,能较好的应付大数据量,并且拥有较好的实时性。
  本文首先对相似度进行了改进,在实验的基础上优化了推荐预测阶段的K近邻算法,同时对增量协同过滤算法进行了并行化的改进。
  主要研究工作包括如下四个方面:
  ①对推荐系统的发展现状、系统分类、评测指标及相关技术进行了介绍,并重点介绍了协同过滤推荐算法、分类、比较、及其存在的问题。
  ②接着介绍了增量算法中使用的GDC相似度,并在这个相似度的基础上提出了修正的GDC相似度,实验表明该相似度能进一步提高算法的准确度,并且使最优K近邻的值较小。
  ③提出了优化的K近邻算法,在基于项目的协同过滤算法预测评分阶段,在预测某一用户的未评分项目时,最优K近邻的值和该用户的已评分项目个数P相关,通过在已评分项目个数上乘上一个因子g属于{0.1,0.2,…,1.0},使K=P*g,我们得到优化的K近邻算法,实验表明该算法在选定一个较优g值时系统的准确度较稳定,系统数据量的增加对准确度的影响很小,而不像传统的K近邻,最优K值随数据量变化而变化。
  ④介绍了增量协同过滤算法的处理过程,包括因子分解,因子更新,因子组合推荐。并在该算法的基础上对因子更新阶段进行了并行化改进,通过多线程使因子更新阶段实现并行化。实验表明,该算法能显著降低系统的运行时间,提高了系统的实时性,提高了系统的可用性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号