首页> 中文学位 >基于用户兴趣聚类的协同过滤算法的研究与实现
【6h】

基于用户兴趣聚类的协同过滤算法的研究与实现

代理获取

目录

封面

中文摘要

英文摘要

目录

1 绪 论

1.1研究背景与意义

1.2主要内容和论文结构

1.3本章小结

2 相关理论概述

2.1 推荐算法简介

2.2 用户兴趣建模

2.3 聚类算法

2.4 本章小结

3 基于兴趣圈聚类的推荐算法设计

3.1 原始数据预处理

3.2 聚类算法的实现

3.3 协同过滤推荐过程

3.4 算法整体流程描述

3.5 本章小结

4 实验设计与结果分析

4.1 实验数据集

4.2 评价指标

4.3 实验设计

4.4 实验结果分析

4.5 本章小结

5 总结与展望

5.1 全文总结

5.2 未来展望

致谢

参考文献

展开▼

摘要

互联网越来越深入的融入人们的生活,其中产生的信息大大超过了人们处理信息、利用信息的能力范围,因此推荐系统的使用越来越受到重视。其中应用最多的协同过滤推荐技术得到了广泛的应用和发展。现有的单纯协同过滤算法给出的推荐结果已经不能满足广大用户的需求。很多人考虑到了挖掘用户的兴趣爱好,给出更加符合用户喜好的推荐结果。这类推荐过程是将有相同兴趣爱好的用户聚为一类,然后再根据和目标用户有相同兴趣爱好的用户的购买情况,给目标用户推荐他可能购买的商品。
  这种方式虽然也考虑了用户的兴趣偏好,但是它将用户所有的评分记录看作一个兴趣整体。然而现实的情况是用户在整个评分信息中可能包含不同兴趣圈的商品并且用户在不同的时间段内关注的兴趣圈也会不同,这里的兴趣圈代表某些商品组成的一个聚类,用户对其中某个商品感兴趣的时候很可能会对其中其他的商品感兴趣。因此本文提出的推荐系统考虑用户兴趣的时候,不是根据兴趣将用户聚类,而是根据用户的评分记录获取潜在的大多数用户可能感兴趣的一些兴趣圈,进而计算每个兴趣圈的中心来代表每个兴趣中心,然后根据用户最近的评分记录和兴趣圈中心的相似性判断用户对每个兴趣圈感兴趣的程度,最后产生推荐结果。
  为了获取上面的兴趣圈中心,需要将原始的用户操作记录转化为适合聚类算法使用的评分记录。为了从用户操作的历史记录中提取用户对各个兴趣圈商品潜在的评分信息,需要先将用户的操作类型转换成用户对商品的评分。然后将用户在同一天对同一商品的评分进行累加合并,这个过程能够减少数据量,降低后面操作的复杂度。接着根据用户评分的时间(具体到天)将用户在每个连续的时间段内评分的商品归类到一个兴趣圈,并将兴趣圈内相同商品的评分信息进行合并。最后将前面获得的兴趣圈内商品的评分信息转化为一条兴趣圈的评分记录。下面对所有的兴趣圈评分记录进行聚类,使用聚类中心来代表每个兴趣圈。
  本文给出的推荐系统使用的聚类算法是蚁群聚类算法,这种聚类方式具有正向反馈和获取全局最优解的特点。另外为了加快聚类算法收敛,本文使用K-means聚类算法来产生蚁群聚类算法的初始聚类中心。这种方式结合了两者的优点,最终使得算法更加准确、高效。获得了兴趣圈中心后,计算用户最近评分记录和各个兴趣圈中心的相似性,再使用协同过滤算法产生用户的推荐列表。
  最后本文设计实验来验证提出算法的性能以及运行特点。实验结果显示,基于用户兴趣聚类的协同过滤算法性能远好于传统基于用户聚类的协同过滤算法;虽然基于蚁群聚类算法的综合评价指数F1对于基于K-means聚类算法没有明显提高,不过可以验证在初始聚类中心合适的情况下 K-means依旧是一种优秀的聚类算法而且蚁群聚类算法在召回率的方面比 K-means聚类算法优秀,这也为推荐系统适应不同的场合提供了多种选择。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号