首页> 中文学位 >基于用户社会关系与社区结构的协同过滤推荐算法研究
【6h】

基于用户社会关系与社区结构的协同过滤推荐算法研究

代理获取

目录

声明

1 绪论

1.1 研究背景与意义

1.2 国内外研究现状

1.3 当前研究存在的主要问题

1.4 本文研究内容与创新点

1.5 论文组织结构

2 融合细粒度显式用户社会关系的协同过滤推荐算法

2.1 引言

2.2 相关工作

2.3 矩阵分解模型介绍

2.4 融合细粒度显式用户社会关系的推荐算法

2.5 实验与分析

2.6 本章小结

3 基于隐式用户社会关系挖掘的协同过滤推荐算法

3.1 引言

3.2 相关工作

3.3 符号表示与框架描述

3.4 信任关系因素建模

3.5 隐式信任关系与不信任关系预测

3.6 基于隐式用户社会关系的推荐

3.7 实验与分析

3.8 本章小结

4 结合信任社区挖掘和稀疏评分填充的协同过滤推荐算法

4.1 引言

4.2 符号表示

4.3 面向信任关系与不信任关系的信任社区挖掘算法

4.4 稀疏评分数据填充算法

4.5 基于新用户资料的协同过滤推荐

4.6 实验与分析

4.7 本章小结

5 基于多类型社区结构融合的协同过滤推荐算法

5.1 引言

5.2 相关工作

5.3 符号表示与框架描述

5.4 多类型社区结构挖掘

5.5 融合多类型社区结构的推荐

5.6 实验与分析

5.7 本章小结

6 总结与展望

6.1 全文总结

6.2 未来工作展望

致谢

参考文献

附录1 攻读学位期间发表论文目录

附录2 攻读博士学位期间参与的科研项目

展开▼

摘要

互联网的迅速发展带来了爆炸式地信息增长,“信息过载”问题日益严重,在这样的背景下,推荐系统应运而生。推荐系统的主要任务是分析用户的历史行为数据,挖掘用户的个人兴趣偏好,为用户的行为偏好建模,主动推送用户可能感兴趣的信息或服务,帮助用户对信息进行筛选和过滤,节省用户时间,提高信息利用率。目前,推荐系统已经在众多电子商务网站、视频网站、音乐网站以及个性化广告等领域得到了广泛的关注和应用,并带来了巨大的经济利益。
  协同过滤推荐技术是目前被研究和应用最为广泛、最为成功的推荐技术,基于简单的“用户-项目”历史评分信息即可构建用户兴趣偏好模型,对用户未来的行为进行预测。然而,传统的协同过滤推荐算法存在着一些固有问题,如数据稀疏性问题、冷启动问题、大规模数据处理与可扩展性等问题。近年来,一些研究工作尝试将用户的社会网络关系信息和社区结构信息融入到传统的协同过滤推荐算法中,在一定程度上提高了协同过滤推荐算法的性能。当前研究结果表明,融入用户社会关系信息能够有效缓解协同过滤算法的数据稀疏性问题和冷启动问题,同时,社区结构的引入能够有效降低系统中的数据规模,提高算法在大规模数据集上的处理能力,增强系统的可扩展性。因此,基于用户社会关系和社区结构的协同过滤推荐算法具有重要的研究意义。鉴于此,针对当前算法中存在的问题和挑战,对基于用户社会关系和社区结构的协同过滤推荐算法展开深入研究,本文的主要贡献如下:
  (1)针对基于用户社会关系的推荐算法中存在的单一性用户社会关系假设问题,本文提出了一种融合细粒度用户社会关系的推荐算法,考虑了用户社会关系的异构性和多样性。先是形式化地定义了一种用户-兴趣偏好矩阵来描述用户细粒度的个人兴趣偏好,并运用模糊聚类方法将具有多方面相似兴趣偏好的用户划分到相同的社区中,以获得细粒度的好友关系集合。然后,以引入正则化项的形式将细粒度的用户社会关系融入到传统的矩阵分解模型中,对用户及其细粒度好友邻居的特征向量进行约束,使得求解结果能够反映用户的个人兴趣偏好和来自社会网络中细粒度好友邻居的影响。基于真实数据集的实验结果表明,细粒度的用户社会关系是反映用户间链接关系紧密程度的重要信息,与考虑单一性社会关系的推荐算法相比,该算法能够获得更准确的社会化推荐结果。
  (2)当前基于社会关系的推荐算法往往只考虑显式社会关系,而忽视了隐式社会关系。然而,在现实应用中,可用的显式社会关系往往比较稀疏或难以获得,同时,某些显式社会关系的质量并不高,如果基于这样的好友邻居来辅助推荐,势必会降低社会化推荐算法的预测准确度。针对上述问题,本文对基于隐式用户社会关系挖掘的推荐算法展开研究。以信任关系为例,提出了一种隐式信任关系挖掘算法,通过分析影响信任关系建立的多种因素,自动挖掘出用户间潜在的信任与不信任关系。该算法一方面能够有效缓解显式用户社会关系的稀疏性问题,另一方面能够自动挖掘出网络中关系密切的潜在用户关联。然后,将挖掘到的隐式社会关系融入到若干最具代表性的社会化推荐算法中,以探究基于隐式社会关系的推荐算法在评分预测准确度方面的表现。基于真实数据集的实验结果验证了该隐式信任关系挖掘算法的准确度,同时,对比实验结果表明,基于隐式社会关系的推荐结果与基于显式社会关系的推荐结果在预测准确度方面的表现相差不大。因此,本文认为,当显式社会关系较稀疏时,基于社会关系挖掘算法得到的隐式社会关系能够在一定程度上辅助或替代显式社会关系并用于社会化推荐。
  (3)基于社区结构的推荐算法的主要思想是基于用户的评分信息,利用社区挖掘技术将相似的用户或项目划分到相同的社区中,然后在每个社区内应用传统的推荐算法,通过降低数据规模来提高其对大规模数据的处理能力。然而,由于社区划分后预测只能在某个社区内部执行,数据规模的降低使得基于内存的推荐算法在为目标用户寻找相似邻居时,所得到的用户集合较为稀疏或相对于整个数据集来说并不一定是最相似的邻居集合。因此,该类推荐算法存在着预测准确度低和覆盖率低等问题。针对这一问题,一些算法开始探究利用评分数据以外的辅助信息,如用户信任关系信息,来挖掘信任社区并进行推荐,为寻找相似邻居提供了新的思路。但是当前基于信任社区的推荐方法均忽略了用户间的不信任关系,以及社区划分后的数据稀疏性问题。为了解决这一问题,本文提出了一种结合信任社区挖掘与稀疏评分数据填充的推荐算法。首先,提出了一种基于SVD符号聚类的信任社区挖掘算法,该算法能够将互相信任的用户划分到同一个信任社区中,而不同社区中的用户之间互相不信任。然后,提出了一种稀疏评分数据填充算法,通过挖掘信任社区中可信邻居用户的评分信息来填充目标用户的部分缺失评分信息。基于真实数据集的实验结果表明,同时考虑信任关系和不信任关系的社区挖掘结果更有利于将相似的用户划分到同一社区中。同时,稀疏评分数据填充算法能够有效缓解数据稀疏性问题,在较大程度上提高了基于信任社区的推荐算法的预测准确度和覆盖率。
  (4)在基于模型的推荐算法中,社区划分使得模型训练的数据规模降低,影响了推荐算法准确度的提高。由于基于不同信息源的社区划分结果往往反映了不同的数据相关性特征,影响着后期推荐算法的性能。因此,本文提出了一种基于多类型社区结构融合的推荐算法。首先,详细论述了如何挖掘不同类型的社区结构并将其融合到一个统一的推荐框架中。然后,深入探究了融合不同信息源的社区挖掘结果对于推荐准确度的影响,并对该方法在稀疏数据和冷启动情况下的结果进行分析比较。基于真实数据集的实验结果验证了该算法在预测准确度方面的表现优于基于单一社区信息源的推荐算法的表现。其中,用户-项目联合社区(co-cluster)能够显著增加子评分矩阵的稠密度,有效缓解了数据稀疏性问题,同时,信任社区的引入对于冷启动用户个人兴趣偏好的预测起到了重要的作用。

著录项

  • 作者

    马霄;

  • 作者单位

    华中科技大学;

  • 授予单位 华中科技大学;
  • 学科 计算机系统结构
  • 授予学位 博士
  • 导师姓名 鲁宏伟;
  • 年度 2017
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.13;
  • 关键词

    推荐系统; 协同过滤; 用户社会关系; 社区结构;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号