首页> 中文学位 >基于潜在特征映射的跨域推荐方法研究
【6h】

基于潜在特征映射的跨域推荐方法研究

代理获取

目录

声明

摘要

第1章 绪论

1.1 研究背景及现状

1.2 研究内容

1.3 本文的主要工作

1.4 本文的组织结构

第2章 相关研究

2.1 单域中的产品推荐

2.2 跨领域推荐

2.2.1 跨领域推荐基础

2.2.2 基于知识迁移的跨领域推荐模型

2.3 社交网络中的推荐研究

2.4 与冷启动相关的推荐研究

2.5 本章小结

第3章 跨领域潜在特征映射模型

3.1 问题定义

3.2 潜在特征的计算

3.2.1 用户评分行为相似度的计算

3.2.2 整合用户相似度的矩阵分解

3.3 基于近邻的潜在特征映射

3.3.1 梯度提升树

3.3.2 多层感知器

3.3.3 基于近邻的特征映射方法

3.4 冷启动用户评分预测

3.5 本章小结

第4章 实验分析

4.1 实验设置

4.1.1 数据集

4.1.2 评价指标与对比方法

4.2 数据稠密度对冷启动用户跨域推荐效果的影响

4.3 锚用户数量对冷启动用户跨域推荐效果的影响

4.4 几种相关模型的冷启动用户跨域推荐效果比较

4.5 参数sim对冷启动用户跨域推荐效果的影响

4.6 MFUS模型的参数灵敏度分析

4.7 本章小结

第5章 总结与展望

5.1 研究总结

5.2 研究展望

参考文献

致谢

攻读学位期间发表的学术论文

攻读学位期间参与科研项目

攻读学位期间获奖情况

展开▼

摘要

随着互联网技术和Web技术的高速发展,电子商务成为一种新的商务活动形式,越来越多的消费者愿意通过网络购买自己需要的商品。相对于传统的线下购物方式,线上购物使消费者拥有更多的选择权。但是另一方面,网络上各类信息更新速度之快,又使消费者很容易迷失在种类繁多的“产品海洋”中。为了帮助消费者找到他们真正需要的商品,提高消费者的购物体验,推荐系统成为电子商务应用中不可或缺的一部分。
  推荐系统是一种信息处理系统,它通过主动地搜集各类信息,建立用户和产品之间的联系,最终为用户筛选出他们感兴趣的产品,并推荐给用户。在推荐系统中,协同过滤是一种广泛使用的推荐技术。传统的协同过滤模型主要应用于单一领域,比如电影领域、音乐领域,通过处理单一领域中的评分数据,预测该领域中用户对产品的偏好信息。对于协同过滤模型,普遍存在的数据稀疏性问题是一大挑战。另外,当一个用户在领域内无评分时,即为该领域的“冷启动用户”,协同过滤无法为其提供个性化的推荐。近些年,跨领域协同过滤技术被提出,目的是使用更丰富的评分数据,在不同领域之间有效地进行知识迁移,进而提升推荐的效果。即便如此,冷启动用户对于现阶段的跨领域协同过滤模型依然是一个巨大的挑战。本文针对普遍存在的冷启动用户问题,提出了一个有效的跨域推荐模型——跨领域潜在特征映射模型(Cross-Domain Latent Feature Mapping,CDLFM)。
  首先,某个产品域中的冷启动用户可能在其他产品域中有评分。比如,在京东网站,很多用户并没有在网站上购买过图书产品,却购买过很多电子产品。另外,同一个用户在不同产品域中的偏好是存在关联的。比如,一个喜欢喜剧电影的用户很可能也喜欢文笔风趣的图书。因此,在本文的问题设置中,我们假定冷启动用户在目标域中无评分、在辅助域中有评分,且目标域与辅助域之间有锚用户存在,即在两个域中都有评分的用户。本文的目标是以锚用户为桥梁实现从辅助域到目标域的知识迁移,解决冷启动用户在目标域中的评分预测问题。针对此问题,本文提出了CDLFM模型。CDLFM模型主要包含两步。第一步是独立处理不同产品域中的评分矩阵,以获得具有领域特点的潜在特征。为了缓解数据稀疏性的影响并为基于近邻的特征映射提供必要的知识,本文提出了一个新的评分矩阵分解模型——整合用户相似度的矩阵分解模型(Matrix Factorization by incorporating User Similarities,MFUS)。MFUS从不同角度分析了用户的评分行为,并将用户之间基于评分行为的相似度整合到评分矩阵分解过程中。第二步,为了将冷启动用户的潜在特征从辅助域映射到目标域,实现有效的知识迁移,CDLFM采用基于近邻的潜在特征映射方法学习跨领域用户潜在特征映射函数。对于目标域中的每一个冷启动用户,先在辅助域中找到与其评分行为相似的锚用户,再根据这些锚用户在辅助域和目标域中的潜在特征对,学习适合此冷启动用户的跨领域潜在特征映射函数。最后,根据学得的特征映射函数以及冷启动用户在辅助域中的潜在特征,计算得到此冷启动用户在目标域中的潜在特征,进而完成冷启动用户在目标域中的评分预测。
  本文的主要工作概括为以下三点:
  1.为了缓解单一领域内稀疏评分数据的影响并为基于近邻的特征映射提供必要的知识,本文提出了一个改进的评分矩阵分解模型——MFUS。除了评分矩阵中已知的评分项,MFUS还深入分析了用户的评分行为,提出了三种计算用户之间评分行为相似度的度量。据我们所知,MFUS是第一个根据稀疏的评分矩阵挖掘用户之间评分行为的相似性,并将这种相似度整合到矩阵分解过程中的工作。
  2.为了实现更准确的跨领域潜在特征映射,本文提出了基于近邻的特征映射方法。目前的特征映射模型几乎都是基于全体锚用户学习一个特征映射函数,供全体冷启动用户使用。这种方式并未体现出用户特征映射的个性,并且在学习的过程中参照全体锚用户,可能引入噪声。而基于近邻的特征映射方法不仅具有良好的可解释性,也能够学习到更准确的特征映射函数。此外,通过采用不同的映射模型(梯度提升树和多层感知器),本文实现了两种CDLFM模型,CDLFM-GBT和CDLFM-MLP。
  3.本文从真实的亚马逊评分数据中提取出两个数据集,以这两个数据集为基础进行了大量的对比实验。实验结果显示通过利用辅助域中的评分数据,CDLFM模型能够有效地完成目标域中冷启动用户的评分预测。此外,本文也进行了大量的参数灵敏度分析实验,深入评价了CDLFM模型以及MFUS模型。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号