首页> 中文学位 >数据稀疏和隐性反馈条件下用户偏好挖掘方法
【6h】

数据稀疏和隐性反馈条件下用户偏好挖掘方法

代理获取

目录

封面

中文摘要

英文摘要

目录

1 绪论

1. 1 论文研究背景与意义

1. 2 国内外研究概况

1. 3 论文研究内容与组织结构

2 相关研究和技术

2. 1 协同过滤

2. 2 贝叶斯个人化排序

2. 3 本章小结

3 挖掘用户偏好的潜在因素模型

3. 1 任务目标和问题描述

3. 2 数据特点分析

3. 3 偏好挖掘模型

3. 3 学习算法

3. 4 本章小结

4 实验设计及结果分析

4. 1 数据集

4. 2 评价标准

4. 3 基线系统描述及参数设定

4. 4 结果分析

4. 5 本章小结

5 总结与展望

5. 1 全文总结

5. 2 展望

致谢

参考文献

展开▼

摘要

个性化推荐服务在当前互联网中随处可见,比如电子商务中的商品推荐系统、搜索引擎网站的个性化搜索等。这样的应用需要对用户的个人偏好有很好的理解。用户偏好挖掘不是简单的向用户推荐具体项目,而是要理解用户对项目的某种属性的偏爱。它可以被归纳为一个协同过滤问题,但面临更多挑战,这是由用户数据的特点决定的。首先,数据是极度稀疏的。单一用户在某一领域中对具体项目的隐性反馈是非常稀有的,可想而知,多用户间共享属性信息也是极度稀有的。其次,隐性反馈,用户不会对项目的具体属性做出直接的评分。从这样的数据中只能得到正反馈,从用户对某项目的行为中推测其偏好。
  协同过滤技术很早就在推荐系统中得到了广泛的应用。它利用相似用户的用户很大概率会拥有相似的品味这一基本假设,对特定用户的偏好和行为做出预测,也在实际应用中取得了较好的效果。但是现有的协同过滤技术不能很好地解决上述两个用户偏好挖掘中的问题,需要进行改造。首先通过跨领域集体学习,使用户在不同领域中的行为数据可以被相互利用,继而学习过程将会彼此相互加强,以此解决单个域内数据稀疏的问题。另一方面,在学习过程中引入贝叶斯个人化排序(Bayesian Personalized Ranking,简称BPR)优化条件。BPR作为一种通用学习框架,在学习过程中以排序为目标进行数据拟合,取代传统的以二值分类为目标的方法,以解决只有正反馈的问题。
  实验证明了这种方法的优越性。实验采用两种真实世界的数据集分别是用户对电影的评分数据和用户在搜索引擎中的搜索关键字数据,分别在其中挖掘用户对演员的偏好和对商品品牌的偏好。实验中用AUC统计指标比较了各种方法的挖掘结果,并且比较了它们在数据稀疏性不断增长下的性能表现。改造后的方法在数据集上的预测性能均优于现在几种最流行的协同过滤方法。并且,当数据的稀疏程度变得愈严重时,其取得的优势愈明显,表现出很好的稳定性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号