协同过滤系统的稀疏性与冷启动问题研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

推荐系统通过预测用户对项目的喜好程度来为用户进行信息过滤，应用知识发现技术来生成个性化推荐。协同过滤是一种常用的减少信息过载的技术，已经成为了个性化推荐系统的一种主要工具，然而现有大多数协同过滤算法存在着几个主要问题：精确性，数据稀疏和冷启动问题。许多结合协同过滤与基于内容的信息过滤的算法可以解决这些问题，但是这些算法需要预先得到项目的内容信息或者用户的个人信息，而这些信息在很多推荐系统中是无法获得的，因此无法利用基于内容的信息过滤技术。本文提出了在无法得到项目的内容信息和用户个人信息的情况下，在数据稀疏和冷启动情况下提高预测准确性的几种方法。在三个公开的数据集上进行了试验，试验结果显示这些方法比常用的算法效果要好。我们采用了两种方法来提高数据稀疏时预测的准确性，即属于特征递增型的PearAfterSVD方法和属于转换型的LCMSTI方法。在特征递增型方法中，一种方法的输出用来作为另一种方法的输入。PearAfterSVD算法首先利用基于奇异值分解的方法来得到预测的评分，然后采用这些预测结果来获得活动用户的邻居，最后用基于邻居的Pearson算法得到最终提供给用户的预测值。在转换型方法中，推荐系统根据当前的情况决定在不同的推荐方法中进行转换。LCMSTI算法设置了一个阈值来决定如何在基于潜在分类模型的Pearson算法与STIN1算法这两种协同过滤方法中进行转换。在基于潜在分类模型的Pearson算法中，首先使用潜在分类模型的结果来进行邻居选择，然后根据最近邻方法来对活动用户未打分项目的评分进行预测。试验结果表明这两种方法在数据稀疏时准确性较高。冷启动问题包括新项目问题与新用户问题。我们采用了基于统计的众数法以及信息熵法来解决冷启动问题。在基于统计的众数法中，利用人们的从众心理，对新用户问题，我们用所有用户在某一项目上的评分的众数作为新用户在该项目上的评分预测值；对新项目问题，我们用活动用户在他所有已评分项目上的评分的众数作为该活动用户在新项目上的评分预测值。在信息熵方法中，我们利用信息熵来选择一些有意义的用户或者项目，然后采用这些用户或者项目的平均评分来作为新用户或者新项目的预测评分。试验结果表明这些方法在推荐系统无法获取项目的内容信息和用户个人信息的情况下比简单平均法效果要好。最后对协同过滤系统中的隐私保护与安全问题、时间序列问题、特殊项目的推荐问题以及如何解释推荐系统的结果等进行了简单的讨论。

著录项

作者
孙小华;
展开▼
作者单位

浙江大学;

展开▼
授予单位浙江大学;
学科计算机科学与技术
授予学位博士
导师姓名孔繁胜;
年度 2005
页码
总页数
原文格式 PDF
正文语种中文
中图分类专家系统、知识工程 ; 算法理论 ;
关键词
协同过滤; 推荐系统; 稀疏性; 冷启动; 奇异值; 分类模型;

相似文献

中文文献
外文文献
专利

1. 协同过滤推荐系统中的冷启动问题研究综述 [J] . 李秋丽 ,陈建英 ,唐敬 . 移动信息 . 2020 ,第9期
2. 协同过滤数据稀疏性问题研究 [J] . 顾立志 . 计算机光盘软件与应用 . 2014 ,第008期
3. 基于GEP-RBF的协同过滤数据稀疏性问题研究 [J] . 古凌岚 . 计算机与数字工程 . 2013 ,第009期
4. 协同过滤算法中冷启动问题研究 [J] . 邵煜 ,谢颖华 . 计算机系统应用 . 2019 ,第002期
5. 协同过滤系统的矩阵稀疏性问题的研究 [J] . 曾小波 ,魏祖宽 ,金在弘 . 计算机应用 . 2010 ,第004期
6. 利用社会网络的关键用户解决协同过滤冷启动问题 [C] . ZHANG Li ,张莉 ,QIN Tao . 信息系统协会中国分会第五届学术年会 . 2013
7. 基于数据稀疏性和冷启动的个性化协同过滤推荐系统研究 [A] . 马梦圆 . 2015

协同过滤系统的稀疏性与冷启动问题研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅