基于LDA模型和核方法改进的协同过滤算法

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

在互联网高速发展的今天，“信息过载”问题使得人们难以在海量信息中找到真正的需求，成为新时代最重要的挑战之一。现在信息体系下，具有丰富的用户行为历史数据。推荐系统通过对此数据进行分析，从而挖掘用户的潜在兴趣，实现精准化推荐，有效过滤信息，因而具有巨大的应用价值。但是同时，推荐系统也面临着许多问题。本文主要针对数据噪声和稀疏性两个主要问题提出了改进方法。
　　针对数据噪声问题，构造了LOF离群点检测算法。本文分别基于用户的共同项目评分和用户评分数据分布特征指标两种方法计算用户离群因子。最后通过效果对比表明：基于构建指标数据的LOF算法比基于原始共同项目评分LOF算法效果具有更优的表现。
　　针对数据稀疏问题，构造了LDA-CF和Kernel-CF混合模型。
　　(1)LDA-CF模型根据主题生成模型的思想，假设用户喜欢某个项目是因为喜欢某些隐含的主题，利用用户评分数据生成伪文档，计算用户下的潜在主题分布和潜在主题下的项目分布，然后根据用户主题分布相似性和项目主题分布相似性，在此基础上结合邻域方法预测用户偏好。
　　(2)Kernel-CF模型假设用户的评分服从某一稳定的分布，利用核密度估计的方法分别估计每个用户评分分布密度函数，然后在根据用户的评分分布密度函数计算用户的相似度，最后结合邻域方法预测用户偏好。
　　通过在MovieLens数据集上的实验验证，表明了两种混合协同过滤在RMSE性能指标上均有优于基于用户和项目的协同过滤算法。
　　最后，本文介绍了推荐算法在课堂交互平台上的一种新型应用：利用Kernel-CF预测学生的答题得分。

著录项

作者
宋建锋;
展开▼
作者单位

华中科技大学;

展开▼
授予单位华中科技大学;
学科应用统计
授予学位硕士
导师姓名叶鹰;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类算法理论;
关键词
推荐系统; 协同过滤; 核密度估计; 主题生成模型; 用户评分;

相似文献

中文文献
外文文献
专利

1. 基于LDA主题模型的文本语料情感分类改进方法 [J] . 郭晓慧 . 延边大学学报（自然科学版） . 2018,第003期
2. 基于改进LDA模型的图书推荐方法研究 [J] . 赵以昕 ,李铮 ,汪强兵 . 情报工程 . 2018,第005期
3. 基于改进LDA模型的图书推荐方法研究 [J] . 赵以昕 ,李铮 ,汪强兵 . 情报工程 . 2018,第005期
4. 基于改进的Mca-sLDA模型的图像分类和标注模型研究 [J] . 罗菊香 . 荆楚理工学院学报 . 2020,第005期
5. 基于人口统计学的改进聚类模型协同过滤算法 [J] . 王媛媛 ,李翔 . 计算机科学 . 2017,第003期
6. 大数据环境下基于人口统计学的改进聚类模型协同过滤算法 [C] . Wang Yuanyuan ,王嫒媛 ,Li Xiang . 2015全国高性能计算学术年会 . 2015
7. 基于核方法的2DLDA人脸识别算法研究 [A] . 程宇 . 2011

基于LDA模型和核方法改进的协同过滤算法

目录

摘要

著录项

相似文献

相关主题

期刊订阅