首页> 中文学位 >基于电阻网络与稀疏数据预测的协同过滤算法研究
【6h】

基于电阻网络与稀疏数据预测的协同过滤算法研究

代理获取

目录

文摘

英文文摘

论文说明:图表目录

声明

第1章绪论

1.1课题背景

1.2研究现状

1.3本文的主要工作

1.4本文内容的组织结构

第2章 CADAL与个性化推荐技术

2.1百万册数字图书馆项目

2.2个性化推荐技术概述

2.2.1个性化技术提出的背景

2.2.2主要技术

2.3 CADAL中的个性化服务

2.3.1用户基本服务

2.3.2收藏

2.3.3书签

2.3.4规则

2.4本章小结

第3章协同过滤技术概述

3.1协同过滤技术简介

3.2协同过滤技术的优缺点

3.3主要算法

3.3.1基于记忆的算法

3.3.2基于模型的算法

3.4相关概念

3.4.1评分刻度

3.4.2数据归一化

3.5本章小结

第4章基于电阻网络模型的相似度计算

4.1评分图

4.1.1定义

4.1.2评分图的作用

4.1.3相似度计算必须符合的三大条件

4.1.4与Pearson Correlation Coefficient(PCC)相比较

4.2电阻距离—相似度的计算

4.3负评分值的影响

4.4 Y-△简化

4.5本章小结

第5章预测评分

5.1选择相似的邻居

5.2稀疏数据的预测算法

5.3预测评分

5.4关于重要参数的讨论

5.5本章小结

第6章实验设计与结果分析

6.1数据集

6.2评价标准

6.3与其他算法,模型比较

6.4预测稀疏数据的作用

6.5本章小结

第7章总结与展望

7.1总结

7.2展望

参考文献

致谢

作者简历

展开▼

摘要

CADAL数字图书馆中存放了海量数字内容,用户在访问数字图书馆的过程中经常面临着信息过载的问题。CADAL门户上为用户提供了一批个性化服务,其中个性化推荐服务是帮助用户克服信息过载的重要手段,大为减少用户寻找信息时候花费的时间与精力。 应用于个性化推荐系统的协同过滤技术在过去的十年中获得了长足发展,但是仍然存在着二大类问题:一、用户间或物品间相似度计算方法单一,多是简单的向量运算;二、系统收集的评分数据稀疏时,常见的基于记忆的推荐系统效果不佳,尤其是在系统运行初期时候,还有冷启动的问题。 本文的主要工作如下:一、采用了一种新颖的基于电阻网络模型的相似度计算方法。用户与物品可被视为电阻网络中的节点,用户给物品评分就构成电阻网络上的通路,评分值即为电导,则与物理电阻网络类似,可以利用线性方程组来求取用户节点间的相似度或者物品节点间的相似度。二、给出一种有效的稀疏数据预测算法:集成使用物品间相似度与用户间相似度,有选择性地预测较有把握的缺失评分,在扩大后的评分集合基础上预测最终的用户评分。三、实现了基于电阻网络模型的协同过滤算法Electrical Resistance Network M0del forCollaborative Filtering(ERCF)。考虑到CADAL网站上收集评分数目不多,我们在著名的MovieLens评分数据集上进行了详细实验,实验结果表明ERCF在准确度上超过其他被测试的方法,有选择性地预测缺失评分可以显著提高推荐算法的准确度。

著录项

  • 作者

    马骋;

  • 作者单位

    浙江大学;

    浙江大学计算机科学与技术学院;

  • 授予单位 浙江大学;浙江大学计算机科学与技术学院;
  • 学科 计算机应用技术
  • 授予学位 硕士
  • 导师姓名 庄越挺,吴江琴;
  • 年度 2008
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 算法理论;
  • 关键词

    电阻网络; 稀疏数据预测; 协同过滤算法; CADAL;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号