协同过滤技术中的数据预处理研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着互联网时代的到来，网络上信息的规模急剧扩大，伴随而来的“信息过载”问题也越来越严重。基于信息检索的信息推荐服务，无法满足用户不断提高的信息服务需求。这也催生了个性化推荐系统的产生。个性化推荐系统能够帮助用户从海量、无序的信息中抓取到用户需要的信息，一定程度上缓解了“信息过载”问题。其中协同过滤技术是个性化推荐领域最为成功的技术之一，在互联网各个领域大规模的应用。然而随着数据规模的剧增、用户需求的不断提高，协同过滤技术也暴露了很多问题，例如数据噪声、数据稀疏、冷启动、扩展性等问题，严重影响了信息推荐服务的质量。数据噪声是本文所要研究的第一个问题。用户在评分时可能会因为一些环境因素影响下意识给出不正当评分或者存在一些恶意刷评分的行为从而导致评分数据存在一些数据噪声。评分数据对协同过滤技术中核心过程之一的计算邻居群体有很大影响，所以如果不消除原始评分数据的评分噪声可能会影响后续信息推荐服务的质量。研究的第二个问题是数据稀疏性问题。由于在偏好数据中往往数据的稀疏程度非常高，偏好信息的缺乏会导致后续计算相似群体的准确度严重降低，而且极端情况下还会导致冷启动问题，进而影响后续信息推荐服务的质量。本文具体工作如下：针对数据噪声问题，本文将使用基于模糊聚类和Weighted Slope One算法的数据清洗算法，针对传统Slope One算法只考虑了项目流行度差异，而未考虑用户之间相似程度信息与项目评价数量信息。本文算法会先根据用户偏好信息对用户进行模糊聚类，然后结合用户对每个簇的从属度和每个簇内项目之间的流行度偏差值计算最终的项目之间流行度差异，最后通过Weighted Slope One算法计算最终调整后的评分数据。经过实验，基于模糊聚类和Weighted Slope One算法的数据清洗算法显著提高了噪声消除的效果。针对数据稀疏问题，本文将使用基于Winnow算法的数据填充算法。算法中先结合项目标签信息与评分数据来初始化用户特征矩阵，然后通过Winnow算法优化用户特征矩阵，再判断填充可信度，将满足条件的通过用户特征矩阵进行评分填充。经过实验，经过本文算法填充的评分矩阵在推荐上具有更高的准确度和覆盖率。

著录项

作者
刘杰;
展开▼
作者单位

大连理工大学;

展开▼
授予单位大连理工大学;
学科计算机技术
授予学位硕士
导师姓名陈炳才;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类自动化技术及设备;
关键词
协同过滤技术;

相似文献

中文文献
外文文献
专利

1. 基于稀疏数据预处理的协同过滤推荐算法 [J] . 陈宗言 ,颜俊 . 计算机技术与发展 . 2016,第007期
2. 协同过滤技术中相似度计算问题研究 [J] . 杨莉云 . 福建电脑 . 2010,第006期
3. 国家发展改革委科学技部财政部海关总署国家税务总局第十八批享受优惠政策的企业（集团）技术中心名单、撤销和调整的国家认定企业技术中心名单公告 [J] . . 中国科技投资 . 2011,第12期
4. 基于RSSI的定位技术中数据预处理的滤波算法 [J] . 曹子腾 ,郭阳 ,赵正旭 . 电脑编程技巧与维护 . 2020,第001期
5. 镇平县工艺美术中等职业学校:德塑人生技行天下 [J] . . 河南教育：教师教育（下） . 2019,第2期
6. “技”与“艺”——谈紫砂艺术中技术的作用 [C] . Wang hui ,王辉 . 首届ISCAEE2006中国清华大学国际陶艺教育交流年会 . 2006
7. 中国传统艺术中的“道--技”关系研究 [A] . 陈琳 . 2020

协同过滤技术中的数据预处理研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅