大数据环境下面向邻域粗糙计算流式并行化研究与应用

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着技术和科技的发展，数据量有了爆炸式的增长，在海量数据中用户无法及时获得自己感兴趣的信息，推荐系统能有效解决这个问题。它根据用户的历史数据，将用户感兴趣的信息推荐给用户。但是传统推荐系统中大部分使用的是离线数据集，它按照一定时间（一般是以天为周期）来对数据进行分析，无法保证推荐系统的实时有效性。现今实时数据流越来越多，这也造成在推荐系统中需要处理的实时数据需求越来越多。同时传统的推荐系统还存在冷启动问题，提供给新用户的推荐内容准确性较低，导致用户的体验较差。本文将双论域邻域粗糙集理论运用在推荐系统中，提高推荐系统冷启动准确性；通过构建实时推荐系统，实时处理数据，来解决传统推荐系统实时性低的问题。论文具体的研究工作情况如下：（1）论文为了解决推荐系统的冷启动问题，采用双论域邻域粗糙模型进行偏好挖掘，提高推荐准确性。在双论域邻域粗糙集模型中，推荐系统的数据集是由用户和商品两个数据域所构成的，而通过用户对商品的评分这种映射关系来提高冷启动问题的准确性。（2）论文在面对评分映射具有不同含义的情况，运用矩阵分解模型构建基础评分线，通过基础评分线来表达实际情况中喜欢和不喜欢两种情绪。同时将评分映射关系进一步区分为积极映射和消极映射，并在偏好规则提取过程中过滤掉消极映射，进一步提高推荐系统冷启动的准确性。（3）论文在面对推荐系统的实时性问题上，设计基于Flink框架的实时推荐系统。为了实时计算基础评分线，在分布式流式架构中提出分布式的自适应权重随机梯度下降算法。该算法在分布式环境中收敛性和收敛速度都有很好的表现。（4）论文从软件工程角度，分别通过系统需求，系统设计和模块设计等方面对基于流平台邻域粗糙计算评分推荐系统进行详细阐述，并对系统进行包含功能测试、性能测试在内的系统测试，以保障系统的可靠性及稳定性。

著录项

作者
涂添翼;
展开▼
作者单位

电子科技大学;

展开▼
授予单位电子科技大学;
学科软件工程
授予学位硕士
导师姓名佘堃;
年度 2019
页码
总页数
原文格式 PDF
正文语种中文
中图分类交通工程与公路运输技术管理;
关键词
数据环境; 邻域; 计算流; 并行化;

相似文献

中文文献
外文文献
专利

1. 大数据流式计算框架Heron环境下的流分类任务调度策略 [J] . 张译天 ,于炯 ,鲁亮 . 计算机应用 . 2019,第004期
2. 大数据流式计算环境下的阈值调控节能策略 [J] . 蒲勇霖 ,于炯 ,王跃飞 . 计算机应用 . 2017,第006期
3. 面向云环境的蛋白质折叠模拟计算并行化算法 [J] . 宋华 ,闫会峰 . 科学技术与工程 . 2018,第005期
4. 面向大数据流式计算的任务管理技术综述 [J] . 梁毅 ,侯颖 ,陈诚 . 计算机工程与科学 . 2017,第002期
5. 大数据环境下并行化先进先出成本算法研究 [J] . 侯宁 . 软件导刊 . 2019,第006期
6. 面向大数据的关联规则挖掘算法并行化设计 [C] . XU Hui ,徐慧 ,SUN Qi . 中国计算机用户协会网络应用分会2014年第十八届网络新技术与应用年会 . 2014
7. 邻域粒化粗糙计算的关键技术研究与应用 [A] . 曾凯 . 2015

大数据环境下面向邻域粗糙计算流式并行化研究与应用

目录

摘要

著录项

相似文献

相关主题

期刊订阅