基于Spark平台的分布式检索及推荐系统的研究与实现

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着互联网技术的飞速发展，进入了信息爆炸的时代。近年来，关于信息过滤的研究越受到人们的关注。一方面用户需要通过条件和关键字主动进行检索信息，另一方面推荐算法向用户推送感兴趣的信息。检索是用户主动对信息进行过滤的一种方式。个性化推荐算法将用户和信息进行二维关联，利用某种方式发掘用户感兴趣的信息，其本质也是信息过滤，是对信息检索的一种有力补充。本文从课题的研究背景与意义出发，介绍了相关领域的研究现状，阐述了目前工业界主流使用的检索技术、协同过滤推荐技术和分布式集群等相关技术。以此为基础，分析单机全文检索技术以及基于Map/Reduce编程模型检索技术的不足，为了解决分布式索引刨建效率和检索负载均衡存在的问题，提出了基于树状的倒排索引方案和基于哈希冗余切片策略的分布式检索方案。进而通过分析用户的历史检索行为属于无评分业务场景，提出了一种基于共现模型的协同过滤推荐方案，并利用因子分解机模型对推荐序列进行预测，从而优化推荐结果。在测试阶段，相比传统Lucene单机检索和基于Map/Reduce实现的分布式检索，提出的方案在多项式时间内完成了对富文本大数据全文索引的创建，索引创建速度大幅提升。就元素据检索而言，检索时间与检索文档数成线性关系。就全文检索而言，检索时间与检索文档成近似线性关系。就高并发查询而言，通过索引备份机制，采取分而治之的策略，近乎实现负载均衡。对比业界传统的协同过滤推荐，提出的方案提高了曝光点击转化率。

著录项

作者
胡阳;
展开▼
作者单位

东北大学;

展开▼
授予单位东北大学;
学科软件工程
授予学位硕士
导师姓名陈东明,柴正;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类汽车工程 ;
关键词
Spark; 平台; 分布式检索;

相似文献

中文文献
外文文献
专利

1. 基于Spark的分布式实时推荐系统 [J] . 王佳娴 ,王中杰 . 系统仿真技术 . 2017 ,第002期
2. 基于Spark平台的混合推荐系统研究 [J] . 孙成 . 电脑编程技巧与维护 . 2020 ,第004期
3. 基于Hadoop平台的Spark快数据推荐算法解析——以其在图书推荐系统中的应用为例 [J] . 吴荣 ,段宏涛 . 数字技术与应用 . 2020 ,第006期
4. 基于Spark平台的电子商务实时推荐系统建设和应用 [J] . 蒋丛萃 ,陈巧灵 . 电子商务 . 2020 ,第011期
5. 基于Hadoop平台的Spark快数据推荐算法解析——以其在图书推荐系统中的应用为例 [J] . 吴荣 ,段宏涛 . 图书情报 . 2019 ,第011期
6. 基于Spark SQL的分布式全文检索框架设计与实现 [C] . CUI Guangfan ,崔光范 ,XU Lijie . 第十六届全国软件与应用学术会议 . 2017
7. 基于Spark平台的实时流计算推荐系统的研究与实现 [A] . 张贤德 . 2016

基于Spark平台的分布式检索及推荐系统的研究与实现

目录

摘要

著录项

相似文献

相关主题

期刊订阅