基于MapReduce的相似数据查询方案

崔炜

首页> 中文期刊>计算机应用 >基于MapReduce的相似数据查询方案

基于MapReduce的相似数据查询方案

开具论文收录证明 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

大规模数据常因其分布式存储特性导致寻找其相似度最大的前k对数据比较困难.针对上述问题,提出一种基于MapReduce的最相似k对数据查询方案.该方案首先将所有数据对分割成多个组,然后提出所有数据对分组算法和核心数据对分组算法,通过单独计算每个组中的最近似k对数据,再从所有组的最近似k对数据中选择相似度最高的k对数据,进而正确地确定最近似k对数据.最后基于合成数据和真实数据进行实验,通过改变最近似数据对数k和机器数目s验证算法性能.实验结果表明增加机器数目s能够提升算法的运行效率和可扩展性,而k参数的变化对基于MapReduce的算法影响不大.

著录项

来源
《计算机应用》|2014年第9期|2532-2536,2542|共6页
作者
崔炜;
展开▼
作者单位

广东松山职业技术学院计算机系,广东韶关512126;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
相似度; MapReduce; 数据查询; 分组; 最近似k对数据;
入库时间 2022-08-18 04:50:31

相似文献

中文文献
外文文献
专利

1. 一种基于语义相似度的P2P数据查询方法 [J] . 林晓 . 电子测试 . 2014,第023期
2. 一种基于MapReduce的局部相似自连接算法 [J] . 王晓霞 ,孙德才 . 计算机技术与发展 . 2020,第002期
3. 一种基于MapReduce的不确定图上的相似性连接方法 [J] . 缪丰羽 ,王宏志 ,阮群生 . 计算机科学 . 2018,第012期
4. 基于MapReduce的聚类算法相似性度量分析研究 [J] . 彭天昊 ,潘有顺 ,杨胜林 . 现代信息科技 . 2018,第011期
5. 基于MapReduce的聚类算法相似性度量分析研究 [J] . 彭天昊 ,潘有顺 ,杨胜林 . 现代信息科技 . 2018,第011期
6. 基于SQL Server及C#的数据查询速度优化方案 [C] . 唐曼 . 第七届内蒙古自治区自然科学学术年会 . 2012
7. 基于MapReduce的海量数据集的相似自连接算法的设计与实现 [A] . 鲍广慧 . 2016

基于MapReduce的相似数据查询方案

摘要

著录项

相似文献

相关主题

期刊订阅