基于学习的分布式局部敏感哈希算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着计算机网络技术的不断发展，网络中充斥着各种各样的海量高维数据，在此数据中搜索目标数据也随之变得耗时和低效。为解决上述问题，近似近邻搜索的概念及各种算法被陆续提出，并成为机器学习、数据挖掘、模式识别等多种应用中的一类基本算法，而局部敏感哈希算法被证明是解决高维空间近邻搜索的最有效算法之一。
　　在处理大数据问题上，基于(key，value)的分布式结构被越来越广泛的采用，如经典的并行编程框架MapReduce、Twitter Storm和Spark等。结合(key，value)结构，对经典局部敏感哈希算法进行分布式化，是近期的研究热点。为了保证查询精度，需要建立大量的哈希表，这无疑将占用不少内存空间，尤其是在处理高维数据的场合。同时，在分布式背景下，由于哈希桶位于不同的节点，在不同的哈希桶进行查询就会产生多次网络调用，从而导致大量的网络传输。为了减少内存占用和网络调度费用，Layered LSH给出了采用O(1)个哈希表的分布式局部敏感哈希方案。不过，研究中发现会降低查询的精度。
　　本文尝试设计了一种将学习算法应用在基于(key，value)的分布式结构，且在该索引基础上进行了基于MapReduce的空间近邻查询实现。本文的主要工作如下:(1)提出了查询精度更高的算法LB-LSH，改进了Entropy LSH的分布式(key，value)模型。(2)类似于Layered LSH机制，LB-LSH在采用O(1)个哈希表的情况下保证了查询精度，大大减少了网络传输和频繁的I/O。(3)在Hadoop平台上实现了LB-LSH，大量的实验结果显示，该算法优于当前所采用的一些哈希算法。

著录项

作者
刘畅;
展开▼
作者单位

大连海事大学;

展开▼
授予单位大连海事大学;
学科计算机技术
授予学位硕士
导师姓名曲雯毓,冯冰;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类算法理论;
关键词
局部敏感哈希算法; 分布式结构; 学习算法; 查询精度;

相似文献

中文文献
外文文献
专利

1. 基于特征降维和精确欧式局部敏感哈希的协同过滤推荐算法研究 [J] . 邹晓瑜 . 无线互联科技 . 2020,第012期
2. 基于群智能和机器学习的分布式生产调度算法研究 [J] . 张萌 . 河南科技 . 2020,第019期
3. 基于局部分布式学习模型的电力系统WSNs路由算法研究 [J] . 艾久超 . 通信技术 . 2020,第006期
4. 基于分布式学习自动机和用户反馈的网页排序算法研究 [J] . 王冲 ,姜金川 . 计算机应用与软件 . 2019,第003期
5. 基于元学习的分布式挖掘频繁闭合模式算法研究 [J] . 琚春华 ,倪栋君 . 计算机应用研究 . 2009,第001期
6. 基于分布式的误用检测规则匹配学习算法研究 [C] . 谢亮 ,胡若 ,钱省三 . 信息系统协会中国分会第一届学术年会 . 2005
7. 基于局部敏感哈希的DBSCAN聚类算法研究 [A] . 叶仕秋 . 2019

基于学习的分布式局部敏感哈希算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅