首页> 中文学位 >高维数据下近似K近邻查询的研究
【6h】

高维数据下近似K近邻查询的研究

代理获取

目录

第1章 绪论

1.1 课题研究背景以及研究意义

1.2 研究现状

1.3 本文主要研究内容

1.4 本文的组织结构

第2章 局部敏感哈希算法

2.1 引言

2.2 相似性搜索

2.3 神经网络

2.4 本章小结

第3章 基于谱哈希的QALSH

3.1 引言

3.2 QALSH

3.3 改进的QALSH算法

3.4 谱哈希(Spectral Hashing)

3.5 SP-QALSH算法

3.6 实验结果与分析

3.7 本章小结

第4章 基于深度哈希的K近邻检索

4.1 引言

4.2 Log-Relu激活函数

4.3 基于卷积自动编码器的特征抽取

4.4 卷积自编码器的设计与实现

4.5 CAE-QALSH模型

4.6 实验结果与分析

4.7 本章小结

结论

参考文献

声明

致谢

展开▼

摘要

近年来,随着互联网的迅速普及,人类日常生活产生的数据也越来越大。数据的爆炸不仅体现在数据量上的增长,也体现在数据维度上的增长,在高维数据上的一些操作成为越来越重要的研究课题,比如本文关注的近似近邻查找问题。本文中我们主要针对于高维数据空间下的近似近邻查询问题进行了较深入的分析与研究。对近似近邻查找领域的查询感知的检索方式进行了一系列优化与改进。
  本研究主要内容包括:⑴对于近似近邻搜索,查询感知LSH是一种非常新颖的检索方式,这种方式不同于一般LSH中所使用的直接哈希分桶,它是通过先确定哈希投影再确定检索范围的方式,使得查询效果明显提升。本文首先对查询感知LSH进行改进,通过改进算法中的一些缺陷然后结合使用谱方法进行哈希,使得算法在时间和IO性能上都得到了一定的提升。⑵深度哈希是基于深度神经网络的一类哈希算法。首先提出了一种新的激活函数,然后建立了一种卷积自编码器网络结构,并提出了适用于该类网络的预训练方法。通过神经网络强大的表示能力,将数据哈希降维到低维数据,得到了非常精简的编码。最后我们联合深度哈希和查询感知检索方式,建立了一个基于深度哈希的近似近邻检索模型。虽然离线训练模型需要占用一定时间,但是这种方式缩短了在线处理时间和并且可以得到更加优良的检索结果。最后在公开数据集上的实验表明我们提出的激活函数和训练策略都非常有用,同时我们在实验中证明了卷积自编码器网络的高效性和实用性。

著录项

  • 作者

    杜帅剑;

  • 作者单位

    哈尔滨工业大学;

  • 授予单位 哈尔滨工业大学;
  • 学科 计算机技术
  • 授予学位 硕士
  • 导师姓名 高宏;
  • 年度 2017
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.13;
  • 关键词

    高维数据; 数据挖掘; 程序语言; 哈希算法;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号