声明
摘要
第1章 绪论
1.1 课题研究的背景及意义
1.2 国内外研究现状
1.3 论文的主要工作及组织结构
1.4 本章小结
第2章 相关技术介绍
2.1 传统索引技术
2.1.1 空间划分树索引及近邻查询
2.1.2 聚类划分树索引及近邻查询
2.2 局部敏感哈希
2.2.1 汉明距离
2.2.2 LSH定义
2.3 乘积量化算法
2.3.1 矢量量化
2.3.2 乘积量化
2.3.3 优化的乘积量化
2.4 分布式计算框架
2.4.1 Hadoop
2.4.2 Spark
2.5 本章小结
第3章 基于多哈希表索引的近邻查找算法
3.1 问题描述
3.2 论文方法的提出
3.3 多哈希表的建立
3.3.1 二进制编码表示
3.3.2 不同哈希位关联性的衡量
3.3.3 比特位分组方案的优化
3.4 数据的索引及查询优化
3.5 Spark并行环境的实现
3.5.1 数据及任务并行化
3.5.2 Spark的并行实现
3.6 本章小结
第4章 实验设计与结果分析
4.1 实验环境及数据库
4.1.1 实验环境
4.1.2 实验数据
4.2 算法的评估标准
4.3 实验结果与分析
4.3.1 哈希表哈希位数的影响
4.3.2 不同方法的对比实验
4.4 本章小结
第5章 总结与展望
参考文献
攻读学位期间公开发表论文
致谢