声明
摘要
第一章绪论
1.1本文的研究背景及意义
1.2国内外的研究现状
1.2.1数据相似性连接分类
1.2.2一般数据相似性连接研究现状
1.2.3高维数据相似性连接研究现状
1.3目前存在的问题
1.4本文的主要研究内容
1.5本文的组织结构
第二章研究基础和相关技术
2.1大数据处理相关技术
2.1.1 Hadoop技术
2.1.2 Spark技术
2.1.3 Hadoop与Spark的比较
2.2高维数据相似性连接
2.2.1高维数据相似性连接定义
2.2.2高维数据相似性连接算法
2.3高维数据垂直划分技术
2.4本章小结
第三章高维数据相似性连接研究与实现
3.1基于Spark的SAVD算法研究和实现
3.1.1 SAVD算法原理
3.1.2 SAVD算法实现
3.2改进的SAVD算法I-SAVD算法研究和实现
3.2.1 I-SAVD算法原理
3.2.2 I-SAVD算法实现
3.3本章实验
3.3.1实验配置
3.3.2数据集
3.3.3实验及评估
3.4本章小结
第四章高维数据相似性连接的增量式计算方法研究与实现
4.1增量式高维数据连接原理
4.2增量式高维数据连接实现
4.3本章实验
4.4本章小结
第五章总结与展望
参考文献
发表论文和参加科研情况说明
致谢