封面
中文摘要
英文摘要
目录
第1章 绪论
1.1课题背景及意义
1.2国内外研究现状
1.3论文研究内容
1.4论文织结构
第2章 字符串相似性连接技术研究
2.1相关定义及概念
2.2字符串相似度的度量方法
2.3字符串相似性连接方法
2.4本章小结
第3章 基于内存的并行化连接方法
3.1相关符号定义
3.2 Para-Join算法框架
3.3 Para-Join的数据划分及相似度计算
3.4 Para-Join的连接过程
3.5实验结果与分析
3.6本章小结
第4章 基于Spark框架的Spss-Join算法
4.1常见的并行化处理框架
4.2 MapReduce在字符串相似度连接中的应用
4.3基于Spark框架的Spss-Join算法实现
4.4实验结果与分析
4.5本章小结
第5章 系统原型
5.1系统框架
5.2运行结果
5.3本章小结
第6章 总结及展望
6.1论文总结
6.2工作展望
参考文献
致谢
攻读硕士学位期间发表的论文
东华大学;