封面
声明
中文摘要
英文摘要
目录
第一章 绪论
第一节 研究背景
第二节 国内外研究现状
第三节 研究内容和意义
第四节 论文组织结构
第二章 相关技术简介
第一节 Hadoop
第二节 MapReduce
第三节 YARN
第四节 字符串相似度检查算法
第三章 研究背景介绍
第一节 系统概述
第二节 重复检查环节流程
第三节 问题总结
第四章 组合信息的重复检查方法的实现
第一节 组合信息的重复检查方法的提出
第二节 程序设计
第三节 程序实现
第四节 结果总结
第五章 重复检查方法的并行化实现及分析
第一节 可行性分析
第二节 运行环境
第三节 数据集设计
第四节 程序设计及实现
第五节 结果及分析
第六章 总结与展望
第一节 研究工作总结
第二节 研究工作展望
参考文献
致谢
个人简历