封面
中文摘要
英文摘要
目录
第1章 绪论
1.1 研究的背景和意义
1.2 MapReduce程序优化的相关研究
1.3 有关数据清洗的研究
1.4 本文研究内容
1.5 本文的结构
第2章 预备知识与优化方法
2.1 海量数据清洗系统概述
2.2 FLI三层体系的提出
2.3 利用FLI三层体系进行优化
第3章 实体识别子系统优化的研究
3.1 实体识别系统的实现
3.2 分析与优化
3.3 实验结果及分析
3.4 本章小结
第4章 不一致修复子系统优化的研究
4.1不一致数据修复系统地实现
4.2 分析与优化
4.3 实验结果及分析
4.4 本章小结
第5章 缺失值填充子系统的优化
5.1 缺失值填充系统的实现
5.2 分析与优化
5.3 实验结果及分析
5.4 本章小节
结论
参考文献
攻读硕士学位期间发表的论文
声明
致谢