封面
中文摘要
英文摘要
目录
1 绪 论
1.1 研究背景与意义
1.2 国内外研究现状
1.3 研究目的及内容
1.4 论文组织结构
2 Hadoop基础理论
2.1 Hadoop概述
2.2 HDFS介绍
2.3 MapReduce介绍
2.4 本章小结
3 海量小文件存储方法
3.1 整体设计
3.2 文件写入过程
3.3 文件读取过程
3.4 本章小结
4 数据挖掘算法并行化设计
4.1 K-均值算法
4.2 FP-Growth算法
4.3 本章小结
5 实验与分析
5.1 实验环境搭建
5.2 海量小文件存储实验
5.3 算法并行化设计实验
5.4 本章小结
6 总结与展望
6.1 本文总结
6.2 工作展望
致谢
参考文献