声明
摘要
1 绪论
1.1 研究背景及意义
1.1.1 课题研究背景
1.1.2 课题研究意义
1.2 国内外研究现状
1.2.1 Hadoop的研究现状
1.2.2 基于MapReduce的聚类算法的研究现状
1.2.3 海量数据存储的研究现状
1.3 本文的工作
1.4 文章的结构
1.5 本章小结
2 相关技术研究
2.1 物联网技术
2.2 Hadoop云计算技术
2.2.1 云计算概念
2.2.2 云存储概念
2.2.3 Hadoop架构
2.2.4 MapReduce编程模型
2.2.5 HDFS体系结构
2.3 技术路线
2.3.1 HDFS存储物联网小文件的不足
2.3.2 设计思想
2.4 本章小结
3 海量物联网数据聚类算法的研究
3.1 聚类算法
3.1.1 K均值算法
3.1.2 高斯分布测试算法
3.1.3 G均值算法
3.2 物联网数据聚类算法的设计
3.2.1 K均值算法的设计
3.2.2 高斯分布测试算法的设计
3.2.3 G均值算法的设计
3.3 本章小结
4 海量物联网数据存储优化
4.1 Hadoop内存元数据结构
4.2 四叉树文件索引设计
4.2.1 四叉树结构
4.2.2 四叉树索引设计
4.3 物联网小文件合并策略的研究
4.3.1 HDFS小文件处理方案
4.3.2 基于文件关联程度的合并策略
4.4 局部索引预加载访问优化策略
4.5 本章小结
5 实验
5.1 实验环境的部署
5.1.1 实验平台环境
5.1.2 Hadoop主要配置
5.2 实验结果与分析
5.2.1 G均值算法实验结果
5.2.2 G均值实验结果分析
5.2.3 存储优化结果分析
5.3 本章小结
6 总结与展望
6.1 总结
6.2 展望
致谢
参考文献
附录
南京理工大学;