声明
摘要
第一章 绪论
1.1 研究背景和意义
1.2 研究现状
1.3 本文主要工作及结构安排
第二章 HDFS系统的介绍和性能相关因素分析
2.1 HDFS系统中的元数据分析
2.1.1 文件和目录的元数据信息
2.1.2 数据块及副本的元数据信息
2.1.3 文件、数据块、数据节点之间的映射关系
2.1.4 NameNode节点集中统一管理的元数据信息
2.2 HDFS系统中的通信机制分析
2.3 HDFS系统中典型操作解析
2.3.1 文件写入操作
2.3.2 文件读取操作
2.3.3 数据块复制操作
2.4 HDFS系统中主要后台管理工作
2.5 HDFS系统性能相关因素分析与面临的问题
第三章 HDFS中批量文件存储的优化
3.1 批量文件存储的优化策略
3.1.1 文件数据部署原则
3.1.2 用户文件合并操作
3.1.3 数据片段的关联性分析
3.1.4 数据片段的组装
3.1.5 “先伪删除,后真删除”策略
3.2 相关的元数据类型与结构
3.3 相关算法
3.3.1 文件数据部署算法
3.3.2 用户文件合并算法
3.3.3 数据片段关联性分析算法
3.3.4 数据片段的组装算法
3.4 批量文件的操作流程与接口
3.4.1 批量文件的写入操作
3.4.2 批量文件的读取操作
3.4.3 以组文件方式写入的文件的删除操作
3.5 程序功能实现
3.6 实验
3.6.1 实验环境
3.6.2 时间性能测试结果与数据分析
3.6.3 NameNode元数据大小测试结果与数据分析
第四章 HDFS系统架构优化方案
4.1 NoSQL概述
4.2 NoSQL数据库产品简介
4.3 Redis数据库介绍
4.3.1 Redis是什么
4.3.2 Redis的数据类型
4.3.3 Redis的客户端库
4.3.4 Redis的事务、持久化与主从复制
4.4 HDFS系统架构的优化策略
4.5 程序功能实现
4.6 实验
4.6.1 实验环境
4.6.2 时间性能测试结果与数据分析
4.6.3 NameNode元数据大小测试结果与数据分析
第五章 总结和展望
5.1 总结
5.2 展望
参考文献
致谢