声明
摘要
第1章 绪论
1.1 研究背景和意义
1.2 国内外研究现状
1.3 主要研究内容
1.4 论文的组织结构
第2章 相关研究
2.1 云存储相关知识
2.1.1 云存储概念
2.1.2 集群存储技术
2.1.3 HDFS分布式文件系统
2.2 重复数据删除技术
2.2.1 基本概念
2.2.2 数据划分技术
2.2.3 指纹计算技术
2.3 集群重复数据删除技术
2.3.1 相关知识
2.3.2 索引查询优化
2.3.3 数据路由策略
2.4 本章小结
第3章 云存储中集群重删系统的设计
3.1 系统概述
3.2 设计思路
3.3 系统架构与工作流程
3.3.1 系统架构
3.3.2 工作流程
3.4 软件模块设计
3.4.1 客户端
3.4.2 元数据服务器
3.4.3 数据服务器
3.5 本章小结
第4章 面向重删的数据路由算法设计
4.1 数据路由概述
4.2 路由粒度选择
4.3 数据相似性分析
4.4 局部相似路由算法
4.4.1 特征指纹选择
4.4.2 有状态路由匹配
4.4.3 算法描述与总结
4.5 本章小结
第5章 基于HDFS的集群重删系统实现
5.1 系统实现概况
5.2 数据组织结构
5.3 系统相关过程
5.3.1 数据去重过程
5.3.2 数据重组过程
5.3.3 热点索引更新
5.4 本章小结
第6章 实验测试与结果分析
6.1 测试指标定义
6.2 数据集与实验环境
6.2.1 实验数据集
6.2.2 实验环境
6.3 单节点内的测试分析
6.3.1 SuperBlock划分测试分析
6.3.2 热点指纹影响测试分析
6.4 云存储中多节点的测试分析
6.4.1 去重率测试分析
6.4.2 系统性能测试分析
6.4.3 负载均衡测试分析
6.4.4 读写带宽测试分析
6.5 本章小结
第7章 总结与展望
7.1 工作总结
7.2 工作展望
参考文献
致谢
攻读硕士期间参加的科研项目