封面
声明
中文摘要
英文摘要
目录
1 绪论
1.1 数据去重的研究背景
1.2 重复数据的界定方法
1.3 去重效率的评估方法
1.4 数据去重的研究现状
1.5 本文的主要研究内容
2 数据指纹的快速计算方法
2.1 可变长度分块技术
2.2 两级去重方法的基本框架
2.3 两级指纹的流水计算方法
2.4 实验评估与结果分析
2.5 本章小结
3 流式数据重复元素的快速检测方法
3.1 静态数据集的快速索引方法
3.2 非可扩展动态数据集的快速索引方法
3.3 分离计数型布隆过滤器阵列
3.4 理论分析与实验评估
3.5 本章小结
4 可扩展数据集重复元素的速判方法
4.1 可扩展数据集的快速索引方法
4.2 动态布隆过滤器阵列
4.3 实验评估与理论分析
4.4 本章小结
5 高性能可扩展的数据去重方法
5.1 去重存储系统的研究现状
5.2 MAD2数据去重方法
5.3 实验评估与结果分析
5.4 本章小结
6 全文总结
致谢
参考文献
附录1 攻读博士学位期间发表的学术论文
附录2 攻读博士学位期间参加的科研项目及申请的专利
华中科技大学;