摘要
第一章 引言
1.1 分布式存储系统中冗余机制的必要性以及额外的开销
1.2 本文研究工作概述
1.3 本文的组织结构
第二章 背景及其相关工作
2.1 分布式存储系统
2.2 副本和编码
2.2.1 副本
2.2.2 编码
2.3 通过副本策略降低Hadoop集群的能耗
2.4 异构网络环境下的再生码
2.5 本章小结
第三章 通过副本策略降低Hadoop集群能耗
3.1 节能的备份策略
3.1.1 HDFS备份策略
3.1.2 节能的备份策略
3.2 节能的调度策略
3.2.1 节能调度策略的设计
3.2.2 问题描述
3.2.3 近似算法
3.2.4 可靠性和可用性
3.3 实验和性能评估
3.3.1 实验环境
3.3.2 节点文件比率
3.3.3 数据本地化
3.3.4 能量消耗
3.3.5 作业执行时间
3.4 本章小结
第四章 通过再生码降低数据修复时间
4.1 系统总设计
4.2 存储框架
4.2.1 存储模块
4.2.2 存储控制模块
4.3 计算框架
4.3.1 计算控制模块
4.3.2 计算模块
4.3.3 监控模块
4.4 客户端框架
4.5 编解码框架
4.5.1 算法设计
4.5.2 伽罗华域
4.5.3 编码模块
4.5.4 解码模块
4.6 性能测试
4.6.1 实验环境和配置
4.6.2 网络环境异构
4.6.3 编码任务等待时间
4.6.4 移植到HDFS
4.7 本章小结
第五章 总结与展望
5.1 总结
5.2 展望
参考文献
致谢
攻读学位期间发表的学术论文目录
声明