首页> 中文学位 >云计算环境中分布式文件系统数据一致性问题研究
【6h】

云计算环境中分布式文件系统数据一致性问题研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1 课题背景及研究现状

1.2 本文的主要工作

1.3 本文的结构安排

第二章 相关理论与技术概述

2.1 云计算

2.2 云存储

2.3 分布式文件系统

2.4 复制与缓存

2.5 Hadoop分布式文件系统

2.6 NWR模型

2.7 本章小结

第三章 数据一致性问题分析与研究

3.1 一致性问题的由来

3.2 一致性模型

3.3 分布式文件系统中的数据一致性问题

3.4 本章小结

第四章 基于HDFS的交互式云存储系统的设计

4.1 系统需求分析

4.2 系统整体架构

4.3 系统的详细设计

4.4 本章小结

第五章 基于HDFS的交互式云存储系统的实现

5.1小文件处理模块的实现

5.2基于NWR模型的读写同步模块的实现

5.3 本地缓存模块的实现

5.4 本章小结

第六章 测试与分析

6.1 测试环境安装与部署

6.2 测试结果分析与比较

6.3 本章小结

第七章 总结与展望

7.1 论文总结

7.2 工作展望

致谢

参考文献

展开▼

摘要

随着各行各业信息化的程度不断的提高和移动互联网的飞速发展,传统的计算模式和存储模式已经不能满足日益增长的业务需求,云计算就是在这种背景下提出的一种计算模式,它是一种分布式计算、并行计算和网格计算的商业发展,提供了一种按需付费和弹性扩展的服务方式。云存储是云计算服务架构中的重要组成部分,它提供了可扩展,高容错的存储服务。分布式文件系统则提供了对云存储系统的支撑,其性能的好坏直接影响了云存储服务能力。
  分布式文件系统为了提高系统的可靠性和性能一般都采用了副本和缓存的技术,然而复制和缓存却带了副本和缓存的数据一致性问题。为了解决一致性问题从不同的角度有多种一致性模型可以参考。HDFS是一种面向大数据集、高吞吐量应用的一种分布式文件系统,在数据存储节点上它提供了冗余存储数据块的机制来保证系统的可扩展性和可靠性,然而它采用的是基于管道流的副本数据块更新机制,当面对交互式的应用场景时,它所采用的副本数据块强一致性策略会造成服务性能的急剧下降。
  本文从分析面向个人用户的云存储服务的特点以及用户使用云存储服务的习惯出发,在研究了HDFS的技术架构的基础上设计并实现了基于HDFS的交互式云存储系统,使用了一种可配置的数据副本一致策略来提高系统的可用性,并采用了客户端缓存和合并小文件的方案来提高系统的整体性能。本文的主要工作包括:分析和研究了解决分布式系统中一致性问题可以采用的数据同步模型;研究了HDFS所采用的数据同步模型,并指出其在提供面向个人的云存储服务时的不足,提出并实现了一种基于 NWR模型的可配置的数据副本读写同步方案;基于 HDFS不提供客户端缓存的事实,为了增强系统的可扩展性和减轻服务端的访问压力,在原生HDFS的客户接口上增加客户缓存模块;针对HDFS在面临大量小文件存储时 Namenode内存利用率低下的情况设计并实现了一种能够极大的提高小文件存取效率的方案。最后通过测试和分析证明了本系统的可用性以及服务性能的提高。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号