首页> 中文学位 >分布式小数据存储系统的设计与实现
【6h】

分布式小数据存储系统的设计与实现

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 引言

1.1 研究动机

1.2 研究内容

1.3 论文组织

1.4 本章小结

第二章 基础理论与相关技术

2.1 关系数据库

2.2 分布式存储系统

2.3 P2P技术

2.4 常见的键值存储系统

2.5 本章小结

第三章 系统设计

3.1 系统需求分析

3.2 系统的总体框架

3.3 系统关键技术

3.4 数据划分与冗余存储

3.5 节点上下线

3.6 数据一致性

3.7 数据混写

3.8 set中数据的聚集存储

3.9 负载均衡

3.10 系统基本功能与对外接口

3.11 本章小结

第四章 存储服务器的设计与实现

4.1 存储服务器的概述

4.2 通信模块

4.3 数据操作模块

4.4 请求管理模块

4.5 虚节点表模块

4.6 本章小结

第五章 Router与chubby的实现

5.1 Router

5.2 Chubby

5.3 本章小结

第六章 系统测试

6.1 测试环境

6.2 功能测试

6.3 性能对比测试

6.4 本章小结

第七章 结论与展望

致谢

参考文献

硕士期间取得的研究成果

展开▼

摘要

随着互联网的高速发展与全球网民数的激增,网络服务的数据量以指数增长。如何提高对海量数据的存储管理与访问能力,成为了业界研究的一个热点问题。在海量数据面前,传统的关系型数据库模型因缺乏系统的高可扩展性,而逐渐被放弃。继而涌现出了许多非关系型的分布式数据存储系统。这些系统更多的是从分布式架构上出发提高系统可扩展性以及数据存储和访问能力,而忽略了数据的底层数据存储结构在提高数据IO效率上的作用,也忽略了小数据读写可能引发的磁盘磁头频繁移动的问题。
  本文首先介绍了研究动机,然后对当前主流的分布式存储系统与P2P系统进行了分析与学习,并结合小数据存储的特点,设计了一个具备高可靠性、高可扩展性的分布式小数据键值存储系统MSDSS。本文的主要工作与创新点有以下几点:
  第一借助改进型的一致性哈希算法与虚节点技术构建了一个具备高可扩展性的键值存储系统架构。这种架构保证了数据在系统中的分散存储,并解决了存储节点的异构性问题。
  第二使用定位表的方法,实现同一集合中数据在物理上分段聚集存储,为该集合中数据提供了高速的数据浏览支持。
  第三使用数据混写技术,在存储服务器上,采用写缓存策略,将缓存的小数据集中混写到一个临时文件,以提高整个系统的服务能力。
  第四使用chubby技术,监控系统中服务器的在线情况。当系统中服务器上下线时,其他服务器可以较快获得通知,提高了系统的可扩展性。
  第五使用了merkle tree技术,高效检测系统中副本数据的一致性,降低了网络中系统控制信息的流量。
  最后简化实现了MSDSS,并在功能与性能上对系统进行了测试。测试结果表明,在面对大量数据请求时,数据混写可以在数量级上降低用户修改数据的响应时间;数据聚集存储可以在数量级上降低用户浏览集合内数据的响应时间。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号