首页> 中文学位 >高效云存储缓存调度系统设计与实现
【6h】

高效云存储缓存调度系统设计与实现

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

1 绪论

1.1 研究背景

1.2 国内外研究现状

1.3 本文主要内容

2 云存储缓存系统相关技术

2.1 相似文件检测技术

2.2 倒排索引及搜索技术

2.2.1 倒排索引技术概述

2.2.2倒排索引的构建

2.2.3 并行与分布式索引

2.2.4 索引更新策略

2.3 文件差分同步技术

2.3.1 文件差分同步概述

2.3.2 相同数据检测

2.3.3 差分编码

2.4 本章小结

3 系统设计与实现

3.1 系统设计概述

3.2相似文件检测设计与实现

3.2.1 特征文件生成

3.2.2 相似文件检测

3.3文件差分同步的设计与实现

3.3.1 差分同步概述

3.3.2 协议设计

3.3.3 同步源端设计

3.3.4 同步目的端设计

3.4 系统设计与实现小结

4 系统测试分析

4.1 测试环境

4.1.1 机器配置

4.2 测试结果分析

4.2.1 相似文件搜索性能

4.2.2 文件同步性能

4.3 测试总结

5 全文总结

5.1 工作总结

5.2 工作展望

致谢

参考文献

展开▼

摘要

随着大数据时代的来临,云存储也迎来了前所未有的发展。
  当前国内云存储行业迅速发展的同时也遇到了比较大的问题。阻碍国内的云存储行业发展的首先就是慢速网络问题。国内的网络连接速度远低于国际平均水平,慢速的网络让云存储服务的质量很难满足用户要求。除了慢速网络,云环境下大量的重复数据也使得云存储服务提供商们的存储硬件以及网络带宽的利用率比较低,这也无形中增加了云存储服务的成本、降低用户体验。
  针对慢速网络和重复数据问题,当前云存储服务提供商们已有一些优化方案。例如,在用户上传文件时采用md5比对的方法进行文件级重删,进而优化带宽利用率。该种优化措施存在重删粒度太粗并且会消耗云存储客户端的计算资源的问题。
  考虑到云存储系统中一般都会使用缓存,由于访问缓存的高效,客户端可以直接和缓存节点进行完整的数据交互。针对慢速网络和重复数据问题,可以对缓存调度过程做更细致的优化。优化措施包括在调度过程中的相似文件搜索和相似文件差分同步。
  采用按文件内容分块和搜索引擎相结合的技术进行相似文件搜索,该方法适用于文本文件、二进制文件等,具有更好的通用性。并且,对文件按照内容进行分块的方法可以很好的发现两个相似文件之间的相同数据块,有利于相似文件的检测。文件调度时采用差分同步方式,只传输相似文件之间的差异部分,提高网络带宽的利用率,从而带来很好的用户体验。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号