基于最终一致性的HDFS读写技术的研究与优化

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着信息技术的快速发展，云计算、大数据等热门行业崛起，传统的单机作业不再能满足用户日益增长的需求。越来越多的个人以及企业都将平台重心从单机转移至分布式平台。Hadoop以其高可靠、高扩展、高性能、高容错、低成本的特性成为当下炙手可热的分布式系统基础架构，被越来越多的用户及开发者接受，广泛运用于不同的生产环境。HDFS作为Hadoop的底层存储实现不仅高效地服务于Hadoop，还被用于其他分布式系统基础架构例如Spark等。
　　HDFS全名为Hadoop Distributed File System，是Hadoop项目的一个子项目，它被设计为运行在通用硬件上的分布式文件系统。它与现有的分布式文件系统有很多相似之处，同样的，不同之处也十分明显。HDFS具有高容错性，可以被广泛运用于廉价的，淘汰的硬件。HDFS可以提供对应用高吞吐的访问，尤其适用于拥有大数据集的应用。然而随着HDFS被用于更多的生产环境，新的需求被逐渐提出，希望HDFS支持低延迟高性能的特性，以便用户可以尽快对写入HDFS的文件进行读取与分析。
　　为了实现低延迟高性能的分布式文件系统，本文首先研究了 HDFS的现有读写方法，结合国内外对读写技术优化方案的研究现状分析了各自的优缺点，并提出了可以有用方案。此方案根据HDFS在写入数据时数据节点必须依次写入的特性，结合最终一致性理论，实现了分布式文件系统低延迟高性能的特性。该方案首先打破了HDFS在写入操作阶段强一致性的要求，使用最终一致性理论，使得用户可以在文件系统尚未完全写入数据时便能够进行访问和读取数据。然后，在改进的写操作策略下，采用全新的读策略，实现对数据的访问，从而减少延迟，提高系统的访问效率。并且对新读写技术可能引入的新的异常进行分析和研究。最后通过实验结果表明，所提出的基于最终一致性的HDFS读写技术在我们的实验环境中，可以大大减少系统延迟，提高了系统性能高达163%。

著录项

作者
何俊杰;
展开▼
作者单位

上海交通大学;

展开▼
授予单位上海交通大学;
学科软件工程
授予学位硕士
导师姓名胡飞;
年度 2016
页码
总页数
原文格式 PDF
正文语种中文
中图分类分布式操作系统、并行式操作系统;
关键词
HDFS读写技术; 大数据处理; 数据读取; 系统优化; 分布式存储系统;

相似文献

中文文献
外文文献
专利

1. FEMA:基于HDFS的小文件读写优化算法 [J] . 张鑫 ,谭海 . 电脑知识与技术 . 2019,第006期
2. 基于HDFS的安全云存储数据读写机制研究 [J] . 李斌 ,丁上凌 . 计算机光盘软件与应用 . 2014,第015期
3. 基于预测模型的HDFS集群负载均衡优化与研究 [J] . 于磊春 ,陈健美 ,刘响 . 计算机应用与软件 . 2018,第005期
4. 基于FileSystem API的HDFS文件存取和副本选择优化研究 [J] . 贾会玲 ,吴晟 ,李英娜 . 化工自动化及仪表 . 2016,第006期
5. 基于HDFS的海量指纹数据云存储优化研究 [J] . 张宇翔 ,赵建民 ,朱信忠 . 浙江师范大学学报（自然科学版） . 2015,第002期
6. 基于分布式NameNode节点的HDFS优化研究 [C] . RAO Lei ,饶磊 ,YANG Fande . 第八届全国信号和智能信息处理与应用学术会议 . 2014
7. 基于HDFS的海量小文件读写策略研究 [A] . 高宗宝 . 2016

基于最终一致性的HDFS读写技术的研究与优化

目录

摘要

著录项

相似文献

相关主题

期刊订阅