一种面向HDFS中海量小文件的存取优化方法

顾玉宛; 王文闻; 孙玉强

首页> 中文期刊>计算机应用研究 >一种面向HDFS中海量小文件的存取优化方法

一种面向HDFS中海量小文件的存取优化方法

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

为了解决HDFS(Hadoop distributed file system)在存储海量小文件时遇到的NameNode内存瓶颈等问题,提高HDFS处理海量小文件的效率,提出一种基于小文件合并与预取的存取优化方案.首先通过分析大量小文件历史访问日志,得到小文件之间的关联关系,然后根据文件相关性将相关联的小文件合并成大文件后再存储到HDFS.从HDFS中读取数据时,根据文件之间的相关性,对接下来用户最有可能访问的文件进行预取,减少了客户端对NameNode节点的访问次数,提高了文件命中率和处理速度.实验结果证明,该方法有效提升了Hadoop对小文件的存取效率,降低了NameNode节点的内存占用率.%In order to solve the problem of NameNode memory bottleneck when HDFS stored a massive amount of small files, this paper proposed an optimization of massive small files storage and accessing on HDFS to improve the efficiency of HDFS.First, it could get the relationship between small files by analyzing a large number of history access logs, and then merged these correlative small files into a big file which would be stored on HDFS.When the client read data from HDFS, the system would prefetch the related files which were most likely to be visited next according to the relevance of small files to reduce the number of request for NameNode, thereby increasing the hit rate and processing speed.The results of experiment show that this method can effectively improve the efficiency of storing and accessing mass small files on HDFS, and cuts down the memory utilization of NameNode.

著录项

来源
《计算机应用研究》|2017年第8期|2319-2323|共5页
作者
顾玉宛; 王文闻; 孙玉强;
展开▼
作者单位

常州大学信息科学与工程学院,江苏常州 213164;

常州大学信息科学与工程学院,江苏常州 213164;

常州大学信息科学与工程学院,江苏常州 213164;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
海量小文件; 文件相关性; 合并; 预取;
入库时间 2022-08-18 05:02:17

相似文献

中文文献
外文文献
专利

1. HDFS中海量小文件合并与预取优化方法的研究 [J] . 郑通 ,郭卫斌 ,范贵生 . 计算机科学 . 2017,第0z2期
2. SQL-DFS:一种基于HDFS的海量小文件存储系统 [J] . 马志强 ,杨双涛 ,闫瑞 . 北京工业大学学报 . 2016,第001期
3. Ceph系统中海量气象小文件存取性能优化方法 [J] . 陆小霞 ,王勇 ,雷晓春 . 桂林电子科技大学学报 . 2019,第001期
4. 面向Hadoop分布式文件系统的小文件存取优化方法 [J] . 李铁 ,燕彩蓉 ,黄永锋 . 计算机应用 . 2014,第011期
5. 一种面向海量高并发小文件数据的处理方法 [J] . 谭文贵 ,唐福林 ,王琨 . 信息通信 . 2017,第010期
6. 基于Ceph的海量小文件存储的优化方法 [C] . Zhang Bitao ,张毕涛 ,Xin Yang . 第十届中国通信学会学术年会 . 2014
7. 面向海量小文件存取的HDFS优化研究 [A] . 李铁 . 2015

一种面向HDFS中海量小文件的存取优化方法

摘要

著录项

相似文献

相关主题

期刊订阅