基于Hadoop的小文件存储优化方案

李孟; 曹晟; 秦志光

首页> 中文期刊>电子科技大学学报 >基于Hadoop的小文件存储优化方案

基于Hadoop的小文件存储优化方案

开具论文收录证明 >>

期刊封面封底目录下载 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

Hadoop作为成熟的分布式云平台，对较大的文件提供了可靠高效的存储服务，但在处理海量小文件时效率显著降低。该文提出了基于Hadoop的海量教育资源小文件的存储优化方案，利用教育资源小文件间的关联关系，将小文件进行合并成大文件以减少文件数量，并索引机制访问小文件、元数据缓存和关联小文件预取机制来提高文件的读取效率。实验结果表明，该方法提高了Hadoop文件系统存储小文件的存取效率。%Hadoop distributes file system (HDFS) can process large amounts of data effectively through large clusters. However, HDFS is designed to handle large files and suffers performance penalty while dealing with large number of small files. An approach based on HDFS is proposed to improve storage efficiency of small files in HDFS. The main idea is to classify the mass small files, merge them by classes, and index the merged files aiming at reducing the amount of index items in namenodes and improving the storage efficiency. Experimental results show that the storage efficiency of small files is improved contrasting to Hadoop Archives (HAR files).

著录项

来源
《电子科技大学学报》|2016年第1期|141-145|共5页
作者
李孟; 曹晟; 秦志光;
展开▼
作者单位

电子科技大学计算机科学与工程学院成都 611731;

电子科技大学计算机科学与工程学院成都 611731;

电子科技大学计算机科学与工程学院成都 611731;

展开▼
原文格式 PDF
正文语种 chi
中图分类教学机、学习机;
关键词
Hadoop; 索引机制; 关联关系; 小文件存储;
入库时间 2022-08-18 07:47:24

相似文献

中文文献
外文文献
专利

1. 一种Hadoop小文件存储优化方案 [J] . 王全民 ,张程 ,赵小桐 . 计算机技术与发展 . 2016,第011期
2. 基于Ceph存储系统的小文件存储优化方案 [J] . 陈法河 ,柴小丽 . 计算机系统应用 . 2022,第2期
3. 基于Hadoop的海量统计小文件存取优化方案 [J] . 付红阁 ,姜华 ,张怀锋 . 聊城大学学报（自然科学版） . 2016,第001期
4. 基于Hadoop的海量小文件存储优化方法 [J] . 刘君 . 厦门理工学院学报 . 2017,第003期
5. 基于Hadoop的海量气象雷达小文件存储研究 [J] . 杨芙容 ,王永丽 ,王文明 . 成都信息工程学院学报 . 2015,第003期
6. 基于数据库的海量小文件的实时存储优化方案 [C] . XIE Jun ,谢骏 ,SONG Bao-Quan . 2014全国高性能计算学术年会 . 2014
7. Hadoop平台下基于HDFS的小文件存储问题的优化与实现 [A] . 罗青 . 2019

基于Hadoop的小文件存储优化方案

摘要

著录项

相似文献

相关主题

期刊订阅