您现在的位置: 首页> 研究主题> 并行文件系统

并行文件系统

并行文件系统的相关文献在1994年到2022年内共计174篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、大气科学(气象学) 等领域,其中期刊论文120篇、会议论文19篇、专利文献3761669篇;相关期刊58种,包括吉林大学学报(理学版)、物探装备、计算机工程等; 相关会议17种,包括中国计算机用户协会并行处理分会2013-2014年度石油行业计算机新技术交流会、第18届全国信息存储技术学术会议、2011年全国高性能计算学术年会(HPC china2011)等;并行文件系统的相关文献由341位作者贡献,包括舒继武、易乐天、魏文国等。

并行文件系统—发文量

期刊论文>

论文:120 占比:0.00%

会议论文>

论文:19 占比:0.00%

专利文献>

论文:3761669 占比:100.00%

总计:3761808篇

并行文件系统—发文趋势图

并行文件系统

-研究学者

  • 舒继武
  • 易乐天
  • 魏文国
  • 卢凯
  • 薛巍
  • 伍卫国
  • 李群
  • 董勇
  • 金士尧
  • 卢宇彤
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

作者

    • 邓通亮; 陈宸; 殷树
    • 摘要: 用户态文件系统框架(filesystem in user space,FUSE)因其相对简单快捷的开发特性被广泛应用于新型文件系统的开发过程中。但是FUSE框架在处理应用的I/O请求时存在多次用户态和内核态切换、上下文切换以及额外的内存拷贝操作,造成一定的性能开销。为减小FUSE对I/O性能的影响,提出一种绕过FUSE的方案。该方案利用动态链接技术,通过将I/O请求的接收和转发功能实现在用户空间的方式消除FUSE框架的接入。该方案针对并行日志文件系统进行了应用实现和测试,结果表明,该方案对于大块读操作的性能提升最大可达131%,对小块写操作的性能最大提升5倍左右。
    • 宋振龙; 李小芳; 李琼; 谢徐超; 魏登萍; 董勇; 王睿伯
    • 摘要: 大数据和人工智能时代,超级计算中心或数据中心的存储需求从PB级向Exabyte级扩展,许多大数据和智能应用程序在高性能计算(HPC)系统上运行,新兴的深度学习应用程序具有批量小文件随机输入特点,使HPC系统的I/O模式更趋复杂,存储管理和I/O瓶颈问题日益突出.并行文件系统是管理超级计算机数据存储的有效手段,但传统并行文件系统主要面向高带宽需求的科学计算任务,难以满足智能应用程序存储需求.针对上述问题,以新兴的BeeGFS文件系统为基础,研究并行文件系统性能优化的关键技术.设计实现了基于键值存储的元数据管理模块以优化元数据IOPS,基于异步I/O和多线程技术的并行I/O处理模型以提升I/O处理并发度,并采用多轨通信机制以提高网络通信带宽.构建了IO500性能评测环境,在相同的配置环境下,I/O带宽和元数据2类基准测试结果表明,改进后的并行文件系统在元数据、数据读写性能上大幅提升,IO500测分是原有系统的2倍以上.
    • 吴嘉澍; 王红博; 代浩; 须成忠; 王洋
    • 摘要: 近年来,随着大数据、云计算技术的发展,应用系统越来越集中,规模亦越来越大,使得存储系统的性能问题越来越突出.为应对其性能要求,并行文件系统得到了大量的应用.然而现有的并行文件系统优化方法,大多只考虑应用系统或并行文件系统本身,较少考虑两者之间的协同.该文基于应用系统在并行文件系统上的访问模式对存储系统的性能有显著影响这一特点,提出基于动态分区的并行文件系统优化方法.首先,利用机器学习技术来分析挖掘各个性能影响因素和性能指标之间的关系和规律,生成优化模型.其次,以优化模型为基础,辅助并行文件系统的参数调优工作.最后,基于Ceph存储系统进行原型实现,并设计了三层架构应用系统进行了性能测试,最终达到优化并行文件系统访问性能的目的.实验结果表明,所提出方法可以达到85% 的预测优化准确率;在所提出模型的辅助优化下,并行文件系统的吞吐量性能得到约3.6倍的提升.
    • 李传冰; 李弘; 兰婷; 郑江山; 秦宏
    • 摘要: 在核聚变研究领域中,高性能集群的应用十分广泛.一方面需要借助集群进行高性能计算模拟托克马克中粒子的运动状态,另一方面需要存储大量十分珍贵的放电数据以作后续的数据分析.随着位于中国科学技术大学的大型反场箍缩磁约束聚变实验装置"Keda Torus eXperiment"(KTX)的建设取得重要进展,KTX实验室对于高性能计算以及实验数据存储具有高度的需求.因此,部署了一个高性能集群并对存储做出了安全设计.根据IOzone的测试,GPFS文件系统的冗余性机制发挥了作用,数据的读写性能很稳定.
    • 张新诺; 王彬
    • 摘要: GPFS (general parallel file system) is a mature parallel file system with the characteristics of high stability and expansibility, fast data reading and writing and many more,which is widely used in the server cluster of AIX and Linux operating system.Although the GPFS has high stability,it is a software which is run in the operating system and storage media,and when the operating system or storage media fails,it is not used properly.Dealing with the failures of GPFS,we need to configure and create related content of the file system with the relevant commands and different parameters.The main purpose in this paper is to explain the function and usage of the parame-ters in the GPFS,to make the maintenance staff understand and use the GPFS better.At the same time,we also discuss how to use GPFS command to solve the problem,how to effectively protect data security and data integrity,and how to restore the normal operation of file system,when the file system is in the Linux platform.%GPFS是一款成熟的并行文件系统,该系统具有稳定性好、扩展性高、数据读写速度快等特点,广泛应用于AIX和Linux操作系统的服务器集群中.虽然GPFS文件系统稳定性高,但GPFS文件系统是依托在操作系统和存储介质中的软件,当操作系统或存储介质发生故障时,也会造成GPFS文件系统无法正常使用.在处理GPFS文件系统故障时,需要使用相关命令并配合不同的参数对文件系统的相关内容进行配置和创建.文中的主要目的是为了说明GPFS文件系统相关命令及命令中各项参数的作用和使用方式,能够使维护人员更好地了解和维护GPFS文件系统.同时,也对文件系统在Linux平台中出现问题时如何有效使用GPFS命令解决故障,如何有效保护数据安全和数据完整性,及如何恢复文件系统的正常运行等方面进行探讨.
    • 易建亮; 陈志广; 肖侬; 卢宇彤
    • 摘要: In high-performance computing environment,parallel file system faces a mega client.These clients often issue a large number of concurrent IO request to the system in the same period of time,making the metadata server under a huge pressure.On the other hand,concurrent read and write requests from these clients often relate to the same directory.It makes it difficult to schedule work load across multiple servers.Therefore,we add a proxy server between the client and the metadata server and propose corresponding optimization methods to reduce the work load of the metadata server.In this paper,we realize two aspects of optimization based on proxy server.First of all,since the high-performance computing program often access files concurrently,we consider merging the numerous requests into a big one and then sent it to metadata server.Secondly,concurrent IO from the high-performance computing program often points to the same directory.Traditional metadata load balancing mechanism commonly use sub-tree partitioning method to dispatch work load across multiple server.This method is unable to realize load balancing in the situation where all operations relate to the same directory.The paper realizes fine-grained load balancing by scheduling the operations from the same directory to the plurality of metadata servers.%在高性能计算环境中,并行文件系统面临百万量级的客户端,这些客户端往往在同一时间段内发出大量并发I/O请求,使元数据服务器承载巨大的压力.另一方面,这些客户端发出的并发读写请求往往指向同一目录,导致很难将元数据负载调度到多个服务器上.为此,提出在并行文件系统的客户端和元数据服务器之间增加一级代理(proxy),并给出相应的优化措施降低元数据服务器的负载.在元数据代理上实现2方面的优化:1)由于高性能计算程序往往并发访问大量的文件,可以考虑通过元数据聚合将大量请求合并成1个请求发送到元数据服务器上,降低元数据服务器的负载;2)高性能计算程序的并发I/O往往指向同一目录,而传统的元数据负载均衡机制一般采用子树划分的方法将元数据负载调度到多个元数据服务器上,无法实现针对同一目录元数据操作的负载均衡,通过代理将针对同一目录的元数据操作调度到多个元数据服务器上,实现细粒度的负载均衡.
    • 谭文贵; 唐福林; 王琨
    • 摘要: 首先分析了当前海量高并发小文件数据处理的缺陷,文章阐述了通过在节点中设置临时虚拟空间的方式、改变文件系统锁机制、将多个节点中的多个并发操作合并为一次磁盘回写操作处理方法.提高了海量高并发小文件数据的并行处理效率,降低了海量高并发小文件数据磁盘的读写压力,减轻了底层存储的磁盘读写压力,有效延长了底层存储的使用寿命.该方法进行的海量高并发小文件处理相关研究工作,对于后期提升海量并发小文件的处理能力和效率提供了参考依据.
    • 李宏益; 唐娉; 单小军; 张正; 冯峥
    • 摘要: The remote sensing data has many characteristics such as unstructured,formatted,huge amount of a single image and less amount of data records,the amount of most remote sensing data isn't significantly reduced after processing,and large-scale remote sensing data processing is needed.Based on the existing hardware resources,this paper designed and implemen-ted an integrated parallel system for multi-source quantitative remote sensing production in centralized cluster.In order to solve the problem of the parallel about the serial algorithm designed and developed by the remote sensing scientists and the require-ment of large scale data management,the system designed a parallel processing system based on task parallelism and an appli-cation-aware's parallel file system.The system integrated more than 30 kinds of preprocessing algorithms for multiple raw data and 50 kinds of production algorithms for multi-source quantitative remote sensing products developed by remote sensing science workers,to realize the process of workflow production,and solved the problem of large-scale production of the multi-source remote sensing quantitative products on demand.And the production process was carried out.It is confirmed that the platform has the reliability and validity in the management and processing of large scale remote sensing data.%针对遥感数据非结构化、有格式、单景数据量大、记录总量小、大部分处理过程后数据量不显著减少的特点和大规模遥感数据处理的迫切需求,基于已有硬件资源,设计和实现了集中式集群计算的多源定量遥感产品生产系统。系统为解决遥感科学工作者设计开发的算法进行并行计算的问题以及大规模数据管理的需求,设计了基于任务并行的处理系统和面向应用的并行文件系统。系统集成了遥感科学工作者开发的30多种原始数据的预处理算法和50多种多源定量遥感产品生产算法,解决了多源定量遥感产品规模化流程化按需生产的难题,并进行了产品生产,证明了系统在管理和处理大规模遥感数据时的可靠性和有效性。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号