并行文件系统
并行文件系统的相关文献在1994年到2022年内共计174篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、大气科学(气象学)
等领域,其中期刊论文120篇、会议论文19篇、专利文献3761669篇;相关期刊58种,包括吉林大学学报(理学版)、物探装备、计算机工程等;
相关会议17种,包括中国计算机用户协会并行处理分会2013-2014年度石油行业计算机新技术交流会、第18届全国信息存储技术学术会议、2011年全国高性能计算学术年会(HPC china2011)等;并行文件系统的相关文献由341位作者贡献,包括舒继武、易乐天、魏文国等。
并行文件系统—发文量
专利文献>
论文:3761669篇
占比:100.00%
总计:3761808篇
并行文件系统
-研究学者
- 舒继武
- 易乐天
- 魏文国
- 卢凯
- 薛巍
- 伍卫国
- 李群
- 董勇
- 金士尧
- 卢宇彤
- 周恩强
- 张伟
- 谢立
- 钱德沛
- 霍严梅
- 万群
- 卢锡城
- 唐维
- 庄锡进
- 张虎
- 方敏
- 曹晓初
- 曾碧卿
- 李国庆
- 王启迪
- 王宗仁
- 王磊
- 程斌
- 罗秋明
- 耿亮
- 肖侬
- 胡亮
- 董守斌
- 谈华芳
- 谢赞福
- 赵铁柱
- 金弟
- 鞠九滨
- 付喜春
- 何曼
- 全茜
- 关宇
- 刘新春
- 刘洋
- 吴振伟
- 吴炜
- 周晓阳
- 周游
- 周艳红
- 孙丽丽
-
-
邓通亮;
陈宸;
殷树
-
-
摘要:
用户态文件系统框架(filesystem in user space,FUSE)因其相对简单快捷的开发特性被广泛应用于新型文件系统的开发过程中。但是FUSE框架在处理应用的I/O请求时存在多次用户态和内核态切换、上下文切换以及额外的内存拷贝操作,造成一定的性能开销。为减小FUSE对I/O性能的影响,提出一种绕过FUSE的方案。该方案利用动态链接技术,通过将I/O请求的接收和转发功能实现在用户空间的方式消除FUSE框架的接入。该方案针对并行日志文件系统进行了应用实现和测试,结果表明,该方案对于大块读操作的性能提升最大可达131%,对小块写操作的性能最大提升5倍左右。
-
-
宋振龙;
李小芳;
李琼;
谢徐超;
魏登萍;
董勇;
王睿伯
-
-
摘要:
大数据和人工智能时代,超级计算中心或数据中心的存储需求从PB级向Exabyte级扩展,许多大数据和智能应用程序在高性能计算(HPC)系统上运行,新兴的深度学习应用程序具有批量小文件随机输入特点,使HPC系统的I/O模式更趋复杂,存储管理和I/O瓶颈问题日益突出.并行文件系统是管理超级计算机数据存储的有效手段,但传统并行文件系统主要面向高带宽需求的科学计算任务,难以满足智能应用程序存储需求.针对上述问题,以新兴的BeeGFS文件系统为基础,研究并行文件系统性能优化的关键技术.设计实现了基于键值存储的元数据管理模块以优化元数据IOPS,基于异步I/O和多线程技术的并行I/O处理模型以提升I/O处理并发度,并采用多轨通信机制以提高网络通信带宽.构建了IO500性能评测环境,在相同的配置环境下,I/O带宽和元数据2类基准测试结果表明,改进后的并行文件系统在元数据、数据读写性能上大幅提升,IO500测分是原有系统的2倍以上.
-
-
吴嘉澍;
王红博;
代浩;
须成忠;
王洋
-
-
摘要:
近年来,随着大数据、云计算技术的发展,应用系统越来越集中,规模亦越来越大,使得存储系统的性能问题越来越突出.为应对其性能要求,并行文件系统得到了大量的应用.然而现有的并行文件系统优化方法,大多只考虑应用系统或并行文件系统本身,较少考虑两者之间的协同.该文基于应用系统在并行文件系统上的访问模式对存储系统的性能有显著影响这一特点,提出基于动态分区的并行文件系统优化方法.首先,利用机器学习技术来分析挖掘各个性能影响因素和性能指标之间的关系和规律,生成优化模型.其次,以优化模型为基础,辅助并行文件系统的参数调优工作.最后,基于Ceph存储系统进行原型实现,并设计了三层架构应用系统进行了性能测试,最终达到优化并行文件系统访问性能的目的.实验结果表明,所提出方法可以达到85% 的预测优化准确率;在所提出模型的辅助优化下,并行文件系统的吞吐量性能得到约3.6倍的提升.
-
-
李传冰;
李弘;
兰婷;
郑江山;
秦宏
-
-
摘要:
在核聚变研究领域中,高性能集群的应用十分广泛.一方面需要借助集群进行高性能计算模拟托克马克中粒子的运动状态,另一方面需要存储大量十分珍贵的放电数据以作后续的数据分析.随着位于中国科学技术大学的大型反场箍缩磁约束聚变实验装置"Keda Torus eXperiment"(KTX)的建设取得重要进展,KTX实验室对于高性能计算以及实验数据存储具有高度的需求.因此,部署了一个高性能集群并对存储做出了安全设计.根据IOzone的测试,GPFS文件系统的冗余性机制发挥了作用,数据的读写性能很稳定.
-
-
-
-
张新诺;
王彬
-
-
摘要:
GPFS (general parallel file system) is a mature parallel file system with the characteristics of high stability and expansibility, fast data reading and writing and many more,which is widely used in the server cluster of AIX and Linux operating system.Although the GPFS has high stability,it is a software which is run in the operating system and storage media,and when the operating system or storage media fails,it is not used properly.Dealing with the failures of GPFS,we need to configure and create related content of the file system with the relevant commands and different parameters.The main purpose in this paper is to explain the function and usage of the parame-ters in the GPFS,to make the maintenance staff understand and use the GPFS better.At the same time,we also discuss how to use GPFS command to solve the problem,how to effectively protect data security and data integrity,and how to restore the normal operation of file system,when the file system is in the Linux platform.%GPFS是一款成熟的并行文件系统,该系统具有稳定性好、扩展性高、数据读写速度快等特点,广泛应用于AIX和Linux操作系统的服务器集群中.虽然GPFS文件系统稳定性高,但GPFS文件系统是依托在操作系统和存储介质中的软件,当操作系统或存储介质发生故障时,也会造成GPFS文件系统无法正常使用.在处理GPFS文件系统故障时,需要使用相关命令并配合不同的参数对文件系统的相关内容进行配置和创建.文中的主要目的是为了说明GPFS文件系统相关命令及命令中各项参数的作用和使用方式,能够使维护人员更好地了解和维护GPFS文件系统.同时,也对文件系统在Linux平台中出现问题时如何有效使用GPFS命令解决故障,如何有效保护数据安全和数据完整性,及如何恢复文件系统的正常运行等方面进行探讨.
-
-
易建亮;
陈志广;
肖侬;
卢宇彤
-
-
摘要:
In high-performance computing environment,parallel file system faces a mega client.These clients often issue a large number of concurrent IO request to the system in the same period of time,making the metadata server under a huge pressure.On the other hand,concurrent read and write requests from these clients often relate to the same directory.It makes it difficult to schedule work load across multiple servers.Therefore,we add a proxy server between the client and the metadata server and propose corresponding optimization methods to reduce the work load of the metadata server.In this paper,we realize two aspects of optimization based on proxy server.First of all,since the high-performance computing program often access files concurrently,we consider merging the numerous requests into a big one and then sent it to metadata server.Secondly,concurrent IO from the high-performance computing program often points to the same directory.Traditional metadata load balancing mechanism commonly use sub-tree partitioning method to dispatch work load across multiple server.This method is unable to realize load balancing in the situation where all operations relate to the same directory.The paper realizes fine-grained load balancing by scheduling the operations from the same directory to the plurality of metadata servers.%在高性能计算环境中,并行文件系统面临百万量级的客户端,这些客户端往往在同一时间段内发出大量并发I/O请求,使元数据服务器承载巨大的压力.另一方面,这些客户端发出的并发读写请求往往指向同一目录,导致很难将元数据负载调度到多个服务器上.为此,提出在并行文件系统的客户端和元数据服务器之间增加一级代理(proxy),并给出相应的优化措施降低元数据服务器的负载.在元数据代理上实现2方面的优化:1)由于高性能计算程序往往并发访问大量的文件,可以考虑通过元数据聚合将大量请求合并成1个请求发送到元数据服务器上,降低元数据服务器的负载;2)高性能计算程序的并发I/O往往指向同一目录,而传统的元数据负载均衡机制一般采用子树划分的方法将元数据负载调度到多个元数据服务器上,无法实现针对同一目录元数据操作的负载均衡,通过代理将针对同一目录的元数据操作调度到多个元数据服务器上,实现细粒度的负载均衡.
-
-
谭文贵;
唐福林;
王琨
-
-
摘要:
首先分析了当前海量高并发小文件数据处理的缺陷,文章阐述了通过在节点中设置临时虚拟空间的方式、改变文件系统锁机制、将多个节点中的多个并发操作合并为一次磁盘回写操作处理方法.提高了海量高并发小文件数据的并行处理效率,降低了海量高并发小文件数据磁盘的读写压力,减轻了底层存储的磁盘读写压力,有效延长了底层存储的使用寿命.该方法进行的海量高并发小文件处理相关研究工作,对于后期提升海量并发小文件的处理能力和效率提供了参考依据.
-
-
李宏益;
唐娉;
单小军;
张正;
冯峥
-
-
摘要:
The remote sensing data has many characteristics such as unstructured,formatted,huge amount of a single image and less amount of data records,the amount of most remote sensing data isn't significantly reduced after processing,and large-scale remote sensing data processing is needed.Based on the existing hardware resources,this paper designed and implemen-ted an integrated parallel system for multi-source quantitative remote sensing production in centralized cluster.In order to solve the problem of the parallel about the serial algorithm designed and developed by the remote sensing scientists and the require-ment of large scale data management,the system designed a parallel processing system based on task parallelism and an appli-cation-aware's parallel file system.The system integrated more than 30 kinds of preprocessing algorithms for multiple raw data and 50 kinds of production algorithms for multi-source quantitative remote sensing products developed by remote sensing science workers,to realize the process of workflow production,and solved the problem of large-scale production of the multi-source remote sensing quantitative products on demand.And the production process was carried out.It is confirmed that the platform has the reliability and validity in the management and processing of large scale remote sensing data.%针对遥感数据非结构化、有格式、单景数据量大、记录总量小、大部分处理过程后数据量不显著减少的特点和大规模遥感数据处理的迫切需求,基于已有硬件资源,设计和实现了集中式集群计算的多源定量遥感产品生产系统。系统为解决遥感科学工作者设计开发的算法进行并行计算的问题以及大规模数据管理的需求,设计了基于任务并行的处理系统和面向应用的并行文件系统。系统集成了遥感科学工作者开发的30多种原始数据的预处理算法和50多种多源定量遥感产品生产算法,解决了多源定量遥感产品规模化流程化按需生产的难题,并进行了产品生产,证明了系统在管理和处理大规模遥感数据时的可靠性和有效性。
-
-
-
宋雪峰;
董玉敏;
塔依尔.伊布拉音;
关宇
- 《第四届全国石油石化行业信息化创新发展论坛》
| 2018年
-
摘要:
地震勘探采集技术的进步促使外业采集数据急剧增大,对资料处理系统而言大容量、高带宽、低延迟的存储性能要求随之提高.依据地震资料处理系统特点并结合snfs并行文件系统技术特点,调优高性能处理集群系统,构建了一套基于IB-SAN的snfs并行文件系统,集群聚合读、写IOPS达到40Gb/s,保障了地震资料处理高性能集群高效运行,满足了地震勘探大数据处理需求.
-
-
-
陈兵;
贺跃军;
张武斌
- 《中国计算机用户协会并行处理分会2013-2014年度石油行业计算机新技术交流会》
| 2014年
-
摘要:
本文通过利用开源软件,使用廉价的直联存储实现了存储文件系统的并行化,既节约了设备成本,又提高了I/O的存储性能,为大规模资料处理中心的存储使用提供了一种新的使用方法.通过对Gluster并行文件系统的研究与优化以及实际应用,基本上达到了目前国内同行业存储应有的性能,希望能够给大家在存储方面的应用提供一些借鉴.集群存储一般分为直联存储( DAS)、网络存储(NAS)和存储区域网络(SAN)存储3类。GlusterFS是Scale-Out存储解决方案Gluster的核心,它是一个开源的分布式文件系统,具有强大的横向扩展能力,通过扩展能够支持数PB存储容量和处理数千客户端。GlusterFS借助TCP/IP或InfiniBand RDMA网络将物理分布的存储资源聚集在一起,使用单一全局命名空间来管理数据。GlusterFS基于可堆叠的用户空间设计,可为各种不同的数据负载提供优异的性能。GlusterFS文件系统也是一种C/S(客户端/服务器)结构。因此,其安装同样需要分服务器和客户端两方面。目前,GeoEast应用主要是Infortrend直联存储(使用NFS方式)和云存存储(NAS+并行),所以主要把GlusterFS(主要也是使用Infortrend直联盘作存储池)与上述两种存储性能进行比较。GlusterFS并行文件系统底层还是依赖于目前的直联存储系统。因此,提高直联存储的性能,也就可以相对提高GlusterFS的性能,基于该特点,GlusterFS并行文件系统调优策略可以从底层文件系统、操作系统内核、机头组合、配置文件的优化4点考虑。通过对GlusterFS并行文件系统的研究,利用廉价的直联存储实现了存储的并行化,并在实际生产中得以应用与实践。一方面提高了直联存储的性能,基本上达到国内同行业存储的性能,探索出了直联存储并行化的应用模式;另一方面也可以节省大量的购买品牌并行存储的设备成本。当然,对于GulsterFS并行文件系统的研究还有待于进一步深入探讨,比如,安全性的问题和使用过程可能出现的各种问题等,都需要我们在今后的应用过程不断完善和改进,使得GlusterFS并行文件系统能够广泛地应用于资料处理过程。
-
-
-
-
-
-