您现在的位置: 首页> 研究主题> 分布式文件系统

分布式文件系统

分布式文件系统的相关文献在1995年到2023年内共计1489篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、测绘学 等领域,其中期刊论文431篇、会议论文53篇、专利文献5988181篇;相关期刊216种,包括电脑编程技巧与维护、电脑知识与技术、计算机工程等; 相关会议45种,包括2015全国高性能计算学术年会、全国抗恶劣环境计算机第二十五届学术年会 、2015年全国工业控制计算机技术年会等;分布式文件系统的相关文献由2413位作者贡献,包括苗艳超、王勇、邵宗有等。

分布式文件系统—发文量

期刊论文>

论文:431 占比:0.01%

会议论文>

论文:53 占比:0.00%

专利文献>

论文:5988181 占比:99.99%

总计:5988665篇

分布式文件系统—发文趋势图

分布式文件系统

-研究学者

  • 苗艳超
  • 王勇
  • 邵宗有
  • 杨浩
  • 张勤
  • 马振杰
  • 刘新春
  • 王帅阳
  • 马照云
  • 季旻
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

作者

    • 张云; 李岚
    • 摘要: 移动云计算技术具有易扩展、高存储、高计算能力等特点,可将其有效地应用于教学资源平台中。笔者根据教学资源平台建设的背景,结合移动云计算和教学资源平台的特点,对构成移动云计算教学资源平台的移动云计算平台层、教学资源服务层和移动应用层进行深入分析。
    • 俞春娜; 郑杰; 王哲奇
    • 摘要: 浙江省历史存档的不同遥感平台、传感器、时相以及分辨率的海量影像数据,缺乏一种高效的存储管理方法。为了满足用户的高并发、多样性的数据共享服务需求,对历史存档数据进行标准化处理,设计并实现了分布式架构的海量多源遥感数据管理系统,该系统能够进行高效的定制化式的数据检索、共享以及分发等功能,满足了实际应用需求。
    • 刘丹; 李志军; 高荣鑫
    • 摘要: 为解决医疗数据的高效存储与处理分析等问题,设计并开发了医疗大数据平台。首先,搭建并部署了Hadoop分布式文件系统,设计基于Tomcat服务器搭建的网站平台。然后,通过编写Hadoop WEB API将WEB服务器与分布式文件系统相结合,设计数据处理效率高的Python脚本程序读取并统计分析医疗数据。平台运行测试结果表明,该医疗大数据平台实现了数据存储、共享、可视化展示等预期功能。
    • 雷鸣; 陈凯华; 武国良; 李庆博; 李宝桐; 姜罕盛
    • 摘要: 随着气象数据的不断增长及气象服务现代化要求的提升,原有省级CIMISS系统已经无法满足业务需求。为了解决系统动态扩展能力不足、实时查询性能低下等问题,分别利用分布式网格存储系统和分布式数据库,以及分布式文件系统和NAS技术,构建基于分布式技术的气象大数据共享服务系统,实现结构化数据和半/非结构化数据的存储、共享和管理,并实现与CIMISS系统无缝对接。实践证明,该方案能极大提升CIMISS系统的数据存储能力,且并发响应能力强。相同条件下,查询性能提升22倍以上,能够有效满足未来气象业务对数据服务的要求。
    • 段海军; 郭勇; 陈福
    • 摘要: 云技术是提高分布式系统灵活性和扩展性的关键技术,在航空电子系统中引入云技术可以降低产品研发周期和成本,但首先需要设计符合机载环境需求的云模型。在分析商用云的服务模型结构基础上,结合行业内的相关标准,给出了一种新型航空电子云模型。建立了层次化的云模型架构,包括物理资源层、本地资源管理层、资源虚拟层、平台管理层和应用功能层;采用虚拟化技术建立资源虚拟模型,隔离软件APP与硬件资源和软件环境;分布式的数据动态发布与订阅,提高应用部署的灵活性;分布式资源管理,实现资源池管理、健康监控和故障管理;分布式存储模型,提供分布式数据和文件共享能力。遵循行业标准,为应用软件提供面向服务的航空电子云计算模型,对工程实践具有一定的指导意义。
    • 王源; 陈智勇
    • 摘要: 大数据时代,传统的数据离线处理手段与工具已经不适应行业与技术的发展要求,本文以大数据为基础,借助于Spark大数据实时流处理引擎与Flask应用框架,使用Python语言编程实现大数据的爬取采集、清洗与存储、建模分析、数据挖掘等功能,探索并发现大数据背后所隐藏的行为模式和内在规律,最后调用可视化库PyEcharts对数据结果进行相应图表的渲染展示。
    • 李云; 张海明
    • 摘要: 随着数据的不断积累,数据存储系统已经由单节点、小规模的文件系统演变成支持海量数据存储的分布式文件系统.分布式文件系统中的大规模数据如何能够面向用户提供简洁、高效和稳定的数据上传下载服务成为了广泛研究的问题.为此,本文提出了基于FTP协议的数据服务端的解决方案,该方案包括利用缓冲区、协程、多线程等技术优化传输模型和传输算法,使得数据流能进行高速传输.同时,配合Keepalived(开源的系统高可用解决方案)与LVS实现了高可用、高并发以及良好的拓展性,在FTP协议之上修改使得服务端支持动态验证、用户隔离并兼容多种编码格式.在实际的运行中,以中国科技云iHarbor存储系统为例,验证了本文提出方案的有效性、可靠性以及高性能的数据传输效果,可以充分满足用户的需求.
    • 陈茂棠; 郑圣安; 游理通; 王晶钰; 闫田; 屠要峰; 韩银俊; 黄林鹏
    • 摘要: 持久性内存技术与远程直接内存访问(remote direct memory access,RDMA)技术的发展,为高效分布式系统的设计提供了新的思路.然而,现有的基于RDMA的分布式系统没有充分利用RDMA的多播能力,难以解决1对多传输场景下的多拷贝文件数据传输问题,严重影响了系统性能.针对此问题,提出一种基于RDMA多播机制的分布式持久性内存文件系统(RDMA multicast transmission based distributed persistent memory file system,MTFS),通过低延迟多播通信机制充分利用RDMA多播能力,将数据高效传输到多个数据节点,从而避免了多拷贝传输操作带来的高延迟.为提升传输操作灵活性,MTFS设计了多模式多播远程过程调用(remote procedure call,RPC)机制,实现了RPC请求自适应识别,并通过优化返回机制将部分传输操作移出关键路径,进一步提升传输效率.同时MTFS提供了轻量级一致性保障机制,通过设计故障恢复功能、数据校验系统、重传策略与窗口机制,当节点出现崩溃时进行快速恢复,并在传输出现错误时实现数据精准检测与纠正,保证了数据的可靠性和一致性.实验证明,MTFS在各测试集上相比现有系统GlusterFS吞吐量提升了10.2~219倍.在Redis数据库的工作负载下,MTFS相比于NOVA取得了最高10.7%的性能提升,并在多线程测试中取得了良好的可扩展性.
    • 陈茂棠; 郑圣安; 游理通; 王晶钰; 闫田; 屠要峰; 韩银俊; 黄林鹏
    • 摘要: 持久性内存技术与远程直接内存访问(remote direct memory access,RDMA)技术的发展,为高效分布式系统的设计提供了新的思路然而,现有的基于RDMA的分布式系统没有充分利用RDMA的多播能力,难以解决1对多传输场景下的多拷贝文件数据传输问题,严重影响了系统性能.针对此问题,提出一种基于RDM A多播机制的分布式持久性内存文件系统(RDM A multicast transmission based distributed persistent memory file system,MTFS),通过低延迟多播通信机制充分利用RDMA多播能力,将数据高效传输到多个数据节点,从而避免了多拷贝传输操作带来的高延迟.为提升传输操作灵活性,MTFS设计了多模式多播远程过程调用(remote procedure call,RPC)机制,实现了RPC请求自适应识别,并通过优化返回机制将部分传输操作移出关键路径,进一步提升传输效率.同时MTFS提供了轻量级一致性保障机制,通过设计故障恢复功能、数据校验系统、重传策略与窗口机制,当节点出现崩溃时进行快速恢复,并在传输出现错误时实现数据精准检测与纠正,保证了数据的可靠性和一致性.实验证明,MTFS在各测试集上相比现有系统GlusterFS吞吐量提升了10 2~219倍在Redis数据库的工作负载下,MTFS相比于NOVA取得了最高10.7%的性能提升,并在多线程测试中取得了良好的可扩展性.
    • 魏征; 窦禹; 高艳珍; 马捷; 孙凝晖; 邢晶
    • 摘要: 分布式存储系统作为数据存储的载体,广泛应用于大数据领域.纠删码存储方式相对副本方式,既具有较高的空间利用效率,又能保证数据存储的可靠性,因此被越来多的应用于存储系统当中.在EB级大规模纠删码分布式存储系统中,元数据管理成本较大,位置信息等元数据查询效率影响了I/O时延和吞吐量.基于位置信息记录的有中心数据放置算法需要频繁访问元数据服务器,导致性能优化受限,基于Hash映射的无中心数据放置算法越来越多地得到应用.但面向纠删码的无中心放置算法,在节点变更和数据恢复过程中,存在位置变更困难、迁移数据量大、数据恢复和迁移并发度低等问题.提出了一种基于条带的一致性Hash数据放置算法(consistent Hash data placement algorithm based on stripe, SCHash),SCHash以条带为单位放置数据,通过把数据块到节点的映射转化为条带到节点组的映射过程,减少节点变动过程中的数据迁移量,从而在恢复过程中降低了变动数据的比例,加速了恢复带宽.并基于SCHash算法设计了一种基于条带的并发I/O调度恢复策略,通过避免选取同一节点的数据块进行I/O操作,提升了I/O并行度,通过调度恢复I/O和迁移I/O的执行顺序,减少了数据恢复的执行时间.相比APHash数据放置算法,SCHash在数据恢复过程中,减少了46.71%~85.28%数据的迁移.在条带内重建时,恢复带宽提升了48.16%,在条带外节点重建时,恢复带宽提升了138.44%.
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号