Distributed management of data is one of the most important problems facing grids. Within the Enabling Grids for Enabling eScience (EGEE) project, currently the world's largest production grid, a sophisticated hierarchy of data management and storage tools have been developed to help Virtual Organisations (VOs) with this task.
rnIn this paper we review the technologies employed for storage and data management in EGEE, and the associated Worldwide LHC Computing Grid (WLCG). We describe from low level networking and site storage technologies, through data transfer and cataloging middleware components. A particular emphasis is placed on deployment of these services in a large scale production environment. We also examine the interface between generic and VO specific data management, taking the example of the ATLAS high energy physics experiment at CERN.
数据的分布式管理是网格面临的最重要问题之一。在目前全球最大的生产网格的“增强科学能力的网格(EGEE)”项目中,开发了复杂的数据管理和存储工具层次结构,以帮助虚拟组织(VO)完成此任务。 P> rn
在本文中,我们回顾了EEEE中用于存储和数据管理的技术以及相关的全球LHC计算网格(WLCG)。我们从低级网络和站点存储技术到数据传输和分类中间件组件进行描述。特别强调在大规模生产环境中部署这些服务。我们还以欧洲核子研究组织(CERN)的ATLAS高能物理实验为例,研究了通用数据和VO特定数据管理之间的接口。 P>
University of Glasgow, Glasgow, UK;
European Organization for Nuclear Research, Geneve, Switzerland;
University of Edinburgh, Edinburgh, UK;
机译:用于学术研究VOS的联邦国家数据存储的双层模型的后端集成了EGEE数据管理
机译:网格中的故障管理:EGEE基础设施的案例
机译:EGEE生产网格基础架构上基于工作流的数据并行应用程序
机译:将GridSpace虚拟实验室与EGEE存储服务集成
机译:数据模型, 查询执行 , 并 存储 为 传统 和 沉浸式 视频 数据管理
机译:医学计算方法。数据基础和管理数据库管理:SLIPS:一种用于计算机存储和语音错误分析的数据库系统
机译:EGEE - 智能,分布式气候数据管理