首页> 外文OA文献 >Conservation of Computational Scientific Execution Environments for Workflow-based Experiments Using Ontologies
【2h】

Conservation of Computational Scientific Execution Environments for Workflow-based Experiments Using Ontologies

机译:使用本体论进行基于工作流的实验的计算科学执行环境的保存

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

La reproducibilidad de estudios y resultados científicos es una meta a tener en cuenta por cualquier científico a la hora de publicar el producto de una investigación. El auge de la ciencia computacional, como una forma de llevar a cabo estudios empíricos haciendo uso de modelos matemáticos y simulaciones, ha derivado en una serie de nuevos retos con respecto a la reproducibilidad de dichos experimentos. La adopción de los flujos de trabajo como método para especificar el procedimiento científico de estos experimentos, así como las iniciativas orientadas a la conservación de los datos experimentales desarrolladas en las últimas décadas, han solucionado parcialmente este problema. Sin embargo, para afrontarlo de forma completa, la conservación y reproducibilidad del equipamiento computacional asociado a los flujos de trabajo científicos deben ser tenidas en cuenta. La amplia gama de recursos hardware y software necesarios para ejecutar un flujo de trabajo científico hace que sea necesario aportar una descripción completa detallando que recursos son necesarios y como estos deben de ser configurados. En esta tesis abordamos la reproducibilidad de los entornos de ejecución para flujos de trabajo científicos, mediante su documentación usando un modelo formal que puede ser usado para obtener un entorno equivalente. Para ello, se ha propuesto un conjunto de modelos para representar y relacionar los conceptos relevantes de dichos entornos, así como un conjunto de herramientas que hacen uso de dichos módulos para generar una descripción de la infraestructura, y un algoritmo capaz de generar una nueva especificación de entorno de ejecución a partir de dicha descripción, la cual puede ser usada para recrearlo usando técnicas de virtualización. Estas contribuciones han sido aplicadas a un conjunto representativo de experimentos científicos pertenecientes a diferentes dominios de la ciencia, exponiendo cada uno de ellos diferentes requisitos hardware y software. Los resultados obtenidos muestran la viabilidad de propuesta desarrollada, reproduciendo de forma satisfactoria los experimentos estudiados en diferentes entornos de virtualización. ABSTRACT Reproducibility of scientific studies and results is a goal that every scientist must pursuit when announcing research outcomes. The rise of computational science, as a way of conducting empirical studies by using mathematical models and simulations, have opened a new range of challenges in this context. The adoption of workflows as a way of detailing the scientific procedure of these experiments, along with the experimental data conservation initiatives that have been undertaken during last decades, have partially eased this problem. However, in order to fully address it, the conservation and reproducibility of the computational equipment related to them must be also considered. The wide range of software and hardware resources required to execute a scientific workflow implies that a comprehensive description detailing what those resources are and how they are arranged is necessary. In this thesis we address the issue of reproducibility of execution environments for scientific workflows, by documenting them in a formalized way, which can be later used to obtain and equivalent one. In order to do so, we propose a set of semantic models for representing and relating the relevant information of those environments, as well as a set of tools that uses these models for generating a description of the infrastructure, and an algorithmic process that consumes these descriptions for deriving a new execution environment specification, which can be enacted into a new equivalent one using virtualization solutions. We apply these three contributions to a set of representative scientific experiments, belonging to different scientific domains, and exposing different software and hardware requirements. The obtained results prove the feasibility of the proposed approach, by successfully reproducing the target experiments under different virtualization environments.
机译:科学研究和结果的可重复性是任何科学家在发布调查结果时都要考虑的目标。作为使用数学模型和模拟进行实证研究的一种方法,计算机科学的兴起导致了有关这些实验可重复性的一系列新挑战。采用工作流作为指定这些实验的科学程序的方法,以及旨在保留近几十年来开发的实验数据的计划,已部分解决了这一问题。但是,要完全解决该问题,必须考虑与科学工作流程相关的计算设备的保存和可重复性。执行科学工作流程所需的广泛的硬件和软件资源,因此有必要提供完整的描述,详细说明哪些资源是必需的以及应如何配置它们。在本文中,我们通过使用正式模型来记录科学工作流的执行环境的可重现性,该文件使用可用于获得等效环境的正式模型。为此,已经提出了一组表示和关联这些环境的相关概念的模型,以及利用所述模块生成基础结构描述的一组工具,以及一种能够生成新规范的算法。此描述中的执行环境,可以使用虚拟化技术来重新创建它。这些贡献已应用于一组代表不同科学领域的代表性科学实验,每个实验都展示了不同的硬件和软件要求。获得的结果表明了该建议的可行性,成功地再现了在不同虚拟化环境中研究的实验。摘要科学研究和结果的可重复性是每个科学家宣布研究成果时都必须追求的目标。作为使用数学模型和模拟进行实证研究的一种方式,计算科学的兴起在此背景下提出了一系列新的挑战。采用工作流程作为详细说明这些实验的科学程序的方式,以及最近几十年来进行的实验数据保存计划,已部分缓解了此问题。但是,为了充分解决这一问题,还必须考虑与之相关的计算设备的保存和可再现性。执行科学工作流程所需的广泛的软件和硬件资源意味着必须有详尽的描述,详细说明这些资源是什么以及如何安排它们。在本文中,我们通过以形式化的方式记录科学工作流的执行环境的可再现性问题,以后可以将其用于获得等效的工作流。为此,我们提出了一组语义模型,用于表示和关联那些环境的相关信息,以及一组使用这些模型生成基础结构描述的工具,以及使用这些语义模型的算法过程描述以获取新的执行环境规范,可以使用虚拟化解决方案将其制定为新的等效环境规范。我们将这三个贡献应用于一组代表性科学实验,这些实验属于不同的科学领域,并且暴露出不同的软件和硬件要求。通过成功地在不同虚拟化环境下重现目标实验,所获得的结果证明了该方法的可行性。

著录项

  • 作者

    Santana Pérez Idafen;

  • 作者单位
  • 年度 2016
  • 总页数
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号