首页> 外文OA文献 >GENERIC AND ADAPTIVE METADATA MANAGEMENT FRAMEWORK FOR SCIENTIFIC DATA REPOSITORIES
【2h】

GENERIC AND ADAPTIVE METADATA MANAGEMENT FRAMEWORK FOR SCIENTIFIC DATA REPOSITORIES

机译:用于科学数据存储库的通用和自适应元数据管理框架

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Der rapide technologische Fortschritt hat in verschiedenen Forschungsdisziplinen zu vielfältigen Weiterentwicklungen in Datenakquise und -verarbeitung geführt. Hi- eraus wiederum resultiert ein immenses Wachstum an Daten und Metadaten, gener- iert durch wissenschaftliche Experimente. Unabhängig vom konkreten Forschungs- gebiet ist die wissenschaftliche Praxis immer stärker durch Daten und Metadaten gekennzeichnet. In der Folge intensivieren Universitäten, Forschungsgemeinschaften und Förderagenturen ihre Bemühungen, wissenschaftliche Daten effizient zu sichten, zu speichern und auszuwerten. Die wesentlichen Ziele wissenschaftlicher Daten- Repositorien sind die Etablierung von Langzeitspeicher, der Zugriff auf Daten, die Bereitstellung von Daten für die Wiederverwendung und deren Referenzierung, die Erfassung der Datenquelle zur Reproduzierbarkeit sowie die Bereitstellung von Meta- daten, Anmerkungen oder Verweisen zur Vermittlung domänenspezifischen Wis- sens, das zur Interpretation der Daten notwendig ist. Wissenschaftliche Datenspe- icher sind hochkomplexe Systeme, bestehend aus Elementen aus unterschiedlichen Forschungsfeldern, wie z. B. Algorithmen für Datenkompression und Langzeit- datenarchivierung, Frameworks für das Metadaten- und Annotations-management, Workflow-Provenance und Provenance-Interoperabilität zwischen heterogenen Work- flowsystemen, Autorisierungs und Authentifizierungsinfrastrukturen sowie Visual- isierungswerkzeuge für die Dateninterpretation.udDie vorliegende Arbeit beschreibt eine modulare Architektur für ein wis- senschaftliches Datenarchiv, die Forschungsgemeinschaften darin unterstützt, ihre Daten und Metadaten gezielt über den jeweiligen Lebenszyklus hinweg zu orchestri- eren. Diese Architektur besteht aus Komponenten, die vier Forschungsfelder repräsen- tieren. Die erste Komponente ist ein Client zur Datenübertragung (“data transfer client”). Er bietet eine generische Schnittstelle für die Erfassung von Daten und den Zugriff auf Daten aus wissenschaftlichen Datenakquisesystemen.udDie zweite Komponente ist das MetaStore-Framework, ein adaptives Metadaten- Management-Framework, das die Handhabung sowohl statischer als auch dynamis- cher Metadatenmodelle ermöglicht. Um beliebige Metadatenschemata behandeln zu können, basiert die Entwicklung des MetaStore-Frameworks auf dem komponen- tenbasierten dynamischen Kompositions-Entwurfsmuster (component-based dynamic composition design pattern). Der MetaStore ist außerdem mit einem Annotations- framework für die Handhabung von dynamischen Metadaten ausgestattet.udDie dritte Komponente ist eine Erweiterung des MetaStore-Frameworks zur au- tomatisierten Behandlung von Provenance-Metadaten für BPEL-basierte Workflow- Management-Systeme. Der von uns entworfene und implementierte Prov2ONE Al- gorithmus übersetzt dafür die Struktur und Ausführungstraces von BPEL-Workflow- Definitionen automatisch in das Provenance-Modell ProvONE. Hierbei ermöglicht die Verfügbarkeit der vollständigen BPEL-Provenance-Daten in ProvONE nicht nur eine aggregierte Analyse der Workflow-Definition mit ihrem Ausführungstrace, sondern gewährleistet auch die Kompatibilität von Provenance-Daten aus unterschiedlichen Spezifikationssprachen.udDie vierte Komponente unseres wissenschaftlichen Datenarchives ist das Provenance-Interoperabilitätsframework ProvONE - Provenance Interoperability Framework (P-PIF). Dieses gewährleistet die Interoperabilität von Provenance-Daten heterogener Provenance-Modelle aus unterschiedlichen Workflowmanagementsyste- men. P-PIF besteht aus zwei Komponenten: dem Prov2ONE-Algorithmus für SCUFL und MoML Workflow-Spezifikationen und Workflow-Management-System- spezifischen Adaptern zur Extraktion, Übersetzung und Modellierung retrospektiver Provenance-Daten in das ProvONE-Provenance-Modell. P-PIF kann sowohl Kon- trollfluss als auch Datenfluss nach ProvONE übersetzen. Die Verfügbarkeit hetero- gener Provenance-Traces in ProvONE ermöglicht das Vergleichen, Analysieren und Anfragen von Provenance-Daten aus unterschiedlichen Workflowsystemen.udWir haben die Komponenten des in dieser Arbeit vorgestellten wissenschaftlichen Datenarchives wie folgt evaluiert: für den Client zum Datentrasfer haben wir die Daten-übertragungsleistung mit dem Standard-Protokoll für Nanoskopie-Datensätze untersucht. Das MetaStore-Framework haben wir hinsichtlich der folgenden bei- den Aspekte evaluiert. Zum einen haben wir die Metadatenaufnahme und Voll- textsuchleistung unter verschiedenen Datenbankkonfigurationen getestet. Zum an- deren zeigen wir die umfassende Abdeckung der Funktionalitäten von MetaStore durch einen funktionsbasierten Vergleich von MetaStore mit bestehenden Metadaten- Management-Systemen. Für die Evaluation von P-PIF haben wir zunächst die Korrek- theit und Vollständigkeit unseres Prov2ONE-Algorithmus bewiesen und darüber hin- aus die vom Prov2ONE BPEL-Algorithmus generierten Prognose-Graphpattern aus ProvONE gegen bestehende BPEL-Kontrollflussmuster ausgewertet. Um zu zeigen, dass P-PIF ein nachhaltiges Framework ist, das sich an Standards hält, vergle- ichen wir außerdem die Funktionen von P-PIF mit denen bestehender Provenance- Interoperabilitätsframeworks. Diese Auswertungen zeigen die Überlegenheit und die Vorteile der einzelnen in dieser Arbeit entwickelten Komponenten gegenüber ex- istierenden Systemen.
机译:技术的飞速发展导致各种研究学科在数据采集和处理方面的进一步发展。反过来,这又导致了科学实验产生的数据和元数据的巨大增长。无论具体的研究领域是什么,科学实践都越来越具有数据和元数据的特征。结果,大学,研究团体和资助机构正在加紧努力,以有效地查看,存储和评估科学数据。科学数据存储库的主要目标是建立长期存储,访问数据,提供数据以供重复使用和参考,收集数据源以实现可复制性以及提供元数据,注释或参考资料以转让特定领域的知识-解释数据所必需的感觉。科学数据存储设备是高度复杂的系统,由来自不同研究领域的元素组成,例如B.数据压缩和长期数据归档算法,元数据和注释管理框架,异构工作流系统之间的工作流出处和出处互操作性,授权和身份验证基础结构以及用于数据解释的可视化工具。科学数据档案库的模块化架构,可支持研究社区在各自的生命周期内有针对性地协调其数据和元数据。该体系结构由代表四个研究领域的组件组成。第一个组件是用于数据传输的客户端(“数据传输客户端”)。它提供了一个通用的接口,用于数据的采集和从科学数据采集系统的数据访问Ud第二个组件是MetaStore框架,这是一个自适应元数据管理框架,可以处理静态和动态元数据模型。为了处理任何元数据方案,MetaStore框架的开发基于基于组件的动态组合设计模式。 MetaStore还配备了用于处理动态元数据的注释框架Ud第三个组件是MetaStore框架的扩展,用于为基于BPEL的工作流管理系统自动处理出处元数据。我们设计和实施的Prov2ONE算法会自动将BPEL工作流程定义的结构和执行轨迹转换为ProvONE来源模型。 ProvONE中完整的BPEL来源数据的可用性不仅可以对工作流定义及其执行轨迹进行汇总分析,而且还可以确保来自不同规范语言的来源数据的兼容性 Ud我们的科学数据档案库的第四部分是来源互操作性框架ProvONE-来源互操作性框架(P-PIF)。这样可以确保来自不同工作流程管理系统的异构出处模型的出处数据的互操作性。 P-PIF包含两个组件:用于SCUFL和MoML工作流程规范的Prov2ONE算法,以及用于将回顾性出处数据提取,转换和建模为ProvONE出处模型的工作流管理系统特定的适配器。 P-PIF可以将控制流和数据流都转换为ProvONE。 ProvONE中异种来源痕迹的可用性可进行比较,对来自不同工作流系统的来源数据的分析和要求 UdWe评估了这项工作中呈现的科学数据档案的组成部分,如下所示:对于数据传输的客户,我们使用纳米显微镜数据记录的标准协议检查了数据传输性能。我们已经从以下两个方面评估了MetaStore框架。一方面,我们测试了在不同数据库配置下的元数据记录和全文搜索性能。另一方面,我们通过将基于功能的MetaStore与现有元数据管理系统进行比较,显示了MetaStore功能的全面覆盖。为了评估P-PIF,我们首先证明了Prov2ONE算法的正确性和完整性,还针对现有BPEL控制流模式评估了由Prov2ONE BPEL算法生成的ProvONE预测图模式。为了表明P-PIF是符合标准的可持续框架,我们还将P-PIF的功能与现有来源互操作性框架的功能进行了比较。这些评估表明,与现有系统相比,这项工作中开发的各个组件的优越性和优势。

著录项

  • 作者

    Prabhune Ajinkya;

  • 作者单位
  • 年度 2018
  • 总页数
  • 原文格式 PDF
  • 正文语种 eng
  • 中图分类

相似文献

  • 外文文献
  • 中文文献
  • 专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号