【24h】

A Noisy 10GB Provenance Database

机译:嘈杂的10GB来源数据库

获取原文

摘要

Provenance of scientific data is a key piece of the metadata record for the data's ongoing discovery and reuse. Provenance collection systems capture provenance on the fly, however, the protocol between application and provenance tool may not be reliable. Consequently, the provenance record can be partial, partitioned, and simply inaccurate. We use a workflow emulator that models faults to construct a large 10GB database of provenance that we know is noisy (that is, has errors). We discuss the process of generating the provenance database, and show early results on the kinds of provenance analysis enabled by the large provenance.
机译:科学数据的来源是元数据记录中用于数据的持续发现和重用的关键部分。种源收集系统可以实时捕获种源,但是,应用程序和种源工具之间的协议可能并不可靠。因此,出处记录可能是不完整的,不完整的,不完整的。我们使用对故障进行建模的工作流仿真器来构造一个大型的10GB起源数据库,我们知道该数据库是嘈杂的(即有错误)。我们讨论了出处数据库的生成过程,并展示了由大量出处所支持的各种出处分析的早期结果。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号