首页> 外文OA文献 >Provenance network analytics: an approach to data analytics using data provenance
【2h】

Provenance network analytics: an approach to data analytics using data provenance

机译:来源网络分析:使用数据来源进行数据分析的方法

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Provenance network analytics is a novel data analytics approach that helps infer properties of data, such as quality or importance, from their provenance. Instead of analysing application data, which are typically domain-dependent, it analyses the data's provenance as represented using the World Wide Web Consortium's domain-agnostic PROV data model. Specifically, the approach proposes a number of network metrics for provenance data and applies established machine learning techniques over such metrics to build predictive models for some key properties of data. Applying this method to the provenance of real-world data from three different applications, we show that it can successfully identify the owners of provenance documents, assess the quality of crowdsourced data, and identify instructions from chat messages in an alternate-reality game with high levels of accuracy. By so doing, we demonstrate the different ways the proposed provenance network metrics can be used in analysing data, providing the foundation for provenance-based data analytics.
机译:来源网络分析是一种新颖的数据分析方法,可帮助根据其来源推断数据的属性,例如质量或重要性。它不分析通常依赖于域的应用程序数据,而是分析使用World Wide Web联盟的与域无关的PROV数据模型表示的数据来源。具体而言,该方法为源数据提出了许多网络指标,并在这些指标上应用了已建立的机器学习技术,以建立数据某些关键属性的预测模型。将这种方法应用于来自三个不同应用程序的真实数据的来源,我们表明它可以成功地识别来源文档的所有者,评估众包数据的质量,并在具有较高替代性的现实游戏中从聊天消息中识别指令准确性水平。通过这样做,我们演示了所提出的出处网络指标可以用于分析数据的不同方式,为基于出处的数据分析奠定了基础。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号