【24h】

Inferactive data analysis

机译:互动数据分析

获取原文
获取原文并翻译 | 示例
       

摘要

We describe inferactive data analysis, so-named to denote an interactive approach to data analysis with an emphasis on inference after data analysis. Our approach is a compromise between Tukey's exploratory and confirmatory data analysis allowing also for Bayesian data analysis. We see this as a useful step in concrete providing tools (with statistical guarantees) for current data scientists. The basis of inference we use is (a conditional approach to) selective inference, in particular its randomized form. The relevant reference distributions are constructed from what we call a DAG-DAG-a Data Analysis Generative DAG, and a selective change of variables formula is crucial to any practical implementation of inferactive data analysis via sampling these distributions. We discuss a canonical example of an incomplete cross-validation test statistic to discriminate between black box models, and a real HIV dataset example to illustrate inference after making multiple queries on data.
机译:我们描述了推论性数据分析,即所谓的“推论”是指一种交互式的数据分析方法,重点是数据分析后的推理。我们的方法是Tukey探索性数据和确认性数据分析之间的折衷,也允许贝叶斯数据分析。我们认为这是为当前数据科学家提供具体工具(具有统计保证)的有用步骤。我们使用的推理基础是(有条件的方法)选择性推理,特别是其随机形式。相关的参考分布是根据我们所谓的DAG-DAG-a数据分析生成DAG构造的,变量的选择性更改公式对于通过采样这些分布进行推理数据分析的任何实际实现都是至关重要的。我们讨论了一个不完整的交叉验证测试统计量的典型示例,以区分黑盒模型,并讨论了一个真实的HIV数据集示例,以说明对数据进行多次查询后的推论。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号