首页> 外文会议>Discovery science >Multiple Hypothesis Testing in Pattern Discovery
【24h】

Multiple Hypothesis Testing in Pattern Discovery

机译:模式发现中的多重假设检验

获取原文
获取原文并翻译 | 示例

摘要

The problem of multiple hypothesis testing arises when there are more than one hypothesis to be tested simultaneously for statistical significance. This is a very common situation in many data mining applications. For instance, assessing simultaneously the significance of all frequent itemsets of a single dataset entails a host of hypothesis, one for each itemset. A multiple hypothesis testing method is needed to control the number of false positives (Type I error). Our contribution in this paper is to extend the multiple hypothesis framework to be used in a generic data mining setting. We provide a method that provably controls the family-wise error rate (FWER, the probability of at least one false positive). We show the power of our solution on real data.
机译:当有多个假设同时要进行统计显着性检验时,就会出现多重假设检验的问题。在许多数据挖掘应用程序中,这是非常普遍的情况。例如,同时评估单个数据集的所有频繁项集的重要性需要进行一系列假设,每个假设项对应一个假设。需要使用多种假设检验方法来控制假阳性(I型错误)的数量。我们在本文中的贡献是扩展了在通用数据挖掘环境中使用的多重假设框架。我们提供了一种可证明可控制家庭错误率(FWER,至少一个假阳性的概率)的方法。我们展示了我们的解决方案对真实数据的强大功能。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号