首页> 美国卫生研究院文献>other >Online Cross-Validation-Based Ensemble Learning
【2h】

Online Cross-Validation-Based Ensemble Learning

机译:在线基于交叉验证的集成学习

代理获取
本网站仅为用户提供外文OA文献查询和代理获取服务,本网站没有原文。下单后我们将采用程序或人工为您竭诚获取高质量的原文,但由于OA文献来源多样且变更频繁,仍可能出现获取不到、文献不完整或与标题不符等情况,如果获取不到我们将提供退款服务。请知悉。

摘要

Online estimators update a current estimate with a new incoming batch of data without having to revisit past data thereby providing streaming estimates that are scalable to big data. We develop flexible, ensemble-based online estimators of an infinite-dimensional target parameter, such as a regression function, in the setting where data are generated sequentially by a common conditional data distribution given summary measures of the past. This setting encompasses a wide range of time-series models and as special case, models for independent and identically distributed data. Our estimator considers a large library of candidate online estimators and uses online cross-validation to identify the algorithm with the best performance. We show that by basing estimates on the cross-validation-selected algorithm, we are asymptotically guaranteed to perform as well as the true, unknown best-performing algorithm. We provide extensions of this approach including online estimation of the optimal ensemble of candidate online estimators. We illustrate excellent performance of our methods using simulations and a real data example where we make streaming predictions of infectious disease incidence using data from a large database.
机译:在线估算器使用新的传入数据批更新当前估算,而不必重新访问过去的数据,从而提供可扩展到大数据的流估算。我们开发了一种灵活的,基于集合的在线无穷大目标参数估计器,例如回归函数,在这种情况下,数据是通过已知的过去条件通过公共条件数据分布顺序生成的。此设置包含各种时间序列模型,在特殊情况下,还包括独立且分布均匀的数据的模型。我们的估算器考虑了大量候选在线估算器库,并使用在线交叉验证来确定性能最佳的算法。我们证明,通过基于交叉验证选择算法的估计,我们可以渐近地保证其性能与真实的,未知的最佳性能算法一样好。我们提供了这种方法的扩展,包括在线估算候选在线估算器的最佳集合。我们使用模拟和一个真实的数据示例来说明我们的方法的出色性能,在该示例中,我们使用来自大型数据库的数据对传染病发病率进行流式预测。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号