首页> 外文期刊>Journal of Statistical Planning and Inference >Information-based optimal subdata selection for big data logistic regression
【24h】

Information-based optimal subdata selection for big data logistic regression

机译:基于信息的大数据逻辑回归的最佳子数据选择

获取原文
获取原文并翻译 | 示例
获取外文期刊封面目录资料

摘要

Technological advances have enabled an exponential growth in data volumes, and proven statistical methods are no longer applicable for extraordinary large data sets due to computational limitations. Subdata selection is an effective strategy to address this issue. In this study, we investigate existing sampling approaches and propose a novel framework of selecting subsets of data for logistic regression models. We show that, while the information contained in the subdata based on random sampling approaches is limited by the size of the subset, the information contained in the subdata based on the new framework increases as the size of the full data set increases. Performances of the proposed approach and those of other existing methods are compared under various criteria via extensive simulation studies. (C) 2020 Elsevier B.V. All rights reserved.
机译:技术进步在数据卷中启用了指数增长,并且由于计算限制而不再适用于非凡的大数据集。 子数据选择是解决此问题的有效策略。 在本研究中,我们调查了现有的采样方法,并提出了一种选择逻辑回归模型的数据子集的新框架。 我们表明,当基于随机采样方法的子数据中包含的信息受子集的大小限制,而基于新框架的子数据中包含的信息随着完整数据集的大小增加而增加。 通过广泛的模拟研究在各种标准中比较所提出的方法的性能和其他现有方法的性能。 (c)2020 Elsevier B.V.保留所有权利。

著录项

相似文献

  • 外文文献
  • 中文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号