首页> 中文期刊> 《统计研究》 >大规模数据下基于充分降维的Leverage重要性抽样方法

大规模数据下基于充分降维的Leverage重要性抽样方法

         

摘要

随着信息技术的飞速发展,大规模数据在短时间内搜集并储存下来,为分析决策提供了巨大的信息量,也给统计建模带来了一定难度.对于样本容量大、变量个数少的数据,Leverage重要性抽样是一个简便可行的方法.本文发现,该方法中度量样本重要性的Leverage分数与因变量无关,而且在维度较大的情形下对样本没有区分程度,使得估计结果较差.为了同时考虑因变量和维度的影响,本文提出了基于充分降维的Leverage重要性抽样方法.该方法以不损失信息为前提,在充分降维的空间内重新计算Leverage分数,使得抽样更具有代表性.模拟数据分析显示,在样本容量较大的复杂数据中,相比于原始的Leverage重要性抽样方法,本文提出的方法可以降低估计的均方误差.三个实际数据也证实了该方法的可行性和有效性.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号