大数据背景下概率-非概率样本的数据整合推断——从误差校正的视角出发

刘晓宇; 金勇进; 倪成

首页> 中文期刊> 《统计研究》 >大数据背景下概率-非概率样本的数据整合推断——从误差校正的视角出发

大数据背景下概率-非概率样本的数据整合推断——从误差校正的视角出发

开具论文收录证明 >>

期刊封面封底目录下载 >>

文献代查 >>

团队文献服务 >>

页面导航

摘要
著录项
相似文献
相关主题

摘要

以互联网为媒介的调查数据采集具有成本低、速度快等优势,但这些样本通常属于非概率样本,存在覆盖误差和选择性偏差,不具有总体代表性,无法直接用于有限总体推断。基于概率-非概率样本的数据整合,可以综合两类样本的优势,处理这些非概率样本偏差。本文将非概率样本看作有限总体的不完全覆盖,在假定概率样本和非概率样本有重合的前提下,构造数据整合事后分层与校准估计。该假定是校准的基础,在此框架下考虑测量误差的校正,在概率样本或非概率样本存在测量误差的情况下,提出基于无偏误真值的校准和基于有偏误测量值修正的校准两种思路。此外,本文还提出基于Bagging决策树的半监督分类法,用于识别非概率样本和概率样本的重合部分,这在实际工作中具有较强的指导意义。

著录项

来源
《统计研究》 |2023年第8期|149-160|共12页
作者
刘晓宇; 金勇进; 倪成;
展开▼
作者单位

首都经济贸易大学统计学院;

中国人民大学应用统计科学研究中心;

中国人民大学统计学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类统计调查 ;
关键词
数据整合; 非概率样本; 测量误差; 校准法; Bagging决策树;

相似文献

中文文献
外文文献
专利

1. 大数据背景下非概率抽样的统计推断问题研究 [J] . 胡俊红 . 数学学习与研究：教研版 . 2017 ,第13期
2. 大数据背景下非概率抽样的统计推断问题 [J] . 金勇进 ,刘展 . 统计研究 . 2016 ,第3期
3. 非概率样本与概率样本的融合推断新方法 [J] . 刘展 ,王典妮 ,潘莹丽 . 统计与决策 . 2023 ,第8期
4. 基于Model-X Knockoffs的非概率样本倾向得分模型推断方法 [J] . 刘展 ,郑俊博 ,刘洋 . 统计与决策 . 2023 ,第4期
5. 大数据背景下网络调查样本的建模推断问题研究——以广义Boosted模型的倾向得分推断为例 [J] . 刘展 ,潘莹丽 . 统计研究 . 2019 ,第9期
6. 多维度视角下大数据与档案关系的思考——以杭州市大数据管理为背景 [C] . 梁凯 . 2018年全国档案工作者年会 . 2018

大数据背景下概率-非概率样本的数据整合推断——从误差校正的视角出发

摘要

著录项

相似文献

相关主题

期刊订阅