您现在的位置: 首页> 研究主题> 抽样误差

抽样误差

抽样误差的相关文献在1978年到2022年内共计344篇,主要集中在统计学、经济计划与管理、预防医学、卫生学 等领域,其中期刊论文339篇、会议论文5篇、专利文献22099篇;相关期刊215种,包括中国经济问题、数据、统计教育等; 相关会议5种,包括2013年全国医药学术交流会、第三届中国信息融合大会、中国数学会均匀设计分会第十届学术研讨会暨2009西安应用统计学术研讨会等;抽样误差的相关文献由434位作者贡献,包括杨军毅、王佐仁、黄良文等。

抽样误差—发文量

期刊论文>

论文:339 占比:1.51%

会议论文>

论文:5 占比:0.02%

专利文献>

论文:22099 占比:98.47%

总计:22443篇

抽样误差—发文趋势图

抽样误差

-研究学者

  • 杨军毅
  • 王佐仁
  • 黄良文
  • 吴国培
  • 徐迪生
  • 刘红英
  • 方杰
  • 熊应进
  • 郭生练
  • 丁国安
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 王晓惠; 潘晓春; 沈旭伟
    • 摘要: 极值Ⅰ型概率分布模型常被用于海港工程极端水位、设计波要素和设计最大风速的频率分析,因样本容量过小引起设计值的抽样误差不容忽略。本文采用设计安全修正值估算设计值抽样误差,基于我国技术标准推荐的Gumbel参数估计法,通过蒙特卡洛试验,得出极值Ⅰ型分布安全修正值系数B值为频率、样本容量的函数,而与变差系数无关,进而绘制B值与B′值诺模图,并与基于多种参数估计方法的Pearson-Ⅲ型概率分布模型的B值诺模图进行对比分析。通过实例验证了极值Ⅰ型分布的B值与B′值诺模图可为极端水位与波高设计值抽样误差估计提供依据。
    • 许琪
    • 摘要: 本文从“数据量大”这一个角度分析了大数据相比抽样调查的优势以及研究者应该如何利用好这一优势开展大数据研究。主要结论为:第一,大数据可以消除随机性抽样误差,但由此带来的估计精度上的提升并不大,而大数据在覆盖偏差方面的缺陷使其在代表性上往往不如传统抽样调查;第二,大数据是一个非概率样本,但因为其数据量极大,研究者可以通过非常精细的事后分层调整获得对总体真值的有效估计;第三,利用数据量大的优势,研究者可以使用大数据更好地研究稀有事件,分析总体异质性并发现细微差异,所以,数据量大的真正价值在于“细”,即研究者应当使用大数据开展更加精细化的研究。
    • 刘辉; 李敬茹; 李静
    • 摘要: 三峡库区经济社会发展水平与三峡移民安稳致富息息相关,进行经济社会动态监测是检验相关工作成效的重要举措,其中三峡库区经济社会监测移民样本选取的代表性和科学性则关系到监测结论的科学性和准确性。本文构建了三峡库区经济社会监测移民样本抽样的基本技术方案,对抽样目标的设定、抽样总体范围的界定、抽样框的构建、样本量的确定和分配,以及样本的动态管理等抽样技术进行详细阐述和说明。
  • 4. 遗传漂变教学方法刍议 北大核心 CSCD CSTPCD
    • 王春明; 林昌俊; 冯虎元
    • 摘要: 遗传漂变是影响群体遗传平衡的4个重要因素之一.因为它的作用形式不如突变、选择、迁移这3个因素那么直观易懂,所以在理解和掌握上存在较大的困难.尤其目前国内外教材中关于遗传漂变内容的介绍系统性不足,要么过于粗略,要么完全忽视了二项式定理这样的数学基础,造成了遗传漂变学习长期不到位的困难局面.本文总结得出遗传漂变的5个基本属性,即固有性、普遍性、随机性、无方向性、有规律性.进而从遗传漂变的遗传基础是雌雄配子的自由组合出发,指出抽样误差属性是遗传漂变固有的本质特征,并循序渐进地从N=1这样仅仅由1个个体组成的极端小群体出发,推演出遗传漂变随着群体变大而影响减弱的性质,通过二项式定理数学模型、二项分布的特点、以及计算机模拟结果,形象直观地展示遗传漂变的作用,助力遗传漂变教学.
    • 吴凤波; 黄国庆; 刘敏; 彭留留
    • 摘要: 非高斯风压极值的准确估计对于建筑结构抗风设计非常重要.由于使用方便,转换过程法被广泛用于非高斯风压极值估计.转换过程法中典型的转换函数模型有Hermite多项式模型(HPM)、Johnson转换模型(JTM)及平移广义对数正态分布(SGLD)模型.通常,这三个转换函数模型的参数估计仅需数据的前四阶矩,因而这些模型被称为基于矩的转换函数模型.实际工程设计中用于计算风压极值的数据通常是有限长度的,而基于有限长度数据计算的前四阶矩具有抽样误差,致使基于矩的转换函数模型估计的风压极值亦具有抽样误差.现阶段对于以上三种模型估计非高斯风压极值所引起的极值抽样误差的区别尚不清楚.为了对三种模型估计极值时的抽样误差进行对比研究,该研究介绍了HPM、JTM和SGLD三个模型;给出了三个模型估计非高斯极值的抽样误差的理论方法;随后基于理论方法的计算结果对比了三个模型估计的极值的抽样误差;基于超长风压风洞试验数据对三种模型极值估计时的抽样误差进行了系统的评估和验证.结果 表明:HPM对非高斯风压极值抽样误差的估计效果通常比SGLD模型和JTM估计的效果更好.该研究结果可为合理选择非高斯风压极值估计模型提供一定的指导.
    • 杨江燕; 殷守强; 张利; 门明新; 陈影
    • 摘要: 耕地质量监测是当前国家及时掌握耕地质量和产能变化的重要工作手段.合理布设耕地质量监测样点可以大幅提高耕地质量监测的效率.以河北省黄骅市县域耕地为研究对象,以耕地的质量属性和空间位置属性为耕地质量等别监测区的划定依据,采用空间聚类法生成20种备选监测区方案,通过综合比较方差、抽样误差、抽样效率和抽样弹性系数,选出初始监测区方案,并在此基础上局部优化,最终生成耕地质量等别监测区方案,最后以耕地质量等别监测区为分层依据,运用分层抽样法布设了耕地质量等别监测样点.研究表明:①在抽样误差为1%的要求下,分区数为65的备选耕地质量等别监测区方案的综合样本容量为77,抽样效率相对较高,被选定为初始监测区方案;②随着耕地质量等别监测区数目从5增加到100,相同监测区内耕地单元之间在空间位置和耕地质量等别上的差异程度由快速减少到趋于平稳;③在布设相同数量的监测样点时,本文提出的基于空间聚类分层抽样的样点布设方法在表土质地、剖面构型、盐渍化、有机质含量、排水条件、灌溉条件和国家耕地质量自然等指数等因素方面的抽样误差分别为0.37、1.02、1.39、0.91、0.31、1.53和1.27,均明显低于传统的等别分层抽样、简单随机抽样、网格分层抽样,具有较高的抽样效率.研究成果可为耕地质量等别监测样点布设相关工作和研究提供有效指导.
    • 摘要: 注:1.本表数据根据2018年人口变动情况抽样调查数据推算。2.全国总人口包括现役军人数,分地区数字中未包括;全国总人口未包括香港、澳门特别行政区和台湾省的人口数据。3.全国总人口根据2018年人口变动情况抽样误差和调查误差进行了修正,分地区人口未做修正。
    • 周俊飞; 彭海; 崔野韩; 唐浩; 李论; 陈红; 温雯; 韩瑞玺; 黄思思; 方治伟
    • 摘要: [目的]植物品种分子标记鉴定标准只抽检了基因组上部分标记位点,存在抽样误差,鉴定结论常常因此被质疑.估计植物品种分子标记鉴定位点的抽样误差与鉴定结论的可靠性,为品种分子鉴定标准的应用提供科学依据.[方法]以2个品种间观察到的差异位点的数目为条件,根据贝叶斯公式建立品种间真实差异位点数目的条件概率模型.根据观察到的差异位点的数目服从于二项分布,且真实差异位点数的先验概率近似于均匀分布的特点,实现条件概率模型的计算.根据概率模型获得的概率保障的大小,将品种间的关系划分为红区、绿区和黄区,对应相同或近似品种、不同品种和待定品种.利用8个水稻品种的3 205个SSR分子标记位点的分型结果,估计2个品种组合间的真实差异水平,进而判定品种间关系的真实值.对每一对品种进行10 000次的分子标记位点的模拟抽样,每次抽取48个SSR标记位点.根据每次模拟抽样的结果,按概率模型计算概率并判定品种间的关系,将判定结论与真实值比较,验证概率模型的准确性.最后,利用概率模型为近期的西瓜品种侵权案的判决结论提供概率支持.[结果]在模拟抽样的验证试验中,每个品种组合有4 295-10 000次随机抽样在95%的概率保障下,判定为不同品种.与品种间的真实关系比较表明,利用概率模型鉴定的水稻品种间关系的正确率为100%.最后,利用概率模型为最近的西瓜品种侵权案的判决结论的正确性提供了95%以上概率保障,败诉方对抽样位点不足导致判决不可靠的质疑理由并不充分.[结论]构建了一个评估品种间关系、判定结论可靠性的概率模型,为品种间关系的分子鉴定结论赋予了概率保证,提高品种间关系判定结论的准确性,避免因检测位点不足导致的争议.%[Objective]The current standards for plant variety identification only examine a small number of markers on the genome,which may lead to sampling errors,therefore identification conclusions are often questionable.The goal of this study is to estimate the sampling errors in plant variety identification procedure and evaluate the reliability of the conclusions,and eventually provide the scientific basis for the applications of molecular identification standards.[Method]Based on the number ofobserved differential loci between two varieties,a conditional probability model was established based on the Bayes' theorem to estimate the true number of the different loci.Given that the observed number of differential loci between two varieties follows the binomial distribution,and the prior distribution of true number is an approximate uniform distribution,the conditional probability model was finally computed.Based on the confidence levels provided by the probabilistic model,the relationship between plant varieties is divided into the red,green or yellow zones,corresponding to the same or similar,different and undetermined varieties,respectively.To validate this probabilistic model,the genotyping data of 3 205 SSR molecular markers for each of the 8 rice varieties were used.For each pair of varieties,10 000 sets of molecular markers were simulated,and each set is composed of 48 random SSR markers.For each simulation,the relationship between the varieties was estimated based on the probability computed by the model.And then the estimated relationship was compared with the real one to evaluate the accuracy of the probabilistic model.Finally,the probabilistic model was applied to provide probabilistic support for the conclusion of a recent watermelon variety infringement case.[Result]The validation results showed that each pair of varieties was determined as different varieties in 4 295-10 000 simulations at a confidence level of 95%.Compared with the true relationship between varieties,the probabilistic model had an accuracy of 100% in determination of rice variety relationships.Finally,the court decision about the infringement dispute of watermelon varieties also was supported by the probabilistic model at a confidence level of 95%,indicating that the losing party's doubt on the limited number of the sampling loci is not sufficient.[Conclusion]In this study,a probabilistic model was built to evaluation the reliability of the conclusion of the variety relationships,which provides confidence levels for the molecular identification conclusion of the relationship among varieties,and thus improves the accuracy,and finally avoids the controversies caused by the insufficient number of testing markers.
    • 曹兆进; 曲英莉; 赵峰; 刘玲; 宋士勋; 刘迎春; 蔡嘉旖; 施小明
    • 摘要: 目的 探讨国家人体生物监测项目抽样方法,并通过计算抽样误差来评估抽样设计.方法 该监测采用多阶段复杂抽样方法,并以贵州省抽样结果为例,应用多阶段不等概率抽样误差计算方法计算贵州省抽样误差及变异系数,探讨多阶段抽样设计下误差估计方法.结果 该监测覆盖全国31个省(自治区、直辖市)的152个监测点,抽取21 888名3 ~ 79岁城乡居民,三个阶段置换率分别为5.26%、6.35%及40.6%.经计算贵州省抽样误差为3 207 594人,变异系数为0.097.结论 根据多阶段不等概率抽样方法计算,贵州省抽样变异系数较小,精度较高,但该计算方法未考虑人群缺失率、应答率等非抽样误差的权重调整,大型公共卫生监测项目多阶段抽样误差计算方法有待继续研究.%Objective To explore the sampling method in China National Human Biomonitoring Program (HBP) and the related errors,so as to calculate and evaluate the study design in sampling.Methods The sampling method of HBP is of multistage nature.Taking the results of sampling method from Guizhou province as an example,results related to sampling error and variation coefficient were calculated,using the multistage unequal probability sampling error method.Results The HBP covered 152 monitoring sites in 31 provinces (autonomous regions and municipalities) and with 21 888 residents selected.The replacement rates at various stages were 5.26%,6.35% and 40.6% respectively.The sampling error in Guizhou province was 3 207 594,and the coefficient of variation was 0.097.Conclusions According to the multi-stage unequal probability sampling method,the sampling coefficient variability appeared small with high precision,in Guizhou province.However,this method did not consider the weight adjustment of non-sampling errors such as population missing rate and response rate.Methods related to the calculation on multi-stage sampling error among large-scale public health monitoring projects need to be further studied.
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号