首页> 中文学位 >一类零过度数据的建模及诊断分析
【6h】

一类零过度数据的建模及诊断分析

代理获取

摘要

在公共卫生、生物医学、经济、道路安全、制造业和农业等众多的领域中存在着大量的计数数据(count data),为了分析这类数据,常常借助于经典的离散广义线性模型.然而,实际问题中计数数据里往往会含有大量超过标准模型能够预测的零,称之为零过度(zero inflation,记为ZI),此时,标准离散分布将可能不再适合分析它们.取而代之,ZI离散模型成为分析零过度数据的有效方法,受到越来越广泛的重视,并且在理论和应用上都有十分重要的意义.本文系统地研究了零过度偏差泊松回归模型和相应混合效应模型的统计诊断问题.
   第二章致力于研究零过度偏差泊松回归模型的统计诊断.首先基于普通似然和EM算法下完全数据似然研究了模型的参数估计;其次基于数据删除方法和局部影响分析方法研究了影响诊断问题,得到了参数估计的一步近似、广义Cook距离、似然距离、WK统计量以及各种扰动情形下的影响曲率;然后研究了ZI参数和非退化部分散度参数的显著性检验,并基于参数化方法探讨了它们的齐性检验,得到了Score检验统计量;最后基于ZI广义泊松(ZIGP)和ZI双泊松(ZIDP)回归模型分别通过随机模拟和实例说明了统计量的有效性.
   纵向数据分析是当前统计学的热点课题之一,主要用于探索各组受试单元在不同时间或空间上的重复观测数据的统计性质,这时,组内与组间相比,组内常是相关的.第三章系统地研究了零过度偏差泊松混合效应模型的参数估计和统计诊断问题.首先基于最佳线性无偏预测(BLUP)型对数似然和约束极大似然估计(REML)方法研究了参数估计,并同时给出了参数估计的EM算法;其次基于BLUP型对数似然研究了模型的数据删除度量和局部影响度量问题,得到了参数估计的一步近似、广义Cook距离、似然距离、WK统计量以及各种扰动情形下的影响曲率;然后基于BLUP型对数似然研究了回归系数和非退化部分散度参数的显著性检验,并利用参数化方法探讨了散度参数的齐性检验,得到了多个检验统计量;最后基于Laplace近似方法研究了方差成分检验,得到了梯度检验统计量.本章还通过实例和随机模拟方法结合ZIGP混合效应模型说明了检验方法的有效性.
   统计推断一般都是基于数据和假定的概率模型进行的,且推断的有效性依赖于模型的正确程度.然而,在多数场合,它们是否正确我们不能完全确信.若模型被误判则可能导致参数估计和协方差阵估计的不相合.第四章研究了零过度偏差泊松模型均值函数的误判检验问题.首先基于累加残差研究了零过度模型中退化部分和非退化部分的协变量函数形式以及联系函数的误判检验,得到了相应的检验统计量并研究了它们的渐近性;其次采用相同方法探讨了零过度混合效应模型中协变量函数形式以及联系函数的误判检验,并得到了相应的检验统计量;最后通过实例和随机模拟方法结合ZIGP模型说明了检验统计量的有效性.
   另外,Bayes统计是统计学发展最快的分支之一.在Bayes统计中,一般假定参数为随机变量且服从某先验分布,然后利用参数和样本的联合分布得到参数的后验分布,并在此基础上进行Bayes统计推断.第五章探讨了零过度偏差泊松回归模型和相应混合效应模型的Bayes统计分析.首先利用马尔可夫链蒙特卡罗方法中Gibbs抽样并结合Metropolis-Hastings(MH)算法研究了模型的Bayes估计;其次基于Kullback-Leibler(K-L)距离研究了关于联合后验分布和边际后验分布的Bayes数据删除影响诊断问题,得到了相关的诊断统计量;最后通过随机模拟和实例说明了本章估计方法和诊断统计量是有效的.
   综上所述,本文比较深入系统地研究了零过度偏差泊松回归模型和基于重复测量数据的混合效应模型的参数估计、统计诊断以及模型误判检验等问题,并得到了一系列新的诊断统计量.大量的数值实例和随机模拟结果表明,这些统计量都是很有效的.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号