首页> 中文学位 >广义线性模型的稳健估计及其医学应用
【6h】

广义线性模型的稳健估计及其医学应用

代理获取

目录

文摘

英文文摘

声明

前言

第一章 广义线性模型及其参数估计

1.1模型基本结构介绍

1.2广义线性模型参数估计

第二章 稳健估计理论概要

第三章 广义线性模型稳健估计

4.1 Mallows型拟似然估计(Mallows quasi-likelihood estimates)

4.2条件无偏影响约束估计(conditionally unbiased bounded influence CUBIF)

4.3 Mallows型降权杠杆点估计(Mallows-type downweight leverage estimate)

4.4一致性错分模型估计(Consistent mis-classification model estimate)

第四章 模型诊断理论概要

第五章 模拟研究

5.1最大似然估计值分布情况

5.2 Logistic回归模型的稳健估计

5.2.1对无离群点数据的系数估计

5.2.2对不同比例污染样本的系数估计

小结

5.3 Poisson回归模型的稳健估计

5.3.1对无离群点数据的系数估计

5.3.2对不同比例污染样本的系数估计

小结

第六章 实例分析

6.1白血病数据的logistic模型

6.2癫痫病人数据的Poisson回归模型

第八章讨论

参考文献

个人简介

致谢

展开▼

摘要

广义线性模型(generalized linear model,GLM)是一类应用范围较广的模型,它可以满足应变量为连续和离散数据的建模,特别是后者,如属性数据,计数数据。这在应用上,尤其是生物、医学、经济和社会数据的统计分析上,有着重要意义。但是其经典模型拟合方法最大似然估计(MLE)容易受离群点的影响,甚至得出错误结论。因此,研究能有效对抗离群点的稳健估计方法将具有重要意义。 本文回顾和比较了四种适用于广义线性模型的稳健估计方法:Mallows拟似然估计、条件无偏影响约束估计(CUBIF)、Mallows降权杠杆点估计和一致性错分模型估计。首先在稳健回归估计基本理论的基础上对这四种估计方法的基本思想和稳健性质进行了详细的阐述。其中后两种方法只能适用于Logistic回归模型。 在模拟分析中,对Mallows拟似然估计考虑了帽矩阵、MVE和MCD三种针对x方向降权的尺度,对Mallows降权杠杆点估计考虑Carroll和Huber两种降权函数。模拟分析基于两种常见的广义线性模型即Logistic回归和Poisson回归进行了设计,然后对每种模型建立的模拟样本中分别构建y方向、x和y方向两种不同类型和不同比例的离群点情况,探讨了适用于各自模型的各种估计方法对抗不同类型和比例离群点的能力。通过模拟研究我们得到以下结论: 1.相比较于经典的MLE,这一类稳健估计方法在一定程度上可以更好的对抗离群值产生的影响,描述最佳拟合大部分数据的结构;可以更清楚地识别离群值、模型中的强影响点与模型偏离的结构;当数据中没有影响点时,其估计与经典MLE估计一样好,但是当MLE条件不满足时,稳健估计结果要远远优于MLE。 2.在Logistic回归模型和Poisson回归模型情况下,Mallows拟似然估计基于MVE和MCD的降权方法都表现了较其他估计方法更强的对抗离群点的能力。而基于帽矩阵的降权方法则由于帽矩阵本身的不稳健性导致了其较低的失效点。 3.Mallows降权杠杆点估计方法由于其权函数是基于x方向离群点,所以在单纯的1%的y方向的离群点时即失去效用,但是在x和y方向同时异常时有很好的对抗性离群点的能力,不过由于其权函数对x方向离群点观测赋权重为0达到规避离群观测的特性,在离群点比例增大时,极容易导致logistic回归模型完美分割导致估计无解情况的发生,而且其降权过程会损失样本的大量信息。 4.一致性错分模型估计表现要差于前两种方法,但相对MLE来说具有较好的稳健性,不过其缺点在于可能造成正常观测点的强制降权作用。 5.CUBIF本身思想为影响约束估计,可以同时考虑x和y方向的异常情况,不过其表现要劣于其他稳健估计方法。 最后本文通过两个实例,探讨了这些方法的实际应用。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号