首页> 中文学位 >基于广义线性模型、广义线性混合模型、偏最小二乘-logistic回归对我国当前收入分配满意度情况的
【6h】

基于广义线性模型、广义线性混合模型、偏最小二乘-logistic回归对我国当前收入分配满意度情况的

代理获取

目录

声明

摘要

1 绪论

1.1 选题的背景和意义

1.2 满意度研究综述

1.3 广义线性模型、广义线性混合模型以及偏最小二乘—logistic模型综述

1.3.1 理论部分的综述

1.3.2 应用部分的综述

1.4 本文拟所的方法及其文章结构

2 三个模型的介绍

2.1 广义线性模型(GLM)

2.1.1 广义线性模型的定义

2.1.2 广义线性模型的参数估计

2.2 广义线性混合模型(GLMM)

2.2.1 随机效应的概念

2.2.2 随机效应的估计

2.2.3 广义线性混合模型的定义

2.2.4 广义线性混合模型的参数估计

2.3 偏最小二乘回归(PLS)以及偏最小二乘logistic回归(PLS-logistic)

2.3.1 多因变量的偏最小二乘回归模型

2.3.2 单因变量的偏最小二乘回归模型

2.3.3 偏最小二乘logistic回归

2.4 模型检验

2.5 本章小结

3 对我国当前收入分配满意度实证分析

3.1 数据说明

3.2 基于GLM对我国当前收入分配的满意度分析模型

3.2.1 广义线性模型的变量及其定义

3.2.2 模型选择

3.2.3 模型结果和分析

3.3 基于GLMM对我国当前收入分配的满意度分析模型

3.3.1 广义线性混合模型的变量及其定义

3.3.2 模型的选择与结果

3.3.3 结果分析

3.4 基于偏最小二乘logistic模型对我国当前收入分配的满意度分析模型

3.4.1 变量选取

3.4.2 数据变量间的相关性分析

3.4.3 构建模型及结果分析

3.5 三个模型的比较

3.6 本章小结

4 结果与展望

4.1 本文研究主要结果

4.2 展望

参考文献

附录

致谢

作者在攻读硕士学位期间完成的论文

展开▼

摘要

广义线性模型是线性模型的推广,将随机误差项推广到了指数分布族,这样在处理数据时就更具有了灵活性、更具有广泛性。然而在实际问题中,一些变量的加入会导致随机变量不在独立,这就有悖于广义线性模型的基本假设。所以,这也就导致了再用广义线性模型处理具体问题的时候可能会忽略掉一些重要的变量,从而导致我们在处理实际问题中产生偏差,影响分析的结果。因此有学者将随机效应加入了广义线性模型从而建立了广义线性混合模型,这一举措大大的拓展了传统的分析领域。
  传统的分析政策满意度的方法中往往都是一些定性的分析,本文基于对传统分析方法的研究,结合前人的研究,通过广义线性模型和广义线性混合模型定量的分析了国民对当前政策的满意度。
  本文的数据来自于中国人民大学的“社会心态与政策评价关联”课题研究,此课题在全国范围内进行了问卷调查。将GLM、GLMM、PLS-logistic模型引入政策满意度评价领域,为满意度评价问题的研究提供了新的路径。本文主要内容如下:
  1.在详细的阐述了问卷的设计内容以及各选项的赋值情况下,通过对问卷数据的研究发现,这是一个典型的纵向数据,并且以往研究满意度评价的文献中有学者采用过普通logistic回归,这与广义线性模型具有很高的相似性。再加之广义线性模型的连接函数更多元化,不仅仅是把因变量划分为二元离散变量,因此考虑采用广义线性模型来分析满意度评价的问题。在基于GLM的分析中,选取了问卷中的部分具有代表性的变量如下:对我国当前收入分配满意度作为因变量,民族、户口、受教育程度、工作大单位作为自变量。并对自变量进行哑变量处理,把被调查者划分为60类人群,应用R软件,定量分析了这60类人们对政策的满意度情况,进行了分类排序,并分析了单个自变量对满意度的影响情况。从整体看来,国民对我国当前收入分配的满意度情况较为良好,但是还是表达出了国民希望国家在收入分配政策中进一步完善激励约束机制。并且分析发现受教育程度的高低,和满意度高低成正比,因此国家应出台相应政策提高国民的普遍的受教育程度。
  2.将家庭年收入作为随机效应构建满意度评价是合理的。从上一节分析发现,通过固定民族、户口、受教育程度这3项对应的自变量,研究不同工作单位人群的满意度,计算对比发现,在企业单位工作的人群以及离退休人员的满意度较高。联想到不同工作单位收入的高低不同,因此决定将家庭年收入作为一个随机效应加入到模型中。本节的自变量数据处理方式与上面的略不同(见表3.4),迭代100次后参数收敛,发现参数整体的拟合效果得到很大提高;对单个效应因子来说,作为固定效应的民族因子、户口因子、受教育程度因子和工作单位因子的参数估计都是比较显著的。特别是受教育程度的参数的显著性有了很大的改善。也说明了GLMM对于满意度评价问题的适用性。
  3.偏最小二乘回归在现实生产的用的比较广泛,大都用于水质测量、医学、生物、地质等科学领域。PLS-logistic模型是将普通logistic模型、主成分提取方法和典型相关性分析结合起来的一种新的分析模型,巧妙地把偏最小二乘回归和logistic回归的优点结合了起来。PLS-logistic模型能消除观测数据间的多重共线性问题,在提取成分时同时考虑了自变量与因变量的相关性。受前人的启发,本文首次将PLS-logistic模型用于满意度的分析实证中。本文表3.7对变量的选取做了详细的说明,利用统计软件matlab进行模型构建,依次迭代可以发现提取3个偏最小二乘成分时模型最达到优,最后,为了进一步分析自变量对满意度的解释作用,计算了重要性指标VIP来测度,分析并给出了政策建议。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号