首页> 中文学位 >基于EM算法的缺失数据的统计分析及应用
【6h】

基于EM算法的缺失数据的统计分析及应用

代理获取

目录

声明

摘要

第1章 引言

1.1 研究背景和意义

1.1.1 研究背景

1.1.2 研究意义

1.2 国内外的研究现状

1.2.1 国外研究现状

1.2.2 国内研究现状

1.3 研究设计

1.3.1 本文的工作

1.3.2 论文的可能创新之处

1.3.3 研究框架

第2章 缺失数据产生的原因及分类

2.1 缺失数据的定义及其产生原因

2.1.1 缺失数据的定义

2.1.2 缺失数据产生的原因

2.2 缺失数据的分类

2.2.1 按照缺失数据的机制分类

2.2.2 按照缺失数据的模式分类

2.3 缺失数据的处理方法

第3章 EM算法的相关理论

3.1 EM算法

3.1.1 极大似然估计

3.1.2 完备数据集

3.1.3 EM算法

3.2 EM算法的几种解释

3.2.1 直观解释

3.2.2 下界极大化

3.3 EM算法的性质

第4章 EM算法在调查表中的应用

4.1 一个变量缺失的情形

4.2 两个变量缺失的情形

4.3 实例分析

第5章 EM算法在二阶高斯混合模型中的应用

5.1 EM算法在高斯混合模型中的应用

5.1.1 高斯混合模型简介

5.1.2 EM算法高斯混合模型中的参数估计

5.2 EM算法在数据分开形式下的二阶高斯混合模型中的应用

5.2.1 总体分布的符号说明

5.2.2 分开形式下完全数据的二阶高斯混合模型的参数估计

5.2.3 分开形式下缺失数据的二阶高斯混合模型的参数估计

5.2.4 数值模拟

5.3 EM算法在一般形式下的二阶高斯混合模型中的应用

5.3.1 一般形式下完全数据的二阶高斯混合模型的参数估计

5.3.2 数值模拟

第6章 EM算法在二项-泊松多层混合模型中的应用

6.1 EM算法在二项-泊松多层混合模型中的参数估计

6.2 算法简要步骤

6.3 实例分析

第7章 总结和展望

7.1 总结

7.2 展望

参考文献

硕士期间发表的学术论文

致谢

展开▼

摘要

EM是一种专门用于求解参数极大似然估计的迭代算法。特别地,它为有缺失数据条件下的参数估计提供了一个标准的理论框架,这里的缺失有以下两种情况:一种是我们所研究的问题中确实存在数据的缺失;另一种是原始数据是完全的,但由于似然函数的求解十分困难,而额外添加一些数据就能将原来十分复杂的过程转化成一系列简单的似然函数优化问题,于是原始数据自然就成为了不完全数据。由于EM算法具有良好的收敛性和每次迭代都能使似然函数值单调不减的优良性质,所以许多与缺失数据有关的问题中都会结合EM算法来分析,也难怪有学者称EM算法和缺失数据如同一对孪生姐妹一般总是如影随形。  本文主要对EM在含缺失数据的统计分析及应用中作了以下几方面的研究:  (1)引言。主要介绍了本文研究的背景、意义以及国内外研究现状。  (2)理论基础的构建部分。首先介绍了缺失数据的产生的原因、机制和模式;其次对极大似然估计的理论作了简要概述;最后介绍了EM算法的相关理论,在这一部分中详述了对EM算法的几种解释,从而加深了对该算法的理解。  (3) EM算法在含缺失数据的调查表中的应用。这是EM算法在实际生活中的一类非常重要的应用,在这部分中我们首先将该算法应用在常见的调查表中数据有缺失的情形,然后以重庆市居民的交通起止点调查表为例,用EM算法来补全表中的数据并对其中的参数进行估计,从而很好的展现了该算法的实用价值。  (4)EM算法在混合模型中的应用。在这一部分中我们主要研究了EM算法在二阶高斯混合模型和多层混合模型中的应用,其中在研究EM算法在二阶高斯混合模型中的应用时,我们将观测数据划分成(X,Y)和整体Y的形式,分别在这两种形式下给出模型中参数的估计,并用Matlab软件进行了随机数值模拟;在研究多层混合模型时,我们以二项-泊松多层混合模型为例给出了EM算法在该种模型下的参数估计,并用具体的实例来验证了EM算法在处理这类复杂的混合模型参数估计方面的优势,为EM算法在其它复杂混合模型中的应用提供了很好的借鉴。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号