首页> 中文学位 >基于MLE的本征维数估计方法研究
【6h】

基于MLE的本征维数估计方法研究

代理获取

目录

文摘

英文文摘

第一章 引言

1.1 本征维数估计方法背景知识

1.2 本征维数估计方法的研究目的与意义

1.3 本征维数估计方法的研究现状

1.4 本文主要内容

第二章 本征维数估计方法分析

2.1 包数方法

2.1.1 相关概念

2.1.2 基于包数的本征维数估计算法

2.2 K-近邻图方法

2.3 极大似然估计方法

2.4 本章小结

第三章 基于MLE的本征维数估计算法

3.1 邻域平滑

3.2 测地线距离

3.3 算法实现与实验结果分析

3.3.1 实验数据库

3.3.2 实验结果分析

3.4 本章小结

第四章 结束语

4.1 总结

4.2 展望

参考文献

致谢

在学期间公开发表论文及著作情况

展开▼

摘要

自上个世纪以来,随着计算机技术的飞速发展,人们可以更好的处理复杂数据,与此同时,高维数据分析技术也蓬勃发展。高维数据的本征维数估计问题研究,在高维数据处理领域中有着重要的地位。对于高维数据处理领域,本征维数的寻求具有重要的意义。在降维方法中,本征维数是一个需要我们去估计的未知量,准确的估计出高维数据的本征维数,对接下来的降维处理问题有着重要的指导意义。并且,在数据处理过程中,准确的本征维数估计对选取合适的邻域大小有很大的帮助,可以避免“维数灾难”。
   本文提出一种新的方法——基于MLE算法的本征维数估计算法。大多数情况下,数据间的近邻关系能充分的反映数据的局部几何特征。MLE(Maximum LikelihoodEstimation)估计方法就是通过建立关于近邻间距离的似然函数,从而得到本征维数的估计值。传统的MI正方法存在两点不足:一是对同一个邻域内的不同样本点所估计出的本征维数值,只是简单的求均值作为该邻域的本征维数,受奇异值的干扰较大;二是在选取K近邻时,采用传统的欧氏距离,容易出现越层现象。针对以上不足,本文采用邻域平滑(Neighborhood Smoothing)方法替代原来的均值方法,求出更加可靠的本征维数值;在选取K近邻时,采用测地线距离代替欧氏距离,以找到真实的K近邻点。
   本文在模拟数据库和真实数据库上对该方法进行了实现,通过实验证明了改进后算法的可行性和有效性,文章最后对算法的实验结果进行了分析,实验结果表明,这种新的方法是有效的,可以估计出更为可靠的本征维数值。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号