首页> 中文学位 >高维多重共线性数据特征筛选
【6h】

高维多重共线性数据特征筛选

代理获取

目录

声明

1 绪论

1.1研究背景及现状

1.1.1 超高维特征筛选

1.1.2 多重共线性

1.2常用特征筛选方法概述

1.2.1 SIS方法

1.2.2 DC-SIS方法

1.3 本文主要内容及创新点

2 高维多重共线性型数据的变量筛选研究

2.1 引言

2.2 筛选方法与理论研究

2.2.1 筛选方法

2.2.2 理论性质

2.3 定理证明

3 数值模拟与实例分析

3.1 数值模拟

3.2实例分析

4总结与展望

4.1研究总结

4.2研究展望

参考文献

致谢

展开▼

摘要

随着信息技术的不断发展,在金融、气象预测、基因研究等一些领域中,统计学家常能够收集到高维数据。但由于维数过高,传统的统计分析方法和变量选择方法变得不再稳健和难以适用。并且还有其他的难题需要去克服,例如当误差分布为厚尾分布时,它们的效率都普遍较低甚至它们会变得无法适用;还有当自变量间存在严重的多重共线性时,这也会严重干扰到变量选择方法的筛选效果。为了克服多重共线性,本文突破性地提出能够应对存在多重共线性高维线性数据的稳健的高维特征筛选法。  本文的主要工作如下:  第一章阐述了在面临高维数据时变量筛选的研究现状与历史,并且对一些常用特征筛选方法进行了回顾和学习,最后对本文的内容安排和创新点进行了说明。  第二章中提出一种针对多重共线性的高维特征筛选法,可处理存在多重共线性这类型的高维数据。当下很多针对高维线性模型的研究都是基于单一的边际效应下进行的,变量的筛选依赖于变量之间相互独立,这使得当存在变量间存在多重共线性时可能导致变量筛选的不稳定性,本文通过引入净效应的这一概念,让自变量的净效应替代其边际效应,提出一种基于全局影响的特征筛选方法,这使得其筛选方法的适用范围更广,并进一步通过证明得到了确定筛选性质。  第三章通过数值模拟和实例分析中与其他筛选方法比较的结果说明了推广后的筛选方法更具稳定性。  第四章总结了本文所提出的特征筛选方法,并对可以进一步地去研究的方向进行展望。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号