首页> 中文学位 >基于复合分位数回归的超高维稀疏数据的特征选择研究
【6h】

基于复合分位数回归的超高维稀疏数据的特征选择研究

代理获取

目录

第1章 引言

1.1 研究背景

1.2研究内容

1.3 论文创新点

1.4 论文的结构安排

第2章 建立模型与特征选择

2.1复合分位数回归模型

2.2 模型的建立

2.3 特征选择

第3章 模型求解

3.1 模型优化

3.2 模型求解

第4章 基于SRCE-PLM的选择过程

第5章 数值模拟

5.1 参数值设置

5.2 模拟过程

5.3 模型评价指标

5.4 模拟结果分析

5.5 真实模拟例子

第6章 结论与展望

6.1 结论

6.2 论文进一步研究方向

参考文献

附录

致谢

声明

展开▼

摘要

随着计算机技术和人工智能的发展,数据爆炸是当代最热门的问题之一。在超高维数据中,数据的样本量大幅增长,此时只有少数的协变量与响应变量有关联,模型呈现稀疏性特征且模型参数的解释性较差。统计人员面临着识别最重要特征的任务,并构建最优解释模型,将这些重要特征与响应变量联系起来。从超高维数据中提取有用的特征是对超高维数据建模的基础。因为此时模型呈现稀疏性,所以对超高维数据进行任何精确分析之前,重要的是删除最明显的非影响特性特征。由于维数过高,许多传统的建模方法和高维数据变量选择方法不适用于超高维数据分析。近年来,为了这个目标,数学家已经开发了一些算法。比较可行的策略是建立一个两阶段特征选择过程,第一阶段使用快捷高效变量筛选过程将特征维度降低到样本量之下的合适规模,并且能够保留所有的重要特征,在此基础上再使用一些有效的方法对降维后的高维数据进行重要变量选择。 论文中提出了一种超高维数据特征选择方法,基于复合分位数模型提出了稀疏性限制的复合分位数估计模型来实现超高维数据特征选择第一阶段过程,将特征维度降低到样本量之下的合适规模。与此同时引入MM算法和IHT迭代硬阀值算法对稀疏性限制复合分位数估计模型进行求解。特征选择第二阶段采用LASSO和SCAD惩罚似然方法对降维后的数据进行重要特征选择。文章中的筛选方法自然地采用了筛选过程中特征的联合效应,这使其本身具有超越现有方法的优势。论文中方法得到了许多建模设置下的仿真研究的进一步支持。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号