首页> 中文学位 >混合稀疏正则化的多视角无监督特征选择
【6h】

混合稀疏正则化的多视角无监督特征选择

代理获取

目录

声明

第1章 Feature Selection

1.1 Introduction

1.1.1 Label categorization

1.1.2 Selection Strategy categorization

1.2 Related work

1.3 Averaging and Feature Selection

1.4 Objective of this work

1.5 Summary

第2章 Emerging Challenges and Related Work

2.1.1 Stability

2.1.2 Sparsity

2.1.3 Multi-source feature selection

2.2 Big Data

2.2.1 Scalability

2.2.2 Real-time processing

2.2.3 Distributed Feature Selection

2.2.4 Multi-Source Data and Multi-View Data

2.2.5 Visualization and Interpretability

2.2.6 Model Selection

2.3 Summary

第3章 Unsupervised Feature Selection

3.1 Multi-view Unsupervised Feature Selection

3.2 Experiments

3.2.3 Methods of Comparison

3.3 Summary

第4章 Conclusion and Future work

4.2 Future work

参考文献

Published Papers and Scientific Research Participation

致谢

展开▼

摘要

特征选择是机器学习和数据挖掘中的高效且有效的数据预处理技术,通过去除数据中的不相关和冗余特征提高学习性能,同时揣摩维度和计算复杂度。特征选择提高了对学习模型的可理解性,互联网和物联网已经导致全球每天大量数据的大量积累,积累的原始数据维度很高,需要巨大的存储空间,高维度数据使得现有的某些机器学习算法无效,最优特征选择在大数据时代变得更加重要。 数据可以来源于不同的背景和模态,并从多个视角进行描述。研究发现,在处理多视角数据的特征维数时,由于其固有的多视角和高维特性,在无监督学习任务中非常具有挑战性。实践证明多视角中的关系表示在处理多视角无监督特征选择时是特别困难的。本文针对这一问题展开研究提出了一种新的多视角无监督特征选择方法,该方法在多视角和独立特征中加入了稀疏性,考虑到各个视角的重要性,而不必在互补信息利用中引入事先设定的权重。 本文采用了七个公开的数据集进行实验,每个数据集至少包含三个不同的视角作为基准进行比较。在参数设置方面,邻域k在所有数据集和所有对比算法上均设置为5。λ1和λ2的参数调整采用网格搜索策略,它保证了所涉及矩阵的稀疏性。特征维度的设置与之前实验相同,展示的实验结果为在不同维度上的结果平均值。在基准数据集上的实验表明,本文提出的混合稀疏正则化的多视角无监督特征选择算法(MSMFS)优于其他最先进的无监督特征选择算法。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号