首页> 中文学位 >面向高维数据的共享子空间识别方法研究
【6h】

面向高维数据的共享子空间识别方法研究

代理获取

目录

声明

致谢

摘要

1 引言

1.1 国内外研究现状

1.2 研究的内容和目的

1.3 论文结构及章节安排

1.4 本章小结

2 相关工作研究

2.1 数据降维

2.1.1 数据预处理

2.1.2 数据降维

2.2 特征之间的相关性

2.1.1 标签特征的关联性

2.2.2 数据特征的关联性

3 一种基于共享子空间的数据表示模型

3.1 基于共享子空间的多标签数据重表示

3.1.1 共享空间识别模型

3.1.2 优化算法

3.1.3 计算复杂度分析

3.1.4 多标签学习算法

3.2 实验结果与分析

3.2.1 实验数据

3.2.2 实验结果评价指标

3.2.3 实验结果分析

3.3 本章小结

4 基于共享信息的聚类算法

4.1 基于共享信息的聚类分析

4.1.1 一种基于稀疏结构的无监督特征选择模型

4.1.2 模型的优化

4.1.3 计算复杂度分析

4.2 实验结果与分析

4.2.1 数据集说明和对比方法

4.2.2 实验结果评价指标

4.2.3 实验结果分析

4.3 本章小结

5 结论

参考文献

作者简历及攻读硕士学位期间取得的研究成果

学位论文数据集

展开▼

摘要

随着信息化和互联网的发展,高维数据在人们生活的各个领域不断涌现,如天文望远镜所收集到的数据,Web文档,多媒体数据以及生物医学领域中的基因数据等等。总的来说,这些数据都处于维数较高的特征空间中,特征维数的高维性带来的直接后果就是维度灾难(curse of dimensionality)。那么如何从这些高维的数据中挖掘出对人类有价值的信息就变得更为困难,并且已经成为迫切需要解决的问题。高维数据挖掘的一个重要的方法是通过对构建数据的特征属性之间的共享空间进行研究,基于这种共享子空间将原始的数据降到一个低维的、具有清晰的潜在的结构上去。于是,基于共享子空间的多标签学习和利用特征属性之间的共享信息的聚类分析得到了越来越多学者的关注。
  在多标签分类问题中,多个标签共享同一个输入空间,而且同一个实例的不同标签之间也存在一定的相关性。所以在研究此类问题的时候,标签之间的关联性研究就显得尤为重要。现有的多标签学习对于标签之间的相关性研究均是在原始数据上进行的,然而原始数据存在高维、信息冗余等特点,致使已有学习方法无法达到预期的效果。本文提出一种基于共享子空间的多标签数据表示模型,该模型在类标信息指导的基础上,从原始特征空间中提炼出高层信息,并有效的体现多标签之间的相关性。基于高层特征信息,原始高维数据被有效的映射到一个低维空间中。实验证明该模型有效的提高了多标签数据的分类性能。
  随后,我们将对共享子空间的研究拓展到聚类分析中,利用特征属性之间的共享信息提高特征选择的可靠性,从而提升最终的聚类效果。通过对已有特征选择模型的分析,并将该模型应用到聚类分析中,验证了算法的有效性,也证明了在聚类问题中共享子空间的研究同样重要。

著录项

  • 作者

    邹珊;

  • 作者单位

    北京交通大学;

  • 授予单位 北京交通大学;
  • 学科 计算机科学与技术
  • 授予学位 硕士
  • 导师姓名 景丽萍;
  • 年度 2015
  • 页码
  • 总页数
  • 原文格式 PDF
  • 正文语种 中文
  • 中图分类 TP311.131;
  • 关键词

    多标签数据; 高层信息; 共享子空间; 聚类分析;

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号