首页> 中文学位 >基于多视图的半监督特征选择算法研究
【6h】

基于多视图的半监督特征选择算法研究

代理获取

目录

声明

第一章 绪论

1.1 课题背景及研究意义

1.2 国内外研究现状

1.3 本文主要研究内容

1.4 本文组织结构

第二章 相关理论与概念定义

2.1 特征选择的概念定义

2.2 特征选择的框架分析

2.3 特征选择算法

2.4 多视图学习

2.5 多视图中文文本分类相关技术

2.6 本章小结

第三章 基于多视图学习的中文文本分类研究

3.1前言

3.2相关工作

3.3基于多支持向量机的并行学习算法

3.4实验结果

3.5本章小结

第四章 基于多视图的半监督特征选择算法

4.1 前言

4.2 单视图的最大相关最小冗余特征选择算法

4.3 基于多视图的特征选择算法

4.4 基于多视图的半监督特征选择算法

4.4 实验结果

4.5 本章小结

第五章 结论与展望

5.1 本文主要结论

5.2 下一步工作及展望

参考文献

攻读硕士学位期间发表的论文和参与的项目

致谢

展开▼

摘要

在处理计算机问题时,现实中遇到的数据一般都是高维度的,存在很多不相关的冗长特征。这为现实问题的解决带来了一定的困难。人们研究出了特征选择算法,以此提高算法选择的准确率。此方法可以高效的对数据进行降维,能够从数据的原始特征中直接选择出最优化的特征子集。因此,针对这一课题的研究已成为机器学习和数据挖掘领域的热点研究课题。
  在解决实际问题时也会发现数据之间具有多个视图,多视图学习也是机器学习过程中的重点研究课题。若是能在多视图数据之间发现他们隐藏的互补性关系,那么就可以在很大程度上提高学习的效果。然而随着现代社会技术的发展,数据的大规模应用加大了提取数据并进行标记的难度。那么如何在这种环境下获得数据之间多视图关系,并以此选择出最大相关和最小冗余的子集,这是本文研究的主要内容。参照当前计算及算法研究领域的最新进展,分析并研究出了一种基于多视图的半监督特征选择算法方式。此算法不但能够有效的提取多视图之间的互补信息,而且可以分析不同视图中各个特征间的冗余关系。结合少量标记的数据信息和没有标记的数据信息,同时进行特征选择和聚类学习,从而解决部分标记的多视图数据。
  本文的研究工作主要有以下贡献:
  (1)将本文构建一种改进的并行SVM,基于w-model,采取多个SVM分类器并行计算数据,此方法既确保分类器推广性能又缩短训练时间。
  (2)在进行多视图的特征选择时,对每个视图中各个特征间的冗余关系进行了综合考虑。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号