首页> 中文学位 >基于类心和特征加权的特征选择
【6h】

基于类心和特征加权的特征选择

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

第一章 绪论

1.1研究背景及研究意义

1.2国内外研究现状

1.3研究新的特征选择方法所面临的挑战

1.4本文的研究内容及论文结构

1.5本章小结

第二章 特征选择基本过程和评测标准

2.1特征选择概述

2.2特征选择过程

2.3搜索策略

2.4特征相关分析

2.5特征评价标准

2.6本章小结

第三章 现有特征选择算法综述

3.1过滤方法

3.2封装方法

3.3嵌入式方法

3.4本章小结

第四章 常用的分类器

4.1最近邻分类器

4.2贝叶斯分类器

4.3欧式距离分类器

4.4神经网络分类器

4.5支持向量机

4.6本章小结

第五章 基于类心和特征加权的特征选择

5.1算法的理论分析

5.2算法复杂度

5.3仿真实验

5.4本章小结

第六章 总结和展望

6.1总结

6.2展望

参考文献

发表论文和参加科研情况说明

致谢

展开▼

摘要

在科技日新月异的大数据时代,我们所面对的数据集越来越庞大。在海量数据中,往往含有大量的不相干信息和冗余信息,使得现有机器学习算法面临着严峻的挑战。如何在保持数据信息足够完整的前提下,从中提取出有效而又合理的特征数据,满足存储需求和提高信息处理效率,是亟需解决的问题。因此特征选择问题一直是模式识别领域的研究热点之一。
  基于边界最大化的特征选择方法是一种有效的特征选择方法,它能够显著去除高维数据中的不相干特征,在机器学习中有着重要的应用,但该方法存在着计算复杂度较大的问题。以计算高效性著称的基于局部学习的特征选择算法的计算复杂度仍与输入对数维度呈对数复杂度。为了克服这一问题,本文在其基础上,提出了基于类心和特征加权的特征选择算法。其基本思想是以某一类的类心为中心,寻找其同类和异类最近邻构成边界,根据某种准则获得一个特征空间的权重,使得权重特征空间中的边界最大。本文的算法具有很好的处理效率,可以在两秒内处理5000维特征。
  通过对该特征选择算法选择出的特征进行SVM分类来验证其性能。在4个UCI数据库上的实验验证了所提算法不仅有更高的效率而且有更好的分类准确度,并且对于不相干特征几乎是不敏感的。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号