基于类心和特征加权的特征选择

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

在科技日新月异的大数据时代，我们所面对的数据集越来越庞大。在海量数据中，往往含有大量的不相干信息和冗余信息，使得现有机器学习算法面临着严峻的挑战。如何在保持数据信息足够完整的前提下，从中提取出有效而又合理的特征数据，满足存储需求和提高信息处理效率，是亟需解决的问题。因此特征选择问题一直是模式识别领域的研究热点之一。
　　基于边界最大化的特征选择方法是一种有效的特征选择方法，它能够显著去除高维数据中的不相干特征，在机器学习中有着重要的应用，但该方法存在着计算复杂度较大的问题。以计算高效性著称的基于局部学习的特征选择算法的计算复杂度仍与输入对数维度呈对数复杂度。为了克服这一问题，本文在其基础上，提出了基于类心和特征加权的特征选择算法。其基本思想是以某一类的类心为中心，寻找其同类和异类最近邻构成边界，根据某种准则获得一个特征空间的权重，使得权重特征空间中的边界最大。本文的算法具有很好的处理效率，可以在两秒内处理5000维特征。
　　通过对该特征选择算法选择出的特征进行SVM分类来验证其性能。在4个UCI数据库上的实验验证了所提算法不仅有更高的效率而且有更好的分类准确度，并且对于不相干特征几乎是不敏感的。

著录项

作者
崔文玲;
展开▼
作者单位

天津大学;

展开▼
授予单位天津大学;
学科信息与通信工程
授予学位硕士
导师姓名何改云,庞彦伟;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类自动推理、机器学习;
关键词
特征选择; 边界; 特征加权; 支持向量机; 分类准确度;

相似文献

中文文献
外文文献
专利

1. 基于类心和特征加权的特征选择算法 [J] . 崔文玲 ,潘静 ,何改云 . 电子测量技术 . 2015,第3期
2. 基于特征加权与特征选择的数据挖掘算法研究 [J] . 颜义人 . 电子技术与软件工程 . 2015,第015期
3. 基于GPU的文本特征选择与特征加权 [J] . 李志龙 ,黄理灿 ,刘飘悦 . 工业控制计算机 . 2014,第005期
4. 联合图嵌入与特征加权的无监督特征选择 [J] . 张巍 ,张圳彬 . 广东工业大学学报 . 2021,第005期
5. 基于类内类间判据与遗传算法的故障特征选择方法 [J] . 赵荣珍 ,李坤杰 . 兰州理工大学学报 . 2017,第002期
6. 一种高效的基于特征选择和特征加权的网络异常检测方法 [C] . 李洋 ,方滨兴 ,郭莉 . 2008中国计算机网络安全应急年会（信息内容安全分会） . 2008
7. 基于特征选择和特征加权算法的文本分类研究 [A] . 石慧 . 2015

基于类心和特征加权的特征选择

目录

摘要

著录项

相似文献

相关主题

期刊订阅