一种数据挖掘中的特征子集选取模型研究和应用

代理获取

页面导航

目录
摘要
著录项
引文网络
相似文献
相关主题

摘要

特征提取是模式识别中的一个重要过程,如今,也在数据挖掘领域也有着广泛的应用。对于高维数据的数据挖掘,特征提取可以有效地对数据进行降维处理,从而降低算法的运算规模。相对于主成分分析,粗糙集等数据降维方法,特征提取更加系统化,也更加依赖与问题的具体应用领域,提出针对性的特征提取模型,得到的结果也更加具有参考价值。将支持向量机应用于特征提取中,可以结合两者的长处,优化特征提取的过程,是对特征提取方法的一种探索。
　　本文针对最优特征子集选取的问题,进行了相关的探索研究。借鉴经典统计理论中的分位数的概念,将其引入特征选取模型,建立了分位数特征选取模型。另外,参考信息学中关于信息相对熵的概念和定义,建立了相对熵特征选取模型。在对特征候选集进行最优特征子集选取的过程中,本文依照分位数特征选取模型和相对熵特征选取模型分别建立了样本属性的可分性判别函数,并运用浮动序列前进算法找出不同属性个数下的最佳特征候选子集。最后,本文又借助于支持向量机的方法,将包含不同属性个数的特征候选子集对应的数据放入支持向量机,学习后进行判断,根据最后识别的错误率来判断该特征候选子集的优劣程度,从而得到最优特征子集。另外,通过在结肠癌患病和正常样本基因表达水平数据集上进行实验,来对上述特征提取模型进行了验证。
　　本文将特征提取应用于数据挖掘领域中,所建立的特征提取模型依据样本的统计学特性以及信息学特性,这些模型的建立脱离了系统的具体应用领域,使其更具有普遍意义。

著录项

作者
张箫;
展开▼
作者单位

华中师范大学;

展开▼
授予单位华中师范大学;
学科管理科学与工程
授予学位硕士
导师姓名陈菁华;
年度 2011
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.131;
关键词
特征子集选取模型; 支持向量机; 特征提取; 数据挖掘;

相似文献

中文文献
外文文献
专利

1. 排序特征子集选取方法研究 [J] . 胡素君 ,李云 . 计算机技术与发展 . 2010,第009期
2. 特征子集选取中相似性度量公式的研究 [J] . 李继荣 ,郑顾平 . 计算机与现代化 . 2007,第003期
3. 多类问题中最优特征子集选取的研究 [J] . 李继荣 . 自动化技术与应用 . 2006,第012期
4. 一种有效的算法在胃癌特征基因选取中的应用研究 [J] . 黄成玉 ,于臻 ,冉晓瑛 . 华北科技学院学报 . 2008,第004期
5. 一种动态特征选取方法及其在故障诊断中的应用 [J] . 蔡斌斌 ,蒋鹏 ,金炜东 . 计算机工程 . 2014,第011期
6. 一种新的令牌群模型及其在数据挖掘中的应用 [C] . 樊建聪 ,梁永全 ,唐雷雨 . 2007年首届仪表、自动化与先进集成技术大会 . 2007
7. 基于PCA的特征子集选取及网络入侵检测算法研究 [A] . 李英淏 . 2021

一种数据挖掘中的特征子集选取模型研究和应用

目录

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅