基于非唯一决策差异熵的特征选择方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

特征选择目前已成为机器学习研究领域的热点之一，其核心是根据某一评估准则从原始特征中获取能够保留初始物理特征的特征子集。粗糙集理论是被用于描述分类数据不一致程度的数学工具，现已将其运用在处理离散型符号数据的分析任务中。模糊粗糙特征选择方法能有效的解决符号、实值数据和二者的混合数据，对其进行改进可以获得更加简单和容易理解的学习模型。
　　粗糙集理论运用属性的依赖度或不确定度去构建特征选择算法时，需要先对数据集进行等价划分求得正域或边界域。这种利用等价划分来求解依赖度或不确定度的计算过程较复杂，不利于在规模较大的数据集中应用。
　　本文首先在粗糙集离散型数据的基础之上，提出了基于非唯一决策差异熵的特征选择算法。先将非唯一决策度的三种不同数学模型用于数据中边界域信息的计算，然后用差异熵去评价属性子集的重要程度进行约简操作，其中非唯一决策度的计算简化了粗糙集不一致度的求解过程。其次，本文针对广泛存在的符号型、布尔型、缺失值和数值型数据共存的混合信息系统，研究了基于模糊相似关系的非唯一决策数学模型，得到了基于混合数据的非唯一决策差异熵的特征选择算法，在保证分类精度的前提下简化在混合信息系统中不确定度的计算过程，提升了特征选择算法的效率。
　　本文采用UCI中八类符号型数据集和九类混合型数据集进行实验分析，分别将非唯一决策差异熵的特征选择算法与其他算法在分类精度与AUC值两方面进行对比分析，其中对比算法包括蚁群算法、模糊粗糙快速约简算法、主成分分析算法和粒子群算法。实验结果表明基于非唯一决策差异熵的特征选择算法能够使得约简的效果显著提升，同时得到的特征子集具有较高的分类精度和AUC值，这证明了本文所提出的算法具有现实研究意义。

著录项

作者
李荣;
展开▼
作者单位

大连海事大学;

展开▼
授予单位大连海事大学;
学科软件工程
授予学位硕士
导师姓名邓安生;
年度 2018
页码
总页数
原文格式 PDF
正文语种中文
中图分类自动推理、机器学习;
关键词
粗糙集; 特征选择; 差异熵; 非唯一决策;

相似文献

中文文献
外文文献
专利

1. 基于类别分布差异和特征熵的维吾尔语文本特征选择 [J] . 阿力木江·艾沙 ,吐尔根·依布拉音 ,库尔班·吾布力 . 计算机应用研究 . 2013,第010期
2. 基于粗糙集和信息熵的入侵检测特征选择方法研究 [J] . 吴萍 ,姜懿庭 . 云南民族大学学报（自然科学版） . 2011,第004期
3. 基于主动特征选择的非合作航天器鲁棒视觉导航方法研究 [J] . 宁明峰 ,张世杰 ,张翰墨 . 上海航天 . 2016,第006期
4. 基于改进直觉模糊熵的混合多属性决策方法研究 [J] . 林晶 ,王健 . 管理现代化 . 2014,第006期
5. 基于熵权的可拓侧距多属性决策方法研究 [J] . 杨丹丹 ,李园 ,杨海涛 . 内蒙古民族大学学报 . 2012,第005期
6. 基于方案偏好关系的群一致性偏差熵多属性群决策方法研究 [C] . 徐选华 ,周声海 . 第七届（2012）中国管理学年会——新经济环境下中国管理变革与范式探索 . 2012
7. 基于划分差异熵特征选择改进方法的研究 [A] . 孙倩 . 2018

基于非唯一决策差异熵的特征选择方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅