首页> 中文期刊>电子学报 >面向分类的流特征在线特征选择算法

面向分类的流特征在线特征选择算法

     

摘要

在线流特征选择通过实时过滤无关特征和冗余特征,实现流特征空间降维.针对已有算法,如Alpha-investing分类精度低、SAOLA选择特征数多和OSFS在低冗余高相关数据集下运行时间长的问题,提出了一种面向分类的流特征在线特征选择算法——OSFIC.算法运用四层过滤框架,通过无条件独立过滤不相关新特征、单条件下互信息过滤冗余新特征和候选特征集合中的部分冗余特征,最后通过多条件独立过滤候选特征集中的剩余冗余特征,最终得到分类标签的近似马尔可夫毯.为了分析OSFIC的性能,选择了NIPS 2003和Causality Workbench中的数据集,从预测精度、特征数量、运行时间和AUC方面与已有基准算法进行比较.实验表明,OSFIC平均分类精度比Alpha-investing提升4.41%.在保证精度的前提下,平均特征数量比SAOLA减少41.9%,运行时间比OSFS减少91.59%.最后,在真实的应用场景下验证了OSFIC的有效性.

著录项

  • 来源
    《电子学报》|2020年第2期|321-332|共12页
  • 作者单位

    燕山大学信息科学与工程学院 河北秦皇岛066004;

    河北省计算机虚拟技术与系统集成重点实验室 河北秦皇岛066004;

    燕山大学信息科学与工程学院 河北秦皇岛066004;

    河北省计算机虚拟技术与系统集成重点实验室 河北秦皇岛066004;

    燕山大学信息科学与工程学院 河北秦皇岛066004;

    河北省计算机虚拟技术与系统集成重点实验室 河北秦皇岛066004;

    燕山大学信息科学与工程学院 河北秦皇岛066004;

    河北省计算机虚拟技术与系统集成重点实验室 河北秦皇岛066004;

    燕山大学信息科学与工程学院 河北秦皇岛066004;

    河北省计算机虚拟技术与系统集成重点实验室 河北秦皇岛066004;

    燕山大学信息科学与工程学院 河北秦皇岛066004;

    河北省计算机虚拟技术与系统集成重点实验室 河北秦皇岛066004;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 计算机的应用;
  • 关键词

    在线特征选择; 流特征; 互信息; 条件独立; 近似马尔可夫毯;

  • 入库时间 2023-07-24 21:25:54

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号