首页> 中文期刊>计算机研究与发展 >面向高维数据的低冗余top-k异常点发现方法

面向高维数据的低冗余top-k异常点发现方法

     

摘要

异常发现是数据挖掘领域的一类重要任务.针对高维对象的异常度量问题和异常点集合的冗余问题,提出了一种新的面向高维数据的异常点发现方法.该方法通过采用高维数据的二部图表示,以高维对象的压缩能力作为其异常程度的度量,能够有效支持包含不同类型属性的高维数据.为了解决top-k异常点集合中的冗余问题,提出了低冗余top-k异常点的概念.由于精确计算低冗余的top-k异常点是NP-hard问题,设计了计算近似低冗余的top-k异常点的启发式方法k-AnomaliesHD算法.从在真实和人工数据集上的实验结果可以看出,该方法具有较好的扩展性;而且与不考虑冗余的异常点发现方法相比较,能够更有效地概括数据中的异常模式.

著录项

  • 来源
    《计算机研究与发展》|2010年第5期|788-795|共8页
  • 作者单位

    北京大学信息科学技术学院,北京,100871;

    机器感知与智能教育部重点实验室(北京大学),北京,100871;

    北京大学信息科学技术学院,北京,100871;

    机器感知与智能教育部重点实验室(北京大学),北京,100871;

    北京大学信息科学技术学院,北京,100871;

    高可信软件技术教育部重点实验室(北京大学),北京,100871;

    北京大学信息科学技术学院,北京,100871;

    机器感知与智能教育部重点实验室(北京大学),北京,100871;

    北京大学信息科学技术学院,北京,100871;

    机器感知与智能教育部重点实验室(北京大学),北京,100871;

    北京大学信息科学技术学院,北京,100871;

    机器感知与智能教育部重点实验室(北京大学),北京,100871;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 TP311.13;
  • 关键词

    数据挖掘; 异常检测; 高维数据; 低冗余; 异常度量;

  • 入库时间 2023-07-25 09:27:38

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号