首页> 中文期刊> 《小型微型计算机系统》 >一种基于磁盘的大数据集快速异常检测算法

一种基于磁盘的大数据集快速异常检测算法

         

摘要

异常点检测是数据挖掘的一个重要研究方向,基于Cell的异常点检测算法生成的Cell(单元)数与维数成指数增长.当生成的单元数增多及数据量增大时,基于Cell的算法不能有效工作.分析发现这些单元中存在很多无用的空单元.本文采用CD-Tree结构对非空单元进行索引,并采用聚簇技术,将每个单元中的数据点存放在同一个磁盘页链中.实验表明,采用CD-Tree以及聚簇技术设计的异常点检测磁盘算法的效率,以及所能处理的数据集维数较原基于Cell的磁盘算法都有显著的提高.

著录项

  • 来源
    《小型微型计算机系统》 |2005年第11期|1938-1941|共4页
  • 作者单位

    东北大学,信息科学与工程学院,辽宁,沈阳,110004;

    通化师范学院,吉林,通化,134002;

    东北大学,信息科学与工程学院,辽宁,沈阳,110004;

    东北大学,信息科学与工程学院,辽宁,沈阳,110004;

    东北大学,信息科学与工程学院,辽宁,沈阳,110004;

    东北大学,信息科学与工程学院,辽宁,沈阳,110004;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 TP311.13;
  • 关键词

    数据挖掘; 异常点检测; CD-Tree; 聚簇;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号