首页> 中文期刊> 《计算机工程与科学》 >基于大数据的异常检测方法研究

基于大数据的异常检测方法研究

         

摘要

离群数据检测,主要目的是从海量数据中发现异常数据.其有以下两点好处:第一,作为数据预处理工作,减少噪声点对模型的影响;第二,针对特定场景检测出异常,并对异常现象本身进行挖掘,也非常有价值.目前,国内外主流的方法像LOF、KNN、ORCA等,无法兼顾全局离群点、局部离群点和离群簇同时存在的复杂场景的检测.针对这一情况,提出了一种新的离群数据检测模型.为了能够最大限度对全局、局部离群数据以及离群簇的全面检测,基于iForest、LOF、DBSCAN分别对于全局离群点、局部离群点、离群簇的高度敏感度,选定该三种特定基分类器,并且改变其目标函数,修正框架的错误率计算方式,进行融合,形成了新的离群数据检测模型ILD-BOOST.实验结果表明,该模型充分兼顾了全局和局部离群数据及离群簇的检测,且效果优于目前主流的离群数据检测方法.

著录项

  • 来源
    《计算机工程与科学》 |2018年第7期|1180-1186|共7页
  • 作者单位

    湖南科技大学知识处理与网格化制造湖南省普通高校重点实验室;

    湖南湘潭411201;

    湖南科技大学知识处理与网格化制造湖南省普通高校重点实验室;

    湖南湘潭411201;

    步步高商业连锁股份有限公司;

    湖南湘潭411000;

    湖南科技大学知识处理与网格化制造湖南省普通高校重点实验室;

    湖南湘潭411201;

    湖南科技大学知识处理与网格化制造湖南省普通高校重点实验室;

    湖南湘潭411201;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 理论、方法;
  • 关键词

    离群数据检测; 模型融合; 商业大数据; 提升框架;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号