首页> 中国专利> 一种基于k甚近邻的高准确率全局离群点检测算法

一种基于k甚近邻的高准确率全局离群点检测算法

摘要

本发明适用于数据挖掘领域,提供了一种全局离群点检测算法,包括步骤S1:将数据集D以分块方式进行检测;步骤S2:用数据集D的每个对象与第一个数据块的每个对象计算距离,并更新第一个数据块中每个对象的(m+k)近邻,实时计算每个对象的离群度,离群度小于阈值c的就从该数据块排除;步骤S3:处理完第一个数据块后,将第一个数据块中未被排除的对象按离群度从大到小排序,取前n个对象加入TOP n离群点,并更新阈值c;步骤S4:采用步骤S2对第i个数据块进行处理,处理完该数据块后更新TOP n离群点和阈值c;待所有数据块都处理完后输出TOP n离群点。本发明提供的算法能够增大数据集适用范围并能够提高检测准确率。

著录项

  • 公开/公告号CN105117485B

    专利类型发明专利

  • 公开/公告日2018-07-20

    原文格式PDF

  • 申请/专利权人 深圳大学;

    申请/专利号CN201510593056.7

  • 申请日2015-09-17

  • 分类号G06F17/30(20060101);

  • 代理机构44312 深圳市恒申知识产权事务所(普通合伙);

  • 代理人陈健

  • 地址 518060 广东省深圳市南山区南海大道3688号

  • 入库时间 2022-08-23 10:14:23

法律信息

  • 法律状态公告日

    法律状态信息

    法律状态

  • 2018-07-20

    授权

    授权

  • 2015-12-30

    实质审查的生效 IPC(主分类):G06F17/30 申请日:20150917

    实质审查的生效

  • 2015-12-02

    公开

    公开

相似文献

  • 专利
  • 中文文献
  • 外文文献
获取专利

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号