首页> 中文学位 >基于条件渐增总熵和全局邻域的局部离群点挖掘算法
【6h】

基于条件渐增总熵和全局邻域的局部离群点挖掘算法

代理获取

目录

声明

第1章 绪 论

1.1 课题背景及研究的目的和意义

1.2 国内外研究现状

1.3 存在的问题

1.4 本课题研究的主要内容

1.5 本文总体结构

第2章 子空间聚类和离群点挖掘技术

2.1 子空间聚类概述

2.2离群点挖掘技术

2.3本章小结

第3章 基于条件渐增总熵的局部离群点挖掘算法

3.1 引言

3.2 问题引入和基本概念

3.3 条件渐增总熵的离群点检测算法

3.4 本章小结

第4章 基于全局邻域的子空间局部离群点挖掘算法

4.1 引言

4.2 基本概念

4.3 子空间局部离群点挖掘算法

4.4 本章小结

第5章 实验与分析

5.1 实验环境配置

5.2 实验数据获取

5.3 基于条件渐增总熵的局部离群点挖掘算法的实验结果及分析

5.4 基于全局邻域的子空间局部离群点挖掘算法的实验结果及分析

5.5 本章小结

结论

参考文献

攻读硕士学位期间承担的科研任务与主要成果

致谢

展开▼

摘要

离群点挖掘是数据挖掘中的重要分支之一,它的主要任务是发现明显偏离其它数据行为特征的对象。在日常生活中,大部分事物都是普遍寻常的。但是也不能忽视许多不寻常对象的存在。这些对象通常具有非常重要的研究意义。目前,国内外研究人员已经提出了很多有关离群点挖掘的方法。本文针对局部离群点挖掘算法性能不佳的问题,对子空间聚类和局部离群点挖掘算法进行了深入的研究。本文的工作内容主要包括以下4个方面。
  首先,分析了局部离群点挖掘技术的研究背景和意义,并深入分析了国内外研究现状,对经典的子空间聚类和离群点挖掘算法进行了详细的分析和研究。
  其次,针对CMI算法子空间聚类效果不佳的问题进行了改进,采用条件渐增总熵的值来度量子空间聚类的情况,提出了一种基于条件渐增总熵的局部离群点挖掘算法,以便选择出最佳聚类子空间。之后,采用LOF算法在最佳聚类子空间中进行离群点检测。
  再次,结合HICS算法,并针对LoOP算法对全局离群点挖掘不准确的问题,采用全局邻域代替局部邻域的方法来进行离群点挖掘,提出一种基于全局邻域的局部离群点挖掘算法。同时对提出的全局局部离群概率参数进行了介绍和分析,并对其有效性进行了分析,以便验证算法已达到更好的检测效果。
  最后,在UCI真实数据集和虚拟数据集上,实现了本文提出的两种算法,并分别与对比实验进行了分析与比较。通过实验分别验证了两种算法的精确度和高效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号