首页> 中文学位 >基于邻域粗糙集的混合型属性离群点检测方法研究
【6h】

基于邻域粗糙集的混合型属性离群点检测方法研究

代理获取

目录

第一个书签之前

展开▼

摘要

离群点检测是数据挖掘领域重要的研究方向之一,其目的是找出在数据集中其行为很不同于其他数据对象的对象。它在入侵检测系统、信用卡欺诈、有趣的传感器事件、医学诊断、执法和地球科学等领域都具有十分重要的应用。然而,传统的几何距离法不能有效处理符号型属性数据集,经典粗糙集方法又不能有效处理数值型属性数据集。针对这些问题,本文以邻域粗糙集为统一框架,利用其对问题的粗糙表示与计算能力,重点研究了基于邻域粗糙集的混合型属性离群点检测方法问题。论文的主要工作创新点如下: (1)利用有序二分和近邻搜索思想改进了计算单属性邻域基本算法,它降低了传统无序逐一比较算法的实际计算时间复杂度。 (2)为了有效处理混合型属性数据集,通过研究并优选混合型距离度量和具有自适应的标准差邻域半径,以构建新型的邻域信息系统。 (3)基于前述工作基础,在邻域粗糙集中提出了基于邻域值差异度量、基于序列和基于邻域信息熵的三种离群点检测新方法。理论模型和UCI数据集实验均表明,三种新型算法能够有效处理符号型、数值型和混合型属性数据,且具有较好的适应性和有效性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号