首页> 中文期刊>深圳大学学报(理工版) >面向分类型矩阵数据的无监督孤立点检测算法

面向分类型矩阵数据的无监督孤立点检测算法

     

摘要

孤立点检测是数据挖掘的重要分支之一, 旨在发现一个数据集中与多数对象行为明显不同的一些对象.针对分类型矩阵数据, 通过给出一种矩阵对象自身的内聚度和该矩阵对象与其他矩阵对象之间的耦合度, 定义了矩阵对象的孤立因子, 提出一种面向分类型矩阵数据的孤立点检测算法.在Market basket、Microsoft web和MovieLens真实数据集上的实验结果表明, 与基于共同近邻 (common-neighbor-based, CNB)算法、局部异常因子 (local outlier factor, LOF)算法和基于信息熵 (information entropy-based, IE-based)的算法相比, 本算法能有效检测分类型矩阵数据中的孤立点.%Outlier detection is an important branch of data mining, aiming at finding the objects in a data set that are significantly different from most objects.In this paper, we define the outlier factor of a matrix-object and propose an outlier detection algorithm for categorical matrix-object data by defining the cohesion degree of a matrix-object itself and the coupling degree with other matrix-objects.The experimental results on real data sets, i.e., Market basket, Microsoft web, and MovieLens, show that the proposed algorithm can effectively detect the outliers for the matrixobject data set compared with common-neighbor-based (CNB), local outlier factor (LOF), and information entropybased (IE-based)algorithms.

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号