A new technique of outlier detection

代理获取

页面导航

目录
摘要
著录项
引文网络
相似文献
相关主题

摘要

孤立点检测是数据挖掘领域一个重要的研究课题，目的是为了发现藏在大数据集中的有用的异常和不规则的模式。孤立点的检测在多种应用领域也备受关注，如信用卡，保险、税务，欺诈监测中、网络安全的问题中入侵检测和其他许多领域。
　　许多数据挖掘技术中服务孤立点只是聚类操作的一个副产品。一般而言，这些技术将不在簇内的点定义孤立点。因此，基于聚类的孤立点检测算法的一个主要问题是找到集群和孤立点，而这些孤立点经常被视为噪声而去除，为了得到更多可靠的聚类。
　　本论文通过分析孤立点检测方法，提出了一种有效检测孤立点和数据聚类的新法。该算法的主要思想是在聚类完成后继续进行数据过滤，方法首先利用k-means进行聚类，然后通过阈值是的设定进行孤立点的判别，最后将孤立点去除。
　　为了检验算法的效率和有效性，本文采用用于KDD的Cup1999比赛数据集进行实验。实验结果表明，论文中提出的方法成功检测到了目前数据中的入侵行为，是可行及可靠的。此外，我们还将提出的算法与现有的一些算法在KDD常用数据集上进行实验比较，并得到了更好的孤立点的去除性能。

著录项

作者
Nassir Abdullah Nassir(那西尔);
展开▼
作者单位

中南大学;

展开▼
授予单位中南大学;
学科 Computer Science
授予学位硕士
导师姓名廖志芳;
年度 2012
页码
总页数
原文格式 PDF
正文语种英文
中图分类 TP311.131;
关键词
数据挖掘; 孤立点检测; 数据过滤; 聚类算法;

相似文献

专利

A new technique of outlier detection

目录

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅