数据密集型计算环境下的离群点挖掘算法

陈亚丽; 张龙波; 张树森

首页> 中文期刊> 《计算技术与自动化》 >数据密集型计算环境下的离群点挖掘算法

数据密集型计算环境下的离群点挖掘算法

AI论文写作 >>

开具论文收录证明 >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

The characteristics of data,such as huge amounts,high dimension and distributed storage etc,have brought new challenges for the design of outlier mining algorithm.This paper proposed a grid and density based outlier mining meth-od on account of MapReduce.It is divided into two steps:in the Map phase,which deletes a large number of normal data, then sends the representative information to the master node.During the Reduce phase,it uses clustering algorithm based on density and simplifies the selection of the core.It can detect any shapes of outliers.The experimental results show that,in data-intensive computing environments,the algorithm is effective for mining outliers.%在数据密集型计算环境中，数据的海量、高维、分布存储等特点，为数据挖掘算法的设计与实现带来了新的挑战。基于 MapReduce模型提出网格技术与基于密度的方法相结合的离群点挖掘算法，该算法分为两步：Map阶段采用网格技术删除大量不可能成为离群点的正常数据，将代表点信息发送给主节点；Reduce阶段采用基于密度的聚类方法，通过改进其核心对象选取，可以挖掘任意形状的离群点。实验结果表明，在数据密集型计算环境中，该方法能有效的对离群点进行挖掘。

著录项

来源
《计算技术与自动化》 |2015年第2期|74-77|共4页
作者
陈亚丽; 张龙波; 张树森;
展开▼
作者单位

山东理工大学计算机科学与技术学院;

山东淄博 255000;

山东理工大学计算机科学与技术学院;

山东淄博 255000;

山东理工大学计算机科学与技术学院;

山东淄博 255000;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
离群点检测; 网格; MapReduce; MR_DBScan;

相似文献

中文文献
外文文献
专利

1. 数据密集型计算环境下离群点挖掘算法设计与实现 [J] . 陈亚丽 ,张龙波 ,李彩虹 . 山东理工大学学报（自然科学版） . 2013,第005期
2. Ⅰ-Miner环境下三种离群点挖掘算法的设计与实现 [J] . 侯天子 ,朱焱 . 软件 . 2011,第011期
3. 基于邻域密度的异构数据局部离群点挖掘算法 [J] . 王晓辉 ,宋学坤 ,王晓川 . 计算机仿真 . 2021,第007期
4. Spark平台下综合属性权重离群点挖掘算法研究 [J] . 马晶 ,刘建华 . 计算机与数字工程 . 2019,第008期
5. 基于网格技术的高维大数据集离群点挖掘算法 [J] . 郭龙 . 通讯世界 . 2016,第021期
6. 基于离群点剔除的网络热点事件挖掘算法 [C] . WANG Gen-cheng ,王跟成 ,LI Jun . 中国计算机用户协会仿真应用分会成立三十周年庆祝大会暨2013全国仿真技术学术会议 . 2013
7. 数据密集型计算环境下离群点挖掘算法的研究 [A] . 陈亚丽 . 2014

数据密集型计算环境下的离群点挖掘算法

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅