首页> 中文期刊>计算机科学与探索 >基于数据场的改进DBSCAN聚类算法

基于数据场的改进DBSCAN聚类算法

     

摘要

DBSCAN(density based spatial clustering of applications with noise)算法是一种典型的基于密度的聚类算法.该算法可以识别任意形状的类簇,但聚类结果依赖于参数Eps和MinPts的选择,而且对于一些密度差别较大的数据集,可能得不到具有正确类簇个数的聚类结果,也可能将部分数据错分为噪声.为此,利用数据场能较好描述数据分布,反映数据关系的优势,提出了一种基于数据场的改进DBSCAN聚类算法.该算法引入平均势差的概念,在聚类过程中动态地确定每个类的Eps和平均势差,从而能够在一些密度相差较大的数据集上得到较好的聚类结果.实验表明,所提算法的性能优于DBSCAN算法.%DBSCAN (density based spatial clustering of applications with noise) algorithm is a typical density-based clustering algorithm. The algorithm can discover the arbitrary-shaped clusters. However, the clustering results depend on the two parameters Eps and MinPts which are chosen by users. And for some datasets with large density differences, either the clustering results may have the incorrect cluster number, or the algorithm may label part of the data as noise. Using the advantages that data field can commendably describe the data distribution and reflect the data relationship, this paper proposes a new clustering algorithm called improved DBSCAN algorithm based on data field. The algorithm introduces the concept of average potential difference and dynamically determines Eps and average potential difference of each class during the clustering process. In this way, it can receive better clustering results for some clusters with large density differences. Experimental results indicate that the proposed algorithm performs better than DBSCAN algorithm.

著录项

  • 来源
    《计算机科学与探索》|2012年第10期|903-911|共9页
  • 作者单位

    山西大学计算智能与中文信息处理教育部重点实验室,太原030006;

    山西大学计算机与信息技术学院,太原030006;

    山西大学计算智能与中文信息处理教育部重点实验室,太原030006;

    山西大学计算机与信息技术学院,太原030006;

    山西大学计算智能与中文信息处理教育部重点实验室,太原030006;

    山西大学计算机与信息技术学院,太原030006;

    山西大学计算智能与中文信息处理教育部重点实验室,太原030006;

    山西大学计算机与信息技术学院,太原030006;

  • 原文格式 PDF
  • 正文语种 chi
  • 中图分类 人工智能理论;
  • 关键词

    DBSCAN算法; 数据场; 聚类;

相似文献

  • 中文文献
  • 外文文献
  • 专利
获取原文

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号