首页> 中文学位 >基于高斯分布的聚类边界检测算法的研究
【6h】

基于高斯分布的聚类边界检测算法的研究

代理获取

摘要

信息化是当今世界经济和社会发展的大趋势,其所产生的信息量也是非常巨大的,研究如何从这些海量数据中快速准确地获取有价值的数据信息已经成为当前科学研究领域的一个热点。数据挖掘技术就是顺应时代的需求而产生的。人们通过运用数据挖掘技术可以发现大量的实用价值非常高的信息,而且人们通过使用这些有价值的信息能够促进科技进步和创新,推动社会向前发展。聚类分析是数据挖掘中的一个重要技术和工具,人们对聚类技术的研究已经比较成熟,提出了很多经典的聚类算法,现在它已经在多个领域中得到广泛地应用,例如模式识别、市场调查研究、图像图形的分析与处理、数据的分析与处理、医学分析与诊断等领域。而聚类边界分析又是聚类分析的一个研究热点,在聚类分析、图像检索、医学分析等领域中已经发挥着举足轻重的作用。现在对于聚类边界点的研究才刚刚起步,而且现有的聚类边界点检测算法仍然存在着不能正确区分噪声和边界点,不能检测多密度数据集等一系列的问题,而且算法运行效率较也比较低。
   针对现有的边界点检测算法的缺点和一些不足,本文提出了一种新的基于高斯分布的边界检测算法MARGIN。
   MARGIN算法充分利用了高斯分布函数和变异系数相结合的方法来提取聚类的边界点。数据密度的分布情况可以通过使用高斯分布函数来反映,然后通过高斯分布函数来计算出来数据在该区域的具体密度数值,最后再利用变异系数来提取出数据的全部边界点。经过对比分析实验结果,表明该算法能够非常快速地、准确提取出来不同形状、大小和密度的数据集中的聚类中的真实的边界点,并且本算法能够去除噪声所产生的干扰。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号