首页> 中文学位 >分类数据聚类边界检测技术研究
【6h】

分类数据聚类边界检测技术研究

代理获取

摘要

随着互联网技术和信息技术的迅猛发展,人类社会进入了信息时代。信息时代的一个显著的特点就是人们所面对的信息和对信息的需求剧增。如何从这些信息中获取有用的知识是人们需要解决的一个问题。数据挖掘技术可以较好的满足人们对信息提炼的需求。聚类是数据挖掘中一个重要的分支,而聚类边界检测是对聚类的进一步的细化。聚类边界是一个新兴的研究方向具有广泛地应用前景,可应用于生物学、传染病学、统计学、基因工程等多个领域。聚类边界是具有多个聚类特征的数据对象,对这类数据对象的研究具有实用价值。例如:进行产品市场调查时,可以通过对这类对公司产品感兴趣但并没有成为公司消费者的被调查者的信息特征进行分析,并相应调整公司营销策略来争取这类顾客,比盲目的争取那些对公司产品没有丝毫兴趣的消费者的成功率要高得多。
   本文针对现有聚类边界算法中的以下两个方面进行相关研究并取得相应的成果,具体如下:⑴针对目前对聚类边界的研究主要集中在对数值类型数据的聚类边界的检测而尚未对分类数据聚类边界进行相关研究的问题,本文对分类数据聚类边界进行了相关研究。给出了表征分类数据对象同所属类亲疏关系边界度定义和分类数据聚类边界的形式化定义,利用证据积累的思想提出了一种针对分类数据的聚类边界检测算法——CBORDER。在多个真实数据集上的实验结果表明算法可以有效的提取高维分类数据集中聚类的边界。⑵针对现有算法对边界的提取精度不高和不能有效去除噪声的缺点,结合BRIM算法中的正、负半邻域思想和EDGE算法中的联合熵的思想的基础上提出了一种新的聚类边界检测算法——EBRIM。通过多个数据集上的实验的对比结果表明EBRIM算法在聚类边界提取精度和有效去除噪声两方面都明显优于BRIM算法和EDGE算法。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号