首页> 中文学位 >基于密度模式的参数自适应聚类算法研究
【6h】

基于密度模式的参数自适应聚类算法研究

代理获取

目录

文摘

英文文摘

声明

第一章绪论

1.1研究背景

1.1.1数据挖掘与聚类技术相关概念

1.1.2聚类算法所关注的性能指标

1.1.3聚类算法研究现状

1.2本文的主要工作及论文组织结构

1.2.1本文关注的主要问题及主要工作

1.2.2论文组织结构

第二章参数自适应聚类算法中的关键问题

2.1现有聚类算法在自适应性能方面所作的工作

2.1.1高自适应性聚类算法的意义

2.1.2参数自适应聚类算法的相关研究进展

2.2聚类算法参数自适应工作的难点

2.2.1效率和准确度的冲突:聚类算法普遍存在的问题

2.2.2高识别能力的参数自适应聚类算法面临的挑战

2.3本章小结

第三章DMBC算法主要设计思想

3.1基于密度聚类算法的重要启示

3.1.1 DBSCAN算法的核心思想及主要工作原理

3.1.2 DBSCAN算法的特色和启发性

3.1.3 DBSCAN算法存在的缺陷及其原因分析

3.1.4本文算法对于簇判定依据的重新认识

3.2密度模式的描述:最近邻关系的发展和应用

3.2.1最近邻关系的基本特点

3.2.2最近邻关系在现有聚类算法中的应用

3.2.3最近邻关系所蕴含丰富信息的进一步挖掘

3.3本章小结

第四章DMBC算法设计实现及其关键技术分析

4.1 DMBC算法工作原理概述

4.1.1动态k近邻图对于数据点在簇中所在位置的精确描述

4.1.2动态k近邻图中数据点的三种位置模式

4.1.3 DMBC算法聚类机制简述

4.1.4 Expand函数的工作原理及过程

4.2算法实现及其关键技术

4.2.1非均匀标度变换和比例判据

4.2.2数据结构对算法查询功能的支持和实现

4.3本章小结

第五章算法性能及实验结果分析

5.1算法时间复杂度分析

5.1.1算法主程序及核心函数结构分析

5.1.2算法时间复杂度的分析

5.2实验结果及分析

5.2.1实验数据选取及实验结果分析

5.2.2实验结果进一步分析和验证

5.3本章小结

第六章总结和展望

6.1论文总结

6.2进一步的研究方向

参考文献

致谢

攻读学位期间主要的研究成果

展开▼

摘要

聚类算法的自适应程度对其在许多领域的应用效果有着重要的影响,而这方面的研究尚比较薄弱,论文研究在不牺牲算法效率和准确性的前提下,如何提高聚类算法的自适应性。 在深入分析传统聚类算法和自适应聚类算法特点和缺陷基础上,明确了将数据描述、聚类判断等环节作为整体进行建模和解决的原则,避免现有算法由于将上述相互关联耦合的环节割裂而产生的问题。通过分析现有基于密度聚类算法在簇扩展方法上的优点及其聚类判据的缺陷,确定了以密度模式为聚类依据从而实现正确识别任意形状、不同密度簇的目标。通过分析和挖掘最近邻关系中所包含的丰富信息,深入挖掘最近邻关系的不对称性在簇边界识别中的指示作用,设计和构造了动态k近邻图和基于密度模式的簇扩展机制,将密度模式的表示、簇边界的识别、簇内成员点扩展等环节在统一的模型下进行解决。针对动态k近邻图构造和扩展规则中的关键前提,设计了非均匀标度变换和比例判据技术,使得算法对于经过标度变换后的不同输入数据集,都能输出正确的聚类结果,无须对与数据相关的任何参数进行设置,较好的实现了参数自适应的目标。 基于以上工作原理和关键技术,设计了一个基于密度模式的参数自适应聚类算法DMBC。对于所设计的算法进行了时间复杂度分析、编程实现和实验结果比较,验证了DMBC算法在时间复杂度、任意形状识别准确性、抗噪声能力方面都有较好的性能。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号