首页> 中文学位 >基于核函数参数优化的FCM聚类算法的研究
【6h】

基于核函数参数优化的FCM聚类算法的研究

代理获取

目录

基于核函数参数优化的FCM聚类算法的研究

A STUDY OF A NEW FCM CLUSTERING ALGORITHM BASED ON THE KERNEL METHOD WITH OPTIMIZED PARAMETERS

摘要

Abstract

第1章 绪论

1.1 课题研究的背景及意义

1.2 聚类分析的概况

1.3 核方法的概念

1.4 本文的研究内容

第2章 基于目标函数的模糊聚类分析

2.1模糊聚类理论发展

2.2数据集的c划分

2.3聚类目标函数

2.3.1硬聚类目标函数

2.3.2模糊聚类目标函数

2.4模糊c-均值聚类算法

2.5 模糊聚类算法实现途径的研究

2.5.1基于梯度的优化算法研究

2.5.2基于神经网络的优化算法研究

2.5.3基于进化计算的优化算法研究

2.6本章小结

第3章 核函数理论

3.1 基本概念

3.3.1 相似程度

3.3.2 两点的相似度

3.2 积特征

3.3 Mercer核

3.4 核函数的构造

3.5 本章小结

第4章 核聚类算法

4.1 引言

4.2 核聚类算法的基础理论

4.3 两种基于核函数的FCM算法(FKCM)

4.3.1 模糊核 均值算法问题的刻画

4.3.2特征空间中的模糊核聚类算法(KFCM-Ⅰ)

4.3.3输入空间中的模糊核聚类算法(KFCM-Ⅱ)

4.3.4 KFCM-Ⅱ算法的鲁棒性分析

4.3.5仿真实验及结果分析

4.4 对不完整数据集的聚类

4.4.1处理不完整数据时的模糊核聚类算法

4.4.2实验结果

4.5本章小结

第5章 对离群数据点核函数方法的优化

5.1 离群问题

5.2 特征加权模糊核聚类算法

5.3 特征加权模糊核聚类算法的收敛性

5.4 仿真实验

5.5 本章小结

结论

参考文献

哈尔滨工业大学硕士学位论文原创性声明

哈尔滨工业大学硕士学位论文使用授权书

致谢

个人简历

展开▼

摘要

聚类分析是用数学的方法研究分类问题的一门学科,近20年来得到了迅猛的发展,并在模式识别、计算机视觉、决策分析以及预测等领域中获得了广泛的应用。模糊聚类由于能够描述样本类属的中介性,能够客观地反映现实世界,已逐渐成为聚类分析的主流。在众多的模糊聚类算法中,模糊c-均值算法(FCM)可以说是应用最为广泛、最为灵敏的一种算法。但它没有对样本特征进行优化,其有效性很大程度上取决于数据点的分布情况,对初始化特别敏感,很容易陷入局部极小值或者鞍点,而得不到全局最优解。并且当使用这一聚类算法时,必须事先指定数据集的聚类数,然而聚类数c一般是很难预先知道的。当样本边界为线性不可分或者样本中有离群点时,聚类效果较差,无法达到高精度的聚类要求。而核函数的引入增加了对样本特征的优化,通过将样本点从输入空间映射到高维特征空间,将非线性学习问题转化为线性学习问题,从而实现了更为准确的聚类。
  本文将核方法的思想推广到模糊c-均值聚类算法,提出了两种核聚类算法,包括特征空间中的模糊核聚类算法KFCM和输入空间中的模糊核聚类算法KFCM。在人工和Benchmark数据集上的结果显示,所提出的核聚类算法是鲁棒的,适合对不完整或缺失数据、包含噪声和离群数据的聚类。
  对于样本集中含有离群点的数据,提出了一种新的特征加权模糊核聚类算法来发现样本集中的离群点。通过Mercer核把离群点映射到特征空间,并为特征空间的每个向量分配一个动态权值,在经典的FCM模糊聚类算法的基础上得到了一个特征空间内的全新聚类目标函数,通过目标函数的优化,最终得到了各个数据的权值,根据权值的大小标识出样本集中的离群点,并且,也从理论上证明了特征加权模糊核聚类算法的收敛性。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号