改进的模糊C均值聚类与连续属性离散化算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

连续属性的离散化是数据挖掘理论中重要的研究内容之一，有监督离散化没有考虑属性之间的相容性，对最终的效果造成一定的偏差，无监督离散化对分布不均匀以及含有噪声的数据集十分敏感。在现实世界中，很多数据之间的分类界线是非常模糊的，很难断定一个数据具体属于哪个类别。在没有先验知识的指导下，人为的将数据集进行划分，不但破坏了数据之间的相关信息，而且最终得出的结果也无法令人信服。针对传统模糊离散化算法对噪声数据敏感和忽略属性之间相关性等缺陷，对模糊C均值聚类和连续属性的离散化进行了研究，主要工作如下:
　　(1)针对模糊C均值(FCM)算法对初始聚类中心和噪声数据敏感的缺陷，给出一种基于大密度区域的模糊聚类DCFCM算法。该算法首先利用大密度区域以及样本的密度值变化方法，选取初始聚类中心以及候选初始聚类中心，并依据初始聚类中心与候选初始聚类中心的距离，确定初始聚类中心点，从而有效的克服了随机给定初始聚类中心容易使算法收敛到局部极小的缺陷;其次，分别利用密度函数为样本加权和引用改进的隶属度函数进行优化，有效地提高了模糊聚类的抗噪性。最后实验验证了算法在初始聚类中心的确定，聚类效果和抗噪性方面具有良好的效果。
　　(2)在上述基础之上，给出了一种基于DCFCM的软划分离散化算法。该算法利用决策表中决策属性对条件属性的相容性原理作为评判标准，对算法参数动态调整，达到优化的离散化效果。通过UCI和天文光谱数据，实验验证该算法的有效性。

著录项

作者
李鑫;
展开▼
作者单位

太原科技大学;

展开▼
授予单位太原科技大学;
学科计算机应用技术
授予学位硕士
导师姓名张继福;
年度 2011
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.131;
关键词
密度函数; 相容度; 动态参数调整; 连续属性; 离散化算法; 模糊C均值聚类; 数据挖掘;

相似文献

中文文献
外文文献
专利

1. 基于模糊C均值聚类的粗集理论连续属性的离散化新算法 [J] . 黄晓莉 ,曾黄麟 ,王秀碧 . 重庆邮电大学学报（自然科学版） . 2006,第005期
2. 连续属性离散化算法研究综述 [J] . 张钰莎 ,蒋盛益 . 计算机应用与软件 . 2014,第008期
3. 基于改进离散粒子群优化的连续属性离散化 [J] . 张荣光 ,胡晓辉 ,宗永胜 . 计算机工程与应用 . 2017,第018期
4. 基于改进的SOM聚类连续属性离散化算法 [J] . 陶刚 ,闫永刚 ,刘俊 . 计算机应用 . 2015,第0z1期
5. 一种基于改进粒子群的连续属性离散化算法 [J] . 汪凌 . 计算机工程与应用 . 2013,第021期
6. 基于粗糙集理论的连续属性离散化算法研究 [C] . 蔡智 ,王煦法 ,蔡庆生 . 第一届中国Rough集与软计算学术研讨会 . 2001
7. 基于粗糙集理论的连续属性离散化算法研究 [A] . 李慧 . 2010

改进的模糊C均值聚类与连续属性离散化算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅