基于缺失属性值概率模型的不完备数据聚类研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

模糊聚类已广泛应用于图像处理、模式识别等领域。传统聚类分析方法只能应用在完备数据集上，不能直接应用于不完备数据集。但是在实际应用中，由于各种原因数据通常是不完备的，而且缺失属性的处理对聚类效果有着显著影响。因此，研究不完备数据集的聚类方法是一个具有实际应用意义的问题。
　　本文以缺失属性值的最近邻区间为基础，研究了不完备数据的聚类方法。最近邻区间描述能够在一定程度上体现缺失属性值的不确定性，但是没有对近邻样本的属性值进行充分挖掘，不能体现近邻样本的属性值分布信息。本文利用近邻样本相应属性值在最近邻区间范围内的分布信息，为缺失属性值建立一种简单有效的概率模型（Probability Model，PM）。通过遗传算法和梯度下降法迭代实现聚类，遗传算法通过概率取值来进行初始种群和变异操作，梯度下降法通过缺失属性值的概率来确定搜索步长。算法在相应最近邻区间范围内依据概率搜索缺失属性估算值以极小化聚类目标函数，通过对基于优化的缺失属性估计值还原数据集进行 FCM聚类可以较好的实现不完备数据模糊聚类问题。
　　本文所提缺失属性值概率模型不仅能够将最近邻信息引入缺失属性描述，并且充分挖掘了相应属性值在最近邻区间范围内的分布信息，因此能够较为有效地“还原”缺失属性值。遗传算法有精细的全局搜索能力，且稳定性较好；而梯度下降法具有快速搜索的能力，能够快速搜索到比较好的解，可以得到不错的聚类结果。在多个UCI数据集上的仿真实验表明：概率模型较其他缺失属性的描述方法，是一种描述不完备数据缺失属性值的有效方法，在此基础上聚类得到的结果更好。

著录项

作者
刘国新;
展开▼
作者单位

大连理工大学;

展开▼
授予单位大连理工大学;
学科控制工程
授予学位硕士
导师姓名李丹;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.131;
关键词
概率模型; 模糊聚类; 遗传算法; 梯度下降法; 不完备数据;

相似文献

中文文献
外文文献
专利

1. 基于不完备数据聚类的缺失数据填补方法 [J] . 武森 ,冯小东 ,单志广 . 计算机学报 . 2012,第008期
2. 基于不完备信息系统的粗模糊属性值的知识获取 [J] . 赵辉 ,谭天晓 ,赵宗涛 . 微电子学与计算机 . 2008,第8期
3. 基于概率模型的非均匀数据聚类算法 [J] . 杨天鹏 ,陈黎飞 . 计算机应用 . 2018,第010期
4. 一种基于动态填充的不完备数据聚类算法 [J] . 裴卫杰 ,庞天杰 . 太原师范学院学报（自然科学版） . 2018,第001期
5. 基于模糊规则的随机缺失属性值数据分类算法 [J] . 段亚军 ,杨有龙 ,白旭英 . 吉林大学学报（理学版） . 2019,第001期
6. 容差集合差异度高维不完备数据聚类 [C] . 武森 ,张桂琼 ,王莹 . 第十二届中国管理科学学术年会 . 2010
7. 基于密度峰值和维度概率模型的混合属性数据聚类研究 [A] . 刘世华 . 2017

基于缺失属性值概率模型的不完备数据聚类研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅