首页> 中文学位 >类属型数据的加权粗糙聚类算法及应用研究
【6h】

类属型数据的加权粗糙聚类算法及应用研究

代理获取

目录

文摘

英文文摘

声明

第一章 绪论

1.1研究背景与意义

1.2国内外研究现状

1.3主要研究内容

1.4本文的组织结构

第二章 基本理论知识

2.1引言

2.2聚类分析

2.3经典粗糙集理论

2.4相似粗糙集模型

2.5小结

第三章 加权粗糙聚类算法(WRCA)

3.1引言

3.2类属型数据

3.3算法整体描述

3.4基于相似粗糙集模型聚类

3.5评价属性重要度

3.6加权重复聚类

3.7算法性能分析

3.8小结

第四章 WRCA实验结果分析

4.1实验数据

4.2实验结果分析

4.3总结

第五章 WRCA在中医亚健康数据上的应用

5.1引言

5.2聚类分析目标

5.3亚健康数据

5.4聚类结果分析

5.5小结

第六章 总结与展望

6.1总结

6.2展望

参考文献

附录

攻读硕士期间参与项目

致谢

展开▼

摘要

随着数据规模的不断增大,竞争的日趋激烈,人们迫切需要从大量数据中挖掘出有用的知识和信息来辅助决策,数据挖掘技术随之应运而生。聚类分析是数据挖掘的一种重要技术,但以往的研究大多限于数值型数据,类属型数据的聚类算法则被研究地较少。
   类属型数据的值域是无序的,无法进行其值的大小比较。因此,我们不能用基于距离的方法度量类属型数据对象间的相似性,传统聚类算法也对类属型数据聚类失效。现存的一些类属型数据聚类算法,期望的簇数目需人工确定,聚类结果对样本输入顺序敏感,没有考虑不同属性对聚类的重要性,降低了聚类分析的质量和效率,限制了聚类分析的应用。
   鉴于此,本文提出了一种加权粗糙聚类算法:首先把各个属性特征看作同等重要,赋予相同的权值,根据粗糙集相似关系得到初始聚簇;然后利用信息增益率去衡量属性特征对聚类的重要性;最后用信息增益率值更新属性的权值,不断迭代,直到产生满足要求的聚簇。该算法能够处理类属型数据,不需要预先给定簇的数目,对样本输入顺序不敏感,考虑了属性对聚类的重要性,提高了聚类的质量。
   最后,利用来自UCI的数据集实验,证实了该算法在分类正确率和聚簇的纯度上均有提高。并将该算法应用于中医亚健康数据,发现了数据中的潜在规律,给中医亚健康状态分类辨识研究提供了一定的理论支撑,为亚健康的发现和防治提供了科学依据。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号