首页> 中文学位 >符号属性数据的半监督聚类与属性选择
【6h】

符号属性数据的半监督聚类与属性选择

代理获取

目录

声明

摘要

图目录

表目录

第1章 绪论

1.1 机器学习简介

1.2 研究背景及主要内容

1.3 论文结构

第2章 聚类与属性选择概述

2.1 聚类算法

2.2 属性选择算法

2.3 小结

第3章 基于权值投票的半监督聚类集成

3.1 聚类集成

3.2 基于权值投票的半监督聚类集成算法

3.3 实验与分析

3.4 小结

第4章 基于分裂重组合的半监督聚类算法

4.1 分裂重组合的半监督聚类算法

4.2 实验与分析

4.3 小结

第5章 最小冗余最大相关半监督属性选择

5.1 最小冗余最大相关算法

5.2 半监督最小冗余最大相关SemiMRMR算法

5.3 实验与分析

5.4 小结

第6章 基于耦合依赖度的半监督属性选择

6.1 粗糙集概述

6.2 基于依赖度的属性约简算法

6.3 基于耦合依赖度的属性选择算法DaulPOS

6.4 实验与分析

6.5 小结

第7章 总结与展望

7.1 主要工作总结

7.2 研究展望

参考文献

发表文章目录

致谢

展开▼

摘要

在机器学习领域中,聚类和属性选择问题已经成为分析数据的有效手段。聚类是无监督学习的基本技术,其目的是在没有数据先验信息下分析数据的结构。一般而言,一个好的聚类算法要遵循类内(Intra-class)对象相似度最大而类间(Inter-class)对象相似度最小的原则。属性选择是在属性全集中选择重要的属性去掉冗余的属性,在提高学习效率和预测精度,降低算法复杂度都有明显的效果。
   近年来,半监督学习成为一个研究热点,而其中的半监督聚类与半监督属性选择是重要研究内容。然而,绝大多数现有半监督聚类与半监督属性选择方法关注的是连续性属性数据,对符号属性数据相关研究还比较少。在现实应用中符号数据大量存在,因此符号属性数据的半监督聚类和属性选择是也是亟待研究的内容。本文对符号属性数据的半监督聚类与属性选择进行了研究,分别提出两种半监督聚类方法和半监督属性选择方法。
   基于聚类集成思想,提出了一种符号属性数据半监督聚类的集成策略。为了有效进行集成,构造了四种基于权重的投票策略去获得最终的聚类结果。此外,提出了一种分裂再组合的聚类方法,利用无监督和有监督信息的形成等价关系,将样本划分成一个个小的簇,然后再将这些小簇通过基于不同集簇间距离度量策略的层次聚类方法进行组合得到最终的聚类结果。
   受到监督学习中属性选择算法mRMR的启发,本文重新定义了半监督环境下的属性相关性和冗余性,构造一种最小冗余最大相关的符号数据半监督属性选择算法。此外,将粗糙集理论中传统的依赖度拓展到了半监督领域,提出了耦合依赖度的概念,它不仅可以度量条件属性对决策属性的依赖程度,还能度量条件属性间的冗余程度。基于耦合依赖度,构造了一种符号数据半监督属性选择算法。
   实验结果表明,所提出的半监督聚类和属性选择方法能有效实现符号属性数据半监督聚类和特征选择。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号