基于判别信息和几何信息的聚类方法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

我们现在处于大数据时代，微信、微博等新媒体迅猛发展，我们不仅是数据的接收者，更是数据的发布者。图片、视频、音频、文字等信息遍布网络，大数据成为网络时代的资产。大数据本身既不是科学也不是技术，大数据的特点是数据数量巨大，价值密度低，实时在线，多源异构，我们希望从庞大的数据中获取有价值的信息，聚类是挖掘大数据资产价值的第一步，大数据突破点在于聚类。现有的机器学习聚类算法如谱聚类、双图聚类、特征选择聚类算法等都存在一定的局限性，传统的谱聚类算法忽略了数据集的判别信息，双图聚类算法没有考虑特征空间的几何信息，特征选择算法忽略了数据本身的自相似性等，聚类的准确率有待提高。因此，我们以聚类为主题，通过挖掘数据本身固有的结构如局部几何结构、全部判别结构，特征空间几何信息等信息对数据聚类。本论文的主要工作如下：
　　1）谱聚类算法建立在图论中的谱图理论基础上，将聚类问题转化为图的最优划分问题。已有学者证明在一定的条件下，谱聚类算法和非负矩阵分解（NMF）等价。在此基础上，已有的非负谱聚类算法NSC-Ncut、NSC-Rcut、NSSC-Ncut和NSSC-Rcut都没有考虑数据集的全局判别信息。基于谱聚类与NMF的等价关系，考虑到数据集的全局判别信息，我们提出了新的谱聚类算法，即基于全局判别的非负谱聚类算法（GDBNSC-Ncut和GDBNSC-Rcut）。新的谱聚类算法保留了数据集的全局几何结构和全局判别结构，获取了数据的内在几何结构，且有更强的判别能力，提高了聚类的质量。实验结果表明，该算法能获得数据集的全局判别信息，具有更好的聚类效果。
　　2）特征选择算法剔除了不相关和冗余的特征，保留最有代表性的特征，不仅能降低数据维数，还能提高算法的质量。现有的特征选择算法大都是在数据空间进行，本文提出了一种新的特征选择算法，即基于自表示的双图正则特征选择聚类算法（DFSC），运用数据可以由自身表示的特性，我们同时保留数据空间和特征空间的局部几何信息。通过对数据空间的自表示系数矩阵加以l2,1范数约束，DFSC算法可以有效地选择最具代表性的特征。实验结果表明，由于考虑了特征空间的信息，DFSC算法的聚类质量优于一些其他的特征选择算法。此外，DFSC算法和一些双图聚类算法相比，多了一个选择的过程，对比试验结果表明DFSC算法的聚类质量更高，选择判别性的特征有利于提高聚类质量。
　　3）特征选择算法被广泛用于高维数据的降维，考虑到高维数据的自表示特征，受流形学习思想的启发，我们提出了一种新的特征选择聚类算法，即基于自表示和局部保留的无监督特征选择聚类算法（SRLP-FS）。我们运用了高维数据可以由自身表示的特性，即每个特征属性可由相关特征属性的线性组合来表示的特性。自表示的系数矩阵可以用来保留特征空间的局部几何信息，我们对自表示的系数矩阵加以l2,1范数约束，SRLP-FS算法可以有效地选择最具代表性的特征。实验结果表明，由于考虑了数据集特征空间的局部几何信息，且运用了高维数据的自表示特性，SRLP-FS算法的聚类质量优于其他一些特征选择算法。

著录项

作者
张竹;
展开▼
作者单位

西安电子科技大学;

展开▼
授予单位西安电子科技大学;
学科电子科学与技术
授予学位硕士
导师姓名尚荣华;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类自动推理、机器学习;
关键词
几何信息; 特征选择; 判别信息; 机器学习; 数据挖掘;

相似文献

中文文献
外文文献
专利

1. 基于Solid Works的零件特征几何信息提取方法研究 [J] . 江征风 ,陈雷 ,丁毓峰 . 组合机床与自动化加工技术 . 2006,第005期
2. 基于K均值聚类算法的交通状态判别方法研究 [J] . 林璐 ,陈健 ,曲大义 . 青岛理工大学学报 . 2019,第004期
3. 基于聚类分析和Fisher判别分析的军用车辆器材分级方法研究 [J] . 张大鹏 ,孙亚东 ,张宪 . 物流技术 . 2010,第007期
4. 基于闭包的聚类判别方法研究 [J] . 彭晓琳 ,黄樟灿 ,朱洁 . 计算机工程与应用 . 2009,第018期
5. 基于广域状态信息和模糊C均值聚类的电网故障区域判别 [J] . 吴浩 ,李群湛 ,易东 . 电力自动化设备 . 2013,第007期
6. 基于K-均值聚类和Fisher判别分析的羌活种苗分级方法研究 [C] . 蒋舜媛 ,孙洪兵 ,朱文涛 . 中国生态学学会中药资源生态专业委员会第五次全国学术研讨会暨世界中医药联合会药用植物资源利用与保护专业委员会第二届学术年会 . 2014
7. 基于模糊聚类的交通状态判别方法研究 [A] . 孙兆军 . 2020

基于判别信息和几何信息的聚类方法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅