子空间聚类
子空间聚类的相关文献在2005年到2022年内共计255篇,主要集中在自动化技术、计算机技术、旅游经济、无线电电子学、电信技术
等领域,其中期刊论文160篇、会议论文8篇、专利文献139306篇;相关期刊79种,包括系统工程与电子技术、西安交通大学学报、计算机工程等;
相关会议7种,包括2016中国计算机辅助设计与图形学会大会、第二十五届中国数据库学术会议(NDBC2008)、第六届中国Rough集与软计算学术研讨会(CRSSC'2006)等;子空间聚类的相关文献由687位作者贡献,包括孙艳丰、胡永利、尹宝才等。
子空间聚类—发文量
专利文献>
论文:139306篇
占比:99.88%
总计:139474篇
子空间聚类
-研究学者
- 孙艳丰
- 胡永利
- 尹宝才
- 尹明
- 王丽娟
- 王卫卫
- 吴小俊
- 夏佳志
- 张强
- 李小平
- 王士同
- 由从哲
- 蒋广
- 赫然
- 陈晓云
- 陈谊
- 周晓云
- 唐启凡
- 夏靖波
- 孙广路
- 孙志挥
- 彭冲
- 景丽萍
- 涂志辉
- 温雯
- 牛琨
- 王秀美
- 田帅
- 祝恩
- 简彩仁
- 罗亮
- 胡文玉
- 蔡瑞初
- 谭铁牛
- 郝志峰
- 陈少敏
- 陈程立诏
- 黄哲学
- 丁世飞
- 万士宁
- 于晓洋
- 何士豪
- 何振峰
- 侯成浩
- 刘小兰
- 刘惊雷
- 刘玉贤
- 刘青山
- 单世民
- 卢孝强
-
-
吴峰;
刘改;
刘诗仪
-
-
摘要:
多视角子空间聚类方法通常用于处理高维度、复杂结构的数据.现有的大多数多视角子空间聚类方法通过挖掘潜在图信息进行数据分析与处理,但缺乏对潜在子空间表示的监督过程.针对这一问题,本文提出一种新的多视角子空间聚类方法,即基于图信息的自监督多视角子空间聚类(SMSC).它将谱聚类与子空间表示相结合形成统一的深度学习框架.SMSC首先通过挖掘多视角数据的一阶图和二阶图构成潜在图信息,其次利用聚类结果监督多个视角的公共潜在子空间学习过程.通过在4个标准数据集上进行的广泛实验,结果验证本文所提方法相较于传统的多视角子空间聚类方法更具有效性.
-
-
李凯;
张可心
-
-
摘要:
利用信息熵或模糊熵确定子空间聚类中每个簇的不同特征,较好地解决了高维数据的子空间聚类.为了进一步提高聚类算法的性能,将权向量的负结构α-熵引入到高斯混合模型中,获得了结构α-熵的加权高斯混合的子空间聚类模型,提出了结构α-熵的加权高斯混合模型的子空间聚类算法SEWMM(Structuralα-Entropy Weighting Mixture Model),该算法不仅可以发现高维数据空间中位于不同子空间的簇,而且能够获得子空间中具有不同形状体积的簇.同时,进一步分析了算法的收敛性与时间复杂性.通过选取UCI(University of California,Irvine)标准数据集及图像数据集,对提出的算法SEWMM进行了实验,并与一些典型的聚类算法进行了比较,表明了提出的算法在总体性能上具有一定的提升.
-
-
范莉莉;
卢桂馥;
唐肝翌;
杨丹
-
-
摘要:
针对低秩表示(LRR)子空间聚类算法没有考虑数据局部结构,在学习中可能会造成局部相似信息丢失的问题,提出了一种基于Hessian正则化和非负约束的低秩表示子空间聚类算法(LRR-HN),用来探索数据的全局结构和局部结构。首先,利用Hessian正则化良好的推测能力来保持数据的局部流形结构,使数据局部拓扑结构的表达能力更强;其次,考虑到获得的系数矩阵往往有正有负,而负值往往没有实际意义的特点,引入非负约束来保证模型解的有效性,使其在数据局部结构描述上更有意义;最后,通过最小化核范数寻求数据全局结构的低秩表示,从而更好地聚类高维数据。此外,利用自适应惩罚的线性交替方向法设计了一种求解LRR-HN的有效算法,并在一些真实数据集上,采用正确率(AC)和归一化互信息(NMI)对所提出的算法进行了评估。在ORL数据集上聚类数目为20时的实验中,LRR-HN与LRR算法相比,AC和NMI分别提高了11%和9.74%;与自适应低秩表示(ALRR)算法相比,AC和NMI分别提高了5%和1.05%。实验结果表明,LRR-HN与现有的一些算法相比,AC和NMI均有较大的提升,有较好的聚类性能。
-
-
汪巧萍;
陈晓云
-
-
摘要:
无监督极限学习机在投影过程中保持原始高维空间中的稀疏或近邻结构,样本在高维空间中存在冗余信息,原始的数据结构不一定适应于投影后的低维特征空间.为此,结合无监督极限学习机和子空间聚类的自表示学习,提出投影自表示无监督极限学习机模型.该模型是面向聚类的特征提取方法,在投影过程中学习自表示子空间结构,从而使无监督极限学习机提取的特征自适应于聚类任务.在IRIS数据集、6个基因表达和2个医学影像高维数据集上进行实验,结果表明该模型和算法是有效的.
-
-
尹明;
吴浩杨;
谢胜利;
杨其宇
-
-
摘要:
子空间聚类(Subspace clustering)是一种当前较为流行的基于谱聚类的高维数据聚类框架.近年来,由于深度神经网络能够有效地挖掘出数据深层特征,其研究倍受各国学者的关注.深度子空间聚类旨在通过深度网络学习原始数据的低维特征表示,计算出数据集的相似度矩阵,然后利用谱聚类获得数据的最终聚类结果.然而,现实数据存在维度过高、数据结构复杂等问题,如何获得更鲁棒的数据表示,改善聚类性能,仍是一个挑战.因此,本文提出基于自注意力对抗的深度子空间聚类算法(SAADSC).利用自注意力对抗网络在自动编码器的特征学习中施加一个先验分布约束,引导所学习的特征表示更具有鲁棒性,从而提高聚类精度.通过在多个数据集上的实验,结果表明本文算法在精确率(ACC)、标准互信息(NMI)等指标上都优于目前最好的方法.
-
-
王英博;
韩国淼;
王铭泽
-
-
摘要:
为了降低数据稀疏性对推荐算法效率产生的影响,提出一种基于子空间聚类的协同过滤推荐算法(SCUCF)。该算法创建感兴趣、不感兴趣以及既不感兴趣也不不感兴趣三种类型被评价项目的不同子空间。利用项目子空间为目标用户绘制邻居用户树,以此来寻找目标用户的邻居。利用改进的用户相似性计算方法来确定推荐用户。通过MovieLens 100K、MovieLens 1M数据集对算法进行了验证,实验结果表明,该算法能够使推荐算法的推荐性能得到提升。并且,在与其他同类改进算法相比,该算法也表现出一定的优越性。
-
-
杨暄皓;
潘柏丞;
蔡松岳
-
-
摘要:
本文在基于张量的多视图聚类算法中引入自适应近邻约束,提出了一种自适应图近邻的张量低秩表示(LRTRAGN)模型,使得该模型既能利用视图间的空间高维信息,又能较好地利用局部图的特征。随后,本文对该模型的优化提出了一种迭带算法。最后,该方法在多个真实数据集上与多种先进算法就聚类表现进行对比,表现出了该方法的优越性。
-
-
郁万蓉
-
-
摘要:
提出了一种新的深度子空间聚类方法,使用了卷积自编码器将输入图像转换为位于线性子空间上的表示。通过结合自编码器提取的低阶和高阶信息来促进特征学习过程,在编码器的不同层级生成多组自我表示和信息表示。将得到的多级信息融合得到统一的系数矩阵并用于后续的聚类。通过多组实验验证了上述创新的有效性,在三个经典数据集:Coil20,ORL和Extended Yale B上,聚类精度分别达到95.38%、87.25%以及97.58%。相较于其他主流方法,能有效提高聚类准确性,并具有较强的鲁棒性。
-
-
荆雪纯;
赵鹏;
崔志华
-
-
摘要:
近年来,基于谱聚类的子空间聚类算法由于其广泛的应用而备受关注.但是,随着数据量的增加,传统方法的时间成本也越来越高.为了提高效率,我们为稀疏子空间聚类提出了一种基于信息传递的统一框架.该框架主要由两个阶段组成.首先,通过采样选择少量的数据点,利用传统方法计算出部分数据的表示系数.在第二阶段,通过信息传递而非传统方式计算出剩余数据的表示系数,从而提高效率.因此,这两部分集成在一起构成完整的表示系数矩阵,传到谱聚类中以获得聚类结果.此框架具有灵活性和可扩展性.它既可以选择不同的采样方法,还可以扩展到其他子空间聚类算法.在COIL-20和YaleBCrop025数据集上的实验结果证实,此框架不仅可以提高效率,而且可以保证聚类精度.
-
-
唐科威;
林栋;
张楠
-
-
摘要:
近年来,基于谱聚类的子空间聚类方法成为研究热点.由于表示系数矩阵的块对角性能带来亲和矩阵的块对角性,它对于许多基于谱聚类的方法如低秩表示等起着核心作用.因此,基于块对角划分的子空间聚类被提出,但是块对角正则项的运用使得该方法需要添加非负与对称的限制条件,这样会限制表示系数矩阵挖掘数据之间关系的能力.为了解决这个问题,对亲和矩阵使用块对角正则项,提出基于亲和矩阵块对角性的子空间聚类方法.该方法在不限制表示系数矩阵表示能力的同时还保证了亲和矩阵的块对角性.但是对亲和矩阵进行惩罚会使得模型不易求解,幸运的是顺利地求解了模型,并在多个数据集上进行实验,验证了所提出方法的有效性.
-
-
-
- 《第二十五届中国数据库学术会议(NDBC2008)》
| 2008年
-
摘要:
随着聚类技术应用范围的不断扩大,传统的聚类方法已不能满足对高维数据的分析要求.对高维数据的聚类分析,要求算法不仅要发现簇,而且还要发现存在簇的子空间.使用子空间聚类策略,通过数据分布差异度的概念来描述子空间上数据分布的密集性,提出了一种新的子空间聚类算法SCDDD.该算法能够满足对高维数据的聚类分析要求,而且能够发现任意形状的簇.实验结果表明算法的聚类精度较高,算法时间随相关维度的增加基本呈线性增长.最后将SCDDD算法应用于一个真实的数据集Food,我们发现了有趣的簇和存在这些簇的子空间.
-
-
甘杨兰;
王浩;
杨静;
姚宏亮
- 《第六届中国Rough集与软计算学术研讨会(CRSSC'2006)》
| 2006年
-
摘要:
聚类就是将数据对象分组成为多个类或簇,在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大.聚类技术在数据挖掘、统计学、机器学习等领域都有广泛的应用.然而对高维数据聚类存在着"维数灾难"问题,并且许多对象只在某些属性上相似.为了解决这一问题,可采用子空间聚类(subspace clustering)将高维空间的数据投影到子空间中再进行聚类.本文探讨基于模式树的高维数据快速子空间聚类算法。
-
-
景丽萍;
香港大学数学系;
高阳;
吴国宝;
黄哲学;
李俊杰
- 《2005第一届中国分类技术与应用研讨会(CSCA)》
| 2005年
-
摘要:
文本聚类是利用聚类技术对大量的文本数据进行分析,把内容相似的文本放在同一个集合.针对基于k-means特征加权算法用于文本子空间聚类的性能进行了一系列的实验研究与分析,并验证得出该算法具有可伸缩性与快速收敛性.文本子空间聚类算法的提出是针对文本数据的两大特点:高维与稀疏性.该算法基于传统的k-means聚类方法,将特征加权加入到k-means迭代的过程中.在聚类文本的同时,对文本集所包含的单词(特征)也进行聚类.特征加权对每一类的所有单词进行评估,并为每个单词赋予权重.这些权重值可用来从文本向量空间中鉴别出文本类别,并且为每一类别提取出相关联的可表达语义的重要特征单词.通过一系列的实际数据实验,得出以下结论:该算法聚类精度高;随着文档数目、单词数目和类别数目的变化,该算法的时间复杂度呈线性变化;同时该算法能快速收敛。
-
-
黄哲学;
徐军;
景丽萍;
高阳;
叶允明;
李雄飞
- 《2005第一届中国分类技术与应用研讨会(CSCA)》
| 2005年
-
摘要:
k-均值是著名的聚类算法,被广泛应用在诸多领域.经过多年发展,原始的MacQueenk-均值算法已经衍生出多种变形,构成了k-均值算法家族.首先回顾k-均值家族重要成员:k-均值(k-means)、k-模(k-modes)、k-原型(k-prototypes)算法和它们的模糊版本,然后提出两个新成员--变量自动加权的k-均值算法,并讨论它们在子空间聚类中的应用.文本数据的实验结果表明,变量自动加权的k-均值算法在分类精度上优于传统的k-均值算法和二分式k-均值算法(bisectionk-means),并能通过权重值识别表达每个聚类簇意义的
-
-
方晨;
王智慧;
周向东;
周皓峰;
汪卫;
施伯乐
- 《第二十三届中国数据库学术会议(NDBC2006)》
| 2006年
-
摘要:
聚类分析作为一种重要的非指导学习方法,在多媒体数据管理中得到越来越多的应用,如对图像进行聚类预处理,有助于发现图像之间的语义相似性、减少检索代价等.但是,由于图像语义与视觉特征之间的差异,使得图像聚类的效果还有待进一步提高.聚类分析中,图像通常用高维特征向量表示,显然,在描述图像的相似性方面,各个维所代表的视觉特征的重要性是不一样的,甚至彼此矛盾.传统方法通过权重调整或降维并不能很好地解决上述问题.本文提出一种新的动态子空间距离计算公式(DSDF),根据任意两幅图像之间关联比较密切的维度,计算出图像之间的相似子空间距离,并利用Clarans聚类算法进行图像子空间聚类.实验表明,该方法在图像聚类效果上明显优于传统聚类方法.
-
-
-
Luo Yangxia;
罗养霞;
Ma Di;
马迪;
Chang Yanshuo;
常言说
- 《2018年全国高性能计算学术年会》
| 2018年
-
摘要:
数据的复杂和多样性使得对大数据处理和分析能力有更高的要求.流形聚类在数据挖掘中取得显著的成功.传统的聚类算法由于参数的调节一般依赖于经验,或者因参数调节的盲目性和随机性,而使得算法失效或复杂度较高.论文研究基于参数改变的差异函数谱聚类,通过构造相似性矩阵,多个主成分分析器估计局部切空间,并通过参数传递标签PT_label()来标记参数,基于PID(Proportional-Integral-Differential)调节和控制模型逼近过程,当逼近局部切空间时,按当前最优参数传递做为初始值,以误差和误差变化率为输出,按三维向量调节模型参数,应用ZN法(Ziegler-Nichols)向两边扩展搜索空间,直到获得合理结果.约束聚类算法参数调节过程,使其与结果进行反馈,改进聚类算法的精确性和复杂度.经在合成数据和真实数据不同类型数据特征集进行检测,可获得较好的聚类性能.
-
-
Luo Yangxia;
罗养霞;
Ma Di;
马迪;
Chang Yanshuo;
常言说
- 《2018年全国高性能计算学术年会》
| 2018年
-
摘要:
数据的复杂和多样性使得对大数据处理和分析能力有更高的要求.流形聚类在数据挖掘中取得显著的成功.传统的聚类算法由于参数的调节一般依赖于经验,或者因参数调节的盲目性和随机性,而使得算法失效或复杂度较高.论文研究基于参数改变的差异函数谱聚类,通过构造相似性矩阵,多个主成分分析器估计局部切空间,并通过参数传递标签PT_label()来标记参数,基于PID(Proportional-Integral-Differential)调节和控制模型逼近过程,当逼近局部切空间时,按当前最优参数传递做为初始值,以误差和误差变化率为输出,按三维向量调节模型参数,应用ZN法(Ziegler-Nichols)向两边扩展搜索空间,直到获得合理结果.约束聚类算法参数调节过程,使其与结果进行反馈,改进聚类算法的精确性和复杂度.经在合成数据和真实数据不同类型数据特征集进行检测,可获得较好的聚类性能.
-
-
Luo Yangxia;
罗养霞;
Ma Di;
马迪;
Chang Yanshuo;
常言说
- 《2018年全国高性能计算学术年会》
| 2018年
-
摘要:
数据的复杂和多样性使得对大数据处理和分析能力有更高的要求.流形聚类在数据挖掘中取得显著的成功.传统的聚类算法由于参数的调节一般依赖于经验,或者因参数调节的盲目性和随机性,而使得算法失效或复杂度较高.论文研究基于参数改变的差异函数谱聚类,通过构造相似性矩阵,多个主成分分析器估计局部切空间,并通过参数传递标签PT_label()来标记参数,基于PID(Proportional-Integral-Differential)调节和控制模型逼近过程,当逼近局部切空间时,按当前最优参数传递做为初始值,以误差和误差变化率为输出,按三维向量调节模型参数,应用ZN法(Ziegler-Nichols)向两边扩展搜索空间,直到获得合理结果.约束聚类算法参数调节过程,使其与结果进行反馈,改进聚类算法的精确性和复杂度.经在合成数据和真实数据不同类型数据特征集进行检测,可获得较好的聚类性能.