聚类数
聚类数的相关文献在1989年到2022年内共计71篇,主要集中在自动化技术、计算机技术、机械、仪表工业、信息与知识传播
等领域,其中期刊论文62篇、会议论文2篇、专利文献26884篇;相关期刊43种,包括中国管理信息化、工程数学学报、计算机仿真等;
相关会议2种,包括2016年第27届中国过程控制会议 、2003年中国智能自动化会议等;聚类数的相关文献由184位作者贡献,包括周世兵、耿新青、唐旭清等。
聚类数—发文量
专利文献>
论文:26884篇
占比:99.76%
总计:26948篇
聚类数
-研究学者
- 周世兵
- 耿新青
- 唐旭清
- 徐振源
- 王正欧
- 余丽
- 侯苏
- 刘燕驰
- 史彩云
- 周强
- 周红芳
- 孙迁
- 彭虎
- 施斌
- 李旭
- 李朋
- 林伟
- 温金环
- 牟研娜
- 王渝
- 蔡振江
- 赵华茗
- 郭靖
- 钱雪忠
- QIN Huan
- YU Zuo-jun
- 丁心安
- 万静
- 于佐军
- 于剑
- 何云斌
- 何佩佩
- 何振峰
- 何馨依
- 余嘉元
- 侯彪
- 倪长健
- 公茂果
- 冯劲
- 刘刚
- 刘天华
- 刘小览
- 刘应波
- 刘志勇
- 刘汝琛
- 刘芝怡
- 刘若辰
- 刘雄英
- 刘雪娇
- 刘颖
-
-
耿新青;
王正欧
-
-
摘要:
针对传统模糊聚类算法需要预先确定初始隶属度矩阵的问题,该文提出了基于增量式模糊聚类算法(Incremental fuzzy clustering algorithm,FCLDA)的文本挖掘方法。首先根据文本集中关键词出现次数进行排序,优先选择出现次数多的关键词作为文本集的主题,然后利用隐含狄利克雷分布(Latent Dirichlet allocation,LDA)主题模型构建文档-主题概率分布组成矩阵,将该矩阵作模糊C均值聚类(FCM)算法的隶属度矩阵,并对隶属度矩阵的隶属度值增加一个权值,在FCLDA算法迭代过程中,采用模糊信息熵作为聚类数确定的标准,增加主题词,当模糊信息熵达到最小值时,聚类数确定下来,最后将FCLDA算法应用到网页的文本挖掘中,结果试验表明,相对于FCM算法和K最近邻(K-nearest neighbor)算法,FCLDA算法的运行聚类结果准确率更高,运行速度加快,更适合处理具有模糊性的文本。
-
-
张明珠;
曹杰;
王斌
-
-
摘要:
聚类数的确定在聚类分析中是一个基本却具有挑战性的问题.一方面,最佳聚类数根据不同的评价标准、用户偏好或需求可能不一致,因此将不同聚类数的聚类结果呈现给用户作参考是有意义的.另一方面,增加聚类数虽会使聚类结果更加紧致,却会削弱不同类之间的分离性,所以选择合适的聚类数是一个在最小化聚类数与最大化类内紧致性或类间分离性之间取得平衡的多目标优化问题.因此,在聚类数不确定的聚类问题中直接将聚类数作为一个优化目标与另一个反映类内紧致性的目标函数同时进行优化,利用新的基于精英集的多目标差分进化算法得到一个Pareto解集,集合中含有多个不同聚类数的近似最优聚类结果.实验结果验证了所提算法的可行性和有效性.
-
-
高波;
何振峰
-
-
摘要:
随着数据维度的增加,传统聚类算法会出现聚类性能差的现象.SubKMeans是一种功能强大的子空间聚类算法,旨在为K-Means类算法搜索出一个最佳子空间,降低高维度影响,但是该算法需要用户事先指定聚类数目K值,而在实际使用中有时无法给出准确的K值.针对这一问题,引入成对约束,将成对约束与轮廓系数进行结合,提出了一种基于成对约束的SubKMeans聚类数确定算法.改进后的轮廓系数能够更加准确的评价聚类性能,从而实现K值确定,实验结果证明该方法的有效性.
-
-
-
冯劲;
姚远
-
-
摘要:
针对模糊C-均值聚类分析(FCM)易陷入局部最小值以及对初始聚类中心敏感度过大的缺点,首先使用一种基于密度的DBSCAN算法,通过计算数据间距离与密度的方法确定聚类数,同时在遗传模拟退火算法(SAGA)的基础上,提出了基于多种群遗传模拟退火算法的聚类分析.首先对FCM进行分析与评价,提出FCM在确定聚类数与聚类过程方面的不足;然后针对FCM中的不足选择ST-DBSCAN算法确定聚类数,同时对遗传模拟退火算法进行研究,加人多种群并行遗传思想对遗传模拟退火算法进行优化;最后将FCM与多种群遗传模拟退火算法有机结合,优化聚类过程.实验结果表明,上述算法有较好的全局搜索能力与收敛能力,同时在聚类效果与稳定性上较传统聚类算法有一定的优势.
-
-
王艳娥;
梁艳;
司海峰;
丁心安
-
-
摘要:
针对聚类算法在实现的过程中需要预先设定最终聚类数目的问题,提出了基于同类全部样本的类内紧密度和类间离差度的一种新聚类有效性指标,通过该指标能够有效地确定数据集的最佳聚类簇数.在确定最佳聚类数的过程中采用K-means算法,针对K-means算法随机选择初始聚类中心的缺陷,提出以欧式距离度量样本相似度,基于样本方差,选出方差最小的前K个样本作为初始聚类中心,避免噪声点成为初始聚类中心,使得选择的初始聚类中心位于样本集稠密区域,K-means聚类的结果稳定有效.使用优化K-means算法和新的聚类有效性指标确定数据集的簇数,通过在UCI数据集和人工模拟数据集上测试,证明文本算法在球形且噪声点较少的样本集中,能够有效地找出最佳的类数且算法运行速度快.
-
-
靳雁霞;
齐欣;
张晋瑞;
程琦甫
-
-
摘要:
针对粒子群优化算法容易陷入局部最优且K-means算法受聚类数及初始聚类中心的选取影响较大,提出了一种改进的简化均值粒子群K-means优化聚类算法(ISMPSO-AKM).一方面,在简化粒子群算法的基础上,加入邻域最优粒子,由个体最优位置、全局最优位置及邻域最优位置线性组合改进位置公式.另一方面,构造一种基于余弦函数和对数函数的惯性权重,实现对惯性权重的动态调整.此外,引入AKM聚类算法确定聚类数,动态获取初始中心,进一步提高算法的准确性.仿真实验表明,改进的ISMPSO-AKM算法具有更快的收敛速度,更高的求解精度及更稳定的聚类结果.
-
-
耿嘉艺;
钱雪忠;
周世兵
-
-
摘要:
模糊聚类是模式识别、机器学习和图像处理等领域的重要研究内容.模糊C-均值聚类算法是最常用的模糊聚类实现算法.该算法需要预先给定聚类数才能对数据集进行聚类.提出了一种新的聚类有效性指标,对聚类结果进行有效性验证.该指标从划分熵、隶属度、几何结构角度,定义了紧凑度、分离度、重叠度三个重要特征测量.在此基础上,提出了一种最佳聚类数确定方法.将新聚类有效性指标与传统有效性指标在六个人工数据集和三个真实数据集进行实验验证.实验结果表明,所提出的指标和方法能够有效地对聚类结果进行评估,适合确定样本的最佳聚类数.
-
-
-
-
QIN Huan;
秦欢;
YU Zuo-jun;
于佐军
- 《2016年第27届中国过程控制会议》
| 2016年
-
摘要:
针对标准人工蜂群算法的缺点:搜索效率低、收敛速度慢,本文提出了一种改进的人工蜂群算法.通过引入算术交叉操作以及利用最优解指导搜索方向,显著增加了算法的收敛速度,在7个基准函数上的测试结果表明该算法拥有比其它五种智能算法更优越的效果.在此基础上,针对K-means算法的缺点,提出了基于改进蜂群算法优化聚类数的K-means算法,使得算法具备自动获得最佳聚类数的功能,在人工数据集和Iris数据集上的测试结果亦表明了算法的可行性.
-
-
于剑
- 《2003年中国智能自动化会议》
| 2003年
-
摘要:
对于许多聚类算法,决定合适的聚类数目至关重要,这称为聚类有效性问题.本文首次建立了聚类有效性与聚类算法稳定性之间的联系.主要思想是,聚类算法得到的结果越好,其稳定性就越高.据此,对应于聚类结果的目标函数的Hessian矩阵的条件数可以作为聚类有效性函数,简称稳定指标.数值实验表明,如果数据确定具有紧致球型的子类结构,模糊c均值算法的稳定指标在选择聚类数时性能较好.
-
-
-
-
-
-
- 湖州师范学院
- 公开公告日期:2021-04-16
-
摘要:
本公开提供一种知识库协调聚类最小簇数计算方法及装置。包括:给定完整性约束Φ、与Φ不协调的知识库K,通过调用已有的算法获得其极小不协调子集MIS(K∪{Φ})以及其所有问题公式集Pb(K,Φ),并构造模型决策变量集合X与模型辅助决策变量集合Y;根据X、Y以及MIS(K∪{Φ})构造二次整数规划约束C;令X之和构成二次整数规划目标函数Z,在满足二次整数规划约束C的条件下求解目标函数Z的最小值,得到变量指派集合,Pb(K,Φ)中每项公式在变量指派集合中对应的整数变量的值即可求得其公式的类别。针对不协调知识库,利用极小不协调子集,构建二次整数规划模型,最后求解二次整数规划模型获取完整的协调聚类簇及最小簇数。
-
-
-
-
-