您现在的位置: 首页> 研究主题> 初始聚类中心

初始聚类中心

初始聚类中心的相关文献在1985年到2022年内共计227篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、轻工业、手工业 等领域,其中期刊论文203篇、会议论文6篇、专利文献84006篇;相关期刊117种,包括长春理工大学学报(自然科学版)、计算机工程、计算机工程与设计等; 相关会议6种,包括信息系统协会中国分会第六届学术年会、全国第26届计算机技术与应用学术会议、第23届过程控制会议等;初始聚类中心的相关文献由555位作者贡献,包括谢娟英、张嘉龙、马燕等。

初始聚类中心—发文量

期刊论文>

论文:203 占比:0.24%

会议论文>

论文:6 占比:0.01%

专利文献>

论文:84006 占比:99.75%

总计:84215篇

初始聚类中心—发文趋势图

初始聚类中心

-研究学者

  • 谢娟英
  • 张嘉龙
  • 马燕
  • 周爱武
  • 张玉萍
  • 张相芬
  • 成颖
  • 曹付元
  • 顾洪博
  • 于海涛
  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

    • 毛森林; 夏镇; 耿新宇; 陈剑辉; 蒋宏霞
    • 摘要: 传统的模糊C均值(Fuzzy C-means,FCM)算法对噪声数据敏感,并且在迭代过程中因仅考虑了距离因素,故使用欧氏距离进行距离度量,这会导致只考虑样本点之间的局部一致性特征,而忽略全局一致性特征的问题,为此,提出了一种基于密度敏感距离和模糊划分的改进FCM算法。首先在建立相似度矩阵时使用密度敏感距离替代欧氏距离来进行计算,然后在聚类过程中引入模糊熵作为约束条件,推导出新的聚类中心和具有高斯分布特性的隶属度计算公式。此外,针对传统FCM算法随机选取初始聚类中心可能导致聚类结果不稳定的问题,根据聚类中心点周围样本点比较密集以及聚类中心点之间距离较远两个原则,结合密度敏感距离来选取初始聚类中心点。最后通过实验对比表明,与传统FCM聚类算法及其派生算法相比,改进算法不仅具有更高的聚类性能和抗噪性,且收敛速度也显著提高。
    • 刘思宏; 余飞; 姜勇
    • 摘要: 大学生的个体因素直接影响着大学生的就业状况,分析个体内驱因素可以预测大学生求职的能力.该文利用改进的K-means算法对大学生就业内驱因素进行聚类分析,建立求职内驱因素路径数据模型,优化内驱因素路径,为就业指导教育和大学生求职能力提升提供参考.
    • 郭文娟
    • 摘要: 针对传统的K-means算法运行的结果依赖于初始的聚类数目和聚类中心,本文提出了一种基于优化初始聚类中心的K-means算法。该算法通过量化样本间距离和聚类的紧密性来确定聚类数目K值;根据数据集的分布特征来选取相距较远的数据作为初始聚类中心,避免了传统K-means算法的聚类数目和聚类中心的随机选取。UCI机器学习数据库数据集的实验证明,本文所提出的改进的聚类算法获得了良好的聚类效果,同时获得较高的聚类准确率。
    • 李波; 管彦允; 龚维印; 韦旭勤; 薛端
    • 摘要: 经典K-means算法在数据分布不均匀的情况下,随机选择初始聚类中心点会导致结果不稳定,文章针对上述问题提出了一种稳定算法。采用距离计算数据样本空间密度,令密度最大区域簇内误差平方和最小点作为第一个初始聚类中心,删除以该样本点为中心,平均距离为半径的数据集,对剩余数据集继续采用上述方法查找初始聚类中心,重复上述过程直至找到K个聚类中心点。使用UCI数据集和经典聚类算法实验结果进行对比,实验结果表明算法能够快速找到聚类初始区域中心点,避免随机初始中心点对算法的影响,从而提升聚类准确性和算法的稳定性。
    • 刘璇; 高保禄; 王朝辉
    • 摘要: 针对FCM算法在图像分割时存在选取初始聚类中心不佳与算法抗噪性差的问题,提出一种融合空间信息的改进FCM图像分割算法;首先采用了直方图算法和LOF算法自适应地选取初始聚类中心,之后使用马尔科夫随机场得到先验概率改进目标函数,使用修正隶属度矩阵的方法改进算法流程,最后使用改进算法进行图像分割;为验证该算法性能,使用Berkeley图像数据集作为实验数据,选取Dice系数、JS系数、SA系数、PSNR指数、运行时间及迭代次数作为评价标准;实验结果表明,该算法能够获取更优初始聚类中心,在处理不同噪声图像上有更好的鲁棒性。
    • 简磊; 陈浩天; 喻胜洋
    • 摘要: 阐述K-means算法是一种根据距离作为划分标准的经典聚类算法,应用广泛,但其对初始聚类中心的选取具有依赖性和较强敏感性等问题。为适应不同领域需求,可以根据数据集的特点对K-means算法进行改进。探讨对K-means算法在受力分析中的应用,采用基于受力面数据分布密度进行初始聚类中心设置的改进K-means算法,通过柔性压力传感器阵列采集人体臀部和腿部对坐凳坐垫受力面的压力数据,利用两种K-means算法对数据分别进行处理分析。实验结果表明,改进的K-means算法在分析结果准确率、稳定性方面优于传统K-means算法。
    • 王森; 刘琛; 邢帅杰
    • 摘要: 聚类分析是数据挖掘的重要技术,而在5G时代,海量的数据维度高、数据集大,利用K-means算法易受离群点的影响,且K值、初始聚类中心的选取影响聚类结果的稳定性和准确率,甚至导致聚类陷入局部最优,对K-means算法的改进受到众多研究者的关注。主要对K-means聚类的研究现状进行归纳总结。首先,介绍K-means算法的思想原理;其次,针对初始聚类中心点的选取、K值确定、离群点对现有改进算法进行基于密度和距离的分类总结,并对各个改进算法的优势和缺陷进行分析;最后对K-means算法未来可能的研究方向和趋势进行展望。
    • 张轶; 高雪冬; 郭亚伟; 赵丙贺
    • 摘要: 高校贫困生资助一直以来是社会关注的重点,但贫困生判别问题是一项较为复杂的社会问题。为了准确科学地判别贫困生,研究采用k-means算法对学生校园卡日常消费数据进行聚类,分析学生贫困程度。但传统k-means算法对初始聚类中心选取较为敏感,容易陷入局部最优解,各维特征的权重也相同。研究针对这些不足进行改进,提出了基于平均密度与最远距离的变异加权k-means算法,利用变异系数作为权值,将密度最大的点作为初始聚类中心点,迭代选出k个距离初始中心点集最远的点作为初始聚类中心。改进的算法具有较高的聚类精度,聚类结果也更加稳定。在UCI数据集上的实验结果表明,本文方法具有较好的识别准确性,从而验证了本文方法的有效性,进而实现了贫困生判别。
    • 王治和; 王淑艳; 杜辉
    • 摘要: 模糊C均值(FCM)聚类算法无法识别非凸数据,算法中基于欧式距离的相似性度量只考虑数据点之间的局部一致性特征而忽略了全局一致性特征.提出一种利用密度敏感距离度量创建相似度矩阵的FCM算法.通过近邻传播算法获取粗类数作为最佳聚类数的搜索范围上限,以解决FCM算法聚类数目需要人为预先设定和随机选定初始聚类中心造成聚类结果不稳定的问题.在此基础上,改进最大最小距离算法,得到具有代表性的样本点作为初始聚类中心,并结合轮廓系数自动确定最佳聚类数.基于UCI数据集和人工数据集的实验结果表明,相比经典FCM、K-means和CFSFDP算法,该算法不仅具有识别复杂非凸数据的能力,而且能够在保证聚类性能和稳定性的前提下加快收敛速度.
    • 林丽; 薛芳
    • 摘要: 传统K-means聚类算法通过欧式距离计算样本的相似度,将数据所有的属性特征均平等对待,忽略每个属性特征的不同贡献,导致样本相似度计算的准确率不高.针对这个不足,提出一种特征加权的K-means算法进行优化.首先,运用Softmax和Sigmoid逻辑回归函数计算特征权重,使得加权的欧式距离更能准确地表示样本相似度;其次,优化初始聚类中心选择策略,选择距离较大的K个样本作为初始聚类中心,可有效避免样本的错误聚类及空簇问题.实验结果表明,在UCI标准数据集中采用加权K-means聚类算法可以有效减少迭代次数,提高聚类的准确率、精确率和召回率.
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号