初始聚类中心
初始聚类中心的相关文献在1985年到2022年内共计227篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、轻工业、手工业
等领域,其中期刊论文203篇、会议论文6篇、专利文献84006篇;相关期刊117种,包括长春理工大学学报(自然科学版)、计算机工程、计算机工程与设计等;
相关会议6种,包括信息系统协会中国分会第六届学术年会、全国第26届计算机技术与应用学术会议、第23届过程控制会议等;初始聚类中心的相关文献由555位作者贡献,包括谢娟英、张嘉龙、马燕等。
初始聚类中心—发文量
专利文献>
论文:84006篇
占比:99.75%
总计:84215篇
初始聚类中心
-研究学者
- 谢娟英
- 张嘉龙
- 马燕
- 周爱武
- 张玉萍
- 张相芬
- 成颖
- 曹付元
- 顾洪博
- 于海涛
- 于雁春
- 侯向丹
- 刘建生
- 刘志伟
- 刘志镜
- 刘洪普
- 刘璇
- 刘钢
- 吕奇峰
- 吴夙慧
- 吴陈
- 周成成
- 孙棣华
- 屈亚楠
- 张姣
- 张桂珠
- 张玉芳
- 房博文
- 曾晶
- 朱凡
- 朱文霖
- 李传江
- 李宗辰
- 李宗鹏
- 李斌
- 李梓
- 李汉波
- 李顺宝
- 杨乐
- 梁吉业
- 潘云涛
- 熊忠阳
- 牟研娜
- 王向阳
- 王晓东
- 王朝辉
- 王泉
- 王渝
- 王纵虎
- 王越
-
-
毛森林;
夏镇;
耿新宇;
陈剑辉;
蒋宏霞
-
-
摘要:
传统的模糊C均值(Fuzzy C-means,FCM)算法对噪声数据敏感,并且在迭代过程中因仅考虑了距离因素,故使用欧氏距离进行距离度量,这会导致只考虑样本点之间的局部一致性特征,而忽略全局一致性特征的问题,为此,提出了一种基于密度敏感距离和模糊划分的改进FCM算法。首先在建立相似度矩阵时使用密度敏感距离替代欧氏距离来进行计算,然后在聚类过程中引入模糊熵作为约束条件,推导出新的聚类中心和具有高斯分布特性的隶属度计算公式。此外,针对传统FCM算法随机选取初始聚类中心可能导致聚类结果不稳定的问题,根据聚类中心点周围样本点比较密集以及聚类中心点之间距离较远两个原则,结合密度敏感距离来选取初始聚类中心点。最后通过实验对比表明,与传统FCM聚类算法及其派生算法相比,改进算法不仅具有更高的聚类性能和抗噪性,且收敛速度也显著提高。
-
-
刘思宏;
余飞;
姜勇
-
-
摘要:
大学生的个体因素直接影响着大学生的就业状况,分析个体内驱因素可以预测大学生求职的能力.该文利用改进的K-means算法对大学生就业内驱因素进行聚类分析,建立求职内驱因素路径数据模型,优化内驱因素路径,为就业指导教育和大学生求职能力提升提供参考.
-
-
郭文娟
-
-
摘要:
针对传统的K-means算法运行的结果依赖于初始的聚类数目和聚类中心,本文提出了一种基于优化初始聚类中心的K-means算法。该算法通过量化样本间距离和聚类的紧密性来确定聚类数目K值;根据数据集的分布特征来选取相距较远的数据作为初始聚类中心,避免了传统K-means算法的聚类数目和聚类中心的随机选取。UCI机器学习数据库数据集的实验证明,本文所提出的改进的聚类算法获得了良好的聚类效果,同时获得较高的聚类准确率。
-
-
李波;
管彦允;
龚维印;
韦旭勤;
薛端
-
-
摘要:
经典K-means算法在数据分布不均匀的情况下,随机选择初始聚类中心点会导致结果不稳定,文章针对上述问题提出了一种稳定算法。采用距离计算数据样本空间密度,令密度最大区域簇内误差平方和最小点作为第一个初始聚类中心,删除以该样本点为中心,平均距离为半径的数据集,对剩余数据集继续采用上述方法查找初始聚类中心,重复上述过程直至找到K个聚类中心点。使用UCI数据集和经典聚类算法实验结果进行对比,实验结果表明算法能够快速找到聚类初始区域中心点,避免随机初始中心点对算法的影响,从而提升聚类准确性和算法的稳定性。
-
-
刘璇;
高保禄;
王朝辉
-
-
摘要:
针对FCM算法在图像分割时存在选取初始聚类中心不佳与算法抗噪性差的问题,提出一种融合空间信息的改进FCM图像分割算法;首先采用了直方图算法和LOF算法自适应地选取初始聚类中心,之后使用马尔科夫随机场得到先验概率改进目标函数,使用修正隶属度矩阵的方法改进算法流程,最后使用改进算法进行图像分割;为验证该算法性能,使用Berkeley图像数据集作为实验数据,选取Dice系数、JS系数、SA系数、PSNR指数、运行时间及迭代次数作为评价标准;实验结果表明,该算法能够获取更优初始聚类中心,在处理不同噪声图像上有更好的鲁棒性。
-
-
简磊;
陈浩天;
喻胜洋
-
-
摘要:
阐述K-means算法是一种根据距离作为划分标准的经典聚类算法,应用广泛,但其对初始聚类中心的选取具有依赖性和较强敏感性等问题。为适应不同领域需求,可以根据数据集的特点对K-means算法进行改进。探讨对K-means算法在受力分析中的应用,采用基于受力面数据分布密度进行初始聚类中心设置的改进K-means算法,通过柔性压力传感器阵列采集人体臀部和腿部对坐凳坐垫受力面的压力数据,利用两种K-means算法对数据分别进行处理分析。实验结果表明,改进的K-means算法在分析结果准确率、稳定性方面优于传统K-means算法。
-
-
王森;
刘琛;
邢帅杰
-
-
摘要:
聚类分析是数据挖掘的重要技术,而在5G时代,海量的数据维度高、数据集大,利用K-means算法易受离群点的影响,且K值、初始聚类中心的选取影响聚类结果的稳定性和准确率,甚至导致聚类陷入局部最优,对K-means算法的改进受到众多研究者的关注。主要对K-means聚类的研究现状进行归纳总结。首先,介绍K-means算法的思想原理;其次,针对初始聚类中心点的选取、K值确定、离群点对现有改进算法进行基于密度和距离的分类总结,并对各个改进算法的优势和缺陷进行分析;最后对K-means算法未来可能的研究方向和趋势进行展望。
-
-
张轶;
高雪冬;
郭亚伟;
赵丙贺
-
-
摘要:
高校贫困生资助一直以来是社会关注的重点,但贫困生判别问题是一项较为复杂的社会问题。为了准确科学地判别贫困生,研究采用k-means算法对学生校园卡日常消费数据进行聚类,分析学生贫困程度。但传统k-means算法对初始聚类中心选取较为敏感,容易陷入局部最优解,各维特征的权重也相同。研究针对这些不足进行改进,提出了基于平均密度与最远距离的变异加权k-means算法,利用变异系数作为权值,将密度最大的点作为初始聚类中心点,迭代选出k个距离初始中心点集最远的点作为初始聚类中心。改进的算法具有较高的聚类精度,聚类结果也更加稳定。在UCI数据集上的实验结果表明,本文方法具有较好的识别准确性,从而验证了本文方法的有效性,进而实现了贫困生判别。
-
-
王治和;
王淑艳;
杜辉
-
-
摘要:
模糊C均值(FCM)聚类算法无法识别非凸数据,算法中基于欧式距离的相似性度量只考虑数据点之间的局部一致性特征而忽略了全局一致性特征.提出一种利用密度敏感距离度量创建相似度矩阵的FCM算法.通过近邻传播算法获取粗类数作为最佳聚类数的搜索范围上限,以解决FCM算法聚类数目需要人为预先设定和随机选定初始聚类中心造成聚类结果不稳定的问题.在此基础上,改进最大最小距离算法,得到具有代表性的样本点作为初始聚类中心,并结合轮廓系数自动确定最佳聚类数.基于UCI数据集和人工数据集的实验结果表明,相比经典FCM、K-means和CFSFDP算法,该算法不仅具有识别复杂非凸数据的能力,而且能够在保证聚类性能和稳定性的前提下加快收敛速度.
-
-
林丽;
薛芳
-
-
摘要:
传统K-means聚类算法通过欧式距离计算样本的相似度,将数据所有的属性特征均平等对待,忽略每个属性特征的不同贡献,导致样本相似度计算的准确率不高.针对这个不足,提出一种特征加权的K-means算法进行优化.首先,运用Softmax和Sigmoid逻辑回归函数计算特征权重,使得加权的欧式距离更能准确地表示样本相似度;其次,优化初始聚类中心选择策略,选择距离较大的K个样本作为初始聚类中心,可有效避免样本的错误聚类及空簇问题.实验结果表明,在UCI标准数据集中采用加权K-means聚类算法可以有效减少迭代次数,提高聚类的准确率、精确率和召回率.
-
-
关鹏;
王日芬;
张海永
- 《信息系统协会中国分会第六届学术年会》
| 2015年
-
摘要:
K-means聚类算法简单高效,适合处理大规模数据,在文本挖掘领域应用广泛,但算法对初始聚类中心的选择非常敏感.本文基于LDA主题模型提出一种优化K-means初始聚类中心的算法.首先通过LDA主题抽取降低文档特征向量维度,将文档映射到主题空间,通过文档的主题特征确定初始聚类中心的选择;然后,利用平均准确率、F-Score和熵作为文本聚类效果评价指标,对选取的初始聚类中心的聚类结果进行评价.选取标准的机器学习语料库20newsgroup中的数据集作为试验数据,实验结果表明该方法可以根据文本语义信息优化Kmeans初始聚类中心的选择,提高K-means文本聚类效果.
-
-
-
-
- 《第十四届全国图象图形学学术会议》
| 2008年
-
摘要:
本文针对纺织品彩色印花图案,基于L*a*b*颜色空间采用K均值聚类进行图像分割.在保证不改变印花图案的前提下,通过对印花图案图像进行缩略,得到缩略图,在缩略图上进行第一次聚类,获得第二次K均值聚类的初始聚类中心,再在原始印花图案图像上进行第二次K均值聚类,实现了印花图案的分割.实验结果表明,采用此二次聚类的方法,大大减少了K均值聚类的迭代次数,使聚类计算量和运行时间大大降低,并很好实现了对印花图案的颜色分割.
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
- 北京科技大学
- 公开公告日期:2020-08-28
-
摘要:
本发明提供一种针对微博评论文本的K‑means初始聚类中心确定方法,能够快速、准确地确定微博评论文本的最优初始聚类中心。所述方法包括:S1,从微博评论向量集合中选取被点赞过的评论加入到核心评论簇中,并按照评论点赞数从大到小,对核心评论簇中的评论进行排序;S2,选取排序后的核心评论簇中的第一个评论作为中心评论,计算中心评论与核心评论簇中的评论的距离;S3,将核心评论簇中与中心评论的距离小于设定距离阈值的评论删除,并将中心评论加入到初始聚类中心簇中;S4,返回继续执行S2和S3,直至核心评论簇中评论数为0,此时初始聚类中心簇中的评论为微博评论向量集合最终的初始聚类中心。本发明涉及网络通信技术领域。