聚类方法
聚类方法的相关文献在1989年到2023年内共计3194篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、经济计划与管理
等领域,其中期刊论文234篇、会议论文21篇、专利文献10217846篇;相关期刊181种,包括人天科学研究、集团经济研究、中国经贸等;
相关会议21种,包括2013中国工程管理论坛、中国地球物理学会第二十九届年会、第六届(2011)中国管理学年会等;聚类方法的相关文献由7922位作者贡献,包括张涛、陈志军、周明伟等。
聚类方法—发文量
专利文献>
论文:10217846篇
占比:100.00%
总计:10218101篇
聚类方法
-研究学者
- 张涛
- 陈志军
- 周明伟
- 李鹏
- 陈立力
- 王磊
- 王亮
- 肖刚
- 陆佳炜
- 李学龙
- 孙艳丰
- 尹宝才
- 焦李成
- 张杰
- 徐俊
- 王琳
- 舒振球
- 赵瑞
- 胡永利
- 陈亮
- 马文萍
- 吴涵
- 徐慧英
- 朱信忠
- 王伟
- 王帅
- 赵建民
- 聂飞平
- 赵伟
- 刘永利
- 刘芳
- 张宏
- 李季檩
- 杨晓君
- 王杰
- 王爽
- 范洪辉
- 陈晋音
- 刘伟
- 刘新旺
- 刘洋
- 吴永坚
- 孙丽萍
- 徐静
- 杨杰
- 殷俊
- 王健宗
- 王刚
- 田国栋
- 肖亮
-
-
马莹莹;
吴幼龙;
唐华
-
-
摘要:
针对作者姓名歧义问题,提出基于特征编码和图嵌入的作者姓名消歧方法。该方法首先利用word2vec模型对文档的属性特征进行编码从而构建文档的表征向量,然后采用图自动编码器将文档关系编码至文档向量中,聚类相似文档。为进一步提升聚类结果的准确性,使用图嵌入的方法将文档关系网络和作者关系网络的拓扑结构信息引入文档向量,进一步聚集相关文档。该方法同时利用文档的属性特征以及多个关系网络的信息,通过无监督学习的方法寻找文档表征向量,实现良好的姓名消歧效果。在真实作者数据集AMiner上的测试结果表明,该方法显著优于目前几个其他基于图网络的方法。
-
-
孙永强;
陈建华;
张剑;
董胜君;
刘权钢;
刘青柏
-
-
摘要:
以201份西伯利亚杏种质为试材,根据枝、叶、果实、果核和果仁的45个表型性状,研究西伯利亚杏核心种质的最佳构建策略,筛选出核心种质。基于逐步聚类法,在25%取样比例下,通过3种取样方法,结合2种遗传距离和6种聚类方法筛选出36份核心种质,以筛选出的最佳构建策略进一步比较7种总体取样比例(15%、20%、25%、30%、35%、40%、45%)的构建效果以确定最适宜的总体取样比例。根据最佳构建策略和最适宜总体取样比例进行分组取样,比较分组取样与不分组整体取样的优劣。结果表明:在西伯利亚杏核心种质构建中,3种取样方法中优先取样法最优;2种遗传距离中欧式距离优于马氏距离;6种聚类方法比较表明,最长距离法优于UPGMA、WPGMA、可变类平均法、离差平方和法、最短距离法;20%是最适宜的总体取样比例;评价参数表明分组取样效果不如整体取样,不予采纳;核心种质样品分布图与原种质具有相似的分布结构,具有很好的代表性。“优先取样法+欧式距离+最长距离法+20%取样比例”进行整体取样是西伯利亚杏核心种质构建的最佳策略,构建的核心种质经过优化补充后共44份,为西伯利亚杏良种选育及高效利用奠定了基础。
-
-
游行键;
张建军
-
-
摘要:
国际游学市场随着经济发展不断扩大,高效率、高质量、个性化的游学路线规划成为顾客日益增长的需求,游学产品路线规划的质量亟需提高。本文将游学路线规划划分为两个阶段进行优化:(1)学校选择阶段,基于QS英国大学排名的数据集构建评价指标体系,采用聚类分析方法将数量众多的英国高校分成三类,以实现为不同人群提供相应的大学游学目标院校组;(2)游学路径优化,基于人群游学时间限制构建相应的路径规划模型,设计改良的遗传算法对游学路径进行优化。在使用自适应参数的遗传算法后,迭代500次左右可以稳定的达到最短的路线。基于以上两阶段规划方法,实证研究结果表明可以为学生和家长提供科学的个性化最优游学路线。
-
-
周冶;
王庆凯;
余刚
-
-
摘要:
针对钽铌选厂不同入选原矿的选矿结果差异开展了对入选原矿分类的研究。在物料平衡分析的基础上,以最小化物料平衡误差为目标,建立了面向所有生产环节物料变化系数的数学模型,并运用差分进化算法进行运算求解;根据求解出的不同入选原矿的物料变化系数,运用聚类的方法进行入选原矿的分类,确定不同类别入选原矿的物料变化系数。
-
-
付文杰;
尚晓明;
陈磊;
张军朝
-
-
摘要:
研究基于混合粒子群优化的智能电表计量多维数据聚类方法,提升智能电表计量数据的应用范围。依据智能电表计量数据间的关联性,提取数据的混沌特征。选取混沌系统中的Logisic映射方法优化粒子群优化算法建立混合粒子群优化算法。根据提取的混沌特征向量,改进粒子群优化算法的位置更新过程,调节系数控制混沌特征向量的扰动程度。利用混合粒子群优化算法优化K-means聚类算法,直至满足智能电表计量多维数据聚类的目标函数,输出智能电表计量多维数据聚类结果。实验结果表明,该方法有效聚类智能电表计量多维数据,直观展示智能电表计量数据中的电压、电量等数据,提升智能电表计量数据的应用性。
-
-
王晰巍;
刘婷艳;
程宇
-
-
摘要:
[目的/意义]本文通过构建直播带货平台用户的信息行为画像模型,以呈现直播平台用户信息行为规律,为直播带货平台用户信息行为画像分析提供相关的理论和研究方法,为直播带货平台的建设和发展提供一定的指导。[方法/过程]以直播带货平台的用户为研究对象,从用户信息使用行为特征、信息交互行为特征和用户购买行为特征3个维度构建直播带货平台用户信息行为画像模型。本文获取数据的途径为发布调查问卷,再运用因子分析和K-Means聚类分析方法,将直播带货中用户信息行为进行聚类分析。[结果/结论]研究结果表明,直播带货平台的群体用户信息行为可划分为交互型用户信息行为、消费型用户信息行为、狂热型用户信息行为和沉默型用户信息行为。
-
-
王新刚;
赵舫;
朱文君
-
-
摘要:
用户耗能的时空分布特性对于电网规划具有重要的参考价值,是电网建设的重要依据。电力运营商通过新型计量设备分析居民的用电行为,从而促进电网高效运营。针对区域用户画像问题,提出基于综合能源计量数据的区域用能特性分析方法。利用“多表合一”用能采集系统,引入用户的燃气消耗数据,基于层次聚类与自组织映射(self organized maps,SOM)聚类方法刻画用能特征分布,通过仿真实验说明所提方法在用能特性分析问题上具有实用价值,有利于挖掘高耗能区域,能帮助电力运营商制定规划方案。
-
-
伍珣;
刘嘉文;
李红佗;
李凯迪;
于天剑;
田睿;
赵俊栋
-
-
摘要:
为在换流阀外冷却系统设计初期快速选择合理的冷却方式,分析了影响冷却方式选择的当地气候环境和换流站设备条件等因素,构建基于堆叠异构的残差网络(SH⁃ResNet)模型用于对冷却方式进行分类,模型集成了有监督的分类器与无监督的聚类方法,并将ResNet作为元分类器,深度挖掘输出结果之间的潜在联系。通过研究近年来不同地区站点的气候环境、换流阀冷却系统需求、设备布置情况以及最终设计使用的冷却方式,总计209个样本数据对所提出模型进行训练与评估试验。结果表明:SH⁃ResNet的分类正确率达到0.97,相较于基础分类器平均提高了11.46%,可见,在样本集较小的情况下该模型保证了其强大的泛化能力,并提高了分类准确度。基于该模型的冷却方式推荐系统交互窗口的设计不仅给予了冷却方式的推荐占比,并可视化特征参数与冷却方式间的联系,为换流阀外冷却系统设计提供了一种最优化选型方法。
-
-
李明媚;
文成林;
胡绍林
-
-
摘要:
为解决现有k-modes聚类方法因忽略了变量属性之间的弱相关性,常造成其在实际应用中聚类性能不佳的问题,提出一种包含属性弱相关性的新k-modes聚类方法。引入最大信息系数(maximum information coefficient,MIC)度量数据集中变量属性之间的相关性;将得到的MIC值与原有距离进行融合,建立包含属性弱相关性信息的新度量方法,以增强变量属性间相关信息的完备性,建立更加精细的k-modes聚类方法;调用3种不同的数据集,将新方法与原有的k-modes聚类方法和其他改进k-modes聚类方法的性能进行对比,并通过仿真结果表明了新方法的有效性。
-
-
杨晓峰
-
-
摘要:
本文通过对商业销售记录流水分析,利用聚类方法,可以实现对商业客户的分类。本文以某航空公司客户分类为例,针对特征特点进行分类归一化,使用模糊C均值聚类方法实现对客户分类,并与使用Kmeans方法聚类的结果进行了对比。实验结果证明模糊C均值聚类方法更适用于商业客户分析。
-
-
-
- 《第四届全国信息检索与内容安全学术会议》
| 2008年
-
摘要:
文档聚类是实现话题检测与跟踪的重要方法.传统的硬聚类算法在处理边界数据时存在很大缺陷,影响话题检测的效果.针对这一问题,本文提出一种改进的基于容错粗糙集的聚类方法,利用某些文档特征项协同出现,构造特征项容错关系,扩充特征项的描述能力,最后用特征项容错类描述文档之间的相似关系,实现了话题检测与跟踪的过程.实验证明,该方法能够有效的处理边界数据,提高文本聚类的效果.
-
-
- 《2008年全国开放式分布与并行计算学术年会》
| 2008年
-
摘要:
现有的Web用户聚类方法都是通过对用户喜好页面的访问模式分析来建立用户聚类,没有充分考虑时间意识、用户兴趣、用户访问模式之间的关系与影响.针对这一问题,在时间意识的Web用户聚类基础之上,提出了基于兴趣度的Web用户聚类方法。通过对日志文件中的用户访问模式进行分析,计算用户兴趣度.结合渐进遗忘算法,对用户兴趣爱好进行调整与更新,并在此基础上对用户进行聚类.实验表明,本方法能够更好地分析用户访问模式,更准确地计算用户兴趣,具有更好的聚类效果.
-
-
-
詹仕凡;
陶春峰;
冉贤华
- 《中国地球物理学会第二十九届年会》
| 2013年
-
摘要:
以小段块断层带、碳酸盐溶洞以及生物礁等为代表的特殊地质体是石油勘探和地质学研究的重要方面,也是油气勘探的重要领域.本文提出了一种基于高斯混合模型的聚类分析方法.这种方法是一种非线性的、完全有数据驱动的方法,不需要用户提供精确地初始模型以及储层特征与地震属性和反演数据之间的先验信息.在实际应用中,对中国西部地区生物礁储层和大小断块进行识别.生物礁的边缘形态、骨架结构和内部的溶蚀空洞以及不同尺度的断块信息均都被准确地刻画出来.
-
-
-
李涵
- 《2010全国开放式分布与并行计算学术年会》
| 2010年
-
摘要:
入侵检测系统是一种积极主动的安全防护技术,它是信息安全保护体系结构中的一个重要组成部分.异常检测是入侵检测的一种方法,因其能够检测出未知的攻击而受到广泛的研究.以基于数据挖掘的异常检测技术为研究内容,以提高异常检测的检测率、降低误报率为目标,以聚类分析为主线,提出了一种改进的聚类检测算法和模型,并进行仿真实验.算法首先去除了数据集中明显的噪声和孤立点,通过分裂聚类、合并聚类以及利用超球体的密度半径确定k个初始聚类中心,以减小初始k值的选取对聚类结果造成的影响,提高异常检测效率,并以此构造入侵检测模型.利用KDD CUP 1999数据集对模型进行实验测试,并对改进算法的效果进行了对比和分析.实验证明,新的检测系统具有良好的性能.
-
-
-
郑国庆
- 《第二届中国分类技术及应用学术会议》
| 2007年
-
摘要:
目前已有大量关于聚类方法的研究.然而,绝大部分现有方法都要求输入簇的个数,该数目在很多情形下都无法事先确定.提出了一个能估计簇的个数的推广的K-means算法.新算法无需对不同的输入参数重复运行,而是在划分过程中分裂某些簇直到满足一定的终止条件.划分过程应用了Ward的最小方差方法(Ward's minimum variance method),最佳的簇个数则由一个基于组间方差的指标决定.实验结果表明,新算法不仅能正确估计实际的簇个数,而且运行效率高.
-