您现在的位置: 首页> 研究主题> 聚类方法

聚类方法

聚类方法的相关文献在1989年到2023年内共计3194篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、经济计划与管理 等领域,其中期刊论文234篇、会议论文21篇、专利文献10217846篇;相关期刊181种,包括人天科学研究、集团经济研究、中国经贸等; 相关会议21种,包括2013中国工程管理论坛、中国地球物理学会第二十九届年会、第六届(2011)中国管理学年会等;聚类方法的相关文献由7922位作者贡献,包括张涛、陈志军、周明伟等。

聚类方法—发文量

期刊论文>

论文:234 占比:0.00%

会议论文>

论文:21 占比:0.00%

专利文献>

论文:10217846 占比:100.00%

总计:10218101篇

聚类方法—发文趋势图

  • 期刊论文
  • 会议论文
  • 专利文献

搜索

排序:

年份

作者

    • 马莹莹; 吴幼龙; 唐华
    • 摘要: 针对作者姓名歧义问题,提出基于特征编码和图嵌入的作者姓名消歧方法。该方法首先利用word2vec模型对文档的属性特征进行编码从而构建文档的表征向量,然后采用图自动编码器将文档关系编码至文档向量中,聚类相似文档。为进一步提升聚类结果的准确性,使用图嵌入的方法将文档关系网络和作者关系网络的拓扑结构信息引入文档向量,进一步聚集相关文档。该方法同时利用文档的属性特征以及多个关系网络的信息,通过无监督学习的方法寻找文档表征向量,实现良好的姓名消歧效果。在真实作者数据集AMiner上的测试结果表明,该方法显著优于目前几个其他基于图网络的方法。
    • 孙永强; 陈建华; 张剑; 董胜君; 刘权钢; 刘青柏
    • 摘要: 以201份西伯利亚杏种质为试材,根据枝、叶、果实、果核和果仁的45个表型性状,研究西伯利亚杏核心种质的最佳构建策略,筛选出核心种质。基于逐步聚类法,在25%取样比例下,通过3种取样方法,结合2种遗传距离和6种聚类方法筛选出36份核心种质,以筛选出的最佳构建策略进一步比较7种总体取样比例(15%、20%、25%、30%、35%、40%、45%)的构建效果以确定最适宜的总体取样比例。根据最佳构建策略和最适宜总体取样比例进行分组取样,比较分组取样与不分组整体取样的优劣。结果表明:在西伯利亚杏核心种质构建中,3种取样方法中优先取样法最优;2种遗传距离中欧式距离优于马氏距离;6种聚类方法比较表明,最长距离法优于UPGMA、WPGMA、可变类平均法、离差平方和法、最短距离法;20%是最适宜的总体取样比例;评价参数表明分组取样效果不如整体取样,不予采纳;核心种质样品分布图与原种质具有相似的分布结构,具有很好的代表性。“优先取样法+欧式距离+最长距离法+20%取样比例”进行整体取样是西伯利亚杏核心种质构建的最佳策略,构建的核心种质经过优化补充后共44份,为西伯利亚杏良种选育及高效利用奠定了基础。
    • 游行键; 张建军
    • 摘要: 国际游学市场随着经济发展不断扩大,高效率、高质量、个性化的游学路线规划成为顾客日益增长的需求,游学产品路线规划的质量亟需提高。本文将游学路线规划划分为两个阶段进行优化:(1)学校选择阶段,基于QS英国大学排名的数据集构建评价指标体系,采用聚类分析方法将数量众多的英国高校分成三类,以实现为不同人群提供相应的大学游学目标院校组;(2)游学路径优化,基于人群游学时间限制构建相应的路径规划模型,设计改良的遗传算法对游学路径进行优化。在使用自适应参数的遗传算法后,迭代500次左右可以稳定的达到最短的路线。基于以上两阶段规划方法,实证研究结果表明可以为学生和家长提供科学的个性化最优游学路线。
    • 周冶; 王庆凯; 余刚
    • 摘要: 针对钽铌选厂不同入选原矿的选矿结果差异开展了对入选原矿分类的研究。在物料平衡分析的基础上,以最小化物料平衡误差为目标,建立了面向所有生产环节物料变化系数的数学模型,并运用差分进化算法进行运算求解;根据求解出的不同入选原矿的物料变化系数,运用聚类的方法进行入选原矿的分类,确定不同类别入选原矿的物料变化系数。
    • 付文杰; 尚晓明; 陈磊; 张军朝
    • 摘要: 研究基于混合粒子群优化的智能电表计量多维数据聚类方法,提升智能电表计量数据的应用范围。依据智能电表计量数据间的关联性,提取数据的混沌特征。选取混沌系统中的Logisic映射方法优化粒子群优化算法建立混合粒子群优化算法。根据提取的混沌特征向量,改进粒子群优化算法的位置更新过程,调节系数控制混沌特征向量的扰动程度。利用混合粒子群优化算法优化K-means聚类算法,直至满足智能电表计量多维数据聚类的目标函数,输出智能电表计量多维数据聚类结果。实验结果表明,该方法有效聚类智能电表计量多维数据,直观展示智能电表计量数据中的电压、电量等数据,提升智能电表计量数据的应用性。
    • 王晰巍; 刘婷艳; 程宇
    • 摘要: [目的/意义]本文通过构建直播带货平台用户的信息行为画像模型,以呈现直播平台用户信息行为规律,为直播带货平台用户信息行为画像分析提供相关的理论和研究方法,为直播带货平台的建设和发展提供一定的指导。[方法/过程]以直播带货平台的用户为研究对象,从用户信息使用行为特征、信息交互行为特征和用户购买行为特征3个维度构建直播带货平台用户信息行为画像模型。本文获取数据的途径为发布调查问卷,再运用因子分析和K-Means聚类分析方法,将直播带货中用户信息行为进行聚类分析。[结果/结论]研究结果表明,直播带货平台的群体用户信息行为可划分为交互型用户信息行为、消费型用户信息行为、狂热型用户信息行为和沉默型用户信息行为。
    • 王新刚; 赵舫; 朱文君
    • 摘要: 用户耗能的时空分布特性对于电网规划具有重要的参考价值,是电网建设的重要依据。电力运营商通过新型计量设备分析居民的用电行为,从而促进电网高效运营。针对区域用户画像问题,提出基于综合能源计量数据的区域用能特性分析方法。利用“多表合一”用能采集系统,引入用户的燃气消耗数据,基于层次聚类与自组织映射(self organized maps,SOM)聚类方法刻画用能特征分布,通过仿真实验说明所提方法在用能特性分析问题上具有实用价值,有利于挖掘高耗能区域,能帮助电力运营商制定规划方案。
    • 伍珣; 刘嘉文; 李红佗; 李凯迪; 于天剑; 田睿; 赵俊栋
    • 摘要: 为在换流阀外冷却系统设计初期快速选择合理的冷却方式,分析了影响冷却方式选择的当地气候环境和换流站设备条件等因素,构建基于堆叠异构的残差网络(SH⁃ResNet)模型用于对冷却方式进行分类,模型集成了有监督的分类器与无监督的聚类方法,并将ResNet作为元分类器,深度挖掘输出结果之间的潜在联系。通过研究近年来不同地区站点的气候环境、换流阀冷却系统需求、设备布置情况以及最终设计使用的冷却方式,总计209个样本数据对所提出模型进行训练与评估试验。结果表明:SH⁃ResNet的分类正确率达到0.97,相较于基础分类器平均提高了11.46%,可见,在样本集较小的情况下该模型保证了其强大的泛化能力,并提高了分类准确度。基于该模型的冷却方式推荐系统交互窗口的设计不仅给予了冷却方式的推荐占比,并可视化特征参数与冷却方式间的联系,为换流阀外冷却系统设计提供了一种最优化选型方法。
    • 李明媚; 文成林; 胡绍林
    • 摘要: 为解决现有k-modes聚类方法因忽略了变量属性之间的弱相关性,常造成其在实际应用中聚类性能不佳的问题,提出一种包含属性弱相关性的新k-modes聚类方法。引入最大信息系数(maximum information coefficient,MIC)度量数据集中变量属性之间的相关性;将得到的MIC值与原有距离进行融合,建立包含属性弱相关性信息的新度量方法,以增强变量属性间相关信息的完备性,建立更加精细的k-modes聚类方法;调用3种不同的数据集,将新方法与原有的k-modes聚类方法和其他改进k-modes聚类方法的性能进行对比,并通过仿真结果表明了新方法的有效性。
    • 杨晓峰
    • 摘要: 本文通过对商业销售记录流水分析,利用聚类方法,可以实现对商业客户的分类。本文以某航空公司客户分类为例,针对特征特点进行分类归一化,使用模糊C均值聚类方法实现对客户分类,并与使用Kmeans方法聚类的结果进行了对比。实验结果证明模糊C均值聚类方法更适用于商业客户分析。
  • 查看更多

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号