层次聚类
层次聚类的相关文献在1998年到2022年内共计869篇,主要集中在自动化技术、计算机技术、电工技术、经济计划与管理
等领域,其中期刊论文670篇、会议论文36篇、专利文献16530篇;相关期刊350种,包括计算机工程、计算机工程与设计、计算机工程与应用等;
相关会议35种,包括2016中国计算机辅助设计与图形学会大会、第十四届全国软件与应用学术会议、2015年全国电力通信技术学术年会等;层次聚类的相关文献由2488位作者贡献,包括姜青山、张旭、郭景峰等。
层次聚类—发文量
专利文献>
论文:16530篇
占比:95.90%
总计:17236篇
层次聚类
-研究学者
- 姜青山
- 张旭
- 郭景峰
- 周勇
- 姚曼
- 徐祖华
- 杨小龙
- 段海洋
- 王丹
- 王旭东
- 王晓东
- 赵均
- 邵之江
- 陈志奎
- 付佳佳
- 刘俊
- 刘杰
- 刘颖
- 吴勇
- 吴扬扬
- 吴磊
- 周晓昕
- 周红芳
- 唐华
- 孙浩军
- 孟志青
- 张仕军
- 张宇
- 张建伟
- 张慧
- 张波
- 张菲菲
- 李信利
- 李千目
- 李寒
- 李晶
- 李波
- 李涛
- 杜楠
- 杨智
- 杨海陆
- 杨秀璋
- 杨超
- 林斌
- 梁斌梅
- 樊仲欣
- 洪宇
- 潘明明
- 王健
- 王兴
-
-
刘政昊
-
-
摘要:
[目的/意义]结合金融证券行业特征,借鉴层次式设计思路和数据立方体概念,提出多层领域本体立方体模型并完成构建.[方法/过程]复用FBIO本体进行知识建模;利用LDA主题建模与BIRCH层次聚类完成概念提取;基于依存句法和深度学习框架的知识抽取完成本体实例扩充;通过维度分类和基于概率的实体空间向量表示增强语义关联性.[结果/结论]多层构建方式和立方体结构增加了知识内在关联,为金融概念知识提供多层次、细粒度的知识组织方式;也为本体构建提供新的思路.
-
-
代先勇;
胥雄;
邓金祥;
俞祥基;
熊竹;
熊民
-
-
摘要:
在近些年网络空间安全形势愈发严峻的情况下,对网络协议分析提出了越来越高的要求,其中,对未知协议分类分析更是亟需攻克的难点。针对未知协议的分类问题,提出一种基于层次聚类的多策略未知协议分类方法。该方法从传输控制协议头部特征、数据包的时空特征等维度入手,与马尔科夫链相结合,首先对收集到的网络数据进行预处理;然后提出可读性分类机制,并运用改进的层次聚类算法的多种聚类策略,发挥现代计算机的多核计算与单指令流多数据流优势;最后结合传输控制协议流中的二元组信息(目的 IP和目的端口),对聚类结果进行调整合并,得到未知协议网络数据的分类结果。据真实网络数据验证表明,该方法对未知协议的分类准确率达到96%以上。
-
-
令狐秋萍;
何世群;
齐梦珂;
罗子江;
杨秀璋
-
-
摘要:
水族文化的主题挖掘和主题演化分析有助于从不同角度了解水族发展状况、热点主题和研究趋势,为后续水族文化传承和文献挖掘提供相关参考价值。基于此,本文采集中国知网990篇水族文献,提取水族文化关键词及主题,利用共现分析和层次聚类挖掘水族关键词间的联系,构建水族主题共现知识图谱和主题演化网络。实验结果表明,本文的方法能有效分析水族文献的主题演化趋势,发现特征词共现关系和相似度,构建水族文化主题知识图谱,并聚类形成五大类水族文献主题,对少数民族文化研究和文献挖掘具有一定的应用价值和理论意义。
-
-
顾偲雯;
沈新逸;
王加安;
句爱松
-
-
摘要:
学生的学习成绩是其对课程学习的掌握程度的一个重要体现,也是反映教师教学效果好坏的一个标准。怎样使用学生某一阶段的成绩提炼分析出有用的信息来提高之后的教学方案与学生成绩有着至关重要的意义。在此背景下,文章将k-means算法与基于分层方法的层次聚类应用于学生成绩的分析中。相比传统的成绩评价标准弥补了其不能根据外部影响而进行灵活改变的短板。最后比较两种算法的优缺点并对学生的综合成绩与单科成绩进行分析,通过宏观分析找出影响学生成绩的因素和各类学生在不同学科上的薄弱点。
-
-
宁涛
-
-
摘要:
投资策略的组合优化是量化交易体系中的重要环节,传统的均值-方差模型难以满足实际需求,文章提出了一种基于层次聚类的风险平价方法,并针对典型中高频趋势策略的组合优化进行实证研究,分析结果表明:基于层次聚类的风险平价方法在样本内外一致性、最大回撤和投资组合分散度等评价指标上都显著优于基于均值-方差的最大夏普比率方法,且样本外风险调整后的收益显著高于一般风险平价方法和最大夏普比率方法。
-
-
丁建立;
刘亦舟;
梁婷婷
-
-
摘要:
针对网络流量异常检测目前存在的数据维度大、冗余数据较多、准确率较低等问题,提出一种基于层次聚类和自编码器并结合多层极限学习机的网络流量异常检测模型。首先考虑数据特征之间的相关性,根据数据特征之间的相似性距离对特征维度进行层次聚类划分,将相关性较高的特征划分到同一特征子集中;然后利用自动编码器对每个特征子集进行约简,消除冗余信息降低检测数据计算量;最后以多层极限学习机作为分类器,利用约简后的特征数据进行网络流量异常检测建模。实验结果显示,文中模型在UNSW-NB15数据集上准确率达到了0.992,精确率达到了0.997。与其他检测方法相比,文中方法可以有效地约简数据特征,提高了检测的准确率和网络流量异常检测的性能。
-
-
朱龙佳;
唐旭东;
夏树高;
王冠群
-
-
摘要:
轨道交通车站能耗受室外温度、湿度、客流、运营数据和设备状态等多种因素的影响,发生能耗异常时,能耗问题定位难,耗能原因发现难,如不能及时准确地应对异常情况,就会造成车站能耗上升,增加运营成本。本文对通风空调系统能耗属性和影响因素进行逐层分解,将基于根因分析的层次聚类法应用于通风空调系统能耗异常分析。其间通过整合多专业、多维度的数据属性,定位通风空调系统能耗异常的问题和造成异常的数据属性,实现能耗异常问题快速定位和根因分析,为车站能源管理提供依据,有效降低车站运营成本。
-
-
程顺达;
程颖;
孙士江
-
-
摘要:
在肿瘤诊断领域,人工智能辅助诊断系统可对肿瘤属性、恶性肿瘤分期进行准确地判别,从而延长患者的生存时间。文中以乳腺肿瘤为例,针对特征提取过程中数据量过大所导致的过拟合问题,提出了一种基于监督学习的人工智能辅助诊断模型。在提取特征时,通过引入层次聚类分析来完成有效的特征降维,并将分类后的特征数据作为人工神经网络模型的特征输入,以此实现分类器的有效训练。实验结果显示,所提算法的准确率和AUC值相比对照算法有所提升,表明该模型不仅能解决海量特征区域描述造成的过拟合问题,还增强了人工智能辅助诊断系统的泛化能力,可以完成对钼靶乳腺肿瘤的高精度区分。
-
-
冯正田;
郑思思;
李雪;
朱虹;
尹冬青;
宁艳哲;
贾竑晓
-
-
摘要:
目的全面系统地探究广泛性焦虑障碍(generalized anxiety disorder,GAD)之上热下寒证的症状特点。方法使用广泛性焦虑障碍中医证候调查表评估首都医科大学附属北京安定医院门诊收治的168例GAD患者的中医四诊信息与西医精神症状信息。专家判定其中100例为上热下寒证患者,68例为非上热下寒证患者。通过频数分析研究上热下寒证的常见寒、热症状分布特点。通过层次聚类分析GAD之上热下寒证的病位证素、病性证素。再通过提取GAD之上热下寒证的核心症状,进行核心症状间的复杂症状网络分析,探究上热与下寒症状间的内在逻辑关系。最后联合聚类分析与复杂网络分析结果,探寻GAD之上热下寒证的核心病机。结果GAD上热下寒证的患者较非上热下寒证的患者病程更长,焦虑程度显著较高,常见症状(频率>30%)更多。GAD上热下寒证常见(频率>30%)的寒、热症状有:口舌干燥、舌苔白、两目干痒、下肢不温、面部洪热潮热、口苦、口渴欲饮、小腹畏寒、腰凉、盗汗、头热汗出、脉滑、手热足冷、足胫寒冷、面部多汗。GAD上热下寒证的病位证素为:心、胃、肾、督脉、脾、胆;病性证素为:火热、寒凝、气滞、气虚、阳虚。精神焦虑在核心症状的复杂症状网络中的作用最大。结论精神症状在GAD上热下寒证的症状中占据主导地位,其潜在的核心病机可能是“君火失明,相火离位”,其治疗则为清热安神,辅以温阳。
-
-
郭昕刚;
王佳;
程超
-
-
摘要:
在基于图的分割(graph-based segmentation,GBS)算法的基础上引入层次聚类算法,构造出一种解决GBS算法欠分割的方法,同时采用多线程并行处理数据的方式,有效改善了传统层次聚类算法的处理速度。该方法首先在RGB彩色空间中使用GBS算法得到图像中每个像素点的初始分割结果,然后提取出每一类区域中的像素值,对其进行层次聚类,得到每一类区域中像素值的类别标签,再根据层次聚类所得到的类别标签和预设的类别范围,修改每个像素点的初始分割结果。根据区域合并准则,生成一个新的分割图。经实验表明,该方法与K-means-SLIC算法和GBS算法等相比,很好地解决了欠分割现象,并产生了分割精度较高的语义分割图。
-
-
MA Baojun;
马宝君;
CHEN Lu;
陈璐;
WAN Yan;
万岩
- 《信息系统协会中国分会第七届学术年会》
| 2017年
-
摘要:
随着电子商务的迅猛发展,网购已经开始成为人们生活中必不可少的一部分,电商平台上的在线客户评论内容对于消费者购买决策以及商家商品和服务改进都发挥着越来越重要的作用,如何能够自动、快速、有效地从大量的在线客户评论文本数据中提取相对完整的属性特征及进行细粒度情感分析,也成为电商平台信息服务提供商越来越关注的问题.鉴于此,本文提出了一种新颖的自动提取在线客户评论属性及其基础上的细粒度情感分析方法,通过应用句法分析模型提取候选属性词及其对应的语义关系,运用word2vec词向量模型训练得到语料中各个词所对应的词向量,并对候选特征词进行层次聚类得到商品属性特征维度,进而计算商品在各个属性维度上的情感强度.最后本研究通过天猫商城游戏本商品的实际数据实验分析验证了该方法的合理性与有效性.
-
-
-
LI Han;
李寒;
Ning Tong;
佟宁;
CHEN Feng;
陈峰
- 《第十四届全国软件与应用学术会议》
| 2015年
-
摘要:
针对软件聚类侧重相似度测度,欠缺考虑实体和特征的特性的问题,提出一种基于层次聚类的软件架构恢复方法(HCSAR).方法有针对性的选取实体和特征,提出特征的多重加权策略,采用信息丢失度作为相似度测度,选取和设计软件聚类的客观和主观评估准则.与目前效果较好的软件聚类方法相比,HCSAR在聚类中期生成更多的簇,主观判定数更低,能够通过调整关注点获得不同的聚类结果,使用设计的评估准则分析聚类结果还能有效辅助系统划分.
-
-
周彬;
余杰;
毛世彪;
孙微
- 《浙江省信号处理学会2015学术年会》
| 2015年
-
摘要:
为了对海量水声数据进行有效的压缩、分类,本文将聚类分析技术与水声目标信号特征提取技术相结合,提出基于层次聚类的水声目标分类技术.本文以信号的瞬时频率、高阶累积量等特征为聚类对象,分别使用K均值和凝聚的层次聚类技术进行聚类分析,通过试验数据处理,对比验证两种聚类算法的可行性和分类效果.
-
-
Fu Jiajia;
付佳佳;
Cai Yi;
蔡毅;
Lin Bin;
林斌
- 《2015年全国电力通信技术学术年会》
| 2015年
-
摘要:
智能电网通信网内的中继节点在进行长距离信息传递时,互相之间的依赖性很强.当其中一个中继节点因故障或其他原因失效后,将会对其他中继节点的消息传递造成影响.为此,该文提出了一种基于层次聚类的配用电故障容忍监测传感器规划算法.该算法分为分组聚类,通信模块部署,备用中继节点部署三个模块.仿真实验表明,该算法不仅可以使智能配电网在中继节点失效后将其隔离出全网的运行范围,还能在某些节点失效后,保证全网的正常运行,很大程度上消除了中继节点失效带来的不利影响.
-
-
Zhou higuang;
周志光;
Hu Dixin;
胡迪欣;
Ye Zhifei;
叶志飞;
Liu Yanan;
刘亚楠;
Zhou higuang;
陶煜波;
Lin Hai;
林海
- 《2016中国计算机辅助设计与图形学会大会》
| 2016年
-
摘要:
空气质量监测数据具有显著的时空多维属性.传统的平行坐标技术虽然能够有效展示数据的多维属性信息,却在分析与解读空气质量监测数据各个属性的时空变化规律方面表现出一定的局限性.本文在平行坐标展示空气质量监测数据多维属性的基础上,提出了一种支持用户交互式探索大气污染时空特征的可视分析方法.首先,利用平行坐标展示空气质量监测数据,支持用户交互改变时空维度,以及指定坐标轴排列顺序;引入角度、面积、正负相关性等方式度量数据在平行坐标系中的布局差异,并且通过矩阵图和交互式柱状图分别展示不同时空维度下数据的布局差异:综合考虑各个属性之间的数据布局差异,构建相似性矩阵,利用多维标度法对当前时空维度的数据进行降维,获得初始数据在低维空间的表示.进而,利用层次聚类方法对低维空间的数据表达做聚类分析,并且分别设计时间隐喻图和地域抽象图描述各个类别的时空节点组成.集成上述可视化算法,设计便捷的用户交互模式,开发面向空气质量监测数据时空多维属性的可视分析原型系统,为用户快速分析和解读大气污染的时空特征及潜在规律提供有效手段.大量的可视化效果及用户反馈结果,进一步验证了本文工具的有效性和实用性.
-
-
-
-
李红梅;
王洪超;
蔡春阳
- 《统计教育与应用统计研讨会》
| 2012年
-
摘要:
随着市场经济的逐步完善,属于定量分析的统计方法越来越重要,但在实践中,经常需要了解人们的观点、态度、行为意愿等主观问题,定性资料的统计分析方法也日益受到统计界的密切关注.本文正是从定性数据的特点出发,研究适合处理定性数据的聚类分析,并对不同方法的处理结果进行对比分析,得出结论认为模糊聚类分析更加适合处理多维定性数据的分类问题.
-
-
李红梅;
王洪超;
蔡春阳
- 《统计教育与应用统计研讨会》
| 2012年
-
摘要:
随着市场经济的逐步完善,属于定量分析的统计方法越来越重要,但在实践中,经常需要了解人们的观点、态度、行为意愿等主观问题,定性资料的统计分析方法也日益受到统计界的密切关注.本文正是从定性数据的特点出发,研究适合处理定性数据的聚类分析,并对不同方法的处理结果进行对比分析,得出结论认为模糊聚类分析更加适合处理多维定性数据的分类问题.