数据聚类
数据聚类的相关文献在1997年到2023年内共计695篇,主要集中在自动化技术、计算机技术、无线电电子学、电信技术、电工技术
等领域,其中期刊论文212篇、会议论文24篇、专利文献553612篇;相关期刊129种,包括沈阳工业大学学报、电子学报、电子与信息学报等;
相关会议23种,包括SCEG2014研讨会(2014年“计算机科学与技术及教育技术“学术研讨会)、中国社会科学情报学会2012年学术年会、第十届中国不确定系统年会、第十四届中国青年信息与管理学者大会等;数据聚类的相关文献由1949位作者贡献,包括张蓉、刘健、彭宏等。
数据聚类—发文量
专利文献>
论文:553612篇
占比:99.96%
总计:553848篇
数据聚类
-研究学者
- 张蓉
- 刘健
- 彭宏
- 徐秀芳
- 陈晋音
- 何熊熊
- 何辉豪
- 侯文娟
- 刘强
- 安晶
- 张毅
- 徐森
- 徐静
- 曹瑞
- 李刚
- 杨杰
- 沈旭昆
- 潘逸辰
- 王博
- 皋军
- 花小朋
- 范志强
- 范文涛
- 赵沁平
- 郭卉
- 陈娇
- 顾王一
- 马泳宇
- 中原匡哉
- 中村健二
- 于晓明
- 俞林刚
- 冯研
- 刘世华
- 刘丽蕴
- 刘博
- 刘向向
- 刘建军
- 刘洋
- 刘玮
- 卢婕
- 史东宇
- 叶展翔
- 向园
- 吕俊
- 周俊
- 夏胜平
- 姚霖
- 小阪孝幸
- 山本雄平
-
-
范圣法;
张先梅;
虞慧群
-
-
摘要:
高校在长期的教学活动中积累了大量的课程数据,如何利用数据资源分析课程教学状况,为提高课程教学质量提供决策支持,具有重要的研究价值。本文设计实现了一个基于关联规则与聚类分析的课程评价体系,对课程评价系统进行了功能需求分析,并对课程评价数据进行预处理。采用FP-growth算法对学生课程成绩数据进行关联规则分析,采用K-means++算法进行聚类分析,提高了课程数据分析的精度,实现了课程评价的自动化,提高了效率和评价的客观性。
-
-
荀超;
陈伯建;
吴翔宇;
项康利;
林可尧;
肖芬;
易杨
-
-
摘要:
现有方法预测电力短期负荷时忽略了对其进行聚类优化处理,导致预测耗时较长,短期负荷预测精度偏低。为此,提出一种基于改进K-means算法的电力短期负荷预测方法。该方法利用改进后的K-means算法聚类处理电力负荷大数据,使用聚类后获得的训练样本构建循环神经网络RNN拓扑结构,然后通过对RNN神经网络模型设置最优权值,实现电力负荷的短期预测。实验结果表明,所提方法具有高预测效率和高短期负荷预测精准度。
-
-
李晓会;
陈潮阳;
张兴;
伊华伟
-
-
摘要:
推荐系统存在用户隐私安全性低、推荐服务质量差的问题。为此,文中提出一种基于差分隐私的个性化服务推荐算法DPk⁃median。该算法针对推荐系统服务器中生成的推荐列表,首先利用k⁃median聚类算法将推荐数据中具有相同属性的数据进行聚类;然后根据不同簇的风险级别,添加相应的拉普拉斯噪声机制,同一簇中的隐私预算参数是相同的,在保证隐私的前提下,可合理控制噪声的加入并提高噪声的利用率,保证推荐的质量损失减小,同时增加算法的执行效率。相关实验结果表明,与以往的基于差分隐私的个性化服务推荐系统相比,文中所提出的算法在保证系统安全性的同时,提高了服务推荐的质量和算法的执行效率。
-
-
任政;
祁建;
陆晨亮
-
-
摘要:
为了深入贯彻国家电网公司的一体化营配调资源调度与业务运行机制,在大数据分析可视化平台关键技术的基础上,创建供电服务指挥平台。使用大数据分析可视化平台聚类不同类型的供电信息,并训练信息语义特征,通过层次聚类获得信息密度中心点。将“五位一体”协同机制作为核心,利用硬件层、支撑软件层、数据储存层构成供电服务指挥架构,再利用耦合变电站-配电线路-配电变压器-用户电网拓扑结构构成供电服务数据库,从而构建集客户服务指挥、业务协同指挥、配电运营管控、服务质量监督和可视化自主统计功能于一体的供电服务指挥平台。经验证可知:该技术能完成高效率完成异常预警故障研判、工单下派与流转等服务流程。
-
-
蔡颖凯;
张冶;
曹世龙;
康乃荻;
宋晓文
-
-
摘要:
短期电力负荷预测结果,直接关联电力系统的规划、调度和运行安全,因此,研究基于决策树算法的短期电力负荷大数据预测模型,精准完成短期电力负荷预测。分析短期电力负荷,确定气象和负荷两种数据为预测所需数据,采用C均值模糊聚类算法聚类该数据后;采用低秩矩阵填充理论和奇异值阈值算法,填补聚类后数据中的缺失,基于梯度提升决策树模型预测短期电力负荷。测试结果显示:该方法聚类效果良好,气象和负荷两种数据聚类的综合相似度评价指标的最佳结果分别为0.014和0.011;数据填补性能良好,能够完成不同场景下的短期电力负荷预测,并获取不同气象条件下负荷的变化结果,应用后电力系统的运行风险值均低于0.0005。
-
-
唐存东;
陈莉;
王志平;
张凌晓;
梁存良
-
-
摘要:
本章文针对教学质量监控滞后问题进行研究,采用将主管部门质量数据、高校内部数据、爬虫获取数据进行大数据处理和分析的方法获取了动态教学质量监控数据。依托数据制定6个教学质量监控一级指标和88个二级指标,实现了“数据驱动”引领“数据说话、数据管理、数据决策、数据创新”的初衷,对促进教学质量持续改进和不断提高具有深远意义。
-
-
王林信;
周盛成;
罗世刚;
江元;
王琼;
马莉
-
-
摘要:
以准确识别电力缴费过程中的敏感用户为目标,文章基于改进词向量模型设计了一种新的电力缴费用户画像方法。首先通过改进K-均值算法对电力用户缴费行为大数据展开聚类处理,实现电网部门缴费用户的电量、电价、电费、停电类诉求数据聚类。然后基于改进词向量模型设计用户画像方法,并将聚类结果导入其中,通过构建用户画像识别电力缴费用户敏感类型。实验结果显示,该方法对4种敏感类型用户的分类结果较准确,分类结果差值仅有1个。且该方法对电网部门缴费用户的电量、电价、电费、停电类诉求数据聚类效果较好,查全率、准确率、F值均大于0.95,证明其聚类效果较好,可准确识别电力缴费过程中的敏感用户。
-
-
陈晓婕
-
-
摘要:
为了精准、稳定监测煤矿建筑工程安全,缩减监测效果受数据量及噪声影响,设计了基于数据实时分析的煤矿建筑工程安全监测系统。通过感知层采集煤矿建筑工程相关数据,数据处理模块对数据进行聚类操作,通信模块将聚类后数据安全传输至煤矿建筑工程安全监测中心,利用改进隔离森林算法对数据执行异常检测操作,并将检测结果存储数据库中,通过安全监测与管理中心为客户呈现监测结果。实验结果表明,该系统可有效聚类煤矿建筑工程数据,且煤矿建筑工程安全监测精度与稳定性好,监测效果受数据量及噪声影响较小。
-
-
孔繁春;
王婷;
李旭东
-
-
摘要:
针对电力客户用电行为分析的收敛性不好、可靠性不高的问题,提出基于动态网格生成技术和k-means算法的电力客户行为分析方法。根据电力客户行为的确定性和非确定性特征量挖掘电力客户行为特征,结合指向性增益控制方法分析电力客户行为分布大数据的动态网格特征参数,通过动态网格生成技术,构建电力客户行为的融合关联特征量,采用先验概率密度特征分析方法,建立电力客户行为的输出可靠性状态参数集,结合最小期望和均方误差估计方法,实现对电力客户行为的特征提取,采用k-means聚类方法聚类提取电力客户行为特征,实现对电力客户行为的优化挖掘和量化分析。仿真测试结果表明,采用该方法进行电力客户行为特征量化分析的准确性较高,可靠性较好,提高了电力客户行为特征挖掘和检测识别的能力。
-
-
陈文婕
-
-
摘要:
为了使加密方法在实际应用中达到既定效果,解决开放性直播电商平台中客户端个人隐私信息与数据安全性难以得到保障的问题,对直播电商中客户隐私数据加密方法展开研究。在对端连接完成后,设定直播电商中隐私协议,对客户端与服务器端实施盲点匹配行为,确保双方均在一种相对隐私与安全的场景下进行资源交互。引进点对点(PP)协议-k-means算法聚类处理客户端隐私数据,再结合客户端信息属性保护与加密处理客户端隐私。实验表明:应用本文方法后,数据的雪崩效应系数稳定在临界值以下,且直播电商在线人数达到10000人次时该现象保持持续,说明在大批量客户端同时在线的情况下,本文方法可以为客户隐私数据提供安全保障。
-
-
潘国涛;
黄德才
- 《2011年青年通信国际会议(ICYC2011)》
| 2011年
-
摘要:
将低维空间中的相似性度量方法应用于高维空间时,由于高维数据存在着稀疏性和空空间现象的特点,高维数据对象之间距离的对比性不复存在。研究适合于高维空间的相似性度量方法已成为高维数据挖掘的主要方向之一。通过对传统相似性度量方法在高维空间中的不适应性进行了分析和总结,在基于维度的思想之上,结合特征选择算法,提出一种新的高维数据的相似性度量方法,并且对其有效性进行分析。通过数值仿真实验, 论证了该相似性度量方法在高维数据聚类中的合理性和有效性。
-
-
Li suli;
李素丽;
Qi zhaohui;
綦朝晖;
Jing mengzhe;
金梦哲
- 《SCEG2014研讨会(2014年“计算机科学与技术及教育技术“学术研讨会)》
| 2014年
-
摘要:
长期以来,甲型H3N2流感病毒一直是威胁人类健康的重要病原体之一,对其变异规律进行深入的分析研究在流感的防治工作中具有重要的意义[1],其中对血凝素(HA)基因变异的研究工作最为重要.目的对1990-2013年全球甲型H3N2流感病毒血凝素的基因和进化特征进行研究.方法从NCBI的流感病毒数据库下载1990--2013年人源甲型H3N2流感病毒HA基因样本,采用数值映射和PCA聚类的方法进行序列分析和进化研究,并用MATLAB绘制聚类图直观表示结果.结果PCA分析中前两个主成分占93.88%.聚类图中1990-1999年,2000-2005年,2006-2013年数据聚类成三部分,但是这三部分并没有特别明显的间隔.三维图中数据呈现为比较连续的曲线.结论1990-2013年期间甲型H3N2流感一直渐进的进化,但并未出现大的基因重组,并没有使血凝素基因特性发生明显改变.
-
-
Zhang songsong;
张松松;
ShenJing;
沈竞
- 《第十届中国不确定系统年会、第十四届中国青年信息与管理学者大会》
| 2012年
-
摘要:
回归模型理论已在众多领域实现了广泛的运用.其中,线性回归模型、空间回归模型和hedonic回归模型等已经有了较大的发展和运用,但是这些模型的方法效率相对较低,数据处理的复杂度比较高,Gibbs抽样方法则将多个参数的复杂问题降低为每次只需处理一个参数的简单问题.本次研究运用SPSS、R和OpenBUGS三大数据分析软件,分别进行对数据聚类分析,典型性分析和基于Gibbs抽样的回归模型求解,其中运用Gibbs抽样的方法较之于传统模型抽样方法相比,Gibbs抽样方法更加简便、高效.通过对这三大软件的运用,做到对数据的科学分析,对模型的科学求解,使得结果更好的反应现实的具体状况.
-
-
-
-
-
王秋生;
高绍坤;
崔勇
- 《第三届全国虚拟仪器学术交流大会》
| 2009年
-
摘要:
人工免疫网络是人工免疫系统的重要组成部分,具有自组织、记忆性、分布性等特点,在数据聚类、模式识别等领域得到了广泛应用;AR模型是分析和处理平稳随机信号的重要工具,广泛应用于频谱分析、数据预测等领域。本文充分利用人工免疫网络和AR模型的各自优点,针对复杂系统综合健康管理的实际需求,提出了基于人工免疫网络和AR模型相结合的数据聚类与预测算法,并通过仿真实验初步验证算法的可行性和有效性。本文提出的聚类与预测算法具有概念直观、实现容易、通用性强等优点。
-
-
-
-
-
-
-
-
-
-
-
-
-
-
- 国网河北省电力有限公司营销服务中心
- 国家电网有限公司
- 公开公告日期:2022-06-24
-
摘要:
本发明提供了一种基于均值漂移聚类的低压台区用户用电数据聚类方法,属于用电数据无监督的数据聚类技术领域,包括:给定m维空间的用电数据集X∈Rm×n,计算用户用电数据xi(i=1,2,…,n)的密度估计函数;根据函数的极值定理,局部密度极大值点位于密度函数的梯度零值点中,对上式求导,得到梯度函数,从而找到用电数据密度的极大值点;考虑用电数据中的噪声数据的影响,引入高斯核函数,实现用户用电数据的高维可分,提高分类的鲁棒性。本发明提供的一种基于均值漂移聚类的低压台区用户用电数据聚类方法,在低压台区用电信息采集场景中,用户类型多样,用电场景、用电行为复杂,有效改善用电数据分析的质量基础。