DBSCAN算法
DBSCAN算法的相关文献在1999年到2022年内共计235篇,主要集中在自动化技术、计算机技术、公路运输、无线电电子学、电信技术
等领域,其中期刊论文196篇、会议论文5篇、专利文献51607篇;相关期刊129种,包括科学技术与工程、吉林大学学报(信息科学版)、智能计算机与应用等;
相关会议5种,包括2011基于互联网的商业管理学术会议(WBM2011)、全国第18届计算机技术与应用学术会议(CACIS)、2005第一届中国分类技术与应用研讨会(CSCA)等;DBSCAN算法的相关文献由674位作者贡献,包括吴鑫、周水庚、张贵等。
DBSCAN算法—发文量
专利文献>
论文:51607篇
占比:99.61%
总计:51808篇
DBSCAN算法
-研究学者
- 吴鑫
- 周水庚
- 张贵
- 蔡琼
- 谭三清
- 丰翔龙
- 俞昕
- 关毅
- 刘佳彬
- 刘军
- 刘宗田
- 刘正江
- 刘涛
- 卢泽新
- 史椸
- 吴奂
- 吴旗
- 吴红斌
- 周傲英
- 周旭
- 周海
- 唐勇
- 唐家博
- 姚雨虹
- 孙悦
- 孙维亚
- 宋志豪
- 张怡
- 张雪洁
- 徐占艳
- 徐柱
- 徐海啸
- 徐进
- 曹晶
- 曹阳
- 朱烨
- 李婷
- 李小龙
- 李建国
- 李旭宏
- 李智
- 李木梓
- 李永攀
- 李清
- 李瑞
- 李莉平
- 李诗伟
- 李赞
- 杨天林
- 杨小兵
-
-
邱灿华;
吴杰
-
-
摘要:
针对传统的合成少数类过采样技术(Synthetic Minority Oversampling Technique,SMOTE)中存在的忽略类间不平衡、类内不平衡、无法控制合成样本的噪声等问题,结合DBSCAN聚类算法,提出了一种基于DBSCAN改进的SMOTE算法:使用DBSCAN算法对少数类样本进行聚类,计算少数类密度系数和采用权重为每个簇分配采样数量,将每个簇中样本点按照到簇质心的距离分为2类,对每类中的样本点分配不同的随机系数进行过采样,得到新的较为平衡的数据集。根据获取的数据集进行实验表明,改进的算法可以很好地改善分类器的分类性能。
-
-
代少升;
刘小兵;
赖智颖;
任忠
-
-
摘要:
经典DBSCAN(density based spatial clustering of applications with noise)算法需要人工指定邻域半径(Eps)和点数阈值(Minpts),且均为全局参数,导致聚类准确率低。针对此问题,为了提高经典DBSCAN聚类算法的聚类准确率,基于网格划分思想,提出了一种局部自适应DBSCAN聚类算法。根据数据集自身特征生成网格空间,将特征数据映射至相应的网格空间;利用高斯核函数估计每个网格区间的局部密度;联合多维度网格密度分布信息,寻找无连接或弱连接高密度网格之间的区域,同时统计同区域的波峰数量,从而自适应确定各区域的Eps及Minpts参数;使用每个区域独有的参数作为DBSCAN算法输入,并进行聚类。实验结果表明,该算法能够在聚类过程中自适应确定每个局部区域的Eps和Minpts参数,聚类准确率高且耗时较低。
-
-
周雪芳;
刘树龙;
周海龙
-
-
摘要:
提升复杂通航环境下船舶航行安全性,提出复杂环境中高可用船舶AIS大数据信息处理方法。选取分布式架构作为船舶AIS大数据的信息处理架构,采集船舶AIS数据,对数据实施报文解析处理,利用云计算节点将完成AIS大数据传送至Oracle数据库。Oracle数据库采用同步复制技术,利用Markov链建立可用性评估模型,依据可用性评估结果确定分布式数据库的最佳接管方案,提升AIS大数据的可用性。选取Dbscan算法完成数据聚类,数据聚类结果为舰船目标识别等应用提供数据基础。实验结果表明,该方法可以有效处理船舶AIS大数据,数据聚类的类内相似度高于0.93,信息处理可用性高。
-
-
严志
-
-
摘要:
随着教育信息化的不断深入,如何从海量数据中挖掘出教育规律引起关注。本文以学情数据为基础,建立学情分析可视化系统,以密度聚类算法为依托,对学生考勤与学情隐含关系、学情稳定性进行了分析研究,并将分析结果可视化。利用DBSCAN聚类算法对数据集挖掘分析,结果表明,教育数据可为高校决策提供管理依据。
-
-
万佳;
胡大裟;
蒋玉明
-
-
摘要:
DBSCAN算法的Eps和MinPts参数需要人为设定,取值不当会导致聚类结果准确度不高,且在密度分布差异大的数据集上,由于参数的全局性,错误地应用于不同密度的簇,导致不能正确地发现簇。针对以上问题,提出一种多密度自适应参数确定算法,利用经过去噪衰减后的数据集的自身分布特性生成候选Eps和MinPts参数列表,并在簇数趋于稳定的区间内根据去噪级别选取对应的Eps和MinPts作为初始密度阈值。对在该密度阈值条件下聚类产生的噪声数据使用同样的方法生成候选参数列表,选取最优参数,得到新密度阈值,循环该步骤直到噪声数据的数量或密度阈值低于一定程度为止。将不同密度阈值下的聚类结果进行合并。实验结果表明,该算法能够自适应地选取合适的多密度阈值,并在密度分布差异大的数据集上有很好的聚类效果。
-
-
张欣环;
刘宏杰;
吴金洪;
施俊庆;
毛程远;
孟国连
-
-
摘要:
基于密度的聚类算法(DBSCAN)是最有效的轨迹数据挖掘方法之一,但基于密度的聚类算法往往受到输入参数选择的限制。在轨迹数据挖掘中,聚类结果不仅受到类内距离和类间距离的影响,还受到聚类中坐标点个数的影响。因此,提出了一种新的基于内外占空比的集群有效性指标来平衡这三个因素,该指标可以自动选择密度聚类的输入参数,并在不同的数据集上形成有效的聚类,优化后的聚类方法可应用于出行者行为轨迹的深度分析和挖掘。实验结果证明,与传统的有效性指标相比,提出的基于占空比的评价指标能够优化输入参数,获得较好的出行者位置信息聚类结果。
-
-
周雅夫;
仪坤;
孙雪松
-
-
摘要:
单体电池间的性能差异是影响动力电池组使用安全性的主要因素之一,为识别电池组中一致性差的电池,即更容易发生危险的异常电池。文章在常规DBSCAN算法的基础上进行改进,针对其对输入参数敏感的缺陷,提出一种基于数据分布特性自适应确定MinPts参数和Eps参数的改进DBSCAN算法。将改进DBSCAN算法用于电池一致性分析,并利用电池充放电数据设计相关实验进行验证,验证结果表明所提出的算法异常电池识别效果良好。
-
-
陈文龙;
时宏伟
-
-
摘要:
针对DBSCAN聚类算法随着数据量增大,耗时越发非常严重的问题,提出一种基于KD树改进的DBSCAN算法(以下简称KD-DBSCAN).通过KD树对数据集进行划分,构造邻域对象集,提前区分出噪声点和核心点,避免聚类过程中对噪声的邻域集计算以及加快了核心点对象的邻域集查询速度.文中以浮动车GPS数据为实验数据,对比传统DBSCAN算法和KD-DBSCAN算法的聚类效果和时间性能,实验结果表明KD-DBSCAN算法的聚类效果和传统的DBSCAN基本一致,但时间性能有很大的提升.
-
-
谢春
-
-
摘要:
二分类问题中的样本不平衡会导致传统分类算法不能很好地对数据进行分类,为解决这一问题,本文采用DBSCAN聚类算法和逻辑回归相结合的混合策略,该策略通过DBSCAN算法将二分类问题转化为多分类问题以平衡数据集,然后采用逻辑回归one-vs-one分类模型,实现对不平衡样本的有效分类,有效消除样本不平衡问题对分类精度的影响。该方法在锅炉燃烧故障诊断的实验结果表明,相比传统的解决样本不平衡问题的方法,DBSCAN结合逻辑回归的混合策略方法具有更好的分类性能,能有效提高分类精度。
-
-
贺玉海;
周庆琨;
程埮晟;
王勤鹏
-
-
摘要:
采用聚类算法和异常值检测算法进行车辆轨迹信息的提取与挖掘,在交通控制与管理、道路拥堵时空分析与治理、用户出行线路规划与推荐,以及自动驾驶决策规划等应用中具有重要意义.针对现有聚类算法和异常值检测算法参数难以控制、算法存在随机性的不足,提出基于K-Medoids与DBSCAN组合的聚类算法.通过对模拟十字交叉路口数据集的训练,得到一个交叉路口最佳聚类模型,并用真实轨迹数据集验证、优化该模型.然后,将交叉路口区域内一段时间内的轨迹聚类数据流进行可视化再现,取得了异常轨迹少、聚类速度快的聚类效果,同时比较选择出算法各个参数的最优值.最后,通过参数传递使DBSCAN算法能够更精确地识别出异常轨迹,为交通治理与自动驾驶决策提供指导.
-
-
-
-
-
-
-
庞洋;
李海林;
郭义喜
- 《全国第18届计算机技术与应用学术会议(CACIS)》
| 2007年
-
摘要:
针对海量日志信息的分析处理,应用了数据挖掘中的DBSCAN聚类算法,并加以实验验证,从而提出了一种海量日志信息分析处理的技术方法。实验结果表明,这种方法能够发现联系紧密的日志信息,帮助用户判断网络的使用情况与安全情况。针对DBSCAN算法在确定参数方面的不足,提出一种基于网格建立不规则数据分区获取合理参数的方法,可以改进DBSCAN算法的参数。
-
-
庞洋;
李海林;
郭义喜
- 《全国第18届计算机技术与应用学术会议(CACIS)》
| 2007年
-
摘要:
针对海量日志信息的分析处理,应用了数据挖掘中的DBSCAN聚类算法,并加以实验验证,从而提出了一种海量日志信息分析处理的技术方法。实验结果表明,这种方法能够发现联系紧密的日志信息,帮助用户判断网络的使用情况与安全情况。针对DBSCAN算法在确定参数方面的不足,提出一种基于网格建立不规则数据分区获取合理参数的方法,可以改进DBSCAN算法的参数。
-
-
庞洋;
李海林;
郭义喜
- 《全国第18届计算机技术与应用学术会议(CACIS)》
| 2007年
-
摘要:
针对海量日志信息的分析处理,应用了数据挖掘中的DBSCAN聚类算法,并加以实验验证,从而提出了一种海量日志信息分析处理的技术方法。实验结果表明,这种方法能够发现联系紧密的日志信息,帮助用户判断网络的使用情况与安全情况。针对DBSCAN算法在确定参数方面的不足,提出一种基于网格建立不规则数据分区获取合理参数的方法,可以改进DBSCAN算法的参数。
-
-
庞洋;
李海林;
郭义喜
- 《全国第18届计算机技术与应用学术会议(CACIS)》
| 2007年
-
摘要:
针对海量日志信息的分析处理,应用了数据挖掘中的DBSCAN聚类算法,并加以实验验证,从而提出了一种海量日志信息分析处理的技术方法。实验结果表明,这种方法能够发现联系紧密的日志信息,帮助用户判断网络的使用情况与安全情况。针对DBSCAN算法在确定参数方面的不足,提出一种基于网格建立不规则数据分区获取合理参数的方法,可以改进DBSCAN算法的参数。
-
-
庞洋;
李海林;
郭义喜
- 《全国第18届计算机技术与应用学术会议(CACIS)》
| 2007年
-
摘要:
针对海量日志信息的分析处理,应用了数据挖掘中的DBSCAN聚类算法,并加以实验验证,从而提出了一种海量日志信息分析处理的技术方法。实验结果表明,这种方法能够发现联系紧密的日志信息,帮助用户判断网络的使用情况与安全情况。针对DBSCAN算法在确定参数方面的不足,提出一种基于网格建立不规则数据分区获取合理参数的方法,可以改进DBSCAN算法的参数。