大规模数据集聚类的K邻近均匀抽样数据预处理算法

吉成恒; 雷咏梅

首页> 中文期刊> 《上海大学学报：自然科学版》 >大规模数据集聚类的K邻近均匀抽样数据预处理算法

大规模数据集聚类的K邻近均匀抽样数据预处理算法

AI论文写作 >>

开具论文收录证明 >>

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

为解决基于密度的聚类算法处理大规模数据集效率低和存储开销大的问题,提出一种分片的基于K邻近关系的空间均匀抽样算法作为聚类应用的数据预处理过程,将数据集分片,按密度降序方式去除数据集中部分样本的K邻居,将剩余样本作为抽样样本,在保证精度的同时,可以降低数据规模,提升计算效率.实验结果表明,在数据规模较大且保证聚类结果准确性的前提下,通过降低聚类数据规模,可以有效提升聚类效率.

著录项

来源
《上海大学学报：自然科学版》 |2016年第1期|28-35|共8页
作者
吉成恒; 雷咏梅;
展开▼
作者单位

上海大学计算机工程与科学学院;

展开▼
原文格式 PDF
正文语种 chi
中图分类信息处理（信息加工）;
关键词
密度降序; K邻近; 空间均匀抽样; 聚类;

相似文献

中文文献
外文文献
专利

1. 大规模数据集谱聚类并行优化算法 [J] . 郝笑弘 ,尹青山 . 机械设计与制造 . 2021,第010期
2. 大规模数据集聚类算法的研究进展分析 [J] . 邢春燕 . 花炮科技与市场 . 2020,第002期
3. 大规模数据集聚类算法的研究进展 [J] . 何玉林 ,黄哲学 . 深圳大学学报（理工版） . 2019,第001期
4. 大规模数据集下基于DBSCAN算法的增量并行化快速聚类 [J] . 王兴 ,吴艺 ,蒋新华 . 计算机应用与软件 . 2018,第004期
5. 适合大规模数据集的增量式模糊聚类算法 [J] . 李滔 ,王士同 . 智能系统学报 . 2016,第002期
6. 基于分层聚类的并行数据预处理算法 [C] . 李朝鹏 ,李肯立 . 2007全国开放式分布与并行计算学术年会 . 2007
7. 面向大规模数据集的自适应聚类算法并行化研究 [A] . 肖雪平 . 2016

大规模数据集聚类的K邻近均匀抽样数据预处理算法

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅