基于共享最近邻的聚类算法的研究与应用

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

本文针对现有的共享最近邻聚类算法，提出一种新型的基于共享最近邻的聚类算法，并将改进后的算法应用到真实数据集和零件的组合过程中。通过聚类结果和实验仿真表明，本文提出的共享最近邻算法能够提高算法有效性，同时节省算法执行时间。
　　为了避免求k-最近邻带来的庞大计算量，本文提出一种k-最近邻空间划定方法，降低算法的整体时间复杂度。根据先验知识给出待划分维的数目，在确定个数的特征向量上进行操作，有利于减少求点对之间距离所需的计算量。根据方差最大化原理确定待划分的维，在较为离散的数据分布中获得相对理想的划分效果，使其能够最大程度地代表数据对象的基本特征，同时提高搜索效率。最后，对确定的维进行基于密度的划分，每个数据对象在其数据空间范围内对k-最近邻进行求取。该k-最近邻空间划定方法极大地减少算法的计算量，在保证结果精度的前提下大大提高算法执行效率。
　　传统的共享最近邻定义只针对共享数据对象的个数，并没有充分考虑距离带来的影响，具有一定的局限性。改进后的共享最近邻综合考虑数据对象距离远近和个数两个因素，通过权值的方式对邻近性度量进行优化，体现其距离意义，使度量标准更符合实际要求。
　　在k-最近邻空间划定方法和改进后的共享最近邻定义的基础上，本文提出一种新型的基于共享最近邻的聚类算法。通过在真实数据集Iris和Pendigits上的聚类实验表明，优化后的算法运行速度更高、聚类结果更准确，其优势在大规模数据集中体现地更加明显。
　　将改进后的算法应用到零件组合的实验中，以聚类后的簇为单位进行组合，有效地避免传统的以零件为单位进行组合带来的庞大计算量。通过两种算法在零件组合实验中的运行结果可知，改进后的聚类算法具有更高的聚类精度，同时大大减少算法的运行时间。为了更好地适应实际的大批量生产模式，使用改进后的算法对不同规模数据集和不同维度数据集进行聚类。通过实验仿真结果可知，本文提出的共享最近邻算法具有较高的可伸缩性。

著录项

作者
孙千婷;
展开▼
作者单位

桂林理工大学;

展开▼
授予单位桂林理工大学;
学科计算机科学与技术
授予学位硕士
导师姓名叶汉民;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类算法理论;
关键词
共享最近邻; 聚类算法; 空间划定; k-最近邻; 搜索效率;

相似文献

中文文献
外文文献
专利

1. 基于共享最近邻的客户交易数据聚类算法 [J] . 李遥 ,荀亚玲 . 计算机技术与发展 . 2022,第1期
2. 基于共享最近邻的密度自适应邻域谱聚类算法 [J] . 葛君伟 ,杨广欣 . 计算机工程 . 2021,第008期
3. 结合自然和共享最近邻的密度峰值聚类算法 [J] . 柏锷湘 ,罗可 ,罗潇 . 计算机科学与探索 . 2021,第005期
4. 罚处共享最近邻密度峰聚类算法 [J] . 高润峰 ,苏一丹 ,覃华 . 计算机工程与设计 . 2021,第012期
5. 改进的共享最近邻聚类算法 [J] . 李霞 ,蒋盛益 . 计算机工程与应用 . 2011,第008期
6. 基于k最近邻划分的聚类算法研究 [C] . 刘大有 ,刘杰 ,金弟 . 中国人工智能学会第12届全国学术年会 . 2007
7. 基于最近邻思想的Chameleon聚类算法研究 [A] . 吕端端 . 2020

基于共享最近邻的聚类算法的研究与应用

目录

摘要

著录项

相似文献

相关主题

期刊订阅