基于混合PSO的K-means算法及并行化研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

数据挖掘有四种主要任务：关联分析、聚类分析、预测建模、异常检测。其中聚类分析是最重要的使用最广泛的任务之一。高效率和高精度结果一直是数据挖掘追求的目标。为了实现这一目标，人们进行了多种研究，其中一种就是将其它算法应用到数据挖掘中，这些算法包括智能算法、启发式算法，神经网络，模糊理论，粗糙集理论等等。论文中将禁忌搜索思想和粒子群优化算法引入到K-me~s聚类算法中，以此来提高K-means聚类算法的效率和聚类结果的精度。禁忌搜索(Tabu Search)是一种智能启发式的全局性邻域搜索算法，它通过局部邻域搜索机制和相应的禁忌准则来避免迂回搜索，并通过特赦准则来释放一些被禁忌的优良对象，从而保证搜索的多样化和有效性，研究表明它可以克服演化算法容易陷入早熟的缺陷，最终实现全局优化。粒子群优化算法(Pmicle SwarmOpfimiz~on)是一种演化计算技术，它具有简单、有效、收敛速度较快、全局搜索能力较强等特点，近年来受到学术界的高度关注，但是该算法也具有可能陷入局部最优进而导致结果精度低和收敛速度慢的缺点，因此在论文中使用禁忌搜索和控制参数等方法来改进粒子群优化算法，从而提高该算法的效率和解的精度。K-means是基于划分的聚类方法。它在目前的聚类分析中应用很广泛。但是该算法的缺点是易陷入局部最优，效率不高。而且聚类个数K常常是依据经验来确定，这将影响聚类结果。针对K-means算法的不足，把禁忌搜索思想和粒子群优化算法引入到K-means聚类算法中，以提高K-means算法的效率和结果精度。论文中研究了禁忌对象和禁忌表结构的选取、个体编码方式的选取、惯性权重的改进、罚函数的方式及表达式的选取和构造、适应度函数的构造。实验证明改进后的K-means算法的效率和结果精度都得到了提高。为了进一步提高算法的执行效率，论文中研究了K-means算法的并行化。通过种群或者子种群之间的等价关系来确定等价类，按等价类初步划分种群，然后把划分好的种群分配到Slave结点上，实现数据并行，最后由Master结点机进行汇总给出结果。论文以时间复杂度和空间复杂度等指标从理论上对并行化的算法进行了评价，理论分析表明并行算法比并行算法具有更高的效率。

著录项

作者
张世勇;
展开▼
作者单位

重庆大学;

展开▼
授予单位重庆大学;
学科计算机系统结构
授予学位硕士
导师姓名熊忠阳;
年度 2007
页码
总页数
原文格式 PDF
正文语种中文
中图分类 TP311.13;
关键词
禁忌搜索; 粒子群优化算法; 数据挖掘; 聚类分析;

相似文献

中文文献
外文文献
专利

1. 基于K-Means变异算子的混合PSO算法聚类研究 [J] . 杨晓庆 ,左为恒 ,李昌春 . 微电子学与计算机 . 2011,第7期
2. 混合PSO的K-means算法在B2C电子商城客户细分中的应用研究 [J] . 胡艳霞 ,刘尖学 ,洪宗民 . 电脑知识与技术 . 2015,第035期
3. 基于MapReduce的模糊K-means算法并行化研究 [J] . 杨延庆 ,袁华兵 . 计算机与数字工程 . 2020,第007期
4. 基于Hadoop平台的K-means聚类算法并行化改进研究 [J] . 禤世丽 ,刘建明 . 玉林师范学院学报 . 2020,第3期
5. 基于CUDA的k-means算法并行化研究 [J] . 刘端阳 ,郑江帆 ,沈国江 . 计算机科学 . 2018,第011期
6. k-means聚类算法的MapReduce并行化实现 [C] . 李锦文 ,张清辉 ,魏化震 . 第三届中国国家网格学术年会 . 2011
7. 基于遗传算法的并行化K-means聚类算法研究 [A] . 马通 . 2017

基于混合PSO的K-means算法及并行化研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅