首页> 中文学位 >基于改进RNA遗传算法的聚类分析研究及应用
【6h】

基于改进RNA遗传算法的聚类分析研究及应用

代理获取

目录

第一个书签之前

展开▼

摘要

随着人工智能的发展和大数据时代的到来,数据资源呈爆炸式增长,数据处理离不开数据挖掘,而数据挖掘中非常关键的工具即为聚类分析,它作为数据挖掘的主要工具,已经活跃在各大领域。目前已经出现了很多聚类方法,但是每一种聚类算法都不是十全十美的,仍有可以改进的空间,除了可以对算法本身进行改进之外,还可以运用一些特定的优化算法来进行优化,弥补算法本身的缺陷和不足。所以,本文选择了当前应用比较广泛的两种聚类分析方法,模糊 C 均值聚类(FCM)和密度峰值聚类(DPC),作为主要的研究内容,并且借助了RNA遗传算法(RNA-GA)来对这两种聚类算法进行了优化,以下为本文的主要研究工作。 提出了一种自适应的RNA遗传算法(ARNA-GA)。在新的选择操作中,引入了惩罚系数d,保证种群中后d%的个体不会留存至下一代,从而引导解空间向最优解空间靠近;设计了新的交叉操作和变异操作,改进了 RNA-GA 中的单一操作;针对交叉和变异操作,设计了自适应策略,即引入相异度系数的概念,在判断个体差异较大时进行交叉操作,相反,进行变异操作,可减少算法的计算量,防止出现冗余操作,提高收敛速度。最后,用四个标准测试函数对算法的性能进行了评估,证明了算法的有效性。 提出了一种基于自适应 RNA 遗传算法的核模糊 C 均值聚类算法(ARNAGA-KFCM)。首先,提出了一种核模糊C均值聚类算法(KFCM),即引入高斯核函数来替代原始FCM 中的距离计算方法,改善了 FCM对孤立点和噪声点敏感的问题;将新提出的ARNA-GA 和 KFCM 进行结合,用改进的ARNA-GA来优化模糊C均值聚类的初始聚类中心,然后再运用KFCM算法来执行聚类,打破了原始 FCM 聚类算法受初始聚类中心影响的问题,并且因为RNA-GA本身就是一种带搜索策略的寻优算法,可以指导FCM算法跳出局部最优。最后,用四种UCI数据集验证了ARNAGA-KFCM的有效性,通过和FCM、KFCM进行对比,证明了本文新提出算法的优越性。 提出了一种基于自适应 RNA 遗传算法的K 近邻密度峰值聚类算法(ARNAGA-KNN-DPC)。首先,改进了DPC算法,采用了 K近邻的思想,改善了原算法中局部密度ρi的计算,使得局部密度的计算不再受截断距离dc的影响;将新提出的自适应RNA遗传算法和基于K近邻的密度峰值聚类算法进行结合,用改进的RNA遗传算法来寻找局部密度ρ和相对距离δ的阈值,因为根据 密度峰值聚类的思想,ρ值和δ值均大的点才是聚类中心,根据ARNA-GA寻优的阈值,我们可以很容易的确定出聚类中心,解决了原始DPC算法确定聚类中心困难的问题。最后,用 UCI 数据集和合成数据集验证了算法的性能,并且和当前比较热门Min_Max_SD以及K-means进行了对比分析,证明了本文提出的ARNAGA-KNN-DPC算法的有效性。 本文提出的算法是从理论可行性的角度出发,提出了算法的改进思路,并且通过MATLAB仿真实验证明了算法的有效性;从应用的角度出发,将本文提出的ARNAGA-KFCM算法应用到文本分类的实验中,其中,文本取自搜狗实验室的真实数据库,结果证明,本文提出的算法不仅在理论上是可行的,在应用上也能收获很好的效果,有一定的实用价值。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号