首页> 中文学位 >基于免疫遗传算法的聚类与特征降维研究
【6h】

基于免疫遗传算法的聚类与特征降维研究

代理获取

摘要

随着信息技术的飞速发展,各种数据呈几何级数增长,面对这些海量的数据,如何利用数据挖掘技术获取有价值的知识,已经成为学术界和工业界的重要研究课题之一。聚类分析作为数据挖掘过程中的重要组成部分,也受到了广泛的关注。本文将免疫遗传算法应用于数据挖掘方法中,针对高维特征的维数约减和数据聚类问题进行了深入的研究,主要工作包括以下几方面的内容。
   首先全面分析了遗传算法和免疫算法的原理特性,将免疫机制引入遗传算法中。重点介绍了免疫遗传算法的设计过程和特点。随后从理论层面上剖析了聚类分析的数学描述、数据结构、相异性度量方法以及常用的一些聚类算法。
   针对k-medoids算法容易受初始聚类中心的影响问题,本文提出将免疫遗传算法与k-medoids算法相结合组成新的聚类方法,这样既可以获得全局最优解,也可以很好的区分孤立点。同时由于使用改进的中心点替换策略,可以加快收敛速度,节约时间成本。
   采用免疫遗传算法与CHI统计方法相结合进行文本特征降维。文本特征通常采用向量空间模型表示,而高维稀疏的特征矩阵会降低聚类的效率和准确率。本文首先运用CHI方法对文本特征进行降维,使得文本特征从几千维降至几百维,然后在此基础上再利用免疫遗传算法继续降维,这样不仅有效地降低了维数,而且提高了聚类质量。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号