首页> 中文学位 >K-Means聚类和L2-SVM分类的距离度量以及模式选择研究
【6h】

K-Means聚类和L2-SVM分类的距离度量以及模式选择研究

代理获取

目录

封面

声明

中文摘要

英文摘要

目录

1 绪论

1.1 研究背景及现实意义

1.2 国内外研究现状

1.3 本文的主要工作和组织结构

2 基于局部保持的K-Means算法

2.1 前言

2.2 K-Means算法和LPP算法

2.3 基于局部保持的K-Means算法

2.4 实验结果分析

2.5 本章小结

3 类内局部保持二次损失函数支持向量机

3.1 前言

3.2 支持向量机

3.3 类内局部保持二次损失函数支持向量机

3.4 实验研究

3.5 本章小结

4 基于改进RM界的二次损失函数支持向量机模式选择

4.1 前言

4.2 RM界和最小包含球半径的近似估计

4.3 基于改进RM界的L2-SVM模式选择

4.4 实验结果与分析

4.5 本章小结

总结与展望

1、工作总结

2、进一步工作展望

参考文献

攻读硕士学位期间发表论文及科研成果

致谢

展开▼

摘要

K-Means算法和L2-SVM算法分别是聚类和分类中研究较热的算法。传统K-Means算法以欧氏距离为度量准则,忽略了样本各属性在聚类过程中发挥的不同作用。同样的,L2-SVM算法寻找决策超平面时,以欧氏距离作为最大间隔的距离度量,忽视了样本集的空间内在结构特征。其次,L2-SVM算法中的参数较多,模式选择增加了算法的计算量。所以本论文就这几个问题进行了相关研究,所研究内容主要有以下几点:
  1、针对传统K-Means算法的距离度量存在的弊端,我们借鉴了LPP算法原理,首先构造一个局部保持散度矩阵,然后改进马氏距离中的协方差矩阵构建新的马氏距离,最后提出了基于局部保持的K-Means算法,并分析了算法的可行性和时间复杂度。与传统K-Means算法相比,本论文改进的算法考虑了数据内在结构和流形特征,有利于提高算法聚类效果。
  2、针对L2-SVM优化问题中的距离间隔,我们引入LPP算法原理,定义了类内局部保持散度矩阵,然后构造了一种新的间隔距离度量,最后提出类内局部保持的L2-SVM分类算法。相对于传统的SVM,我们改进的算法充分考虑了每一类样本的内在流形结构特征。并且,该方法考虑了数据的类标,属于监督方法,而LPP属于无监督方法,没有考虑数据的类别信息。实验结果显示,相对于传统的SVM和KNN分类算法,本论文提出的算法具有更高的识别精度。
  3、RM界中最小包含球半径R的计算需要求解二次规划问题,增加了算法的计算量。针对此问题,我们首先用所有训练样本的最大距离D逼近半径R,其次用D替换R构成新的RM界,然后基于改进的RM界对L2-SVM进行模式选择,并用梯度下降法调节最优参数,最后通过仿真实验,讨论了算法的分类精度和计算效率,得出结论。实验结果表明,相对于基于RM界的模式选择方法,文中算法的分类精度没有受到影响,但计算效率至少提高了一倍。

著录项

相似文献

  • 中文文献
  • 外文文献
  • 专利
代理获取

客服邮箱:kefu@zhangqiaokeyan.com

京公网安备:11010802029741号 ICP备案号:京ICP备15016152号-6 六维联合信息科技 (北京) 有限公司©版权所有
  • 客服微信

  • 服务号