加快SMO算法训练速度的策略研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

支持向量机(SVM)是以Vapnik的统计学习理论为基础，以结构风险最小化(SRM)为原则的新型学习机。它克服了神经网络的一些缺点，如过学习，维数灾难，易陷入局部最优等。因此，它成为目前机器学习领域的一个热门研究课题。当前对SVM的研究集中在训练算法的设计和应用上。大量的研究表明，作为一种解决模式识别问题和非线性函数的回归估计、预测等问题的新技术，sVM无论在模型拟合效果还是模型推广能力方面都表现出了良好的性质。而序贯最小优化(Sequential Minimal Optimization，SMO)则是一种著名的SVM训练算法，它使得SVM问题的求解摆脱了内存的限制，避免了子问题求解的误差积累。但是当面对大规模一般特点训练数据时，SMO训练速度十分缓慢。本文研究重点是提高SMO的收敛速度。我们的创新工作主要有以下几点：大量的实验结果表明，SMO收敛速度慢的根本原因是SMO迭代后期当解空间缩小时而工作集搜索空间不变；由此我们以目标函数改变量为依据，在SMO迭代后期适当的减小工作集选择范围。该策略明显减少了很多无效的迭代，显著的缩短了SMO的训练时间，对大样本数据更是表现出了优秀的性能。其次，考虑到在SVM的优化过程中并不是所有样本都能影响优化进展；因此在SVM<, Light>中的Shrinking策略的基础上，结合SMO选择工作集的特点，我们在SMO的迭代过程中实行改进的Shrinking策略，用来启发式的删除那些可能对优化进展没有影响的样本，以节省训练时间，增强SMO的抗干扰能力。我们提出了两种删除样本策略，一种是基于距离，一种是基于拉格朗日乘子的值。最后通过对SMO每一轮优化过程中有效的工作集个数的分析，我们认为SMO的停止条件不能准确的判断出优化进展程度。结合目标函数改变量，我们引进一个阈值，用来在SMO迭代后期准确的识别出优化所处的阶段，以适当的废弃那些不能引起优化进展的循环。实验表明该策略可以在损失一点点精度的情况下，大大的提高大规模训练数据的训练速度。在几个著名的数据集的实验结果表明，本文提出的这些方法可以大大缩短SMO的训练时间，特别适用于大样本支持向量较多的数据。

著录项

作者
骆世广;
展开▼
作者单位

华南理工大学;

展开▼
授予单位华南理工大学;
学科应用数学
授予学位硕士
导师姓名杨晓伟;
年度 2006
页码
总页数
原文格式 PDF
正文语种中文
中图分类自动推理、机器学习;
关键词
训练算法; 训练速度; 优化过程; 训练时间; 工作集; 大样本; 训练数据; 迭代; 样本策略; 支持向量机; 收敛速度; 目标函数; 序贯最小优化; 统计学习理论; 实验; 拉格朗日乘子; 改变量; 抗干扰能力; 非线性函数; 样本数据;

相似文献

中文文献
外文文献
专利

1. 加快SMO算法训练速度的策略研究 [J] . 骆世广 ,骆昌日 . 计算机工程与应用 . 2007,第033期
2. 基于改进SMO的风机降阶系统速度传感器故障检测 [J] . 李东亮 ,文传博 . 电力科学与工程 . 2017,第002期
3. 基于SMO的PMSM无速度传感器调速系统 [J] . 蓝希清 ,胡立坤 ,卢子广 . 广西大学学报（自然科学版） . 2014,第006期
4. 乌克兰投资与经贸风险分析报告乌克兰重视利用外国直接投资。但在独立后的数年时间内，外国直接投资增长速度不快。1994年为1．6亿美元，2001年为8『乙美元。2004年以来，外国直接投资的增长速度加快，2008年超过100亿美元，但2009年下跌到48．2亿美元。2010g，外国直接投资有昕反弹，增至65fL美元。2011年约 [J] . . 国际融资 . 2012,第12期
5. 另辟蹊径,加快文件传输速度10倍速度传输NS700中的文件 [J] . 龙马 . 微型计算机 . 2008,第024期
6. 速度可调节的粒子群算法训练BP神经网络 [C] . 吴文佳 ,宋晓峰 . 2007年中国智能自动化会议 . 2007
7. SMO基因siRNA慢病毒表达载体的构建及其对胰腺癌细胞SMO基因表达的影响 [A] . 迪力夏提·吐尼牙孜 . 2016

加快SMO算法训练速度的策略研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅