支持向量机的一般化能力与训练样本关系的研究

代理获取

页面导航

摘要
著录项
引文网络
相似文献
相关主题

摘要

本文从支持向量机经验风险的利用、支持向量的合并约简以及训练样本的精简三方面进行论述。利用经验风险以提高分类器的泛化能力，对含有重复矛盾支持向量的合并约简以减少支持向量的个数并提高测试速度，对训练样本精简的目的是达到在泛化能力几乎没有下降的情况下提高支持向量机的训练速度并减少支持向量的个数。训练支持向量机的过程之前往往要进行参数搜索以找到具有最优泛化能力的训练参数。在搜索过程中，有些参数使得经验风险几乎为零、泛化能力最好、支持向量很多，我们往往采用这些参数作为训练参数。有些参数使得经验风险较大、泛化能力比最好稍差、支持向量很少。我们的实验表明利用别的分类器结合后者的经验风险可以使后者的泛化能力比前者最好的泛化能力还要好。有些训练样本中含有重复矛盾的样本，训练支持向量机的结果使得支持向量中仍然含有重复矛盾的支持向量，通过我们的合并约简算法可以减少支持向量的个数，减少的程度与样本重复的程度有关。样本重复度高，减少的比例就大，反之减少的比例就小。支持向量机基于统计学习理论并能较好的解决好小样本问题，但对许多含有大数量样本的数据库来说，他们并不非常适合于支持向量机。训练样本的数量严重影响训练的速度与支持向量的数量。我们的实验表明，保留训练样本的边界样本，去除部分非边界样本可以明显的减少训练样本的数量，明显的减少支持向量的个数，而泛化能力几乎没有下降。

著录项

作者
陈玉坤;
展开▼
作者单位

上海交通大学;

展开▼
授予单位上海交通大学;
学科计算机软件与理论
授予学位硕士
导师姓名吕宝粮;
年度 2006
页码
总页数
原文格式 PDF
正文语种中文
中图分类自动推理、机器学习;
关键词
支持向量机; 经验风险; 训练样本; 泛化能力; 支持向量;

相似文献

中文文献
外文文献
专利

1. 训练样本对TM尺度小麦种植面积测量精度影响研究(Ⅰ)——训练样本与分类方法间分类精度响应关系研究 [J] . 朱秀芳 ,潘耀忠 ,张锦水 . 遥感学报 . 2007,第006期
2. 训练样本数量选择和总体分类精度的关系研究 [J] . 王春来 ,张森原 ,崔璐 . 河南城建学院学报 . 2015,第003期
3. 基于支持向量机的左心室短轴缩短率参考值与地理环境的关系研究 [J] . 岑敏仪 ,葛淼 ,路春爱 . 华中科技大学学报（医学版） . 2015,第002期
4. 基于支持向量机的青年女性红细胞压积参考值与地理环境关系研究 [J] . 刘倩 ,刘三阳 ,葛淼 . 工程数学学报 . 2011,第001期
5. 基于模糊支持向量机的企业关系价值分级度量研究 [J] . 胡健 ,李向阳 . 运筹与管理 . 2009,第002期
6. 基于AdaBoost方法的支持向量机训练样本选择 [C] . 易辉 ,宋晓峰 ,姜斌 . 第三届全国虚拟仪器学术交流大会 . 2009
7. 支持向量机分类算法中训练样本集的构造方法 [A] . 于旭 . 2009

支持向量机的一般化能力与训练样本关系的研究

摘要

著录项

引文网络

相似文献

相关主题

期刊订阅