基于边界样本选择的支持向量机

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

支持向量机(Support Vector Machine,SVM)是以统计学理论和结构风险最小化原则为基础的,一种处理小样本问题的数据挖掘方法。由于其具有完备的理论基础和很好的泛化能力,被广泛应用于求解分类问题和回归问题。因为求解SVM的实质是求解一个凸二次规划问题,它的计算时间复杂度为O(n3),空间复杂度为O(n2),所以当处理大规模数据问题时,其训练时间会很长,对存储空间的要求也很高。
　　由于分类超平面仅由支持向量确定,而支持向量大多分布在分类边界上。根据这一特点,针对上述问题,本文提出了两种基于边界样本选择的支持向量机。利用概率神经网络和极端学习机,选出边界样本作为候选支持向量,训练支持向量机。在筛选候选支持向量时,使用K-L散度和熵作为启发式。当K-L散度值越大时,说明期望分布和真实分布差异越大,也就是说这个样本最不容易被区分,通常这样的样本分布在分类边界上。当熵值越大时,说明样本包含的不确定信息越大,对分类超平面位置的影响也就越大,因此这样的样本也分布在分类边界上。
　　本文在两个人工数据集和13个UCI数据集上进行了实验,验证了所提出的方法在较大规模数据集上其测试精度和训练时间都有很好的结果。从而归纳出一种基于边界样本选择的支持向量机的基本框架。

著录项

作者
李畅;
展开▼
作者单位

河北大学;

展开▼
授予单位河北大学;
学科计算机应用技术
授予学位硕士
导师姓名翟俊海;
年度 2014
页码
总页数
原文格式 PDF
正文语种中文
中图分类自动推理、机器学习 ;
关键词
支持向量机; 数据挖掘; 边界样本选择; K-L散度; 概率神经网络; 极端学习机;

相似文献

中文文献
外文文献
专利

1. 基于边界样本选择的支持向量机加速算法 [J] . 胡小生 ,钟勇 . 计算机工程与应用 . 2017 ,第003期
2. 基于边界样本欠取样支持向量机的电信用户欠费分类算法 [J] . 李创创 ,卢光跃 ,王航龙 . 电信科学 . 2017 ,第009期
3. 基于边界样本的训练样本选择方法 [J] . 张莉 ,郭军 . 北京邮电大学学报 . 2006 ,第4期
4. 基于有效候选集的支持向量机样本选择方法 [J] . 王展青 ,王传廷 ,张富铭 . 计算机工程与应用 . 2008 ,第023期
5. 基于余弦相似度的边界样本选择方法 [J] . 李春利 ,柳振东 ,惠康华 . 计算机与现代化 . 2017 ,第008期
6. 基于AdaBoost方法的支持向量机训练样本选择 [C] . 易辉 ,宋晓峰 ,姜斌 . 第三届全国虚拟仪器学术交流大会 . 2009
7. 不平衡样本集的支持向量机模型选择 [A] . 姚程宽 . 2007

基于边界样本选择的支持向量机

目录

摘要

著录项

相似文献

相关主题

期刊订阅