基于分类噪声检测的支持向量机算法研究

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

支持向量机(Support Vector Machine, SVM)是基于统计学习理论的一种优秀的机器学习方法。它在最基本的线性可分问题中，采用与结构风险最小化理论一致的间隔最大化原理产生原始凸规划问题模型，使得基本问题模型具有良好的泛化能力。并且由于模型是凸规划模型，所以能够获得全局最优解。在获得这些良好特性的基础上，通过引入惩罚系数和惩罚因子来获得线性不可分问题的问题模型。并通过进一步使用核函数理论来解决非线性问题，从而避免了维数灾难。由于其优异的性能，已经广泛应用于模式分类，密度估计和函数逼近等领域，成为机器学习中的研究热点。
　　本文围绕支持向量机在分类问题中的训练过程和过学习现象，瞄准高维数据中的相对密度计算及与支持向量机的结合为关键问题，以提高支持向量机的训练速度为主要目的，其具体的研究成果主要包括以下几个内容：
　　①通过分析分类问题中噪声数据的特点，引入分类噪声的概念，提出了相对密度模型对其进行检测。分类问题中的噪声数据会明显减弱决策曲线的平滑度，降低决策函数的泛化能力，从而引起过拟合，因而挖掘这些噪声数据具有重要意义。本文针对现有算法无法有效检测分类问题中的噪声数据的问题，基于噪声数据在同类样本集合中的样本密度要小于在异类样本集合中的样本密度，引入了分类噪声的概念，进一步提出了相对密度模型来对分类噪声进行快速有效地检测。仿真实验表明相对密度模型能够很好的识别分类噪声。
　　②通过排除分类噪声将不可分问题转化为可分问题，简化了支持向量机模型和训练过程，并结合序列最小优化（Sequential Minimal Optimization, SMO）算法，提出了基于分类噪声检测的序列最小优化算法（Classification Noises Detection based Sequential Minimal Optimization, CNSMO）。针对现有的支持向量机在训练过程中依赖交叉验证会大幅增加训练时间的问题，CNSMO算法通过排除分类噪声后平滑了决策函数，避免了分类噪声产生的过学习现象，因此在训练过程中不需要使用交叉验证也能够获得良好的预测精度。同时，由于排除分类噪声将不可分问题转化为可分问题，不需要对惩罚系数进行寻优，简化了拉格朗日参数迭代模型。仿真结果表明改进算法能够在不牺牲算法预测精度的前提下，大幅缩短了支持向量机的训练时间，算法具有良好的稳定性。
　　③通过计算到某些固定参考点的度量来衡量不同样本之间的位置差异，以避免直接计算样本之间的欧式距离，提出了基于位置差异的近邻搜索算法(Location Difference based Algorithm，LDBA)。针对在相对密度计算中使用的现有近邻算法在高维数据集中性能下降的问题，LDBA算法使用参考点与样本所构成的角度和距离来度量不同样本点之间的位置差异，避免对样本之间的欧式距离直接进行计算，因此具有较低的算法时间复杂度。另外，LDBA算法不依赖索引树结构，因此在高维数据集中仍然能够保持良好的算法效率。仿真结果表明LDBA算法具有和基本算法接近的预测精度，但比同类算法在高维数据集中表现出了更好的算法效率。
　　④通过将LDBA算法结合到CNSMO算法中，提出了基于位置差异和分类噪声的最小序列化支持向量机算法(Location Difference and Classification Noise based Sequential Minimal Optimization,LD-CNSMO)。针对CNSMO算法在高维数据集中性能下降的问题，将LDBA算法结合到相对密度的计算过程中以检测和消除分类噪声，提出了LD-CNSMO算法。由于LDBA算法不依赖树索引结构，因此LD-CNSMO算法能够在高维数据集中保持良好的算法效率。仿真结果表明LD_CNSMO算法在高维数据集中能够获得比CNSMO和其他算法更好的算法效率。
　　本论文引入分类噪声后，通过使用基于LDBA的相对密度模型进行检测和排除分类噪声，并结合到SMO支持向量机中，避免了在支持向量机训练过程中使用交叉验证。在不影响算法泛化能力的情况下，大幅度提高了算法在低维和高维数据集中的训练效率，并增强了算法稳定性，有效地提高了支持向量机的算法性能。

著录项

作者
夏书银;
展开▼
作者单位

重庆大学;

展开▼
授予单位重庆大学;
学科计算机科学与技术
授予学位博士
导师姓名熊忠阳;
年度 2015
页码
总页数
原文格式 PDF
正文语种中文
中图分类自动推理、机器学习;
关键词
机器学习; 支持向量机; 分类噪声; 训练速度;

相似文献

中文文献
外文文献
专利

1. 基于改进支持向量机的运动视频内容分类算法研究 [J] . 许淑贤 . 现代电子技术 . 2020,第004期
2. 基于支持向量机的模糊特征分类算法研究 [J] . 安旭 ,张树东 . 计算机工程 . 2017,第001期
3. 基于支持向量机的人脸图像质量分类算法研究 [J] . 李昆仑 ,兰长明 . 电脑知识与技术 . 2016,第006期
4. 基于支持向量机的人脸图像质量分类算法研究 [J] . 李昆仑 ,兰长明 . 电脑知识与技术 . 2015,第006期
5. 基于支持向量机的舰船战储器材分类算法研究 [J] . 赵翀 ,由大德 ,彭亮 . 舰船电子工程 . 2014,第009期
6. 一种基于支持向量机的抗噪声邮件分类方法 [C] . 陈琳 ,黄杰 ,龚正虎 . 第二十一届中国数据库学术会议 . 2004
7. 基于支持向量机的网络流量分类技术研究基于支持向量机的网络流量分类技术研究 [A] . 吴思远 . 2019

基于分类噪声检测的支持向量机算法研究

目录

摘要

著录项

相似文献

相关主题

期刊订阅