基于模糊C均值聚类的支持向量机集成研究及应用

代理获取

页面导航

目录
摘要
著录项
相似文献
相关主题

摘要

随着大数据时代的到来，利用机器学习算法挖掘大数据的价值成为焦点。支持向量机作为机器学习界分类预测性能优良，推广能力好的算法，被应用于各行各业。这一技术在解决小样本量，线性不可分问题时表现的非常好，然而面对大批量的数据，要训练出高性能的分类器，会遇到诸如训练时间长，维数灾难，模型性能下降等问题，因此，本论文尝试将优化SVM（Support Vector Machine）的性能作为重点研究内容。
　　本论文的核心即为SVM集成模型的研究。首先评述支持向量机、集成学习的国内外研究现状。依据之前方法存在的缺陷，本论文针对问题提出新的改进方法—基于模糊C均值聚类的支持向量机集成模型。文章研究主要选取了SVM算法作为基分类器，根据它的一些缺陷作进一步的改善，并运用到实际问题中。考虑到SVM的训练时间与样本集的大小成超线性关系及现实中问题的模糊不确定性，本论文引入模糊聚类思想，利用隶属度来处理数据。这样既能够有效保持原有样本数据信息的数据点，又能较好地实现正类和负类样本的平衡。在模型的应用当中，简单比较SVM与Logistic回归、BP神经网络在分类性能上的差异，同时对比不同集成方法性能的差异。
　　在算法的应用部分，本论文选取医疗疗效数据和用户信用评分2个数据集，对前述算法性能进行验证。首先用随机森林的方法，对数据集进行特征选择，然后用网格搜索及交叉验证的方法对SVM惩罚参数C及?值进行选择；其次用模糊C均值聚类的思想对数据样本进行筛选，从而选择出具有代表性的样本作为最终的训练样本，同时达到平衡数据的目的；最后以SVM为基分类器，选用 Ba gging、Ada Boos t集成方法，进行模型的训练。最终通过编程实现模型的运行，将研究提出的方法与其他单一分类器模型的预测性能对比，得出 SVM的 Bagging集成使模型性能提高2-3个百分点。最终证实了通常Ba gging可以改善学习系统的性能，而 Ada Boost算法是不稳定算法，有时候可以起到改善模型性能的作用，有时却没有效果甚至会严重降低模型的预测性能。

著录项

作者
侯兴翠;
展开▼
作者单位

西南财经大学;

展开▼
授予单位西南财经大学;
学科应用统计
授予学位硕士
导师姓名范国斌;
年度 2017
页码
总页数
原文格式 PDF
正文语种中文
中图分类自动推理、机器学习;
关键词
模糊C均值聚类; 支持向量机; 集成学习; 机器学习;

相似文献

中文文献
外文文献
专利

1. 基于超像素快速模糊C均值聚类与支持向量机的柑橘病虫害区域分割 [J] . 袁芊芊 ,邓洪敏 ,王晓航 . 计算机应用 . 2021,第002期
2. 基于模糊C均值聚类算法和最小二乘支持向量机的母线负荷预测研究 [J] . 蒋燕 ,吴洋 ,栾毅 . 电气自动化 . 2019,第003期
3. 基于模糊C均值聚类与单类支持向量机的音频隐写分析方法 [J] . 王昱洁 ,蒋薇薇 . 计算机应用 . 2016,第003期
4. 基于模糊C均值聚类-支持向量机的海底沉积物分类识别 [J] . 尤加春 ,毛慧慧 ,段文豪 . 海洋科学 . 2014,第011期
5. 基于模糊C均值聚类和支持向量机的信号识别方法 [J] . 顾敏剑 . 计算机与数字工程 . 2013,第003期
6. 基于模糊C均值聚类和支持向量机的电力变压器故障诊断模型研究 [C] . 吴晓辉 ,李彦明 . 2007年全国电气设备安全与信息技术研讨会暨中国电机工程学会能源与信息专委会学术年会 . 2007
7. 基于模糊C均值聚类与集成高斯过程回归的赖氨酸发酵过程软测量建模与应用 [A] . 张翔 . 2014

基于模糊C均值聚类的支持向量机集成研究及应用

目录

摘要

著录项

相似文献

相关主题

期刊订阅